Saintis Data

Panduan kerjaya Data Scientist BrainStation boleh membantu anda mengambil langkah pertama ke arah kerjaya yang menguntungkan dalam sains data. Teruskan membaca untuk mendapatkan gambaran keseluruhan bidang sains data, serta peranan kerja Ahli Sains Data.

Menjadi Ahli Sains Data

Bercakap dengan Penasihat Pembelajaran untuk mengetahui lebih lanjut tentang cara bootcamp dan kursus kami boleh membantu anda menjadi seorang Saintis Data.

Dengan mengklik Hantar, anda menerima kami Syarat .



Hantar

Tidak dapat menyerahkan! Muat semula halaman dan cuba lagi?

Ketahui lebih lanjut tentang Bootcamp Sains Data kami

Terima kasih!

Kami akan berhubung tidak lama lagi.

Lihat halaman Bootcamp Sains Data

Apa Itu Saintis Data?

Saintis Data mengumpulkan, menyusun dan menganalisis set besar data besar – data berstruktur dan tidak berstruktur – untuk mencipta penyelesaian dan rancangan perniagaan terdorong data yang boleh diambil tindakan untuk syarikat dan organisasi lain. Menggabungkan rasa untuk matematik, sains komputer dan perniagaan, Saintis Data perlu memiliki kedua-dua kemahiran teknikal untuk memproses dan menganalisis data besar serta kepintaran perniagaan untuk mencungkil cerapan boleh diambil tindakan yang tersembunyi dalam data tersebut.

Sains Data lwn. Perlombongan Data

Terdapat beberapa perbezaan antara sains data dan perlombongan data. Mari kita lihat lebih dekat:

Sains Data

  • Merupakan bidang luas yang cenderung merangkumi pembelajaran mesin, kecerdasan buatan, analitik sebab akibat ramalan dan analitik preskriptif
  • Berurusan dengan semua jenis data, termasuk data berstruktur dan tidak berstruktur
  • Bertujuan untuk membina produk tertumpu data dan membuat keputusan berdasarkan data
  • Memberi tumpuan kepada kajian saintifik data dan corak

Perlombongan Data

  • Merupakan subset sains data yang merangkumi pembersihan data, analisis statistik dan pengecaman corak, dan kadangkala termasuk visualisasi data, pembelajaran mesin dan transformasi data
  • Berurusan terutamanya dengan data berstruktur, bukan data tidak berstruktur
  • Bertujuan untuk mengambil data daripada pelbagai sumber dan menjadikannya boleh digunakan
  • Fokus kepada amalan perniagaan

Apakah yang dilakukan oleh saintis data?

Seorang Saintis Data menganalisis set data besar untuk mencungkil corak dan arah aliran yang membawa kepada cerapan perniagaan yang boleh diambil tindakan dan membantu organisasi menyelesaikan masalah rumit atau mengenal pasti peluang untuk hasil dan pertumbuhan. Seorang Saintis Data boleh bekerja dalam hampir semua bidang dan mesti mahir dalam mengendalikan set data berstruktur dan tidak berstruktur. Ia merupakan kerja pelbagai disiplin dan untuk menjadi seorang Saintis Data, anda mesti mempunyai pemahaman tentang matematik, sains komputer, perniagaan dan komunikasi untuk melaksanakan tugas anda dengan berkesan.

Walaupun tugas dan tanggungjawab kerja khusus seorang Saintis Data akan berbeza-beza bergantung pada industri, jawatan dan organisasi, kebanyakan peranan Saintis Data akan merangkumi bidang tanggungjawab berikut:

Penyelidikan

Seorang Saintis Data perlu memahami peluang dan titik kesakitan khusus untuk kedua-dua industri dan syarikat individu.

Menyediakan data

Sebelum sebarang cerapan berharga ditemui, Ahli Saintis Data mesti menentukan set data yang berguna dan relevan sebelum mengumpul, mengekstrak, membersihkan dan menggunakan data berstruktur dan tidak berstruktur daripada pelbagai sumber.

Mencipta model dan algoritma

Menggunakan pembelajaran mesin dan prinsip kecerdasan buatan, Saintis Data mesti mampu mencipta dan menggunakan algoritma yang diperlukan untuk melaksanakan alatan automasi.

Analisis data

Adalah penting bagi seorang Saintis Data untuk dapat menganalisis data mereka dengan cepat untuk mengenal pasti corak, arah aliran dan peluang.

Visualisasi dan Komunikasi

Seorang Saintis Data mesti dapat menceritakan kisah yang ditemui melalui data dengan mencipta dan menyusun papan pemuka dan visualisasi yang menarik dari segi estetika, sambil juga memiliki kemahiran komunikasi untuk meyakinkan pihak berkepentingan dan ahli pasukan lain bahawa penemuan dalam data itu patut diambil tindakan.

Tinjauan Kemahiran Digital BrainStation yang terbaharu mendapati bahawa profesional data menghabiskan sebahagian besar masa mereka untuk perbalahan dan pembersihan data. Responden juga membuat kesimpulan bahawa objektif kerja mereka paling kerap ialah pengoptimuman platform, produk atau sistem sedia ada (45 peratus), atau pembangunan yang baharu (42 peratus).

Jenis Sains Data

Bidang Sains Data yang lebih luas menggabungkan banyak disiplin yang berbeza, termasuk:

Kejuruteraan data

Mereka bentuk, membina, mengoptimumkan, menyelenggara dan mengurus infrastruktur yang menyokong data serta aliran data di seluruh organisasi.

Penyediaan data

Membersih dan mengubah data.

Perlombongan data

Mengekstrak (dan kadangkala membersihkan dan mengubah) data yang boleh digunakan daripada set data yang lebih besar.

Analisis ramalan

Menggunakan data, algoritma dan teknik pembelajaran mesin untuk menganalisis kemungkinan pelbagai kemungkinan hasil masa hadapan berdasarkan analisis data.

Pembelajaran mesin

Mengautomasikan pembinaan model analisis dalam proses analisis data untuk belajar daripada data, menemui corak dan memperkasakan sistem untuk membuat keputusan tanpa banyak campur tangan manusia.

Visualisasi data

Menggunakan elemen visual (termasuk graf, peta dan carta) untuk menggambarkan cerapan yang ditemui dalam data dengan cara yang boleh diakses supaya khalayak dapat memahami arah aliran, outlier dan corak yang terdapat dalam data.

Faedah Sains Data

Syarikat dalam semua industri di semua bahagian dunia menumpukan lebih banyak wang, masa dan perhatian kepada sains data dan ingin menambah Saintis Data kepada pasukan mereka. Penyelidikan menunjukkan bahawa syarikat yang benar-benar menerima pembuatan keputusan berasaskan data adalah lebih produktif, menguntungkan dan cekap daripada persaingan.

Sains data adalah penting untuk membantu organisasi mengenal pasti masalah dan peluang yang betul sambil membantu membentuk gambaran yang jelas tentang gelagat dan keperluan pelanggan dan pelanggan, prestasi pekerja dan produk serta potensi isu masa depan.

Sains data boleh membantu syarikat:

  • Buat keputusan yang lebih baik
  • Ketahui lebih lanjut tentang pelanggan dan pelanggan
  • Manfaatkan trend
  • Jangka masa depan

Bagaimanakah sains data boleh meningkatkan nilai untuk syarikat?

Sains data adalah pelaburan yang semakin popular untuk perniagaan kerana potensi ROI untuk membuka kunci nilai data besar adalah besar. Sains data adalah pelaburan yang layak kerana:

    Ia mengalih keluar tekaan dan memberikan cerapan yang boleh diambil tindakan.Syarikat membuat keputusan yang lebih baik dikuasakan oleh data dan bukti yang boleh diukur.Syarikat lebih memahami tempat mereka dalam pasaran.Sains data akan membantu syarikat menganalisis persaingan, meneroka contoh sejarah dan membuat pengesyoran berasaskan nombor.Ia boleh dimanfaatkan untuk mengenal pasti bakat terbaik.Bersembunyi dalam data besar adalah banyak cerapan tentang produktiviti, kecekapan pekerja dan prestasi keseluruhan. Data juga boleh digunakan untuk merekrut dan melatih bakat.Anda akan mengetahui segala-galanya tentang khalayak sasaran, pelanggan atau pengguna anda.Semua orang sedang menjana dan mengumpul data sekarang, dan syarikat yang tidak melabur dengan betul dalam sains data hanya mengumpulkan lebih banyak data daripada yang mereka tahu apa yang perlu dilakukan. Cerapan tentang tingkah laku, keutamaan dan keutamaan pelanggan atau pelanggan yang lalu atau bakal pelanggan adalah tidak ternilai, dan mereka hanya menunggu untuk ditemui oleh Saintis Data yang berkelayakan.

Gaji untuk Saintis Data

Walaupun gaji untuk Saintis Data sangat berbeza mengikut wilayah dan industri, gaji purata untuk Saintis Data di A.S. dilaporkan berada di antara $96,000 hingga $113,000, bergantung pada sumber. Seorang Saintis Data Kanan boleh membawa masuk kira-kira $130,000 secara purata.

Permintaan untuk Saintis Data

Saintis Data mendapat permintaan tinggi dan kekurangan bekalan merentasi hampir semua industri. Laporan oleh Deloitte Access Economics mendapati bahawa 76 peratus perniagaan merancang untuk meningkatkan perbelanjaan pada tahun-tahun berikutnya untuk keupayaan analisis data, manakala IBM meramalkan lonjakan 28 peratus dalam permintaan sains data pada awal dekad.

Biro Statistik Buruh A.S. telah mengunjurkan pertumbuhan 31 peratus dalam sains data dalam tempoh 10 tahun akan datang. Sementara itu, Laporan Pasaran dan Pasaran mendapati bahawa pasaran global untuk data besar diramalkan berkembang kepada $229.4 bilion menjelang 2025, dengan platform sains data meningkat 30 peratus menjelang 2024.

Di mana-mana di dunia, nampaknya, pelaburan dalam sains data dijangka meningkat dan, dengan itu, permintaan untuk Saintis Data.

Apakah Alat yang Digunakan oleh Saintis Data?

Saintis Data menggunakan pelbagai alat dan program yang berbeza untuk aktiviti termasuk analisis data, pembersihan data dan mencipta visualisasi.

Python ialah bahasa pengaturcaraan teratas untuk Data Saintis yang ditinjau dalam Tinjauan Kemahiran Digital BrainStation. Bahasa pengaturcaraan tujuan umum, Python berguna untuk aplikasi Pemprosesan Bahasa Kebangsaan dan analisis data. R juga sering digunakan untuk analisis data dan perlombongan data. Untuk pemecahan nombor yang lebih berat, alat berasaskan Hadoop seperti Hive adalah popular. Untuk pembelajaran mesin, Saintis Data mungkin memilih daripada pelbagai alatan termasuk h2o.ai, TensorFlow, Apache Mahout dan Accord.Net. Alat visualisasi juga merupakan bahagian penting daripada senjata Saintis Data. Program seperti Tableau, PowerBI, Bokeh, Plotly dan Infogram membantu Saintis Data mencipta rajah yang menarik secara visual, peta haba, grafik, plot serakan dan banyak lagi.

Saintis Data juga harus sangat selesa dengan kedua-dua SQL (digunakan merentasi pelbagai platform, termasuk MySQL, Microsoft SQL dan Oracle) dan program hamparan (biasanya Excel).

Apakah Kemahiran yang Diperlukan oleh Saintis Data?

Terdapat beberapa kemahiran yang semua calon Saintis Data dan harus membangunkan, termasuk:

    Excel.Alat yang paling banyak digunakan untuk 66 peratus profesional data yang ditinjau dalam Tinjauan Kemahiran Digital BrainStation, Excel masih penting untuk Saintis Data.SQL.Bahasa pertanyaan ini amat diperlukan dalam pengurusan pangkalan data dan ia digunakan oleh kira-kira separuh daripada responden data.Pengaturcaraan statistik.Python dan R biasanya digunakan oleh Saintis Data untuk menjalankan ujian, mencipta model dan menjalankan analisis set data yang besar.Visualisasi data.Alat seperti Tableau, Plotly, Bokeh, PowerBl dan Matplotlib membantu Saintis Data mencipta perwakilan visual yang menarik dan boleh diakses bagi penemuan mereka.

Laluan Kerjaya Saintis Data

Sebagai profesion yang agak baharu, laluan kerjaya Saintis Data tidak ditulis dalam batu, dan ramai orang mencari jalan ke sains data daripada latar belakang dalam sains komputer, IT, matematik dan perniagaan. Tetapi empat paksi utama untuk laluan kerjaya Saintis Data secara amnya ialah data, kejuruteraan, perniagaan dan produk. Banyak peranan pelbagai disiplin dalam sains data memerlukan penguasaan beberapa atau semua bidang tersebut.

Orang yang bekerja dalam sains data berada di barisan hadapan dalam perubahan teknologi yang paling memberi kesan pada masa hadapan. Oleh kerana sains data boleh menyumbang kepada kemajuan dalam hampir semua bidang lain, Saintis Data berada dalam kedudukan untuk menyelidik lebih lanjut dalam segala-galanya daripada kewangan dan perdagangan kepada statistik aktuari, tenaga hijau, epidemiologi, perubatan dan farmaseutikal, telekomunikasi - senarai itu hampir tidak berkesudahan. Setiap industri memperdagangkan jenis datanya yang berbeza, memanfaatkannya dengan cara yang berbeza untuk mencapai matlamat yang berbeza. Walau apa pun perkara itu berlaku, Saintis Data boleh membimbing membuat keputusan yang lebih baik, sama ada dalam pembangunan produk, analisis pasaran, pengurusan perhubungan pelanggan, sumber manusia atau sesuatu yang lain sepenuhnya.

Bukan sahaja aplikasi untuk sains data luas, menyentuh banyak sektor yang berbeza, tetapi terdapat pelbagai jenis sains data juga. Apa yang dikongsi oleh semua aktiviti ini ialah kesemuanya cuba menukar data kepada pengetahuan. Lebih tepat lagi, Saintis Data menggunakan pendekatan berkaedah untuk menyusun dan menganalisis data mentah untuk mengenal pasti corak dari mana maklumat berguna boleh dikenal pasti atau disimpulkan.

Memandangkan skop kesannya, tidak hairanlah bahawa Saintis Data menduduki jawatan yang sangat berpengaruh – dan sangat memerlukan. Walaupun jalan untuk menjadi seorang Saintis Data mungkin mencabar, kini terdapat lebih banyak sumber untuk calon Saintis Data berbanding sebelum ini, dan lebih banyak peluang untuk mereka membina jenis kerjaya yang mereka inginkan.

Tetapi untuk semua cara Saintis Data boleh menyumbang kepada industri yang berbeza, dan semua laluan kerjaya berbeza yang boleh diikuti oleh Saintis Data, jenis kerja yang mereka lakukan boleh dipecahkan kepada beberapa kategori utama. Tidak semua sains data sesuai dengan kumpulan ini, terutamanya di barisan hadapan sains komputer, di mana asas baharu terus dipecahkan - tetapi mereka akan memberi anda sedikit idea tentang cara Saintis Data mengubah data menjadi cerapan.

Perangkaan

Di tengah-tengah sains data, statistik ialah bidang matematik yang menerangkan ciri-ciri berbeza bagi set data, sama ada nombor, perkataan, imej atau beberapa jenis maklumat boleh diukur yang lain. Kebanyakan statistik tertumpu pada hanya mengenal pasti dan menerangkan perkara yang ada - terutamanya dengan set data yang sangat besar, hanya mengetahui perkara yang dilakukan dan tidak disertakan oleh maklumat adalah satu tugas untuk dirinya sendiri. Dalam bidang sains data, ini sering dipanggil analisis deskriptif. Tetapi statistik boleh pergi lebih jauh, menguji untuk melihat sama ada andaian anda tentang perkara dalam data adalah betul, atau, jika ia betul, sama ada ia penting atau berguna. Ini boleh melibatkan bukan sahaja memeriksa data, tetapi juga memanipulasinya untuk mengeluarkan ciri-ciri menonjolnya. Terdapat banyak cara yang berbeza untuk melakukan ini - regresi linear, regresi logistik dan analisis diskriminasi, kaedah pensampelan yang berbeza, dan sebagainya - tetapi akhirnya, setiap teknik ini adalah tentang memahami ciri set data dan seberapa tepat ciri ini. mencerminkan beberapa kebenaran bermakna tentang dunia yang sesuai dengannya.

Analisis data

Walaupun ia dibina di atas asas statistik, analisis data pergi sedikit lebih jauh, dari segi memahami kausaliti, visualisasi dan menyampaikan penemuan kepada orang lain. Jika statistik menetapkan untuk menentukan apa dan bila set data, analisis data cuba mengenal pasti sebab dan bagaimana. Penganalisis Data melakukan ini dengan membersihkan data, meringkaskannya, mengubahnya, memodelkannya dan mengujinya. Seperti yang dinyatakan di atas, analisis ini tidak terhad kepada nombor sahaja. Walaupun banyak analisis data menggunakan data berangka, anda juga boleh menjalankan analisis pada jenis data lain - maklum balas pelanggan bertulis, sebagai contoh, atau siaran media sosial, malah imej, audio dan video.

Salah satu matlamat utama Penganalisis Data ialah untuk memahami kausaliti, yang kemudiannya boleh digunakan untuk memahami dan meramalkan arah aliran merentas pelbagai aplikasi. Dalam analisis diagnostik, Penganalisis Data mencari korelasi yang mencadangkan sebab dan akibat, yang kemudiannya boleh digunakan cerapan untuk membantu mengubah suai hasil. Analisis ramalan juga mencari corak, tetapi kemudian memanjangkannya lagi, mengekstrapolasi trajektori mereka melangkaui data yang diketahui untuk membantu meramalkan bagaimana peristiwa tidak diukur atau hipotesis - termasuk peristiwa masa depan - mungkin berlaku. Bentuk analisis data yang paling maju ditetapkan untuk memberikan panduan tentang keputusan tertentu dengan memodelkan dan meramalkan hasil pelbagai pilihan untuk mengenal pasti tindakan yang paling sesuai.

Kepintaran buatan dan pembelajaran mesin

Salah satu kemajuan hebat yang berlaku pada masa ini dalam sains data - dan satu yang bersedia untuk memberikan pengaruh yang besar pada masa hadapan - ialah kecerdasan buatan, dan lebih khusus lagi, pembelajaran mesin. Secara ringkasnya, pembelajaran mesin melibatkan latihan komputer untuk melaksanakan tugas yang biasanya kami fikirkan memerlukan beberapa bentuk kecerdasan atau pertimbangan, seperti dapat mengenal pasti objek dalam foto. Ini biasanya dicapai dengan memberikan contoh yang banyak tentang jenis penentuan yang anda latih rangkaian untuk membuat. Seperti yang anda bayangkan, ini memerlukan kedua-dua rim data (biasanya berstruktur) dan keupayaan untuk mendapatkan komputer untuk memahami data tersebut. Kemahiran statistik yang kuat dan kemahiran pengaturcaraan adalah satu kemestian.

Kesan berfaedah pembelajaran mesin hampir tidak terhad, tetapi pertama sekali ialah keupayaan untuk melaksanakan tugas yang rumit atau berpanjangan dengan lebih cepat daripada mana-mana manusia yang pernah dapat, seperti mengenal pasti cap jari tertentu dari dalam repositori berjuta-juta imej, atau rujukan silang berpuluh-puluh pembolehubah dalam beribu-ribu fail perubatan untuk mengenal pasti persatuan yang mungkin menawarkan petunjuk kepada punca penyakit. Dengan data yang mencukupi, pakar pembelajaran mesin malah boleh melatih rangkaian saraf untuk menghasilkan imej asli, mengekstrak cerapan bermakna daripada kumpulan besar teks bertulis, membuat ramalan tentang arah aliran perbelanjaan masa depan atau peristiwa pasaran lain dan memperuntukkan sumber yang bergantung pada pengedaran yang sangat kompleks, seperti tenaga , dengan kecekapan maksimum. Faedah menggunakan pembelajaran mesin untuk melaksanakan tugasan ini, berbanding dengan bentuk automasi lain, ialah A.I yang tidak diselia. sistem secara automatik boleh belajar dan bertambah baik dari semasa ke semasa – walaupun tanpa pengaturcaraan baharu.

Perisikan perniagaan

Seperti yang mungkin anda duga daripada rujukan awal kepada acara pasaran, dunia perniagaan dan kewangan ialah salah satu tempat yang pembelajaran mesin telah memberi kesan terawal dan paling mendalam. Terima kasih kepada jumlah besar data berangka yang tersedia - pangkalan data pemasaran, tinjauan, maklumat perbankan, angka jualan dan sebagainya, yang kebanyakannya sangat teratur dan agak mudah untuk digunakan - Saintis Data dapat menggunakan statistik, analisis data dan pembelajaran mesin untuk mengekstrak cerapan tentang pelbagai aspek dunia perniagaan, membimbing membuat keputusan dan mengoptimumkan hasil, sehingga perisikan perniagaan telah menjadi bidang sains data sendiri.

Selalunya, Pembangun Perisikan Perniagaan tidak hanya melihat apa sahaja data yang tersedia untuk melihat perkara yang boleh mereka temui; mereka secara proaktif mengejar pengumpulan data dan membangunkan teknik dan produk untuk menjawab soalan khusus dan mencapai matlamat tertentu. Dalam pengertian itu, Pembangun dan Penganalisis Perisikan Perniagaan adalah penting untuk pembangunan strategik dalam dunia perniagaan dan kewangan – membantu kepimpinan membuat keputusan yang lebih baik dan menjadikannya lebih pantas, memahami pasaran untuk mengenal pasti peluang dan cabaran perniagaan, dan meningkatkan kecekapan keseluruhan sistem dan operasi perniagaan, semuanya dengan matlamat menyeluruh untuk mencapai kelebihan daya saing dan meningkatkan keuntungan.

Kejuruteraan data

Bidang pengajian utama terakhir yang sering dikerjakan oleh Saintis Data terdiri daripada pelbagai jenis jawatan yang berbeza - Jurutera Data, Arkitek Sistem, Arkitek Aplikasi, Arkitek Data, Arkitek Perusahaan atau Arkitek Infrastruktur, untuk menamakan beberapa sahaja. Setiap peranan ini mempunyai set tanggungjawabnya sendiri, dengan beberapa perisian membangunkan, yang lain mereka bentuk sistem IT, dan yang lain lagi menjajarkan struktur dan proses dalaman syarikat dengan teknologi yang digunakan untuk meneruskan strategi perniagaannya. Apa yang menghubungkan mereka semua ialah Saintis Data yang bekerja dalam bidang ini menggunakan data dan teknologi maklumat untuk mencipta atau menambah baik sistem dengan fungsi tertentu dalam fikiran.

Seorang Arkitek Aplikasi, sebagai contoh, memerhati cara perniagaan atau perusahaan lain menggunakan penyelesaian teknologi tertentu, kemudian mereka bentuk dan membangunkan aplikasi (termasuk perisian atau infrastruktur IT) untuk prestasi yang lebih baik. Seorang Arkitek Data juga membangunkan aplikasi - dalam kes ini, penyelesaian untuk penyimpanan data, pentadbiran dan analisis. Seorang Arkitek Infrastruktur mungkin membangunkan penyelesaian menyeluruh yang digunakan syarikat untuk menjalankan perniagaan harian bagi memastikan penyelesaian tersebut memenuhi keperluan sistem syarikat, sama ada di luar talian atau dalam awan. Jurutera Data, bagi pihak mereka, menumpukan pada pemprosesan data, menyusun dan melaksanakan saluran paip data yang mengumpul, menyusun, menyimpan, mendapatkan semula dan memproses data organisasi. Dalam erti kata lain, ciri penentu kategori luas sains data ini ialah ia melibatkan mereka bentuk dan membina sesuatu: sistem, struktur dan proses yang menggunakan sains data dijalankan.

Apakah Pekerjaan Sains Data Yang Paling Diminta?

Sains data secara amnya ialah kemahiran yang sangat diminati, jadi terdapat banyak peluang besar untuk ditemui dalam setiap bidang dan kepakaran bidang tersebut. Malah, pada 2019, LinkedIn menyenaraikan Data Scientist sebagai pekerjaan paling menjanjikan tahun ini, dan QuantHub meramalkan kekurangan saintis Data berkelayakan yang teruk pada tahun hadapan.

Kata kunci di sini adalah layak. Selalunya, keperluan teknikal yang mesti dipenuhi oleh Saintis Data adalah sangat spesifik sehingga memerlukan beberapa tahun pengalaman bekerja dalam industri untuk membina julat kecekapan yang diperlukan, bermula sebagai generalis, kemudian perlahan-lahan menambah lebih banyak kebolehan dan kebolehan untuk set kemahiran mereka.

Ini hanyalah beberapa cara paling biasa Data Saintis boleh melakukannya – terdapat banyak laluan kerjaya yang berpotensi seperti yang terdapat dalam Data Saintis, tetapi dalam setiap kes, kemajuan kerjaya bergantung pada memperoleh kemahiran dan pengalaman baharu dari semasa ke semasa.

Penganalisis Data

Seperti namanya, Penganalisis Data menganalisis data - tetapi tajuk pendek itu hanya menangkap sebahagian kecil daripada perkara yang sebenarnya boleh dicapai oleh Penganalisis Data. Untuk satu perkara, data jarang dimulakan dalam bentuk yang mudah digunakan, dan biasanya Penganalisis Data yang bertanggungjawab untuk mengenal pasti jenis data yang diperlukan, mengumpul dan memasangnya, dan kemudian membersihkan dan mengaturnya – menukarnya menjadi lebih borang yang boleh digunakan, menentukan kandungan sebenarnya dalam set data, mengalih keluar data yang rosak dan menilai ketepatannya. Kemudian terdapat analisis itu sendiri - menggunakan teknik yang berbeza untuk memeriksa dan memodelkan data, mencari corak, mengekstrak makna daripada corak tersebut dan mengekstrapolasi atau memodelkannya. Akhir sekali, Penganalisis Data menyediakan cerapan mereka kepada orang lain dengan mempersembahkan data dalam papan pemuka atau pangkalan data yang boleh diakses oleh orang lain, dan menyampaikan penemuan mereka kepada orang lain melalui pembentangan, dokumen bertulis dan carta, graf dan visualisasi lain.

Laluan kerjaya Penganalisis Data

Penganalisis Data ialah titik masuk yang sangat baik ke dalam dunia Sains Data; ia boleh menjadi kedudukan peringkat permulaan, bergantung pada tahap kepakaran yang diperlukan. Penganalisis Data Baharu biasanya memasuki bidang itu terus dari sekolah - dengan ijazah dalam statistik, matematik, sains komputer atau yang serupa - atau beralih kepada analisis data daripada bidang berkaitan seperti perniagaan, ekonomi, atau sains sosial, biasanya dengan menaik taraf mereka kemahiran pertengahan kerjaya melalui bootcamp analisis data atau program pensijilan yang serupa.

Tetapi sama ada mereka graduan baru atau profesional berpengalaman yang membuat perubahan pertengahan kerjaya, Saintis Data baharu biasanya bermula dengan menjalankan tugas rutin seperti memperoleh dan memanipulasi data dengan bahasa seperti R atau SQL, membina pangkalan data, melakukan analisis asas dan menjana visualisasi menggunakan program seperti Tableau. Bukan setiap Penganalisis Data perlu tahu cara melakukan semua perkara ini – mungkin terdapat pengkhususan, walaupun dalam jawatan yang lebih rendah – tetapi anda sepatutnya dapat melaksanakan semua tugas ini jika anda berharap untuk maju dalam kerjaya anda. Fleksibiliti adalah aset yang hebat pada peringkat awal ini.

Cara anda maju sebagai Penganalisis Data bergantung sedikit sebanyak pada industri yang anda bekerja - pemasaran, contohnya, atau kewangan. Bergantung pada sektor dan jenis kerja yang anda lakukan, anda boleh memilih untuk mengkhusus dalam pengaturcaraan dalam Python atau R, menjadi pakar dalam pembersihan data, atau menumpukan perhatian semata-mata pada membina model statistik yang kompleks atau menghasilkan visual yang cantik; sebaliknya, anda juga boleh memilih untuk mempelajari serba sedikit tentang segala-galanya, menetapkan anda untuk menjawat jawatan kepimpinan semasa anda menyandang gelaran Penganalisis Data Kanan. Dengan pengalaman yang luas dan mendalam, Penganalisis Data Kanan bersedia untuk mengambil peranan kepimpinan yang menyelia pasukan Penganalisis Data yang lain, akhirnya menjadi pengurus atau pengarah jabatan. Dengan latihan kemahiran tambahan, Penganalisis Data juga berada dalam kedudukan yang kukuh untuk beralih ke kedudukan Saintis Data yang lebih maju.

Saintis Data

Pakar Data Saintis biasanya boleh melakukan semua perkara yang boleh dilakukan oleh Penganalisis Data, ditambah dengan beberapa perkara lagi selain - sebenarnya, dengan latihan dan pengalaman yang betul, Penganalisis Data akhirnya boleh naik ke kedudukan Saintis Data. Jadi ya, Saintis Data seharusnya dapat memperoleh, membersihkan, memanipulasi, menyimpan dan menganalisis data – tetapi juga memahami dan bekerja dengan kaedah pembelajaran mesin yang berbeza, dan boleh memprogram dalam Python, R, atau bahasa pengaturcaraan statistik yang serupa untuk membina dan menilai model yang lebih maju.

Laluan kerjaya Saintis Data

Ramai orang memasuki bidang sebagai Penganalisis Data sebelum memperoleh pengalaman dan menambah kemahiran yang diperlukan untuk memanggil diri mereka Saintis Data. Kemudian, daripada Junior Data Scientist, langkah seterusnya lazimnya ialah Senior Data Scientist – walaupun perubahan ringkas dalam tajuk itu menafikan kerja yang diperlukan untuk membuat peralihan itu; Saintis Data Kanan sama ada akan menguasai pemahaman yang lebih baik tentang hampir semua aspek sains data - A.I., pergudangan data, perlombongan data, pengkomputeran awan dan sebagainya - sebagai tambahan kepada kebiasaan mereka dengan bidang khusus industri seperti strategi perniagaan atau analisis penjagaan kesihatan , atau mereka akan pakar dalam salah satu bidang ini dengan kepakaran peringkat guru.

Perlu dinyatakan bahawa sementara sesetengah Saintis Data memulakan kerjaya mereka dalam analitik dan berusaha ke jawatan yang lebih kanan dalam bidang khusus seperti psikologi, pemasaran, ekonomi dan sebagainya, yang lain bermula sebagai profesional dalam salah satu bidang yang berbeza sebelum beralih kepada data peranan sains.

Bagi kebanyakan orang, Saintis Data Kanan ialah matlamat kerjaya utama; ini sudah menjadi peranan yang begitu maju untuk memastikan bahawa, sekurang-kurangnya dalam bidang sains data, ia selalunya merupakan jawatan paling kanan yang boleh dicapai - anda hanya menjadi seorang Saintis Data Kanan yang lebih baik dan berkebolehan dengan bidang pengkhususan yang lebih luas. Walau bagaimanapun, bagi sesetengah orang, terutamanya mereka yang mengambil pendekatan yang lebih umum, adalah mungkin untuk membuat kemajuan lebih lanjut ke dalam kedudukan pengurusan seperti Ketua Saintis Data, menjalankan pasukan atau jabatan, malah Ketua Pegawai Data, mengetuai strategi data institusi pada tahap tertinggi dan hanya menjawab kepada CEO.

Jurutera Data

Apa yang membezakan Jurutera Data daripada profesional lain yang bekerja dalam bidang data ialah hakikat bahawa mereka mereka bentuk dan membina keseluruhan sistem – termasuk infrastruktur dan proses yang digunakan oleh syarikat untuk memanfaatkan sepenuhnya data tersebut. Maksudnya, Jurutera Data ialah orang yang menentukan cara Ahli Sains Data lain boleh melakukan tugas mereka. Apakah bentuk data yang boleh ditampung oleh sistem syarikat? Apakah kaedah yang digunakan untuk mengumpul data daripada jualan dan pemasaran, atau hasil tinjauan penjagaan kesihatan, dan menjadikannya tersedia untuk analisis? Untuk melakukan ini, Jurutera Data perlu sangat mengenali jenis kerja yang profesional sains data lain lakukan - Pentadbir Pangkalan Data, Penganalisis Data, Arkitek Data dan sebagainya - sehingga Jurutera Data sering boleh melaksanakan setiap peranan ini sebagai baiklah. Tetapi kerana mereka adalah pembina, Jurutera Data biasanya menghabiskan lebih banyak masa bekerja pada pembangunan berbanding profesional sains data lain - menulis program perisian, membina pangkalan data hubungan atau membangunkan alatan yang membenarkan syarikat berkongsi data antara jabatan.

Laluan kerjaya Jurutera Data

Seperti pekerjaan lain yang bekerja dalam data, langkah pertama untuk menjadi Jurutera Data selalunya ijazah universiti (biasanya sarjana muda atau sarjana dalam kejuruteraan, sains komputer atau matematik) - tetapi tidak selalu. Seseorang yang mempunyai banyak pengalaman bekerja dalam IT atau pembangunan perisian mungkin mendapati mereka sudah mempunyai semua kemahiran yang diperlukan untuk menjadi Jurutera Data kecuali kemahiran data itu sendiri, yang mana beberapa latihan semula kemahiran, seperti kem boot data, boleh membantu untuk membawa mereka. sehingga laju. Banyak kemahiran yang diperlukan oleh Jurutera Data (seperti SQL, UNIX dan Linux, pembangunan ETL atau mengkonfigurasi sistem IT) boleh dibangunkan dengan bekerja dalam bidang bersebelahan; yang lain (seperti pembelajaran mesin atau membina saluran paip data) memerlukan pembelajaran yang lebih fokus.

Walaupun begitu, kebanyakan Jurutera Data memulakan kerjaya mereka bekerja dalam beberapa subbidang sains komputer sebelum memperoleh semua kemahiran yang diperlukan untuk menjadi Jurutera Data Muda - sememangnya, kebanyakan penyiaran kerja untuk Jurutera Data Muda memerlukan pengalaman kerja antara satu hingga lima tahun. Dari situ, langkah logik seterusnya ialah Jurutera Data Kanan dan Jurutera Data Utama. Tetapi, dengan penguasaan mereka terhadap begitu banyak aspek IT, kejuruteraan perisian dan sains data, terdapat banyak jawatan lain yang terbuka kepada Jurutera Data juga - termasuk Arkitek Data, Arkitek Penyelesaian atau Arkitek Aplikasi. Bagi seseorang yang ingin melakukan kurang kerja tangan dan lebih banyak pengurusan pekerja, pilihan lain termasuk Pengurus Pembangunan Produk – atau, akhirnya, diberikan kemahiran orang yang betul, malah Ketua Pegawai Data atau Ketua Pegawai Maklumat.

Bolehkah Saintis Data Bekerja Dari Rumah?

Seperti kebanyakan pekerjaan dalam bidang teknologi, peranan Data Scientist selalunya boleh dilakukan dari jauh—tetapi ini akhirnya bergantung pada syarikat yang anda bekerja dan jenis kerja yang anda lakukan.

Bilakah Saintis Data Boleh Bekerja Dari Jauh?

Kedudukan sains data yang berfungsi dengan data dan maklumat yang sangat sensitif atau sulit (yang termasuk sebilangan besar daripadanya, walaupun di luar bidang yang berat privasi seperti perbankan dan penjagaan kesihatan, kerana data proprietari boleh menjadi salah satu aset syarikat yang paling berharga) akan mendapati mereka menghadapi lebih banyak sekatan berkaitan dengan kerja jauh. Dalam kes ini, kemungkinan besar anda akan dikehendaki bekerja di pejabat semasa waktu bekerja.

Beberapa faktor lain yang perlu dipertimbangkan:

  • Betapa tradisional syarikat anda. Syarikat yang lebih besar dan lama biasanya tidak mesra jauh—walaupun COVID mungkin telah membawa perubahan besar dalam bidang ini.
  • Betapa mudahnya anda boleh bekerja dengan rakan sepasukan dan jabatan lain dari jauh. Jika kerja anda sangat kolaboratif, kemungkinan besar anda akan diminta untuk hadir sendiri.
  • Saintis Data yang bekerja secara kontrak—atau pun atas dasar perundingan—mungkin juga mempunyai lebih fleksibiliti untuk memilih lokasi mereka sendiri.

Kategori: Berita