Sehari dalam Kehidupan Saintis Data

Panduan kerjaya Data Scientist BrainStation boleh membantu anda mengambil langkah pertama ke arah kerjaya yang menguntungkan dalam sains data. Teruskan membaca untuk mendapatkan gambaran keseluruhan tentang cara Saintis Data menghabiskan hari mereka di tempat kerja.

Menjadi Ahli Sains Data

Bercakap dengan Penasihat Pembelajaran untuk mengetahui lebih lanjut tentang cara bootcamp dan kursus kami boleh membantu anda menjadi seorang Saintis Data.

Dengan mengklik Hantar, anda menerima kami Syarat .



Hantar

Tidak dapat menyerahkan! Muat semula halaman dan cuba lagi?

Ketahui lebih lanjut tentang Bootcamp Sains Data kami

Terima kasih!

Kami akan berhubung tidak lama lagi.

Lihat halaman Bootcamp Sains Data

Sehari dalam Kehidupan Saintis Data

Daripada semua disiplin yang diperiksa dalam Tinjauan Kemahiran Digital Brainstation, sains data mungkin merangkumi julat aplikasi yang paling luas. Tetapi walaupun sains data telah wujud selama beberapa dekad, ia baru-baru ini berkembang sepenuhnya. Memandangkan ketersediaan data telah berkembang, syarikat telah menyedari betapa pentingnya sains data, kata Briana Brownell, Pengasas dan Ketua Pegawai Eksekutif Strategi Tulen, dan seorang Saintis Data selama 13 tahun. Setiap syarikat kini perlu memberi tumpuan separa pada teknologi. Hanya minggu ini, sebagai contoh, McDonald's membayar anggaran $300 juta USD untuk memperoleh firma data besarnya sendiri.

Maka, tidak hairanlah bahawa persaingan untuk Saintis Data adalah sangat tinggi. Dalam masa dua tahun sahaja, permintaan dijangka meningkat sebanyak 28 peratus, bersamaan dengan kira-kira 2.7 juta pekerjaan baharu. Itu lebih banyak peluang daripada graduan baharu yang dapat diisi—bermakna pekerja teknologi dalam bidang lain perlu meningkatkan kemahiran mereka dan beralih kepada data untuk memenuhi permintaan ini.

Malah, tinjauan kami mencadangkan ini sudah berlaku. Kira-kira empat daripada lima pakar data memulakan kerjaya mereka melakukan sesuatu yang lain, dan 65 peratus daripada semua Saintis Data telah bekerja di lapangan selama lima tahun atau kurang. Kemasukan besar minda baru ini mempunyai kesan dua mata, kata Brownell; di satu pihak, terdapat banyak idea baharu yang masuk, katanya. Apabila saya melihat beberapa kandungan yang keluar daripada komuniti sains data, saya terkejut betapa banyak inovasi yang ada. Sebaliknya, sebaliknya, adalah kecenderungan untuk mencipta semula roda.

Permintaan tinggi untuk Saintis Data adalah bagus jika anda seorang (atau berfikir untuk menjadi ahli sains), tetapi bagi majikan, pengambilan boleh menjadi satu cabaran yang menakutkan. Di sini, kemahiran semula adalah penyelesaian yang jelas; mungkin lebih menjimatkan kos untuk melatih semula pekerja semasa dalam sains data daripada mencari pekerja baharu.

Tetapi walaupun anda bercadang untuk mengupah pasukan sains data baharu, organisasi anda secara keseluruhan mungkin perlu mempertingkatkan literasi datanya, Brownell mengingatkan. Semua orang mahu mengusahakan sesuatu yang memberi kesan kepada tempat kerja mereka, yang menjadikan kehidupan orang lebih baik, katanya. Jika budaya syarikat anda tidak begitu [Saintis Data anda] boleh memberi kesan, hampir mustahil untuk diupah. Kepimpinan mestilah berupaya bukan sahaja untuk berkomunikasi dengan bakal pekerja bagaimana mereka boleh menyumbang—tetapi memahami cadangan yang akhirnya dikemukakan oleh pasukan sains data mereka juga.

Malangnya, Brownell berkata, majoriti yang tidak selesa adalah syarikat yang tidak memikirkan perkara itu. Tinjauan kami menyokong perkara ini: kebanyakan responden (52 peratus) menyifatkan tahap celik data merentas organisasi mereka sebagai asas, dengan perantaraan tindak balas paling biasa seterusnya (31 peratus). Ini menunjukkan bahawa beberapa latihan sains data asas boleh berguna untuk sebahagian besar syarikat—terutamanya dalam kepimpinan.

Keperluan untuk literasi data yang dipertingkatkan—dan komunikasi—ditingkatkan dengan cara kebanyakan pasukan sains data distrukturkan: sebagai pasukan diskret, biasanya dengan 10 orang atau kurang (mengikut 71 peratus responden), dan selalunya lima atau kurang (38 peratus ). Pasukan yang rapat ini tidak mampu untuk diasingkan. Individu yang bekerja dalam syarikat yang lebih besar biasanya berada dalam kumpulan khusus sains data yang kecil, dan pelanggan mereka adalah dalaman—bahagian lain dalam organisasi, jelas Brownell, jadi ia adalah pasukan yang perlu beroperasi merentasi pelbagai bidang organisasi.

Apakah Sebenarnya Sains Data?

Persepsi umum (bahawa Data Scientists memecahkan nombor) tidak terlalu jauh dari sasaran, kata Brownell. Terdapat banyak set data yang perlu mempunyai cerapan didedahkan daripada mereka, dan ini melibatkan banyak langkah seperti pembinaan model dan pembersihan data, malah hanya memutuskan data yang anda perlukan. Walau bagaimanapun, pada akhirnya, usaha ini berorientasikan matlamat: Pada asasnya, anda perlu melakukan sesuatu dengan data.

Untuk perkara itu, data tidak selalunya nombor. Walaupun majoriti responden (73 peratus) menyatakan mereka bekerja dengan data berangka, 61 peratus berkata mereka juga berfungsi dengan teks, 44 peratus dengan data berstruktur, 13 peratus dengan imej dan 12 peratus dengan grafik (dan minoriti kecil juga berfungsi dengan video dan audio —6 peratus dan 4 peratus masing-masing). Hasil tinjauan ini membayangkan cara sains data berkembang jauh melangkaui jadual kewangan, menyenaraikan orang untuk projek seperti memaksimumkan kepuasan pelanggan atau mengumpul cerapan berharga daripada hos api media sosial.

Akibatnya, terdapat pelbagai jenis dalam bidang sains data, kata Brownell. Setiap industri mempunyai pandangan sendiri tentang jenis data yang diusahakan oleh Data Scientists, jenis hasil yang mereka jangkakan dan cara ia sesuai dengan struktur kepimpinan syarikat mereka. Walau bagaimanapun, dalam setiap kes, matlamatnya adalah untuk memanfaatkan data untuk membantu syarikat membuat keputusan yang lebih baik. Ini mungkin menjadikan produk lebih baik, memahami pasaran yang ingin mereka terokai, mengekalkan lebih ramai pelanggan, memahami penggunaan tenaga buruh mereka, memahami cara mendapatkan pekerja yang baik—semua jenis perkara yang berbeza.

Pekerjaan Sains Data

Dalam sesetengah bidang teknologi, menjadi seorang generalis boleh menjadi langkah terbaik anda—tidak begitu dengan sains data. Majikan biasanya mencari kemahiran khusus untuk industri mereka. Oleh kerana sains data datang dalam pelbagai perisa yang berbeza, tinjauan kami menyiasat lebih mendalam, meneliti lima kategori pekerjaan utama: Penganalisis Data, Penyelidik, Penganalisis Perniagaan, Pengurus Data dan Analitis serta Saintis Data yang betul.

Dalam semua tajuk pekerjaan ini, perbalahan dan pembersihan data mengambil sebahagian besar masa seseorang—tetapi untuk tujuan apa? Selalunya, matlamatnya adalah untuk mengoptimumkan platform, produk atau sistem sedia ada (45 peratus), atau membangunkan platform baharu (42 peratus). Menggali lebih dalam, kami mendapati bahawa mengoptimumkan penyelesaian sedia ada cenderung kepada Penganalisis Perniagaan dan Penganalisis Data, manakala membangunkan penyelesaian baharu lebih kerap jatuh kepada Saintis dan Penyelidik Data.

Teknik yang digunakan Saintis Data juga berbeza mengikut pengkhususan. Regresi linear ialah alat biasa merentas semua kategori, dipetik oleh 54 peratus responden, tetapi terdapat beberapa kejutan apabila kami melihat perisian yang digunakan oleh orang ramai.

Excel—sesungguhnya manipulasi set data—hampir ada di mana-mana, dipetik oleh 81 peratus daripada semua responden, dan alat paling popular dalam setiap kategori kecuali Saintis Data (yang paling kerap bergantung pada Python—dan juga memetik kit alat yang lebih besar daripada kategori lain ). Apakah yang membuatkan Excel tidak dapat dielakkan, walaupun pada tahun 2019?

Perkara yang saya suka tentang Excel ialah bagaimana ia membolehkan anda melihat data dan mendapatkan rasa intuitif untuknya, jelas Brownell. Kami juga menggunakan banyak Python, dan dalam kes itu, apabila anda melakukan analisis pada fail data, ia tersembunyi; melainkan anda memprogramkan sebahagian kod anda secara khusus untuk melakukan visualisasi data mentah yang anda analisis, anda tidak melihatnya. Sedangkan dengan Excel, ia berada di hadapan anda. Itu mempunyai banyak kelebihan. Kadangkala anda boleh melihat isu dengan fail data. Saya tidak nampak Excel hilang daripada analisis.

Walau bagaimanapun, masih terdapat senarai panjang program lain yang digunakan dalam bidang itu-tidak mengejutkan memandangkan kepelbagaiannya. SQL (43 peratus) dan Python (26 peratus) mendahului dalam populariti, dengan Tableau (23 peratus), R (16 peratus), Jupyter Notebook (14 peratus), dan segelintir yang lain mencatatkan angka yang ketara—apatah lagi 32 peratus responden yang memetik alat lain, walaupun diberikan senarai yang sudah panjang ini.

Apakah Masa Depan Sains Data?

Akhirnya, kami bertanya apakah arah aliran yang akan membentuk landskap digital dalam tempoh lima hingga 10 tahun akan datang. Pembelajaran mesin dan AI—kedua-duanya mempunyai aplikasi dalam sains data—memang banyak perkembangan yang dijangkakan oleh responden memberi impak terbesar, masing-masing pada 80 peratus dan 79 peratus. Ini walaupun pada hakikatnya kurang daripada satu perempat (23 peratus) daripada mereka kini bekerja dengan AI.

Kecerdasan buatan benar-benar boleh mengubah sains data, mengesahkan Brownell, yang syarikatnya membangunkan produk AI. Itulah kemuliaan kaedah pembelajaran tanpa pengawasan. Kami hanya mempunyai banyak masa untuk melihat set data ini, dan terutamanya dengan set data yang besar, sangat sukar untuk melakukan segala-galanya. Alat AI boleh membantu mendedahkan sesuatu yang mungkin anda tidak terfikir untuk mencari. Kami pasti pernah mengalaminya.

Trend lain Saintis Data menjangkakan akan mendominasi dalam masa terdekat: Internet of things (51 peratus), blockchain (50 peratus) dan eCommerce (36 peratus), realiti tambahan dan realiti maya (38 peratus dan 27 peratus), dan juga suara- pengalaman berasaskan (25 peratus)—semua tayangan penting dan semua bidang di mana sains data boleh digunakan dengan baik.

Kategori: Berita