How to be a Data Scientist | Putri Cholidhazia , S.T., M.Kom. | Kuliah Kapita Selekta Ke-9
03 Juni 2022 | Via Zoom Meeting

Assalamualaikum wr,wb. Pada mingu kali ini, Pembicara yang akan memberikan materi di kuliah Kapita selekta pada minggu ke-enam, adalah Putri Cholidhazia , S.T., M.Kom. Dosen Teknik Informatika Universitas Al Azhar Indonesia Tahun 2022, yang sekarang bekerja di bidang Data Science , sebagai Data Science Trainer pada perusahaan PT Ilmu Data Indonesia. Pada minggu ini, Tema yang diangkat adalah Bagaimana cara nya menjadi Data Scientist dan juga apa saja yang diperlukan untuk menjadi Data scientist serta peluang karir apa saja yang tersedia bagi data scientist.

Dalam memulai karir sebagai Data scientist, seseorang harus mengetahui tiga tahapan awal dalam memulai karir sebagai data scientist. Tahapan yang pertama adalah Mempersiapkan diri, Seseorang harus mempersiapkan diri untuk menjadi seorang data scientist dengan cara belajar tentang Dasar — dasar dari Data itu sendiri, contohnya belajar tentang konsep big data, belajar tentang basic Database management, belajar tentang bidang karir Data scientist itu sendiri dan lainnya. Tahapan yang kedua adalah Fokus, artinya seseorang harus bisa konsisten dan fokus dalam mempelajari Hard skill yang berhubungan dengan data science. Tahapan yang terakhit adalah portofolio, artinya seseorang harus dapat membangun Pencapaian dalam membuat Personal branding terhadap diri sendiri.
Persiapan Diri — Latar Belakang Big Data

Definisi dari Big data adalah suatu Volume data yang besar milik suatu perusahaan yang bersifat terstruktur maupun yang tidak terstruktur. Data tersebut memiliki banyak jenis dan variasi, serta memiliki sifat tertentu seperti Rahasia atau tidak. Dalam pemanfaatan big data, tahapan pertama yang wajib dilakukan adalah Menganalisa data tersebut untuk pemahanan serta tujuan penggunaan data tersebut bagi suatu perusahaan. Dalam pemanfaatannya big data, perusahaan memerlukan seseorang yang mahir dalam bidang Data Science, karena dalam pengolahannya big data tidak dapat diolah secara manual, oleh karena itu harus dibutuhkan Data scientist untuk mengolah data tersebut secara otomatis.
Definisi Dan Posisi

Sistem database pada umumnya adalah awal dari pengembangan dari konsep Big Data, perbedaan yang mencolok adalah konsep Big data memiliki volume dan Jenis data serta kecepatan yang lebih besar daripada konsep Database konvensional pada umumnya. Konsep database biasanya digunakan untuk proyek yang memiliki Skala yang lebih kecil serta tidak memerlukan banyak aktor dalam pemrosesan nya, dan lebih bersifat open source karena dibantu oleh Software software seperti postgresql, Mysql, Mariadb dan software lainnya. sedangkan konsep Big data adalah memproses Data dengan Volume yang besar serta jenis dan variasi yang banyak menjadi data yang dapat digunakan untuk keperluan tertentu, oleh karena itu membutuhkan software khusus yang dapat melakukan hal-hal tersebut.
Bisa dilihat pada gambar diatas, Setelah data diambil dari Big data engine, data akan diproses ke tahap Data analytic and Visualization, yaitu proses yang dilakukan dalam menganalisa dan memvisualisasikan Volume data yang besar dengan berbagai metrik yang telah ditentukan sebelumnya. waktu dalam pemrosesan ini bisa dibilang sangat lama bisa sampai bertahun-tahun dukarenakan informasi serta volume dari data nya yang bisa dibilang sangat besar dan juga alasan kenapa pemrosesan ini sangat lama adalah untuk menghindari Error atau kesalahan dalam pemilihan informasi untuk penggunaan tertentu.
Setelah data di proses di tahap Data analytic and Visualization, data akan masuk ke proses Based Solution, dimana data yang sebelumnya sudah du analisa dan di visualisasi, akan di konversi kedalam bentuk informasi untuk penggunaan tertentu. Contohnya adalah Mendapatkan Solusi bagi suatu perusahaan, melakukan research tentang market pada suatu model bisnis, memecahkan suatu masalah yang kompleks, dan lainnya.
Perbedaan Business Intellegence dan Data Science

Bisa dilihat pada gambar diatas, perbedaan yang paling mendasar dari bidang Business intellegence dan Data scinece adalah, BI lebih berkiblat pada riset tentang Trend model bisnis yang saat ini terjadi, serta lebih berkiblat pada pengerjaan data-data dan laporan di dalam suatu perusahaan atau bisnis. Sedangkan Data science lebih berkiblat pada Pencarian suatu Korelasi, hubungan dan pola dari suatu Data secara Analitis, Prediktif, dan preskrptif. Bisa dibilang Business intelligence dapat menjadi batu loncatan awal dalam menerapkan data science.
Penerapan Data Science
Selain dapat digunakan sebagai pemecahan masalah dan peng-ekstrakan Informasi, Data science juga dapat digunakan sebagai Object Detection

Object Detection merupakan suatu kemampuan komputer dalam mendeteksi sejumlah objek pada suatu gambar atau video secara real time ataupun unrealtime. Data science disini berperan sebagai Pen-supply data untuk engine Object detection. Selain itu, Data science juga dapat di terapkan pada Self Driving car.

Self-driving car merupakan suatu konsep transportasi di mana mobil sepenuhnya dikendalikan oleh sistem komputer. Peran data science disini sama seperti sebelum nya, yaitu memberikan suatu data dan informasi yang dibutuhkan oleh sistem Self Driving car. Dan juga data science dapat diterapkan ke dalam Sistem Fraud Detection dan juga Recognition of handwriting digits.
Karir Data Scientist

Menurut IBM, Kebutuhan pekerja pada bidang data scientist akan melonjak sebesar 28% dan akan terus berlajut hingga beberapa tahun mendatang. Dalam survey yang melibatkan 11.000 responden, terlihat bahwa data scinece menempati peringkat posisi ketiga sebagai pekerjaan dengan total gaji tertinggi 13,7 juta / bulan dengan rata-rata gaji sebesar 9 juta / bulan.
Fokus dalam Bidang Data Scientist

Dalam mempelajari Bidang data science, kita sebagai Practitioner harus ering kali melakukan Trial and error, karena fokus utama dari seorang data scientist adalah analisa. Dalam terjun kedalam bidan data scince, kita wajib memiliki empat skill utama, yaitu Analisa, Problem solving, Basic Matematika, komunikasi dan Programming, serta database. Narasumber berpendapat bahwa jika seseorang ingin menjadi data scientist, ia harus minimal menguasai bahasa SQL dan bisa menangani Data dengan volume yang besar. selainitu, juga wajib menguasai dasar-dasar bahasa pemrograman berorientasi objek (OOP) seperti R dan Python. dan juga paham serta familiar dengan software DBMS seperti Mysql, Oracle, Postgresql, dan lainnya serta dapat bekerja dengan tim menggunakan Software seperti GIT, dan GIthub.
Portofolio

Dalam berkarir dalam bidang data scientist, seseorang wajib mempersiapkan diri mereka dengan cara membuat portofolio yang berisi pencapaian serta pengalaman mereka pada bidang yang ingin ia apply. Suatu portfolio dapat menjadi suatu acuan bagi seorang Recruiter untuk melihat Skill, pengalaman serta pencapaian yang dimiliki oleh seseorang. lalu pertanyaannya adalah, Bagaimana cara membuat portfolio pribadi kita ? salah satu cara yang umum adalah membuat akun Linkedin yang berisi segala skill, pengalaman, dan pencapaian kita. dan cara yang pintar adalah dengan membuat website pribadi yang berisi tentang portfolio kita sendiri dan berisi segala project, blog tentang pengalaman yang sudah kita lalui sebelumnya.