Analisis Data untuk Semua Orang

28 views

Analisis data adalah bagian dari pekerjaan sehari-hari setiap ilmuwan data (bersama dengan munging dan pembersihan data). Ini juga penting bagi banyak orang di dunia kerja modern, analis sistem, pemilik bisnis, tim keuangan, dan manajer proyek. Analisis Data untuk Semua Orang

Namun, sebagian besar program sarjana tidak (atau paling tidak, tidak) mengajarkan dasar-dasar analisis data dalam salah satu program mereka. Ada kursus matematika dan statistik, serta kursus pemrograman komputer yang melibatkan struktur data dan algoritma.

Namun, tidak satu pun dari ini berfokus pada cara melihat set data dari database, CSV, atau sumber data lainnya yang tersedia di dunia data modern.

Mungkin ada proyek sesekali yang membutuhkan analisis data. Beberapa orang mungkin cukup beruntung untuk menerima serangkaian proyek yang memaksa mereka untuk menganalisis data untuk pertama kalinya dari database.

Namun, sebagian besar siswa dibiarkan mencoba dan mencari tahu sendiri selama pekerjaan pertama mereka.

Bagi siswa yang tidak berencana menjadi programmer, memahami database dan SQL adalah keterampilan yang berharga. Ini memungkinkan mereka mengakses data yang dulunya hanya tersedia untuk tim basis data.

Manajer tidak lagi puas dengan tim mereka yang tidak memiliki akses ke data. Karena itu, semua orang perlu tahu cara bekerja, dan menyusun, analisis dari data!

Analisis data bersifat abstrak. Ini bukan matematika (meskipun matematika terlibat) dan bukan bahasa Inggris atau akuntansi. Dibutuhkan pendekatan langsung untuk benar-benar memahami jebakan yang akan ditemui para analis.

Namun, sebagian besar siswa belum berurusan dengan parameter yang tidak jelas dan kumpulan data besar pada saat mereka mendapatkan pekerjaan pertama mereka, yang memalukan! Banyak siswa bahkan belum pernah mendengar tentang data warehouse dan di sinilah sebagian besar data, yang membantu manajer membuat keputusan penting, berada.

Di dunia bisnis modern, analisis data tidak terbatas pada ilmuwan data. Ini juga penting untuk analis, insinyur sistem, tim keuangan, PR, SDM, pemasaran, dan sebagainya.

Dengan demikian, tim kami ingin membuat panduan untuk membantu siswa baru dan mereka yang tertarik untuk belajar lebih banyak tentang ilmu data dan analisis. Analisis Data untuk Semua Orang

 

Yayasan Ilmu Data Baik dan Analisis

Bagian pertama dari seri ini akan membahas soft skill penting yang diperlukan untuk analisis yang baik. Analisis data tidak hanya matematika, SQL, dan skrip. Ini juga tentang tetap terorganisir dan mampu mengartikulasikan kepada manajer penemuan yang telah digali.

Ini adalah salah satu dari banyak ciri yang digambarkan oleh tim sukses dalam ilmu data dan analitik. Penting untuk menunjukkan ini terlebih dahulu karena meletakkan dasar untuk sisa seri.
Setelah bagian ini, kita akan membahas proses analisis, teknik, dan memberikan contoh dengan set data, SQL dan notebook Python.

 

Komunikasi

Istilah pendongeng data telah berkorelasi dengan para ilmuwan data tetapi juga penting bagi siapa saja yang menggunakan data untuk pandai mengkomunikasikan temuan mereka.

Keterampilan-subset ini cocok dengan keterampilan komunikasi umum. Ilmuwan data memiliki akses ke berbagai sumber data dari berbagai departemen. Ini memberi mereka tanggung jawab dan kebutuhan untuk dapat menjelaskan dengan jelas apa yang mereka temukan kepada eksekutif dan UKM di berbagai bidang.

Mereka mengambil konsep matematika dan teknologi yang kompleks dan membuat pesan yang jelas dan ringkas yang dapat ditindaklanjuti oleh eksekutif. Analisis Data untuk Semua Orang

Mereka tidak bersembunyi di balik jargon mereka, tetapi mereka benar-benar menuliskan ide-ide rumit mereka menjadi bahasa bisnis. Analis dan ilmuwan data harus dapat mengambil angka dan mengembalikan ROI yang dinyatakan dengan jelas dan keputusan yang dapat ditindaklanjuti.

Ini berarti tidak hanya membuat catatan yang bagus dan membuat buku kerja yang solid. Ini juga berarti membuat laporan yang solid dan walk-through untuk tim lain.

Bagaimana kamu melakukannya? Ini bisa berupa pos sendiri tetapi berikut adalah beberapa kiat cepat untuk mengomunikasikan gagasan Anda dengan lebih baik dalam laporan atau presentasi.

  1. Beri label setiap gambar, sumbu, titik data, dll.
  2. uat aliran alami data dan catatan di buku catatan.
  3. Pastikan untuk menyoroti temuan utama Anda dan menjual kesimpulan Anda. Ini lebih mudah diucapkan daripada dilakukan ketika Anda memiliki banyak data untuk membuktikan maksud Anda.
  4. Bayangkan Anda sedang bercerita atau menulis esai dengan data.
  5. Jangan sampai audiens Anda mati, tetap manis dan to-the-point.
  6. Hindari jargon matematika yang berat! Jika Anda tidak bisa menjelaskan perhitungan dalam bahasa Inggris, Anda tidak akan memahaminya.
  7. Tinjau laporan dan presentasi Anda untuk memastikan kejelasan maksimal.
  8. Video Statistik terbaik yang pernah Anda lihat oleh Hans Rosling adalah contoh yang bagus dari penceritaan data.

 

Mendengarkan dengan empatik

Ilmuwan dan analis data tidak selalu berada di tim yang sama dengan pemilik bisnis dan manajer yang datang kepada mereka dengan pertanyaan. Ini membuatnya sangat penting bagi analis untuk mendengarkan dengan rajin apa yang diminta dari mereka.

Bekerja di perusahaan-perusahaan besar, ada banyak nilai dalam mencoba menemukan titik nyeri dan masalah tim lain dan membantu mereka melewatinya.

Ini berarti memiliki empati. Sebagian dari keterampilan ini membutuhkan pengalaman di dunia kerja dan bagian lain dari keterampilan ini hanya membutuhkan pemahaman manusia lain.

Mengapa mereka meminta analisis dan bagaimana Anda bisa membuatnya sejelas dan seakurat mungkin bagi mereka?

Miskomunikasi dengan pemilik bisnis dapat terjadi dengan mudah. Dengan demikian, kombinasi dari mendengarkan dengan tekun, serta mendengarkan apa yang tidak dikatakan, adalah aset besar.

 

Konteks Fokus

Selain difokuskan pada detail, analis data dan ilmuwan data juga perlu fokus pada konteks di balik data yang mereka analisis.

Ini berarti memahami kebutuhan departemen lain yang telah meminta proyek, serta benar-benar memahami proses di balik data yang mereka analisis.

Data biasanya mewakili proses bisnis. Ini bisa berupa pengguna yang berinteraksi dengan situs E-commerce, seorang pasien di rumah sakit, proyek yang disetujui, perangkat lunak yang dibeli dan ditagih, dan sebagainya.

Semua ini diwakili dalam ribuan gudang data dan basis data di seluruh dunia dan mereka seringkali disimpan hanya sedikit berbeda dengan aturan bisnis yang berbeda.

Itu berarti bahwa analis data perlu memahami aturan dan logika bisnis tersebut. Jika tidak, mereka tidak dapat melakukan analisis yang baik; mereka akan membuat asumsi yang buruk dan mereka akan sering membuat data kotor dan duplikat.

Semua karena mereka tidak mengerti konteksnya. Konteks memungkinkan tim yang berfokus pada data untuk membuat asumsi yang lebih jelas. Mereka tidak dipaksa untuk menghabiskan terlalu banyak waktu dalam fase hipotesis di mana mereka menguji setiap teori yang mungkin. Sebaliknya, mereka dapat menggunakan konteks untuk membantu mempercepat proses analisis mereka.

Metadata (mis. Konteks) di sekitar data, seperti emas bagi ilmuwan data. Itu tidak selalu ada, tetapi ketika itu ada, itu membuat pekerjaan kita lebih mudah.

 

Kecakapan Mencatat

Baik Anda menggunakan Excel atau Jupyter Notebook, penting bagi analis data untuk memahami cara melacak pekerjaan mereka.

Analisis membutuhkan banyak asumsi, pertanyaan, dan pemikiran jalur tunggal yang bisa hilang jika tidak dicatat.

Sangat mudah untuk kembali keesokan harinya dan melupakan apa yang dianalisis, bagaimana dan mengapa berbagai kueri dan metrik ditarik, dll. Dengan demikian, penting untuk mencatat semuanya dengan rajin. Itu tidak boleh dibiarkan keesokan harinya karena akan selalu ada kehilangan informasi.

Membuat gaya pencatatan yang jelas memudahkan semua orang yang terlibat. Kami mengemukakan ini sebelumnya, dalam komunikasi, tetapi kami akan menyebutkannya lagi.

Memberi label, menciptakan aliran alami catatan, dan menghindari jargon bisnis dapat membantu semua orang yang terlibat. Bahkan pembuat not asli. Sangat memalukan ketika notulen asli tidak mengerti catatan mereka!

 

Berpikir Kreatif dan Abstrak

reativitas dan pemikiran abstrak membantu para ilmuwan data membuat hipotesis dengan lebih baik pola dan fitur yang mungkin mereka lihat dalam fase eksplorasi awal mereka.
Menggabungkan pemikiran logis dengan titik data minimal, ilmuwan data dapat mengarahkan diri mereka ke beberapa solusi yang mungkin. Namun, ini membutuhkan pemikiran yang out-of-the-box.

Analisis adalah kombinasi antara penelitian disiplin dan pemikiran kreatif. Jika seorang analis terlalu dibatasi oleh bias konfirmasi atau proses, mereka mungkin tidak mencapai kesimpulan yang benar.

Jika, di sisi lain, mereka berpikir terlalu liar dan tidak menggunakan deduksi dan induksi dasar untuk mendorong pencarian mereka, mereka dapat menghabiskan waktu berminggu-minggu mencoba menjawab pertanyaan sederhana ketika mereka berkeliaran melalui berbagai set data tanpa tujuan yang jelas.

 

Pola Pikir Rekayasa

Analis harus mampu mengambil masalah besar dan kumpulan data dan memecahnya menjadi potongan-potongan kecil. Terkadang, dua atau tiga pertanyaan yang diajukan oleh tim terpisah tidak dapat dijawab dengan dua atau tiga jawaban.

Alih-alih, dua atau tiga pertanyaan itu sendiri mungkin perlu dipecah menjadi pertanyaan-pertanyaan kecil yang bisa dianalisis dan didukung oleh data.

Hanya dengan begitu analis dapat kembali dan menjawab pertanyaan yang lebih besar. Ini terutama berlaku untuk kumpulan data yang besar dan kompleks. Semakin penting untuk dapat secara jelas memecah analisis menjadi bagian-bagian yang tepat.

 

Perhatian terhadap detail

Analisis membutuhkan perhatian terhadap detail. Hanya karena seorang analis atau ilmuwan data mungkin tipe orang dengan gambaran besar, itu tidak berarti mereka tidak bertanggung jawab untuk mencari tahu semua detail berharga dari suatu proyek.

Perusahaan, bahkan yang kecil, memiliki banyak celah dan celah. Ada proses pada proses dan tidak memahami proses-proses itu dan rinciannya mempengaruhi tingkat analisis yang dapat dilakukan.

Terutama ketika Anda sedang menulis skrip kueri dan pemrograman yang rumit. Sangat mudah untuk salah bergabung dengan tabel atau memfilter hal yang salah. Jadi, itu adalah kunci untuk selalu memeriksa pekerjaan Anda dua kali lipat dan tiga kali lipat. Juga, jika skrip terlibat, tinjauan sejawat juga harus dilakukan.

 

Keingintahuan

Analisis membutuhkan rasa ingin tahu. Kami akan membahas ini ketika kami memecah proses. Namun, langkah dalam proses analisis adalah mendaftar semua pertanyaan yang Anda yakini berharga untuk analisis. Ini membutuhkan pikiran yang ingin tahu yang peduli untuk mengetahui jawabannya.

Mengapa datanya seperti itu? Mengapa kita melihat pola? Apa yang bisa kita gunakan untuk menemukan jawabannya? Siapa yang tahu?

Ini hanya beberapa pertanyaan yang dapat membantu mengarahkan analisis ke arah yang benar. Anda perlu memiliki dorongan dan keinginan untuk tahu mengapa.

 

Toleransi Kegagalan

Ilmu data memiliki banyak kesamaan dengan bidang sains, dalam arti bahwa mungkin ada 99 hipotesis gagal yang mengarah pada satu solusi yang berhasil.

Beberapa perusahaan yang digerakkan oleh data hanya mengharapkan insinyur pembelajaran mesin dan ilmuwan data mereka untuk membuat algoritma baru, atau korelasi, setiap 12 hingga 18 bulan. Ini tergantung pada ukuran tugas dan jenis implementasi yang diperlukan (mis. Implementasi proses, teknis, kebijakan, dll.).

Dalam semua pekerjaan ini ada kegagalan demi kegagalan, ada pertanyaan yang tidak terjawab setelah pertanyaan yang tidak dijawab dan analis harus melanjutkan.

Intinya adalah untuk mendapatkan jawabannya, atau dengan jelas menyatakan mengapa Anda tidak bisa menjawab pertanyaan itu. Namun, Anda tidak bisa menyerah begitu saja karena beberapa upaya pertama gagal.

Analisis bisa menjadi lubang hitam untuk waktu. Pertanyaan demi pertanyaan bisa salah. Itulah mengapa penting untuk memiliki proses semi-terstruktur. Yang memandu analis tetapi tidak menahannya. Analisis Data untuk Semua Orang

Baca Juga : Seberapa Besar Teknologi?

 

Keterampilan Lunak Ilmu Data dan Analisis

Analis keterampilan dan ilmuwan data tidak perlu semuanya tentang pemrograman dan analisis statistik.

Alih-alih, ini tentang fokus untuk memastikan bahwa wawasan yang ditemukan mudah ditransfer. Ini memungkinkan anggota tim dan manajer lain juga mendapatkan keuntungan dari analisis.

Analis harus mampu melakukan lebih dari sekedar mencapai kesimpulan. Mereka harus mampu menciptakan karya yang mudah direproduksi dan dikomunikasikan.

Proses ini tidak hanya menghemat waktu. Ini, yang lebih penting, membantu para pemimpin mempercayai kesimpulan analis.

Kalau tidak, analis mungkin benar tetapi jika mereka terdengar tidak yakin, jika mereka memiliki catatan buruk, atau bahkan kehilangan satu titik data, itu dapat langsung menyebabkan ketidakpercayaan di antara para pemimpin mereka.

Sayangnya, ini sangat benar. Pekerjaan analis dapat langsung dipertanyakan ketika bahkan hanya satu titik data yang salah atau dikomunikasikan dengan buruk.

Kami sering merekomendasikan agar tim data melakukan walk-through laporan dan presentasi mereka hanya untuk memeriksa lubang. Seorang anggota tim yang pandai mempertanyakan setiap sudut adalah hebat dalam situasi ini.

Semakin banyak tim Anda dapat menjawab pertanyaan yang mungkin dimiliki eksekutif, semakin besar kemungkinan eksekutif akan menandatangani pada bagian selanjutnya dari proyek.

 

Proses Analisis Data

Pada bagian selanjutnya, kami akan menjelaskan proses untuk menganalisis data.

Kami akan menyiapkan buku catatan dasar dan menjelaskan proses sederhana yang akan membantu ilmuwan dan analis data yang baru dan berpengalaman memastikan mereka melacak pekerjaan mereka secara efektif. Analisis Data untuk Semua Orang

Google

Penulis: 
author

Posting Terkait

Tinggalkan pesan