Karl Pearson: Penggagas Ilmu Statistika Modern
Bagi Anda yang mempelajari Ilmu Statistika atau Matematika, tentu sudah tidak asing lagi dengan Karl Pearson. Nama Pearson biasanya muncul dalam rumus statistik mengenai korelasi dan koefisien. Ia memang merupakan penemu rumus statistik tersebut. Namun, kontribusi Pearson dalam Ilmu Statistika ternyata lebih dari itu. Seperti apa peran Karl Pearson dalam Statistika?
Siapakah Karl Pearson?
Karl Pearson lahir di London, Inggris pada 27 Maret 1857. Ia merupakan seorang matematikawan dan ahli biostatistik. Nama Pearson dikenal sebagai pencipta disiplin ilmu statistik matematika. Ia juga merupakan pendiri departemen statistik pertama di dunia, tepatnya di University College, London pada 1911.
Melalui temuannya di bidang matematika, Pearson berperan penting dalam penciptaan statistik modern. Dasar matematika statistiknya bermula dari tradisi panjang metode pendekatan kuadrat terkecil. Mulai dilakukan pada awal abad ke-19, penelitian tentang metode ini bertujuan untuk memperkirakan jumlah dari langkah-langkah astronomi dan geodesi berulang menggunakan teori probabilitas. Pearson kemudian menciptakan bidang baru yang bertujuan mengelola dan membuat kesimpulan dari data di hampir setiap bidang.
Kontribusi Pearson dalam Ilmu Statistika
Karya Pearson mencakup semua aplikasi dan pengembangan statistik matematika. Aplikasi Pearson bahkan mencakup berbagai bidang, mulai dari biologi, epidemiologi, kedokteran, psikologi, hingga sejarah sosial. Pemikiran Pearson mendasari banyak metode statistik yang kerap digunakan saat ini. Contoh kontribusinya adalah sebagai berikut:
- Koefisien dan korelasi
Rumus statistik ini pertama kali dicetuskan oleh Auguste Bravais dan Francis Galton. Pearson kemudian mendefinisikannya sebagai momen produk, dan mempelajari hubungannya dengan regresi linier.
- Metode momen
Pearson memperkenalkan momen, sebuah konsep yang dipinjam dari fisika, sebagai statistik deskriptif dan untuk pemasangan distribusi ke sampel.
- Sistem kurva kontinu Pearson
Sebuah sistem distribusi probabilitas univariat kontinu yang menjadi dasar dari distribusi probabilitas kontinu konvensional sekarang. Ini merupakan pelengkap yang kuat untuk metode momen Pearsonian.
- Nilai-p
Nilai-p didefinisikan sebagai ukuran probabilitas komplemen bola dengan nilai hipotesis sebagai titik pusat dan jarak chi sebagai jari-jari.
- Dasar-dasar teori pengujian hipotesis statistik dan teori keputusan statistik
Pada sebuah makalah yang dimuat dalam Philosophical Magazine, Pearson mengusulkan pengujian validitas nilai hipotesis dengan mengevaluasi jarak chi antara hipotesis dan nilai yang diamati secara empiris melalui nilai-p (diusulkan dalam makalah yang sama). Penggunaan kriteria bukti yang telah ditetapkan, yang disebut probabilitas kesalahan tipe-I alfa, kemudian diusulkan oleh Jerzy Neyman dan Egon Pearson.
Peran Statistika dalam Data Science
Lantas, apa kaitan antara statistika modern yang dicetuskan Karl Pearson dengan data science? Statistika sebenarnya merupakan dasar penerapan matematika untuk merumuskan teknik analisis data. Penerapan statistika digunakan untuk memproses masalah kompleks di dunia nyata, sehingga ilmuwan dan analis data dapat mencari tren dan perubahan yang berarti dalam data.
Teknik dan fungsi statistik yang berbeda, bekerja bersama untuk menghadirkan model statistik ideal. Katakanlah Anda mengambil sampel data dari populasi yang begitu besar, maka statistika akan membantu data scientist atau analis data dalam menemukan pola untuk kemudian menafsirkannya sebagai data dari populasi tersebut. Terdengar begitu berisiko, tapi statistika akan membantu Anda mencapai hasil dengan tingkat akurasi tinggi.
Di sisi lain, data science merupakan kombinasi antara bisnis, matematika, ilmu komputer, dan komunikasi. Data science menyatukan statistik, analisis data, dan beragam metode yang terkait untuk memahami dan menganalisis fenomena aktual dengan data.
Contoh Penerapan Ilmu Statistika dalam Data Science
Nah, statistika membantu analis data dengan algoritma untuk mengidentifikasi pola dari data terstruktur atau tidak terstruktur. Dengan begitu, mereka dapat membentuk wawasan dan mendapatkan pengetahuan mengenai bidang pengetahuan apa pun. Berikut adalah beberapa contoh penerapan Ilmu Statistika dalam data science:
1. Prediksi dan klasifikasi
Statistik membantu dalam prediksi dan klasifikasi data, apakah akan tepat untuk dilihat oleh klien berdasarkan penggunaan data mereka sebelumnya.
2. Distribusi dan estimasi probabilitas
Distribusi dan estimasi probabilitas sangat penting dalam memahami dasar-dasar machine learning dan algoritma seperti regresi logistik.
3. Deteksi pola dan pengelompokan
Statistik membantu analis data dalam memilih data yang optimal dan membuang data yang tidak perlu. Selain membuat data lebih terorganisir, hal ini juga membantu menemukan anomali agar pemrosesan data dapat dilakukan dengan tepat.
Kesimpulan
Karl Pearson merupakan tokoh yang amat berjasa dalam perkembangan Ilmu Statistika modern. Karyanya di bidang matematika terbukti tetap relevan hingga sekarang dan bahkan menjadi dasar untuk temuan-temuan lain.
Apakah Anda berminat untuk mulai menerapkan Ilmu Statistika dalam data science? Di Algoritma Data Science School, Anda bisa mempelajari data science dengan pendekatan statistika beserta contoh penerapannya. Tersedia kelas untuk individu maupun perusahaan. Untuk informasi selengkapnya, silakan klik di sini!
Referensi:
- SciHi – Karl Pearson and Mathematical Statistics (Diakses pada 2 Agustus 2022)
- Britannica – Karl Pearson (Diakses pada 2 Agustus 2022)
- Analytics Steps – Importance of Statistics for Data Science (Diakses pada 2 Agustus 2022)
- Business Toys – Why is Statistics Important in Data Science? (Diakses pada 2 Agustus 2022)