6 Kesalahan yang Umum Dijumpai dalam Penerapan Metode Statistik

Menjadi data scientist bukanlah pekerjaan yang mudah. Ada enam kesalahan saat menerapkan metode statistik yang harus Anda tahu. Simak di sini!

Bunga Dea Laraswati
Bunga Dea Laraswati

Table of Contents

Menjadi seorang data scientist adalah pekerjaan yang tidak mudah. Anda harus bisa menyelesaikan sebuah masalah dengan menerapkan metode statistik untuk mencari jawaban yang tepat. Tidak mengherankan jika saat ini profesi data scientist sangat banyak dicari oleh perusahaan-perusahaan.

Jika Anda tertarik untuk menjadi seorang profesional di bidang ini, maka Anda harus mengetahui beberapa hal yang menjadi kesalahan umum saat menerapkan metode statistik. Apa saja kesalahan-kesalahan umum yang sering terjadi? Simak uraiannya di bawah ini!

Kesalahan Umum dalam Penerapan Metode Statistik

Beberapa kesalahan yang sering terjadi mungkin sudah biasa Anda temui, misalnya adalah jenis pengukuran, variabilitas data, dan juga ukuran sampel. Namun, beberapa kasus dari kesalahan yang terjadi justru akan membingungkan. Ini adalah enam kesalahan umum dalam menerapkan metode statistik.

1. Tidak membandingkan secara langsung

Kesalahan pertama saat penerapan metode statistik adalah tidak membandingkan dua variabel secara langsung. Misalnya, Anda ingin mengetahui efektivitas suatu intervensi, apakah intervensi menyebabkan suatu efek yang lebih besar secara signifikan pada kekuatan dibanding kontrol? Untuk menemukan jawabannya, Anda harus membandingkan dua efek sekaligus. Anda perlu melakukan perbandingan terpisah pada setiap kelompok dan membandingkan p value dari dua uji statistik.

2. Korelasi yang buruk

Korelasi yang buruk juga bisa menjadi salah satu kesalahan umum dalam menerapkan metode statistik. Hal ini bisa terjadi saat data dari dua atau lebih sub-kelompok digabungkan. Misalnya, tidak ada korelasi antara massa tubuh dengan akurasi menembak seseorang. Namun, salah satu pemain yang memiliki massa tubuh yang berat dari anggota lainnya bisa menjadi penembak terbaik.

Keberadaan pemain dengan massa tubuh yang besar dan kemampuan menembak yang baik ini bisa membuat keputusan yang bias. Dalam artian, orang bisa saja berkesimpulan bahwa jika massa tubuh besar, maka ia pandai menembak. Padahal, kedua hal tersebut merupakan korelasi yang belum tentu tepat.

3. Korelasi bukanlah sebab akibat

Menurut seorang ilmuwan terkemuka bernama Tom Fawcett, prinsip dasar dari statistik adalah ilmu ini bukan korelasi sebab-akibat. Artinya, meskipun ada dua hal yang saling terkait satu sama lain, bukan berarti hal tersebut menyebabkan hal lainnya. Misalnya, ada sebuah pernyataan ‘korelasi = 0.86’.

Anda harus mengingat bahwa koefisien korelasi antara +1 dan -1 dengan nol berarti tidak ada hubungan linier sama sekali. Angka tersebut, yakni 0,86, merupakan nilai yang tinggi dan menunjukkan hubungan statistik dari dua deret waktu. Ketika Anda ingin mengeksplorasi hubungan antara dua deret waktu, maka semua yang perlu diketahui adalah apakah variasi dalam satu deret memiliki korelasi dengan variasi lainnya.

4. Sampel yang dipakai terlalu sedikit

Kesalahan umum lain yang terjadi saat menerapkan metode statistik adalah penggunaan sampel yang terlalu sedikit. Semakin besar sampel, maka semakin rendah efek kritis yang diperkirakan signifikan. Semakin kecil ukuran sampel yang Anda amati, maka semakin besar efek  hasil palsu. Hasil palsu biasanya terjadi karena kebetulan. Maka, hindarilah menggunakan sampel yang terlalu sedikit.

5. Data yang bias

Mungkin beberapa dari Anda pernah mendengar algoritma yang bias. Namun, ternyata ada pula data yang bias. Jika berbicara tentang pengambilan sampel yang bias, maka akan menyebabkan kesalahan pada pengukuran sampel yang tidak representatif.

Ada beberapa kasus di mana para data scientist mendapat hasil yang mendekati, namun ternyata tidak akurat. Hal itu terjadi karena ada data yang bias. Estimator digunakan sebagai panduan menghitung perkiraan kuantitas berdasarkan data yang perlu diamati. Namun, faktanya, sampel non acak sering diyakini bias, sehingga datanya tak bisa digunakan untuk mewakili suatu populasi.

6. SDM tidak memadai

Kesalahan umum saat penerapan metode statistik yang terakhir adalah sumber daya manusia tidak memadai. Seperti yang sempat disinggung, menjadi seorang ilmuwan di bidang ini tidaklah mudah. Anda akan berjibaku dengan angka dan rumus-rumus yang rumit untuk menjawab suatu permasalahan yang ingin diamati.

Untuk itulah, keterampilan seseorang akan sangat dibutuhkan dalam bidang ini. Bila sumber daya manusia yang tersedia untuk melakukan pekerjaan ini terlalu sedikit, maka menerapkan metode statistik bisa tidak sesuai dengan aturan yang ada.

Kesimpulan

Berdasarkan uraian di atas, dapat kita pahami bahwa kesalahan dalam menerapkan metode statistik terjadi dari hal-hal yang bersifat teoritis, seperti penggunaan data dan sampel hingga kurangnya sumber daya manusia untuk memahami statistika dengan baik.

Anda berminat untuk mempelajari ilmu statistika lebih jauh? Bergabunglah bersama dengan Algoritma Data Science School. Algoritma Data Science School memiliki berbagai macam kelas dan tingkatan yang bisa Anda ikuti. Instruktur Algoritma Data Science School pun telah mendapatkan sertifikat yang diakui di Asia dan telah melatih lebih dari 20.000 orang. Jadi, tunggu apa lagi? Daftar Algoritma Data Science School sekarang juga!

Referensi:

  • Analytics India Mag - Top 6 most common statistical errors made by data scientists (diakses pada 30 Juni 2022)
  • Dr Stuart McErlain-Naylor - Ten Common Statistical Mistakes (diakses pada 30 Juni 2022)
  • eLife - Science Forum: Ten common statistical mistakes to watch out for when writing or reviewing a manuscript (diakses pada 30 Juni 2022)

Get Free Learning Resources

* indicates required
Insights

Bunga Dea Laraswati

Sr. Writer Algoritma Data Science School