Statistik Dasar: Penjelasan Mean, Median, dan Modus

Statistik menjadi sebuah alat populer mengolah data karena kebermanfaatannya dalam berbagai bidang! Yuk pahamin statistik dasar, seperti Mean, Median, Modus!

Bunga Dea Laraswati
Bunga Dea Laraswati

Table of Contents

Statistik adalah cabang matematika yang berkaitan dengan pengumpulan, analisis, dan interpretasi data. Ada dua bidang utama statistik, yaitu statistik deskriptif yang relatif statistik dasar dan inferensial yang relatif statistik lanjutan. Statistik deskriptif memberikan informasi tentang fitur yang terlihat (menggambarkan) dari kumpulan data, statistik inferensial memungkinkan kita untuk menarik kesimpulan dan perkiraan tentang data. Dalam statistik deskriptif terdapat tiga ukuran utama, yaitu rata-rata, median, dan modus yang menggambarkan sebuah nilai dari kumpulan data. Ketiga ukuran ini dikenal sebagai ukuran tendensi sentral atau ukuran lokasi sentral. Mari kita kenalan dengan ketiga tendensi sentral ini melalui uraian di bawah!

Apa itu Tendensi Sentral?

Sebelum kita berkenalan dengan jenis-jenis tendensi sentral yang paling umum digunakan, kita mesti berkenalan dahulu dengan konsep tendensi sentral. Berikut ilustrasinya, semisal kita memiliki data perkembangan cuaca selama satu hari, ternyata terdapat 40 perubahan cuaca sehingga memiliki 40 data yang berbeda. Ketika teman kita bertanya berapa cuaca pada satu hari tersebut? Tentu kita tidak mungkin menyebutkan 40 data tersebut bukan? Kita memerlukan sebuah nilai yang relatif efisien dan mesti dapat menggambarkan 40 data tersebut. Oleh sebab itulah, muncul konsep tendensi sentral atau kecenderungan suatu kumpulan data yang dapat mempermudah manusia memahami kumpulan data.

Tendensi Sentral adalah nilai atau angka tunggal yang mencoba menggambarkan atau mewakili kumpulan data dengan mengidentifikasi posisi sentral dalam kumpulan data tersebut. Kita dapat menggunakan satu nilai atau angka yang mencoba untuk menggambarkan atau mewakili sekumpulan data karena sebagian besar data cenderung mengelompok di sekitar titik pusat atau suatu nilai. Dengan demikian, tendensi sentral dapat dimaknai ukuran statistik yang mengidentifikasi satu nilai sebagai perwakilan dari seluruh distribusi. Setelah kita memahami tendensi sentral, kita akan membahas 3 ukuran tendensi sentral terpopuler, yaitu Mean, Median dan Modus.

Mean

Mean (Rata-Rata) adalah salah satu ukuran tendensi sentral yang paling populer. Melalui ukuran ini kita mencoba menemukan sebuah nilai yang mewakili sekumpulan nilai tertentu dengan cara menjumlah semua nilai dan membaginya dengan jumlah angka dalam kumpulan data (frekuensi). Berikut gambaran cara kerjanya !

  • Misalkan kita memiliki 9 data {2,3,4,5,2,3,3,4,3},
  • Lalu kita menjumlahkan semua nilai tersebut 2 + 3 + 4 + 5 + 2 + 3 + 3 + 4 + 3 = 29
  • Kemudian bagi nilai penjumlahan tersebut dengan jumlah angka dalam data, yaitu 29/9 = 3,22
  • Jadi 9 data tersebut dapat diwakilkan dengan nilai rata-rata sebesar 3,22.

Median

Median dapat menjadi alternatif dari Mean untuk menemukan pusat data (ukuran tendensi sentral). Median merupakan angka tengah dalam daftar angka yang diurutkan sehingga menjadi nilai yang memisahkan bagian atas dari bagian bawah sampel data, dapat dianggap sebagai nilai "tengah". Berikut gambaran cara kerjanya !

  • Misalkan kita memiliki 9 data {2,3,4,5,2,3,3,4,3}
  • Lalu kita urutkan semua nilai tersebut dari terkecil ke terbesar {2,2,3,3,3,3,4,4,5}
  • Kemudian jumlah angka dalam data ditambah 1 bagi 2, (9 + 1)/2 = 5, untuk menemukan posisi nilai median. Nilai median berada di urutan 5 alias angka 3. Catatan : semisal jumlah angka dalam data adalah genap maka nilainya dijumlah baru dibagi 2, contohnya terdapat 10 data maka data ke 5 dan 6 dijumlah lalu dibagi 2.
  • Jadi 9 data tersebut dapat diwakilkan dengan nilai median sebesar 3.

Modus

Modus adalah angka yang paling sering muncul dalam kumpulan data. Satu set angka mungkin memiliki satu modus, lebih dari satu modus (multi-modus), atau tanpa modus sama sekali. Untuk mencari modusnya, susunlah bilangan-bilangan tersebut secara berurutan (dari yang terkecil sampai yang terbesar), lalu hitung berapa kali setiap bilangan tersebut muncul alias frekuensi kemunculan. Angka yang paling banyak muncul adalah nilai modus. Berikut gambaran cara kerjanya !

  • Misalkan kita memiliki 9 data {2,3,4,5,2,3,7,8,3}
  • Lalu kita urutkan semua nilai tersebut dari terkecil ke terbesar {2,2,3,3,3,3,4,4,5}
  • Kemudian kita hitung jumlah kemunculannya, angka 2 sebanyak 2 kali, angka 3 sebanyak 4 kali, angka 4 sebanyak 2 kali, dan angka 5 sebanyak 1 kali.
  • Jadi 9 data tersebut dapat diwakilkan dengan nilai modus sebesar 3.

Kapan Waktu yang Tepat untuk Menggunakannya?

Kita sudah berkenalan dan mengetahui cara kerja dari 3 ukuran tendensi, yaitu Mean, Median dan Modus. Setiap ukuran tendensi memiliki karakteristik yang menghasilkan kelebihan dan kekurangannya masing-masing ukuran sehingga alangkah lebih baik ketika kita dapat menyesuaikan kondisi data agar memberikan hasil akurat.

Mean (Rata-rata) merupakan ukuran yang populer karena secara gagasan berusaha mengambil setiap unsur dalam kumpulan angka diperhitungkan sehingga cukup jelas secara konseptual. Namun, disisi lain terdapat kelemahan utama Mean, yaitu kerentanannya terhadap pengaruh outlier (sebuah data yang berbeda jauh dari kumpulan data lainnya, data unik atau disebut ekstrim) sebab outlier dapat menyeret nilainya menjauhi nilai representatif. Alhasil ketika terdapat nilai outlier maka nilai rata-rata dapat memberikan makna yang keliru alias tidak dapat mewakili kumpulkan data tersebut.

Sebagai alternatif Mean ketika terdapat nilai outlier maka menggunakan Median yang relatif kurang terpengaruh oleh outlier. Hal ini disebabkan secara konsep median tidak memperhitungkan secara langsung setiap data melainkan mengurutkan setiap data dan mengambil nilai tengah sebagai median. Dengan demikian, relatif median memiliki nilai penyimpangan (perbedaan secara keseluruhan) lebih besar dibandingkan Mean karena tidak memperhitungkan setiap nilai secara langsung.

Selanjutnya terdapat Modus yang memiliki keunggulan dibandingkan median dan rata-rata karena dapat digunakan untuk data numerik dan kategori (non-numerik) alias nilainya berulang. Namun, Modus juga memiliki keterbatasan, di beberapa distribusi, modus mungkin tidak mencerminkan pusat distribusi dengan baik.

Selain itu, terkadang muncul kehadiran lebih dari satu Modus yang dapat membatasi kemampuan Modus untuk mendeskripsikan pusat dari distribusi karena nilai tunggal tidak dapat diidentifikasi untuk mendeskripsikan pusat. Dalam beberapa kasus, khususnya di mana data kontinu, distribusi mungkin tidak memiliki modus (jika semua nilai berbeda).

Kesimpulan

Kita telah berkenalan dengan berbagai tendensi sentral, sebuah nilai atau angka tunggal yang menggambarkan kumpulan data. Kita juga berkenalan dengan 3 ukuran tendensi sentral terpopuler, yaitu Mean bekerja dengan cara menjumlahkan semua nilai lalu membagi dengan jumlah kumpulan data (frekuensi), Median bekerja dengan cara mengurutkan nilai lalu mencari nilai di posisi tengah, dan terakhir adalah Modus yang bekerja dengan mengambil nilai yang memiliki frekuensi tertinggi atau kemunculan tersering.

Terakhir kita membahas kapan waktu yang tepat untuk menggunakan Mean (ketika data tidak memiliki outlier), kemudian Median (sebagai alternatif ketika data memiliki outlier) dan modus (relatif cocok ketika data non-numerik atau kategori).

Jika Anda tertarik mempelajari statistik lebih lanjut dan berbagai teknik pengolahan data lainnya serta pemanfaatannya lebih lanjut hingga berkarir di dunia data menjadi seorang Data Scientist handal, Anda dapat mengikuti Bootcamp Algoritma Data Science yang memiliki serangkaian program yang dapat membantu Anda menguasai dunia data di industri yang Anda minati. Yuk, bergabung bersama Algoritma sekarang!

TONI ANDREAS SUSANTO


Jika Anda tertarik dengan artikel seputar Insight Data Science dan beragam topik menarik lainnya, jadilah orang pertama yang membacanya dengan melakukan subscribe blog dibawah ini!

Get Free Learning Resources

* indicates required


Insights

Bunga Dea Laraswati

Sr. Writer Algoritma Data Science School