5 Cara Mudah Subset Data Frame di R
Terdapat beberapa cara yang dapat dimanfaatkan untuk melakukan subsetting pada data frame yang dimiliki, berikut penjelasannya!
Table of Contents
Dalam melakukan analisis data, tidak selalu dibutuhkan keseluruhan observasi dari data yang dimiliki. Oleh karena itu, dalam R kita dapat melakukan subsetting data berdasarkan kriteria tertentu yang diinginkan untuk membantu kita melakukan analisis eksploratif terhadap data yang kita miliki.
Dibawah ini merupakan iima cara yang dapat digunakan untuk melakukan subsetting data dalam R. Yuk, simak penjelasannya berikut ini!
Cara Subset Data Frame di R
1. Subset menggunakan tanda kurung siku atau square brackets
Hal dasar yang dapat dilakukan untuk melakukan subset data adalah menggunakan tanda kurung siku atau square brackets. Contohnya adalah sebagai berikut:
Keterangan : 'x' merupakan baris yang ingin kita kembalikan, dan 'y' merupakan sebuah kolom yang ingin kita kembalikan.
2. Subset menggunakan tanda kurung atau brackets dengan menghilangkan baris kolom yang tidak diinginkan
Apabila ingin mengambil data dari data frame menggunakan tanda kurung, sebelumnya kita dapat melakukan penghapusan di bagian baris dan kolomnya. Kita dapat melihat code di bawah ini:
Kemudian jika kita tidak ingin mengembalikan data tersebut ke data sebelumnya, maka kita dapat menggunakan tanda “-” sehingga data tersebut tetap pada posisi terakhir kita melakukan subset.
3. Subset menggunakan kombinasi tanda kurung dengan fungsi which() dan operator %in%
Kemudian kita juga dapat mengekstrak baris yang kita butuhkan dengan menggunakan fungsi which(). Fungsi which() dapat membantu mengembalikan indeks pada suatu kolom yang berasal dari data frame yang sudah dikerjakan sebelumnya. Contoh penerapannya dalam kasus ini dapat dilihat pada code dibawah ini:
4. Subset menggunakan fungsi subset()
Selanjutnya kita juga dapat mengambil kolom subset dengan menggunakan operator %in% pada sebuah data frame yang dimiliki. Contoh penerapan dalam kasus ini dapat dilihat pada code dibawah ini:
Fungsi subset() mengambil 3 argumen: data frame yang ingin di-subset, baris yang sesuai dengan kondisi yang diinginkan untuk subset, serta kolom yang ingin dikembalikan.
5. Subset menggunakan fungsi filter() dan select() dari package dplyr
Cara terakhir yang dapat digunakan yaitu dengan mengunduh package dplyr. dplyr merupakan salah satu paket yang paling banyak digunakan dalam R. Kemudian apabila sudah berhasil mengunduh package dplyr, maka kita dapat membuat sebuah data frame dengan menggunakan dua fungsi berbeda dari package ini, yaitu:
A. Filter: argumen pertama adalah data frame; argumen kedua adalah kondisi yang kita inginkan. Hasilnya adalah seluruh data frame dengan baris yang hanya kita inginkan.
B. Select: argumen pertama adalah data frame; argumen kedua adalah nama kolom yang kita inginkan. Kita tidak harus menggunakan fungsi names(), dan bahkan tidak perlu menggunakan tanda kutip. Hanya perlu untuk mencantumkan nama kolom sebagai objek.
Kesimpulan
Nah, itu dia beberapa cara yang dapat dimanfaatkan untuk melakukan subsetting pada data frame yang dimiliki. Ada beberapa pilihan cara yang dapat kalian gunakan untuk melakukan subset pada data, hanya menyesuaikan dengan data seperti apa yang ingin dibentuk.
Jika Anda tertarik untuk mempelajarinya lebih jauh, atau ingin mendalami data science, segera bergabung bersama Algoritma Data Science School. Algoritma terkenal dengan kurikulum yang kompherensif dan dibimbing langsung oleh instruktur data science yang kompeten.
Aldina Anjani