Rekomendasi Berita yang Didukung AI di Dalam Browser Seluler Xiaomi
Pemanfaatan sistem rekomendasi berbasis Kecerdasan Buatan (Artificial Intelligence, AI) bukan lagi menjadi suatu hal yang baru di era digital saat ini. Mulai dari rekomendasi konten media sosial hingga daftar putar di platform layanan musik seperti Spotify, semuanya menjadi elemen penting dalam menentukan jenis konten yang disukai oleh pengguna melalui interaksi mereka di dunia internet. Xiaomi, sebagai salah satu perusahaan raksasa di bidang teknologi, tentunya tidak mau ketinggalan dengan kompetitor lainnya. Oleh karena itu, Xiaomi telah mengembangkan sistem rekomendasi berita untuk browser selulernya dengan mengadopsi Milvus sebagai bagian dari sistem tersebut.
Milvus adalah sebuah basis data vektor yang dirancang untuk mendukung Kecerdasan Buatan, terutama dalam mencari kesamaan dan mengaplikasikan konsep representasi vektor. Oleh karena itu, pada artikel kali ini kami akan menjelaskan bagaimana Xiaomi merancang sistem rekomendasi berita, serta bagaimana Milvus dan Algoritma AI lainnya diterapkan pada sistem tersebut. Yuk pahami lebih lanjut!
Memanfaatkan AI Untuk Rekomendasi Konten Berita Yang Dipersonalisasikan
Hanya dari laman berita seperti New York Times saja, ada lebih dari 230 konten berita yang diterbitkan setiap hari. Tentu saja, tidak mungkin bagi pengguna untuk tertarik dengan semua konten tersebut. Untuk membantu merekomendasikan konten yang sesuai dengan minat pengguna diperlukan bantuan AI sebagai alat dalam menyaring dan memberikan rekomendasi konten berita yang paling relevan dan menarik bagi pengguna. Meskipun Xiaomi sendiri menyadari bahwa rekomendasi dari sistem tersebut masih jauh dari kata sempurna, namun dengan hadirnya AI dan Milvus semakin diperlukan untuk memotong aliran informasi baru yang mengalir terus-menerus dari dunia maya yang semakin kompleks dan saling terhubung.
Hal ini didorong dengan keputusan Xiaomi untuk melakukan investasi pada browser selulernya dimana telah terinstall di lebih dari 40 juta seluler yang terjual di setiap kuartalnya. Saat pengguna membuka browser di ponsel Xiaomi, backend atau sistem akan merekomendasikan konten berita yang diminati, menggunakan Milvus untuk mempercepat pengambilan konten yang sesuai. Rekomendasi konten berita yang muncul nantinya akan disesuaikan dengan personalisasi dari aktivitas pengguna selama menggunakan internet.
Bagaimana Cara Kerja Rekomendasi Konten Berita Menggunakan AI?
Pada intinya, sistem rekomendasi berita atau sejenis sistem rekomendasi konten lainnya, melibatkan penyesuaian data input ke database besar untuk menemukan informasi yang sesuai. Sistem rekomendasi konten yang sukses melibatkan penyeimbangan relevansi dengan ketepatan waktu dan memberikan rekomendasi baru dalam jumlah besar secara efisien.
Untuk mengakomodasi kumpulan data besar yang berjalan pada sistem, sistem rekomendasi konten biasanya dibagi menjadi dua tahapan utama, yakni sebagai berikut:
- Retrieval (Pengambilan): Pada tahap pengambilan, sistem akan mempersempit kumpulan kandidat konten yang ada pada database besar berdasarkan minat dan perilaku pengguna.
- Sorting (Pengurutan): Konten yang telah dipilih pada proses pengambilan akan diurutkan berdasarkan indikator tertentu sebelum diberikan kepada pengguna browser. Saat pengguna telah mendapatkan dan berinteraksi dengan rekomendasi konten yang diberikan, sistem nantinya akan terus beradaptasi secara real-time untuk memberikan rekomendasi yang lebih relevan terhadap minat pengguna.
Lebih lanjutnya mengenai sistem dalam merekomendasikan konten berita, pengambilan rekomendasi tersebut bersifat up-to-date, real-time, dan model yang dibuat harus memenuhi persyaratan berikut:
- Efisiensi: Model harus menyelesaikan pengambilan data rekomendasi dalam jangka waktu singkat.
- Relevansi: Konten yang diambil harus sesuai dengan minat pengguna sebanyak mungkin.
- Ketepatan waktu: Konten yang baru diterbitkan juga harus diambil untuk direkomendasikan sehingga konten terbaru memiliki peluang untuk dilihat.
Kolaborasi Milvus Dengan Algoritma BERT
Milvus adalah sebuah basis data vektor yang dirancang untuk mendukung Kecerdasan Buatan, terutama dalam mencari kesamaan dan mengaplikasikan konsep representasi vektor. Ini merupakan pondasi utama dalam pengelolaan data dalam aplikasi tersebut. Dalam prosesnya data tidak terstruktur akan diubah menjadi vektor melalui model deep learning dan di import ke dalam Milvus, kemudian Milvus akan menyimpan dan mengindeks vektor yang didapat untuk membuat pencarian lebih efisien. Dimana saat anda melakukan pencarian di Milvus maka Milvus akan mengembalikan hasil yang paling mirip dengan vektor kueri yang diminta.
Xiaomi memilih Milvus guna mengelola data vektor untuk sistem rekomendasi berita karena kecepatan, keandalan, dan memerlukan konfigurasi dan perawatan sistem yang minimal. Namun dibalik kelebihannya, Milvus harus dipasangkan dengan algoritma AI untuk bisa membangun aplikasi yang bisa diterapkan.
Xiaomi memilih algoritma Bidirectional Encoder Representation Transformers (BERT) sebagai model representasi bahasa untuk sistem rekomendasinya. BERT dapat digunakan sebagai model Natural Language Understanding (NLU) umum yang dapat menggerakan sejumlah tugas dari Natural Language Processing (NLP) yang berbeda. Dimana terdapat fitur utama didalamnya, yakni meliputi:
- Transformator BERT digunakan sebagai kerangka utama algoritma dan mampu menangkap hubungan dua arah dalam sebuah kalimat dengan lebih menyeluruh.
- Tujuan dari pembelajaran multitugas pada algoritma ini adalah sebagai bentuk pemodelan dari Mask Language Model (MLM) dan Next Sentence Prediction (NSP).
- Algoritma BERT bekerja lebih baik dengan jumlah data yang lebih banyak dalam prosesnya membawa hasil dari algoritma BERT ke tingkat yang baru. BERT bekerja lebih baik dengan jumlah data yang lebih banyak, dan dapat menyempurnakan teknik lainnya seperti Word2Vec dengan bertindak sebagai matriks konversi serta menerapkannya secara efisien pada sistem yang dibuat.
Arsitektur jaringan BERT menggunakan struktur transformator multi-lapis yang meninggalkan tradisional RNN dan CNN neural networks. Dimana hal ini berjalan dengan mengubah jarak antara dua kata di posisi manapun menjadi satu melalui mekanisme attention dengan menyelesaikan masalah ketergantungan yang telah ada pada NLP selama beberapa waktu.
Arsitektur jaringan transformator ditunjukan pada gambar dibawah ini, yang terdiri dari bagian Multi-Head Attention dan feedforward yang terhubung penuh satu sama lainnya. Arsitektur ini mengubah input corpus menjadi feature vector.
Struktur jaringan BERT ditunjukkan pada gambar berikut. tanda ‘Trm’ pada gambar sesuai dengan arsitektur jaringan transformator pada gambar diatas.
BERT menyediakan model sederhana dan kompleks didalamnya. Dimana hyperparameter dalam algoritma ini bisa diatur sebagai berikut: BERT BASE: L = 12, H = 768, A = 12, total parameter 110M; BERT LARGE: L = 24, H = 1024, A = 16, jumlah parameter 340M.
Dalam hyperparameter diatas, L mewakili jumlah lapisan dalam jaringan yaitu jumlah blok transformator, A mewakili jumlah self-Attention dalam Multi-Head Attention dan ukuran filternya adalah sebesar H.
Implementasi Sistem Rekomendasi Konten Berita Xiaomi
Sistem rekomendasi berita berbasis browser pada Xiaomi bergantung pada tiga komponen utama yakni layanan vektorisasi, layanan pemetaan ID, dan layanan approximate nearest neighbor (ANN).
Layanan vektorisasi mengubah judul konten menjadi vektor kalimat umum. Model SimBert berdasarkan algoritma BERT digunakan dalam layanan ini. Sebagai salah satu model BERT, SimBert ialah model 12 lapisan dengan ukuran tersembunyi sebanyak 768 dimensi. Simbert menggunakan Chinese_L-12_H-768_A-12 sebagai pelatihan berkelanjutan untuk tugas pelatihan ‘pembelajaran metrik + UniLM’, dan telah melatih 1,17 juta langkah pada model TITAN RTX tunggal dengan Adam optimizer (kecepatan pembelajaran 2e-6, ukuran batch 128). Sederhananya, ini adalah model BERT yang dioptimalkan.
Algoritma ANN membandingkan judul konten yang di vektorkan dengan seluruh perpustakaan berita yang disimpan di Milvus, lalu mengembalikan konten serupa untuk direkomendasikan kepada pengguna. Kemudian Milvus akan melakukan pencarian berdasarkan kesamaan vektor untuk mendapatkan ID dari konten yang serupa.
Layanan Pemetaan ID akan menggunakan ID yang diperoleh oleh pencarian Milvus untuk mendapatkan informasi yang relevan seperti tampilan halaman dan klik pada konten berita terkait. Diagram arsitektur keseluruhan dari sistem pengambilan (retrieval) adalah sebagai berikut:
Data yang disimpan pada Milvus dimana mendukung sistem rekomendasi berita browser Xiaomi akan terus mengalami pembaruan. Dimana konten yang terus bertambah setiap hari, akan dilakukan penggabungan data baru dengan data lama, selain itu juga diperlukan pembersihan terhadap data-data yang sudah lama dan tidak memiliki pengaruh besar terhadap pembentukkan sistem.
Pada interval waktu yang biasanya ditentukan, data lama akan dihapus pada sistem dan data baru akan dimasukkan ke dalam koleksi data sistem. Disini data baru akan digabungkan secara real-time ke dalam koleksi data sistem. Kemudian setelah data baru dimasukkan, Milvus akan melakukan pencarian kesamaan pada koleksi data yang telah diperbaharui. Dimana konten berita akan diambil kembali dan diurutkan berdasarkan rasio klik dan indikator lainnya, dan setelah diurutkan maka konten teratas akan direkomendasikan kepada pengguna browser. Dalam skenario seperti ini, dimana data akan sering diperbarui dan hasilnya harus dikirimkan secara real-time kepada pengguna, menjadi kelebihan Milvus untuk menggabungkan dan mencari data baru dengan cepat dan memungkinakn untuk secara drastis memperccepat proses rekomendasi konten berita di browser seluler yang Xiaomi miliki.
Kesimpulan
Kita telah membahas banyak hal tentang bagaimana Xiaomi menggunakan AI dalam memberikan rekomendasi berita pada browser selulernya, dimana hal ini dapat memberikan kemudahan untuk pengguna agar mendapatkan konten berita yang sesuai dengan minat dan karakteristik dari pengguna browser Xiaomi itu sendiri. Kita juga membahas mengenai seperti apa sistem rekomendasi konten berita berdasarkan preferensi pengguna, bagaimana cara kerjanya, platform yang membentuk sistem tersebut untuk memberikan kenyaman dan kemudahan terbaik bagi penggunanya.
Selain itu, kita juga telah membahas terkait dengan penerapan dari sistem rekomendasi berita tersebut. Sampai sini kita telah mengetahui betapa pentingnya data science dan AI dalam memberikan rekomendasi dan layanan terbaik untuk banyak orang. Oleh karena itu, memiliki kemampuan dalam bidang data menjadi suatu hal yang penting untuk dimiliki di era digital seperti saat ini. Jika Anda tertarik mempelajari lebih lanjut tentang data dan ingin menjadi seorang Data Scientist yang sukses, ayo ambil bagianmu untuk #JadiTalentaData dengan mengikuti Bootcamp Algoritma Data Science yang hadir dengan serangkaian program dan kurikulum terlengkap yang dapat membantu Anda menguasai ilmu data langsung pada penerapannya di dunia industri saat ini. Yuk, belajar bersama Algoritma sekarang!
Baca juga artikel terkait lainnya disini:
- Apa itu Natural Language Processing dan Bagaimana Cara Kerjanya?
- Natural Language Processing (NLP): Tantangan, Masa Depan dan Pengaplikasian di Dunia Nyata
AHMAD FAUZI
Jika Anda tertarik dengan artikel seputar Insight Data Science dan beragam topik menarik lainnya, jadilah orang pertama yang membacanya dengan melakukan subscribe blog dibawah ini!