Sejarah Data Science dari Tahun ke Tahun

Data science menjadi hal penting di era digital ini. Sebenarnya, bagaimana sejarah data science dari waktu ke waktu? Simak selengkapnya di sini!

Team Algoritma
Team Algoritma

Table of Contents

Sejarah data science memuat kisah penggabungan ilmu statistik dengan komputer. Kisah ini berkutat pada keinginan ilmuwan untuk memahami, menginterpretasikan, menggunakan, dan membuat prediksi data dengan lebih baik. Sejarah ini memiliki jalan panjang dan berliku yang telah dimulai sejak 1962 ketika matematikawan, John W. Tukey, meramalkan efek komputasi elektronik modern pada analisis data sebagai ilmu empiris. Bagaimana kisah lengkapnya? Simak penjelasannya di bawah ini.

Sejarah Data Science

Dimulai sejak 1962, sejarah data science memiliki perjalanan yang sangat panjang. Berikut beberapa poin waktu dan sejarah singkatnya.

Tahun 1962

John Tukey menulis “The Future of Data Analysis“ yang menggambarkan pergeseran dalam dunia statistik. Tukey mengacu pada penggabungan statistik dan komputer ketika komputer pertama kali digunakan untuk memecahkan masalah matematika.

Tahun 1974

Peter Naur menerbitkan buku yang berjudul "The Concise Survey of Computer Methods". Dalam buku tersebut, ada survei tentang metode pemrosesan data kontemporer dalam berbagai aplikasi. Naur mendefinisikan data science sebagai ilmu yang mengelola data.

Tahun 1977

The International Association for Statistical Computing (IASC) dibentuk dengan misi menghubungkan teknologi komputer modern, metodologi statistik tradisional, serta pengetahuan untuk menghasilkan informasi dan pengetahuan berbasis data.

Tukey juga menulis “Exploratory Data Analysis” yang membahas pentingnya data dalam menguji hipotesis. Tukey berpendapat bahwa harus ada kolaborasi antara eksplorasi  dengan analisis data konfirmatori.

Tahun 1989

Gregory Piatetsky-Shapiro menyelenggarakan dan memimpin workshop berjudul "Knowledge Discovery in Databases" (KDD) untuk yang pertama kalinya.

Tahun 1994

Business Week menerbitkan "Database Marketing" yang menggambarkan bagaimana perusahaan mengumpulkan begitu banyak informasi tentang konsumen agar dapat diolah untuk membuat prediksi perilaku konsumen. Hasil dari proses tersebut akan digunakan untuk menyusun pemasaran yang tepat. Namun, masih banyak perusahaan yang kewalahan dalam mengelola banyaknya data yang mereka miliki.

Tahun 1996

Untuk pertama kalinya, istilah data science dimasukkan dalam judul konferensi oleh International Federation of Classification Societies (IFCS).

Di samping itu, Usama Fayyad, Gregory Piatetsky-Shapiro, dan Padhraic Smyth menerbitkan “From Data Mining to Knowledge Discovery in Databases (KDD)” yang menjabarkan keseluruhan proses untuk menemukan informasi penting dari data.

Tahun 1997

Profesor C. F. Jeff Wu dalam kuliah perdana statistik di Universitas Michigan, menyerukan agar statistik diganti namanya menjadi data science dan ahli statistik diganti namanya menjadi data scientist.

Tahun 1999

Jacob Zahavi mengatakan perlunya alat baru untuk menangani jumlah data yang sangat besar dan terus berkembang. Dalam tulisan “Mining Data for Nuggets of Knowledge”, Zahavi menekankan pada masalah skalabilitas dalam data mining yang menunjukkan tantangan teknis dalam mengembangkan model untuk menganalisis data dengan lebih baik, mendeteksi hubungan nonlinier, dan interaksi antarelemen.

Tahun 2001

Sejarah data science pada tahun ini adalah terciptanya Software-as-a-Service (SaaS) untuk pertama kalinya.

Tahun 2002

International Council for Science: Committee on Data for Science and Technology mulai menerbitkan “Data Science Journal” yang berupa platform bagi data scientist untuk saling bertukar ide.

Tahun 2005

Thomas H. Davenport, Don Cohen, dan Al Jacobson menerbitkan “Competing on Analytics,” yang mengungkapkan bahwa beberapa perusahaan mulai menggunakan analisis statistik dan kuantitatif serta pemodelan prediktif sebagai elemen utama dalam menghadapi persaingan. Penelitian ini kemudian diterbitkan di Harvard Business Review dan diperluas (bersama Jeanne G. Harris) ke dalam buku "Competing on Analytics: The New Science of Winning".

Tahun 2006

Hadoop 0.1.0, open source database yang bersifat nonrelasional dirilis dan menjadi bagian dalam rangkaian sejarah data science.

Tahun 2008

"Data scientist" menjadi kata kunci dan akhirnya menjadi bagian dari bahasa. DJ Patil dan Jeff Hammerbacher dari LinkedIn dan Facebook diberi pujian karena memulai penggunaannya sebagai kata kunci.

Tahun 2009

Istilah NoSQL diperkenalkan kembali oleh Johan Oskarsson ketika ia mengadakan diskusi tentang open source database nonrelasional.

Tahun 2010

Drew Conway membuat “The Data Science Venn Diagram” yang mencakup keterampilan meretas, pengetahuan matematika dan statistik, dan keahlian substantif.

Tahun 2011

Daftar pekerjaan untuk data scientist meningkat sebesar 15.000 persen. Ada juga peningkatan seminar dan konferensi yang dikhususkan untuk data science dan big data.  Di sisi lain, James Dixon, CTO Pentaho, mempromosikan konsep data lakes yang mengacu pada penerimaan informasi menggunakan database nonrelasional (NoSQL).

Tahun 2015

Teknik deep learning digunakan untuk membuat Google Voice. Di dalam Google, total proyek perangkat lunak yang menggunakan AI meningkat menjadi lebih dari 2.700 proyek sepanjang tahun.

Kesimpulan

Sejarah data science menunjukkan ketertarikan ilmuwan untuk mengelola dan menggunakan data dengan lebih baik. Dengan masifnya pengaruh internet, volume data bertumbuh secara eksponensial. Data science tidak diragukan lagi akan terus berkembang seiring kebutuhan industri. Seorang data scientist sekarang menjadi sangat berharga bagi perusahaan. Ini merupakan sebuah peluang besar bagi Anda yang ingin berkarir di bidang data science.

Jika Anda ingin mendapatkan skill yang mumpuni untuk menjadi data scientist andal, Anda bisa mengikuti kelas dari Algoritma Data Science School yang menyediakan beragam sesi mengenai data science yang bisa dipilih sesuai kebutuhan atau level expertise Anda.

Get Free Learning Resources

* indicates required
Insights