Setiap hari manusia memproduksi beragam data yang sangat besar baik jumlah dan ukurannya. Data-data tersebut diantaranya tentang data astronomi, bisnis, kedokteran, ekonomi, olahraga, cuaca dan sebagainya. Di bidang astronomi, berdasarkan survei teleskop Large Synoptic di Chile pada tahun 2016, Large Synoptic paling tidak menghasilkan data sebesar 140 TB setiap 5 hari. Di bidang kedokteran, European Bioinformatics Institute (EBI) menghasilkan 20 PB data genom setiap tahunnya, dimana satu manusia dapat menghasilkan data genom sekitar 140 GB. Kehadiran media sosial juga mendorong meningkatnya data yang dihasilkan setiap harinya seperti Facebook, Twitter, Youtube dan sebagainya sehingga mengakibatkan datangnya tsunami data.
Tsunami data mengindikasikan bahwa data-data ini sangat melimpah namun tidak memberikan pengetahuan apapun sehingga tidak bermanfaat bagi manusia. Supaya data ini bermanfaat maka data harus diolah terlebih dahulu menjadi pengetahuan. Semakin banyak pengetahuan yang dihasilkan dari data, maka semakin besar pula nilai atau manfaatnya.
Proses pengolahan dari data menjadi pengetahuan ini disebut dengan istilah data mining. Data mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar. Pengetahuan yang dihasilkan dapat berupa pola, rumus, aturan atau model.
Training ini merupakan lanjutan dari 1 Hour Online Training: Data Mining. Training akan membahas bagimana praktik data mining menggunakan software RapidMiner. Peserta juga akan mempelajari studi kasus terkait penerapan Data Mining di dunia industri dan akademisi.
OBJECTIVES
1. Praktik data mining dengan software RapidMiner
2. Memahami teknik evaluasi dalam data mining
3. Memahami studi kasus data mining sesuai proses standar cross-industry
PREREQUISITES
1 Hour Online Training: Data Mining
CONTENT
1. Proses dan Tools Data Mining
2. Penerapan Proses Data Mining
3. Evaluasi Model Data Mining
4. Proses Data Mining berbasis CRISP-DM