Setiap hari manusia memproduksi beragam data yang sangat besar baik jumlah dan ukurannya. Data-data tersebut diantaranya tentang data astronomi, bisnis, kedokteran, ekonomi, olahraga, cuaca dan sebagainya. Di bidang astronomi, berdasarkan survei teleskop Large Synoptic di Chile pada tahun 2016, Large Synoptic paling tidak menghasilkan data sebesar 140 TB setiap 5 hari. Di bidang kedokteran, European Bioinformatics Institute (EBI) menghasilkan 20 PB data genom setiap tahunnya, dimana satu manusia dapat menghasilkan data genom sekitar 140 GB. Kehadiran media sosial juga mendorong meningkatnya data yang dihasilkan setiap harinya seperti Facebook, Twitter, Youtube dan sebagainya sehingga mengakibatkan datangnya tsunami data.
Tsunami data mengindikasikan bahwa data-data ini sangat melimpah namun tidak memberikan pengetahuan apapun sehingga tidak bermanfaat bagi manusia. Supaya data ini bermanfaat maka data harus diolah terlebih dahulu menjadi pengetahuan. Semakin banyak pengetahuan yang dihasilkan dari data, maka semakin besar pula nilai atau manfaatnya.
Proses pengolahan dari data menjadi pengetahuan ini disebut dengan istilah data mining. Data mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar. Pengetahuan yang dihasilkan dapat berupa pola, rumus, aturan atau model.
Training data mining mempelajari bagaimana mengolah data menjadi pengetahuan menggunakan software K. Peserta akan mendapatkan banyak studi kasus penerapan Data Mining. Diharapkan setelah mengikuti training ini, peserta siap menghadapi tantangan kasus-kasus pada penerapan data mining pada kehidupan nyata.
OBJECTIVES
1. Memahami konsep dan peran utama dalam Data Mining
2. Memahami tahapan-tahapan proses Data Mining
3. Mampu menyelesaikan studi kasus Data Mining sesuai proses standar cross-industry
PREREQUISITES
Tidak ada training khusus yang dipersyaratkan
CONTENT
1. Pengantar Data Mining
1.1. Apa dan Mengapa Data Mining
1.2. Peran Utama dan Metode Data Mining
1.3. Sejarah dan Penerapan Data Mining
2. Proses Data Mining
2.1. Proses dan Tools Data Mining
2.2. Penerapan Proses Data Mining
2.3. Evaluasi Model Data Mining
2.4. Proses Data Mining berbasis CRISP-DM
3. Persiapan Data
3.1. Data Cleaning
3.2. Data Reduction
3.3. Data Transformation and Data Discretization
3.4. Data Integration
4. Algoritma Data Mining
4.1. Algoritma Klasifikasi
4.2. Algoritma Klastering
4.3. Algoritma Asosiasi
4.4. Algoritma Estimasi dan Forecasting
5. Text Mining
5.1. Text Mining Concepts
5.2. Text Clustering
5.3. Text Classification