Nama : Satria Fadhil Muhammad
Kelas : B
NIM : 222520100
Data Mining adalah proses menemukan pola dari dataset besar menggunakan analisis, ekstraksi, dan interpretasi data. KDD adalah kerangka kerja proses data mining dengan 9 langkah utama, sering digabungkan menjadi 5-7 tahap: Selection, Preprocessing, Transformation, Data Mining, dan Interpretation/Evaluation.
KDD (Knowledge Discovery in Databases)
Proses KDD melibatkan beberapa langkah utama untuk menemukan pola dan pengetahuan dari data yang besar. Langkah langkahnya meliputi:
1. Selection: Memilih data yang relevan dari berbagai sumber.
2. Preprocessing: Membersihkan data dan menghilangkan noise atau outliers.
3. Transformation: Mengubah data ke dalam format yang sesuai untuk data mining.
4. Data Mining: Menggunakan algoritma untuk menemukan pola.
5. Interpretation/Evaluation: Mengevaluasi pola dan mengubahnya menjadi wawasan yang dapat ditindaklanjuti.
SEMMA
SEMMA adalah proses yang dikembangkan oleh SAS Institute untuk mendukung analisis data. Langkah-langkahnya meliputi:
1. Sample: Memilih subset data yang representatif.
2. Explore: Memeriksa data untuk menemukan pola awal.
3. Modify: Memodifikasi data untuk meningkatkan kualitas analisis.
4. Model: Membangun model prediktif.
5. Assess: Mengevaluasi model untuk memastikan keakuratannya.
CRISP-DM (Cross Industry Standard Process for Data Mining)
CRISP-DM adalah proses standar industri untuk data mining. Langkah-langkahnya meliputi:
1. Business Understanding: Memahami tujuan bisnis.
2. Data Understanding: Memahami data yang tersedia.
3. Data Preparation: Menyiapkan data untuk analisis.
4. Modeling: Membuat model data mining.
5. Evaluation: Mengevaluasi model.
6. Deployment: Menerapkan model dalam lingkungan bisnis.