Penjelasan KDD, SEMMA, atau CRISP-DM Data Minning

Nama : Satria Fadhil Muhammad

Kelas : B

NIM : 222520100

 

Data Mining adalah proses menemukan pola dari dataset besar menggunakan analisis, ekstraksi, dan interpretasi data. KDD adalah kerangka kerja proses data mining dengan 9 langkah utama, sering digabungkan menjadi 5-7 tahap: Selection, Preprocessing, Transformation, Data Mining, dan Interpretation/Evaluation.

 

KDD (Knowledge Discovery in Databases)

KDD Proses

Proses KDD melibatkan beberapa langkah utama untuk menemukan pola dan pengetahuan dari data yang besar. Langkah langkahnya meliputi:

1. Selection: Memilih data yang relevan dari berbagai sumber.

2. Preprocessing: Membersihkan data dan menghilangkan noise atau outliers.

3. Transformation: Mengubah data ke dalam format yang sesuai untuk data mining.

4. Data Mining: Menggunakan algoritma untuk menemukan pola.

5. Interpretation/Evaluation: Mengevaluasi pola dan mengubahnya menjadi wawasan yang dapat ditindaklanjuti.

 

SEMMA

SEMMA Proccess

SEMMA adalah proses yang dikembangkan oleh SAS Institute untuk mendukung analisis data. Langkah-langkahnya meliputi:

1. Sample: Memilih subset data yang representatif.

2. Explore: Memeriksa data untuk menemukan pola awal.

3. Modify: Memodifikasi data untuk meningkatkan kualitas analisis.

4. Model: Membangun model prediktif.

5. Assess: Mengevaluasi model untuk memastikan keakuratannya.

 

CRISP-DM (Cross Industry Standard Process for Data Mining)

CRISP-DM

CRISP-DM adalah proses standar industri untuk data mining. Langkah-langkahnya meliputi:

1. Business Understanding: Memahami tujuan bisnis.

2. Data Understanding: Memahami data yang tersedia.

3. Data Preparation: Menyiapkan data untuk analisis.

4. Modeling: Membuat model data mining.

5. Evaluation: Mengevaluasi model.

6. Deployment: Menerapkan model dalam lingkungan bisnis.

Tinggalkan komentar