Dataset Akurasi
Jump to navigation
Jump to search
Untuk mengevaluasi akurasi model machine learning dalam klasifikasi, kita dapat menggunakan pustaka Scikit-Learn di Python. Berikut adalah contoh kode yang menunjukkan cara melatih model Decision Tree dan menghitung akurasinya:
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score, classification_report # Contoh: Memuat dataset dari file CSV # Gantilah 'data.csv' dengan path ke dataset Anda df = pd.read_csv('data.csv') # Memisahkan fitur (X) dan target (y) # Asumsikan kolom terakhir adalah target X = df.iloc[:, :-1] y = df.iloc[:, -1] # Membagi dataset menjadi data latih dan data uji (80% : 20%) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Inisialisasi model Decision Tree model = DecisionTreeClassifier() # Melatih model dengan data latih model.fit(X_train, y_train) # Melakukan prediksi pada data uji y_pred = model.predict(X_test) # Menghitung akurasi akurasi = accuracy_score(y_test, y_pred) print(f'Akurasi model: {akurasi:.2f}') # Menampilkan laporan klasifikasi yang mencakup presisi, recall, dan F1-score print(classification_report(y_test, y_pred))
Penjelasan kode:
1. Import Library:
- `pandas` untuk manipulasi data.
- `train_test_split` untuk membagi dataset menjadi data latih dan uji.
- `DecisionTreeClassifier` sebagai model klasifikasi.
- `accuracy_score` dan `classification_report` untuk evaluasi performa model.
2. Memuat Dataset:
- Dataset dimuat dari file CSV ke dalam DataFrame `df`. Pastikan untuk menyesuaikan nama file sesuai dengan dataset Anda.
3. Memisahkan Fitur dan Target:
- `X` berisi semua kolom kecuali kolom target, sedangkan `y` berisi kolom target.
4. Membagi Dataset:
- Dataset dibagi menjadi 80% data latih dan 20% data uji menggunakan `train_test_split`.
5. Inisialisasi dan Pelatihan Model:
- Model Decision Tree diinisialisasi dan dilatih menggunakan data latih.
6. Prediksi dan Evaluasi:
- Model melakukan prediksi pada data uji.
- Akurasi dihitung dengan membandingkan prediksi dengan nilai sebenarnya menggunakan `accuracy_score`.
- Laporan klasifikasi yang mencakup metrik seperti presisi, recall, dan F1-score ditampilkan menggunakan `classification_report`.
Kode ini memberikan gambaran dasar tentang bagaimana mengevaluasi akurasi model klasifikasi menggunakan Python dan Scikit-Learn. Anda dapat menyesuaikan model dan parameter sesuai dengan kebutuhan dan karakteristik dataset Anda.