Dataset Akurasi

From OnnoWiki
Jump to navigation Jump to search

Untuk mengevaluasi akurasi model machine learning dalam klasifikasi, kita dapat menggunakan pustaka Scikit-Learn di Python. Berikut adalah contoh kode yang menunjukkan cara melatih model Decision Tree dan menghitung akurasinya:

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report

# Contoh: Memuat dataset dari file CSV
# Gantilah 'data.csv' dengan path ke dataset Anda
df = pd.read_csv('data.csv')

# Memisahkan fitur (X) dan target (y)
# Asumsikan kolom terakhir adalah target
X = df.iloc[:, :-1]
y = df.iloc[:, -1]

# Membagi dataset menjadi data latih dan data uji (80% : 20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inisialisasi model Decision Tree
model = DecisionTreeClassifier()

# Melatih model dengan data latih
model.fit(X_train, y_train)

# Melakukan prediksi pada data uji
y_pred = model.predict(X_test)

# Menghitung akurasi
akurasi = accuracy_score(y_test, y_pred)
print(f'Akurasi model: {akurasi:.2f}')

# Menampilkan laporan klasifikasi yang mencakup presisi, recall, dan F1-score
print(classification_report(y_test, y_pred))

Penjelasan kode:

1. Import Library:

  • `pandas` untuk manipulasi data.
  • `train_test_split` untuk membagi dataset menjadi data latih dan uji.
  • `DecisionTreeClassifier` sebagai model klasifikasi.
  • `accuracy_score` dan `classification_report` untuk evaluasi performa model.

2. Memuat Dataset:

  • Dataset dimuat dari file CSV ke dalam DataFrame `df`. Pastikan untuk menyesuaikan nama file sesuai dengan dataset Anda.

3. Memisahkan Fitur dan Target:

  • `X` berisi semua kolom kecuali kolom target, sedangkan `y` berisi kolom target.

4. Membagi Dataset:

  • Dataset dibagi menjadi 80% data latih dan 20% data uji menggunakan `train_test_split`.

5. Inisialisasi dan Pelatihan Model:

  • Model Decision Tree diinisialisasi dan dilatih menggunakan data latih.

6. Prediksi dan Evaluasi:

  • Model melakukan prediksi pada data uji.
  • Akurasi dihitung dengan membandingkan prediksi dengan nilai sebenarnya menggunakan `accuracy_score`.
  • Laporan klasifikasi yang mencakup metrik seperti presisi, recall, dan F1-score ditampilkan menggunakan `classification_report`.

Kode ini memberikan gambaran dasar tentang bagaimana mengevaluasi akurasi model klasifikasi menggunakan Python dan Scikit-Learn. Anda dapat menyesuaikan model dan parameter sesuai dengan kebutuhan dan karakteristik dataset Anda.

Pranala Menarik