TF: Colab untuk Unsupervised Learning
Jump to navigation
Jump to search
Berikut adalah source code lengkap untuk melakukan klasifikasi data menggunakan Unsupervised Learning (Clustering dengan K-Means) menggunakan TensorFlow dan Scikit-Learn di Google Colab. Program ini akan membaca data dari file Excel, melakukan preprocessing, menerapkan clustering dengan K-Means, dan menyimpan hasil klasifikasi kembali ke file Excel.
Langkah-langkah dalam kode ini:
- Impor library yang diperlukan.
- Baca dataset dari file Excel.
- Normalisasi data agar skala fitur seragam.
- Gunakan K-Means Clustering untuk mengelompokkan data.
- Simpan hasil klasifikasi ke file Excel.
Saya akan membuat file source code dan menampilkannya dalam Google Colab-compatible format.
# Import library yang diperlukan import pandas as pd import tensorflow as tf from sklearn.cluster import KMeans from sklearn.preprocessing import StandardScaler # Upload file dataset ke Google Colab dari local from google.colab import files uploaded = files.upload() # Baca file Excel (pastikan hanya ada satu file yang diupload) file_name = list(uploaded.keys())[0] # Ambil nama file pertama yang diupload df = pd.read_excel(file_name, sheet_name='Klasifikasi_Pembelian') # Pilih kolom yang digunakan untuk clustering X = df'Usia', 'Pendapatan (Juta IDR)', 'Belanja Online (x per bulan)' # Normalisasi data untuk meningkatkan performa model scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # Tentukan jumlah cluster (misalnya 2 cluster: kelompok pembeli dan non-pembeli) kmeans = KMeans(n_clusters=2, random_state=42, n_init=10) kmeans.fit(X_scaled) # Tambahkan hasil cluster ke dataset df['Cluster'] = kmeans.labels_ # Simpan hasil ke file Excel output_file = 'hasil_klasifikasi.xlsx' df.to_excel(output_file, index=False) # Beri tahu pengguna bahwa file sudah siap di-download files.download(output_file)
Kode di atas akan:
- Meminta Anda mengunggah file Excel yang berisi dataset.
- Membaca dataset dari sheet bernama `'Klasifikasi_Pembelian'`.
- Menormalisasi data dengan `StandardScaler()`.
- Melakukan clustering (unsupervised learning) dengan K-Means.
- Menambahkan hasil cluster ke dataset dalam kolom baru bernama `'Cluster'`.
- Menyimpan hasil klasifikasi ke file Excel yang bisa langsung diunduh.
Silakan jalankan kode ini di Google Colab, unggah dataset, dan lihat hasil klasifikasi!