TF: Colab untuk Unsupervised Learning

From OnnoWiki
Jump to navigation Jump to search

Berikut adalah source code lengkap untuk melakukan klasifikasi data menggunakan Unsupervised Learning (Clustering dengan K-Means) menggunakan TensorFlow dan Scikit-Learn di Google Colab. Program ini akan membaca data dari file Excel, melakukan preprocessing, menerapkan clustering dengan K-Means, dan menyimpan hasil klasifikasi kembali ke file Excel.

Langkah-langkah dalam kode ini:

  1. Impor library yang diperlukan.
  2. Baca dataset dari file Excel.
  3. Normalisasi data agar skala fitur seragam.
  4. Gunakan K-Means Clustering untuk mengelompokkan data.
  5. Simpan hasil klasifikasi ke file Excel.

Saya akan membuat file source code dan menampilkannya dalam Google Colab-compatible format.


# Import library yang diperlukan
import pandas as pd
import tensorflow as tf
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

# Upload file dataset ke Google Colab dari local
from google.colab import files
uploaded = files.upload()

# Baca file Excel (pastikan hanya ada satu file yang diupload)
file_name = list(uploaded.keys())[0]  # Ambil nama file pertama yang diupload
df = pd.read_excel(file_name, sheet_name='Klasifikasi_Pembelian')

# Pilih kolom yang digunakan untuk clustering
X = df'Usia', 'Pendapatan (Juta IDR)', 'Belanja Online (x per bulan)'

# Normalisasi data untuk meningkatkan performa model
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Tentukan jumlah cluster (misalnya 2 cluster: kelompok pembeli dan non-pembeli)
kmeans = KMeans(n_clusters=2, random_state=42, n_init=10)
kmeans.fit(X_scaled)

# Tambahkan hasil cluster ke dataset
df['Cluster'] = kmeans.labels_

# Simpan hasil ke file Excel
output_file = 'hasil_klasifikasi.xlsx'
df.to_excel(output_file, index=False)

# Beri tahu pengguna bahwa file sudah siap di-download
files.download(output_file)


Kode di atas akan:

  1. Meminta Anda mengunggah file Excel yang berisi dataset.
  2. Membaca dataset dari sheet bernama `'Klasifikasi_Pembelian'`.
  3. Menormalisasi data dengan `StandardScaler()`.
  4. Melakukan clustering (unsupervised learning) dengan K-Means.
  5. Menambahkan hasil cluster ke dataset dalam kolom baru bernama `'Cluster'`.
  6. Menyimpan hasil klasifikasi ke file Excel yang bisa langsung diunduh.

Silakan jalankan kode ini di Google Colab, unggah dataset, dan lihat hasil klasifikasi!


Pranala Menarik