TF: TensorFlow Unsupervised Learning dari File Excel
Untuk melakukan pembelajaran tanpa pengawasan (unsupervised learning) dengan menghitung jarak antar kolom dari file Excel dan melakukan klasterisasi hierarkis serta memvisualisasikan hasilnya dalam Google Colab, ikuti langkah-langkah berikut:
1. Mengimpor Pustaka yang Diperlukan
Pastikan Anda mengimpor pustaka yang diperlukan seperti `pandas`, `scipy`, `seaborn`, dan `matplotlib`.
import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from scipy.cluster.hierarchy import dendrogram, linkage from scipy.spatial.distance import pdist, squareform
2. Mengunggah dan Membaca File Excel
Gunakan fitur unggah file di Google Colab untuk mengunggah file Excel Anda, kemudian baca file tersebut menggunakan `pandas`.
from google.colab import files # Unggah file uploaded = files.upload() # Membaca file Excel file_name = list(uploaded.keys())[0] df = pd.read_excel(file_name)
3. Memilih 10 Kolom untuk Analisis
Pilih 10 kolom yang akan digunakan dalam analisis. Pastikan kolom-kolom tersebut berisi data numerik.
# Misalkan kolom yang dipilih bernama 'Kolom1' hingga 'Kolom10' selected_columns = ['Kolom1', 'Kolom2', 'Kolom3', 'Kolom4', 'Kolom5', 'Kolom6', 'Kolom7', 'Kolom8', 'Kolom9', 'Kolom10'] # Memastikan data hanya berisi nilai numerik data = df[selected_columns].select_dtypes(include=[np.number]).dropna()
4. Menghitung Matriks Jarak Antar Kolom
Hitung matriks jarak (misalnya, jarak Euclidean) antar kolom menggunakan `pdist` dari `scipy.spatial.distance`.
# Transpose data agar kolom menjadi baris data_transposed = data.T # Menghitung matriks jarak menggunakan jarak Euclidean
5. Melakukan Klasterisasi Hierarkis
Lakukan klasterisasi hierarkis menggunakan metode linkage.
# Melakukan klasterisasi hierarkis Z = linkage(distance_matrix, method='ward')
6. Memvisualisasikan Dendrogram
Visualisasikan hasil klasterisasi dalam bentuk dendrogram.
# Membuat dendrogram plt.figure(figsize=(10, 8)) dendrogram(Z, labels=data_transposed.index, leaf_rotation=90) plt.title('Dendrogram Klasterisasi Hierarkis') plt.xlabel('Kolom') plt.ylabel('Jarak Euclidean') plt.show()
Dengan langkah-langkah di atas, Anda dapat melakukan klasterisasi hierarkis pada 10 kolom dari file Excel dan memvisualisasikan hasilnya dalam bentuk dendrogram. Pastikan data yang digunakan bersih dan sesuai untuk analisis untuk mendapatkan hasil yang akurat.