TF: TensorFlow Unsupervised Learning dari File Excel

From OnnoWiki
Revision as of 09:43, 18 March 2025 by Onnowpurbo (talk | contribs) (Created page with "Untuk melakukan pembelajaran tanpa pengawasan (unsupervised learning) dengan menghitung jarak antar kolom dari file Excel dan melakukan klasterisasi hierarkis serta memvisuali...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Untuk melakukan pembelajaran tanpa pengawasan (unsupervised learning) dengan menghitung jarak antar kolom dari file Excel dan melakukan klasterisasi hierarkis serta memvisualisasikan hasilnya dalam Google Colab, ikuti langkah-langkah berikut:

1. Mengimpor Pustaka yang Diperlukan

Pastikan Anda mengimpor pustaka yang diperlukan seperti `pandas`, `scipy`, `seaborn`, dan `matplotlib`.

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage
from scipy.spatial.distance import pdist, squareform

2. Mengunggah dan Membaca File Excel

Gunakan fitur unggah file di Google Colab untuk mengunggah file Excel Anda, kemudian baca file tersebut menggunakan `pandas`.

from google.colab import files

# Unggah file
uploaded = files.upload()

# Membaca file Excel
file_name = list(uploaded.keys())[0]
df = pd.read_excel(file_name)

3. Memilih 10 Kolom untuk Analisis

Pilih 10 kolom yang akan digunakan dalam analisis. Pastikan kolom-kolom tersebut berisi data numerik.

# Misalkan kolom yang dipilih bernama 'Kolom1' hingga 'Kolom10'
selected_columns = ['Kolom1', 'Kolom2', 'Kolom3', 'Kolom4', 'Kolom5',
                    'Kolom6', 'Kolom7', 'Kolom8', 'Kolom9', 'Kolom10']

# Memastikan data hanya berisi nilai numerik
data = df[selected_columns].select_dtypes(include=[np.number]).dropna()

4. Menghitung Matriks Jarak Antar Kolom

Hitung matriks jarak (misalnya, jarak Euclidean) antar kolom menggunakan `pdist` dari `scipy.spatial.distance`.

# Transpose data agar kolom menjadi baris
data_transposed = data.T

# Menghitung matriks jarak menggunakan jarak Euclidean

5. Melakukan Klasterisasi Hierarkis

Lakukan klasterisasi hierarkis menggunakan metode linkage.

# Melakukan klasterisasi hierarkis
Z = linkage(distance_matrix, method='ward')

6. Memvisualisasikan Dendrogram

Visualisasikan hasil klasterisasi dalam bentuk dendrogram.

# Membuat dendrogram
plt.figure(figsize=(10, 8))
dendrogram(Z, labels=data_transposed.index, leaf_rotation=90)
plt.title('Dendrogram Klasterisasi Hierarkis')
plt.xlabel('Kolom')
plt.ylabel('Jarak Euclidean')
plt.show()

Dengan langkah-langkah di atas, Anda dapat melakukan klasterisasi hierarkis pada 10 kolom dari file Excel dan memvisualisasikan hasilnya dalam bentuk dendrogram. Pastikan data yang digunakan bersih dan sesuai untuk analisis untuk mendapatkan hasil yang akurat.


Pranala Menarik