DATA: Preprocess Select Kolom

From OnnoWiki
Jump to navigation Jump to search

Untuk melakukan preprocessing data dan memilih kolom tertentu dari file Excel menggunakan Python, Anda dapat menggunakan library Pandas. Berikut adalah langkah-langkah yang dapat Anda ikuti:

1. Instalasi Pandas: Pastikan Anda telah menginstal Pandas. Jika belum, Anda dapat menginstalnya menggunakan pip:

pip install pandas

2. Import Library yang Diperlukan: Impor library Pandas ke dalam skrip Python Anda:

import pandas as pd

3. Membaca File Excel: Gunakan fungsi `pd.read_excel()` untuk membaca file Excel. Jika file Excel memiliki lebih dari satu sheet, Anda dapat menentukan sheet yang ingin dibaca menggunakan parameter `sheet_name`.

# Membaca sheet pertama
df = pd.read_excel('path_ke_file.xlsx', sheet_name=0)

4. Memilih Kolom Tertentu: Setelah data dimuat ke dalam DataFrame, Anda dapat memilih kolom yang diinginkan dengan menyebutkan nama kolom tersebut.

# Memilih kolom 'Kolom1' dan 'Kolom2'
df_selected = df'Kolom1', 'Kolom2'

5. Menampilkan Data yang Dipilih: Untuk melihat data yang telah dipilih, Anda dapat menggunakan fungsi `print()` atau `df_selected.head()` untuk menampilkan beberapa baris pertama.

print(df_selected.head())

Contoh lengkapnya adalah sebagai berikut:

import pandas as pd

# Membaca file Excel dan memilih sheet pertama
df = pd.read_excel('path_ke_file.xlsx', sheet_name=0)

# Memilih kolom 'Kolom1' dan 'Kolom2'
df_selected = df'Kolom1', 'Kolom2'

# Menampilkan 5 baris pertama dari data yang dipilih
print(df_selected.head())

Pastikan untuk mengganti `'path_ke_file.xlsx'` dengan path file Excel Anda dan `'Kolom1'`, `'Kolom2'` dengan nama kolom yang ingin Anda pilih.

Pranala Menarik