Integrasi dengan machine learning dan AI
Berikut adalah Modul 13: Tren Terkini dalam Basis Data – Integrasi dengan Machine Learning dan AI lengkap dengan contoh implementasi di Ubuntu 24.04.
Tren Terkini dalam Basis Data
Topik: Integrasi dengan Machine Learning dan AI
1. Tujuan Pembelajaran
Setelah mempelajari modul ini, mahasiswa diharapkan mampu:
- Memahami bagaimana basis data dapat digunakan dalam proses Machine Learning dan AI.
- Menjelaskan alur integrasi antara data yang disimpan dalam basis data dengan pipeline Machine Learning.
- Menerapkan contoh sederhana pengambilan data dari database dan pelatihan model ML di Ubuntu 24.04 menggunakan Python dan Scikit-learn.
2. Konsep Dasar
Integrasi antara basis data dan Machine Learning (ML) berarti menggunakan data yang disimpan dalam database untuk membangun, melatih, dan menguji model ML. Ini menjadi tren penting karena banyak data bisnis tersimpan di database relasional atau NoSQL.
3. Alur Integrasi Basis Data dengan ML
- Ekstraksi Data dari basis data (MySQL, PostgreSQL, MongoDB, dsb.)
- Preprocessing Data untuk menyiapkannya menjadi fitur yang dapat digunakan oleh algoritma ML.
- Pelatihan Model ML menggunakan pustaka Python seperti Scikit-learn, TensorFlow, atau PyTorch.
- Evaluasi dan Prediksi berdasarkan model yang dilatih.
- Menyimpan Hasil Prediksi kembali ke basis data.
4. Contoh Implementasi: Koneksi MySQL + Machine Learning (Scikit-learn) di Ubuntu 24.04
Langkah 1: Install MySQL dan Buat Database
sudo apt update sudo apt install mysql-server sudo mysql_secure_installation
Login ke MySQL:
sudo mysql -u root -p
Buat database dan tabel:
CREATE DATABASE db_ml; USE db_ml; CREATE TABLE students ( id INT AUTO_INCREMENT PRIMARY KEY, study_hours FLOAT, score FLOAT ); INSERT INTO students (study_hours, score) VALUES (1.5, 50), (2.0, 55), (3.5, 65), (4.5, 70), (5.0, 75), (6.0, 80);
Langkah 2: Install Library Python
sudo apt install python3-pip pip install mysql-connector-python scikit-learn pandas matplotlib
Langkah 3: Script Python Integrasi + ML
import mysql.connector import pandas as pd from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt # Koneksi ke MySQL conn = mysql.connector.connect( host="localhost", user="root", password="password", # ganti dengan password kamu database="db_ml" ) # Ambil data dari MySQL query = "SELECT study_hours, score FROM students" df = pd.read_sql(query, conn) # Pisahkan fitur dan label X = df'study_hours' y = df['score'] # Buat dan latih model model = LinearRegression() model.fit(X, y) # Prediksi dan visualisasi y_pred = model.predict(X) plt.scatter(X, y, color='blue') plt.plot(X, y_pred, color='red') plt.xlabel("Study Hours") plt.ylabel("Score") plt.title("Prediksi Nilai Berdasarkan Jam Belajar") plt.show() # Prediksi data baru new_hours = 7 predicted_score = model.predict(new_hours) print(f"Prediksi nilai untuk 7 jam belajar: {predicted_score[0]:.2f}")
5. Kasus Nyata:
- Retail: Menggunakan data pembelian dari database untuk memprediksi produk yang akan dibeli berikutnya.
- Kesehatan: Menganalisis data pasien untuk prediksi risiko penyakit.
- Keuangan: Mendeteksi penipuan dengan model AI yang dilatih dari transaksi dalam database.
6. Tools dan Framework Pendukung
Tool | Fungsi |
---|---|
MySQL/PostgreSQL | Menyimpan data |
Pandas | Manipulasi data tabel |
Scikit-learn | Algoritma ML klasik |
TensorFlow/PyTorch | Deep learning dan AI lanjutan |
Apache Airflow | Orkestrasi pipeline ML |
Jupyter Notebook | Eksperimen dan dokumentasi |
7. Kesimpulan
Integrasi basis data dengan Machine Learning memperkuat keputusan berbasis data. Di Ubuntu 24.04, kita bisa dengan mudah menghubungkan database ke pipeline ML menggunakan Python. Pendekatan ini menjembatani data statis di database dengan kemampuan prediktif dari kecerdasan buatan.