Integrasi dengan machine learning dan AI

From OnnoWiki
Jump to navigation Jump to search

Berikut adalah Modul 13: Tren Terkini dalam Basis Data – Integrasi dengan Machine Learning dan AI lengkap dengan contoh implementasi di Ubuntu 24.04.

Tren Terkini dalam Basis Data

Topik: Integrasi dengan Machine Learning dan AI

1. Tujuan Pembelajaran

Setelah mempelajari modul ini, mahasiswa diharapkan mampu:

  • Memahami bagaimana basis data dapat digunakan dalam proses Machine Learning dan AI.
  • Menjelaskan alur integrasi antara data yang disimpan dalam basis data dengan pipeline Machine Learning.
  • Menerapkan contoh sederhana pengambilan data dari database dan pelatihan model ML di Ubuntu 24.04 menggunakan Python dan Scikit-learn.

2. Konsep Dasar

Integrasi antara basis data dan Machine Learning (ML) berarti menggunakan data yang disimpan dalam database untuk membangun, melatih, dan menguji model ML. Ini menjadi tren penting karena banyak data bisnis tersimpan di database relasional atau NoSQL.

3. Alur Integrasi Basis Data dengan ML

  1. Ekstraksi Data dari basis data (MySQL, PostgreSQL, MongoDB, dsb.)
  2. Preprocessing Data untuk menyiapkannya menjadi fitur yang dapat digunakan oleh algoritma ML.
  3. Pelatihan Model ML menggunakan pustaka Python seperti Scikit-learn, TensorFlow, atau PyTorch.
  4. Evaluasi dan Prediksi berdasarkan model yang dilatih.
  5. Menyimpan Hasil Prediksi kembali ke basis data.

4. Contoh Implementasi: Koneksi MySQL + Machine Learning (Scikit-learn) di Ubuntu 24.04

Langkah 1: Install MySQL dan Buat Database

sudo apt update
sudo apt install mysql-server
sudo mysql_secure_installation

Login ke MySQL:

sudo mysql -u root -p

Buat database dan tabel:

CREATE DATABASE db_ml;
USE db_ml;

CREATE TABLE students (
    id INT AUTO_INCREMENT PRIMARY KEY,
    study_hours FLOAT,
    score FLOAT
);

INSERT INTO students (study_hours, score) VALUES
(1.5, 50), (2.0, 55), (3.5, 65), (4.5, 70), (5.0, 75), (6.0, 80);

Langkah 2: Install Library Python

sudo apt install python3-pip
pip install mysql-connector-python scikit-learn pandas matplotlib

Langkah 3: Script Python Integrasi + ML

import mysql.connector
import pandas as pd
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

# Koneksi ke MySQL
conn = mysql.connector.connect(
    host="localhost",
    user="root",
    password="password",  # ganti dengan password kamu
    database="db_ml"
)

# Ambil data dari MySQL
query = "SELECT study_hours, score FROM students"
df = pd.read_sql(query, conn)

# Pisahkan fitur dan label
X = df'study_hours'
y = df['score']

# Buat dan latih model
model = LinearRegression()
model.fit(X, y)

# Prediksi dan visualisasi
y_pred = model.predict(X)

plt.scatter(X, y, color='blue')
plt.plot(X, y_pred, color='red')
plt.xlabel("Study Hours")
plt.ylabel("Score")
plt.title("Prediksi Nilai Berdasarkan Jam Belajar")
plt.show()

# Prediksi data baru
new_hours = 7
predicted_score = model.predict(new_hours)
print(f"Prediksi nilai untuk 7 jam belajar: {predicted_score[0]:.2f}")

5. Kasus Nyata:

  • Retail: Menggunakan data pembelian dari database untuk memprediksi produk yang akan dibeli berikutnya.
  • Kesehatan: Menganalisis data pasien untuk prediksi risiko penyakit.
  • Keuangan: Mendeteksi penipuan dengan model AI yang dilatih dari transaksi dalam database.

6. Tools dan Framework Pendukung

Tool Fungsi
MySQL/PostgreSQL Menyimpan data
Pandas Manipulasi data tabel
Scikit-learn Algoritma ML klasik
TensorFlow/PyTorch Deep learning dan AI lanjutan
Apache Airflow Orkestrasi pipeline ML
Jupyter Notebook Eksperimen dan dokumentasi

7. Kesimpulan

Integrasi basis data dengan Machine Learning memperkuat keputusan berbasis data. Di Ubuntu 24.04, kita bisa dengan mudah menghubungkan database ke pipeline ML menggunakan Python. Pendekatan ini menjembatani data statis di database dengan kemampuan prediktif dari kecerdasan buatan.


Pranala Menarik