Integrasi dengan machine learning dan AI

From OnnoWiki
Jump to navigation Jump to search

Berikut adalah **Modul 13: Tren Terkini dalam Basis Data – Integrasi dengan Machine Learning dan AI** lengkap dengan contoh implementasi di **Ubuntu 24.04**.

---

    1. **Modul 13: Tren Terkini dalam Basis Data**
      1. **Topik: Integrasi dengan Machine Learning dan AI**

---

      1. **1. Tujuan Pembelajaran**

Setelah mempelajari modul ini, mahasiswa diharapkan mampu: - Memahami bagaimana basis data dapat digunakan dalam proses Machine Learning dan AI. - Menjelaskan alur integrasi antara data yang disimpan dalam basis data dengan pipeline Machine Learning. - Menerapkan contoh sederhana pengambilan data dari database dan pelatihan model ML di Ubuntu 24.04 menggunakan Python dan Scikit-learn.

---

      1. **2. Konsep Dasar**

Integrasi antara basis data dan Machine Learning (ML) berarti menggunakan data yang disimpan dalam database untuk membangun, melatih, dan menguji model ML. Ini menjadi tren penting karena banyak data bisnis tersimpan di database relasional atau NoSQL.

---

      1. **3. Alur Integrasi Basis Data dengan ML**

1. **Ekstraksi Data** dari basis data (MySQL, PostgreSQL, MongoDB, dsb.) 2. **Preprocessing Data** untuk menyiapkannya menjadi fitur yang dapat digunakan oleh algoritma ML. 3. **Pelatihan Model ML** menggunakan pustaka Python seperti Scikit-learn, TensorFlow, atau PyTorch. 4. **Evaluasi dan Prediksi** berdasarkan model yang dilatih. 5. **Menyimpan Hasil Prediksi** kembali ke basis data.

---

      1. **4. Contoh Implementasi: Koneksi MySQL + Machine Learning (Scikit-learn) di Ubuntu 24.04**
        1. **Langkah 1: Install MySQL dan Buat Database**

```bash sudo apt update sudo apt install mysql-server sudo mysql_secure_installation ```

Login ke MySQL: ```bash sudo mysql -u root -p ```

Buat database dan tabel: ```sql CREATE DATABASE db_ml; USE db_ml;

CREATE TABLE students (

   id INT AUTO_INCREMENT PRIMARY KEY,
   study_hours FLOAT,
   score FLOAT

);

INSERT INTO students (study_hours, score) VALUES (1.5, 50), (2.0, 55), (3.5, 65), (4.5, 70), (5.0, 75), (6.0, 80); ```

        1. **Langkah 2: Install Library Python**

```bash sudo apt install python3-pip pip install mysql-connector-python scikit-learn pandas matplotlib ```

        1. **Langkah 3: Script Python Integrasi + ML**

```python import mysql.connector import pandas as pd from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt

  1. Koneksi ke MySQL

conn = mysql.connector.connect(

   host="localhost",
   user="root",
   password="password",  # ganti dengan password kamu
   database="db_ml"

)

  1. Ambil data dari MySQL

query = "SELECT study_hours, score FROM students" df = pd.read_sql(query, conn)

  1. Pisahkan fitur dan label

X = df'study_hours' y = df['score']

  1. Buat dan latih model

model = LinearRegression() model.fit(X, y)

  1. Prediksi dan visualisasi

y_pred = model.predict(X)

plt.scatter(X, y, color='blue') plt.plot(X, y_pred, color='red') plt.xlabel("Study Hours") plt.ylabel("Score") plt.title("Prediksi Nilai Berdasarkan Jam Belajar") plt.show()

  1. Prediksi data baru

new_hours = 7 predicted_score = model.predict(new_hours) print(f"Prediksi nilai untuk 7 jam belajar: {predicted_score[0]:.2f}") ```

---

      1. **5. Kasus Nyata:**

- **Retail:** Menggunakan data pembelian dari database untuk memprediksi produk yang akan dibeli berikutnya. - **Kesehatan:** Menganalisis data pasien untuk prediksi risiko penyakit. - **Keuangan:** Mendeteksi penipuan dengan model AI yang dilatih dari transaksi dalam database.

---

      1. **6. Tools dan Framework Pendukung**

| Tool | Fungsi | |-------------------|----------------------------------| | MySQL/PostgreSQL | Menyimpan data | | Pandas | Manipulasi data tabel | | Scikit-learn | Algoritma ML klasik | | TensorFlow/PyTorch| Deep learning dan AI lanjutan | | Apache Airflow | Orkestrasi pipeline ML | | Jupyter Notebook | Eksperimen dan dokumentasi |

---

      1. **7. Kesimpulan**

Integrasi basis data dengan Machine Learning memperkuat keputusan berbasis data. Di Ubuntu 24.04, kita bisa dengan mudah menghubungkan database ke pipeline ML menggunakan Python. Pendekatan ini menjembatani data statis di database dengan kemampuan prediktif dari kecerdasan buatan.

---

Kalau kamu mau, aku juga bisa buatin versi NoSQL (seperti MongoDB Atlas + model klasifikasi) langsung di Ubuntu. Mau dilanjutkan?