TF: Training Data untuk Google Colab
Google Colab menyediakan berbagai cara untuk mengakses dan memuat data pelatihan saat belajar menggunakan TensorFlow. Berikut beberapa metode yang dapat Anda gunakan:
1. Menggunakan Dataset Bawaan TensorFlow: TensorFlow menyediakan sejumlah dataset populer yang dapat diakses langsung melalui modul `tf.keras.datasets`. Misalnya, untuk memuat dataset MNIST, Anda dapat menggunakan kode berikut:
import tensorflow as tf # Memuat dataset MNIST (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data() # Normalisasi nilai piksel ke rentang 0-1 x_train, x_test = x_train / 255.0, x_test / 255.0
Dataset lain yang tersedia termasuk CIFAR-10, CIFAR-100, dan Fashion-MNIST.
2. Mengimpor Dataset dari Google Drive: Jika Anda memiliki dataset yang disimpan di Google Drive, Anda dapat mengaksesnya dengan cara berikut:
from google.colab import drive
# Mount Google Drive drive.mount('/content/drive') # Akses file dataset dataset_path = '/content/drive/My Drive/path/to/your/dataset'
Setelah drive ter-mount, Anda dapat menggunakan `dataset_path` untuk membaca dataset sesuai formatnya, misalnya menggunakan `pandas` untuk file CSV.
3. Mengunduh Dataset dari Internet: Anda dapat mengunduh dataset langsung dari internet menggunakan perintah shell seperti `wget` atau `curl`:
!wget -O dataset.zip 'URL_dataset_anda'
Setelah diunduh, Anda dapat mengekstrak dan memuatnya sesuai kebutuhan.
4. Menggunakan Kaggle Datasets: Untuk mengakses dataset dari Kaggle, Anda perlu mengunggah file `kaggle.json` yang berisi API token Anda:
from google.colab import files # Unggah file kaggle.json files.upload() # Membuat direktori .kaggle dan memindahkan kaggle.json ke sana !mkdir ~/.kaggle !mv kaggle.json ~/.kaggle/ !chmod 600 ~/.kaggle/kaggle.json # Mengunduh dataset dari Kaggle !kaggle datasets download -d 'nama_dataset'
Setelah diunduh, ekstrak dan muat dataset sesuai formatnya.