Dataset URL

From OnnoWiki
Revision as of 08:46, 1 April 2025 by Onnowpurbo (talk | contribs) (Created page with "Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari '''Machine Learning''', '''Deep Learning''', '''Large Language Models (LLM)''', '''Keamanan Si...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari Machine Learning, Deep Learning, Large Language Models (LLM), Keamanan Siber, dan ComfyUI:

Machine Learning & Deep Learning

  • Kaggle Datasets: Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda.
  • UCI Machine Learning Repository: Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning.
  • OpenML: Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning.

Large Language Models (LLM)

  • The Pile: The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar.
  • Open-Sourced Training Datasets for LLMs: Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting.

Keamanan Siber

  • Real-CyberSecurity-Datasets: Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya.
  • Awesome-LLM4Cybersecurity: Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait.
  • Cyber Threat Dataset on Kaggle: Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya.

ComfyUI

  • ComfyUI-DataSet: Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI.
  • ComfyUI Dataset Helper & Batch Node: Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch.
  • ComfyUI Dataset Generation Tutorial: Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.

Semoga sumber-sumber di atas membantu Anda dalam perjalanan belajar dan penelitian Anda di bidang-bidang tersebut.


Pranala Menarik