Dataset URL
Revision as of 08:50, 1 April 2025 by Onnowpurbo (talk | contribs)
Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari Machine Learning, Deep Learning, Large Language Models (LLM), Keamanan Siber, dan ComfyUI:
Machine Learning & Deep Learning
- Kaggle Datasets: Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda.
- UCI Machine Learning Repository: Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning.
- OpenML: Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning.
Large Language Models (LLM)
- The Pile: The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29
- Open-Sourced Training Datasets for LLMs: Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-model
Keamanan Siber
- Real-CyberSecurity-Datasets: Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. https://github.com/gfek/Real-CyberSecurity-Datasets
- Awesome-LLM4Cybersecurity: Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. https://github.com/tmylla/Awesome-LLM4Cybersecurity
- Cyber Threat Dataset on Kaggle: Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. https://www.kaggle.com/datasets/ramoliyafenil/text-based-cyber-threat-detection/data
ComfyUI
- ComfyUI-DataSet: Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet
- ComfyUI Dataset Helper & Batch Node: Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper
- ComfyUI Dataset Generation Tutorial: Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.
Semoga sumber-sumber di atas membantu Anda dalam perjalanan belajar dan penelitian Anda di bidang-bidang tersebut.