Dataset URL
Jump to navigation
Jump to search
Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari Machine Learning, Deep Learning, Large Language Models (LLM), Keamanan Siber, dan ComfyUI:
Machine Learning & Deep Learning
- Kaggle Datasets: Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda. https://www.kaggle.com/datasets
- UCI Machine Learning Repository: Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning. https://archive.ics.uci.edu/
- OpenML: Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning. https://openml.org/search?type=data&sort=runs&status=active
Large Language Models (LLM)
- The Pile: The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29
- Open-Sourced Training Datasets for LLMs: Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-model
Keamanan Siber
- Real-CyberSecurity-Datasets: Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. https://github.com/gfek/Real-CyberSecurity-Datasets
- Awesome-LLM4Cybersecurity: Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. https://github.com/tmylla/Awesome-LLM4Cybersecurity
- Cyber Threat Dataset on Kaggle: Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. https://www.kaggle.com/datasets/ramoliyafenil/text-based-cyber-threat-detection/data
ComfyUI
- ComfyUI-DataSet: Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet
- ComfyUI Dataset Helper & Batch Node: Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper
- ComfyUI Dataset Generation Tutorial: Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.
Semoga sumber-sumber di atas membantu Anda dalam perjalanan belajar dan penelitian Anda di bidang-bidang tersebut.