Difference between revisions of "Dataset URL"
Jump to navigation
Jump to search
Onnowpurbo (talk | contribs) (Created page with "Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari '''Machine Learning''', '''Deep Learning''', '''Large Language Models (LLM)''', '''Keamanan Si...") |
Onnowpurbo (talk | contribs) |
||
(2 intermediate revisions by the same user not shown) | |||
Line 3: | Line 3: | ||
=='''Machine Learning & Deep Learning'''== | =='''Machine Learning & Deep Learning'''== | ||
− | * '''Kaggle Datasets''': Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda. | + | * '''Kaggle Datasets''': Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda. https://www.kaggle.com/datasets |
− | * '''UCI Machine Learning Repository''': Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning. | + | * '''UCI Machine Learning Repository''': Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning. https://archive.ics.uci.edu/ |
− | * '''OpenML''': Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning. | + | * '''OpenML''': Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning. https://openml.org/search?type=data&sort=runs&status=active |
=='''Large Language Models (LLM)'''== | =='''Large Language Models (LLM)'''== | ||
− | * '''The Pile''': The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. | + | * '''The Pile''': The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29 |
− | * '''Open-Sourced Training Datasets for LLMs''': Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. | + | * '''Open-Sourced Training Datasets for LLMs''': Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-model |
=='''Keamanan Siber'''== | =='''Keamanan Siber'''== | ||
− | * '''Real-CyberSecurity-Datasets''': Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. | + | * '''Real-CyberSecurity-Datasets''': Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. https://github.com/gfek/Real-CyberSecurity-Datasets |
− | * '''Awesome-LLM4Cybersecurity''': Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. | + | * '''Awesome-LLM4Cybersecurity''': Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. https://github.com/tmylla/Awesome-LLM4Cybersecurity |
− | * '''Cyber Threat Dataset on Kaggle''': Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. | + | * '''Cyber Threat Dataset on Kaggle''': Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. https://www.kaggle.com/datasets/ramoliyafenil/text-based-cyber-threat-detection/data |
=='''ComfyUI'''== | =='''ComfyUI'''== | ||
− | * '''ComfyUI-DataSet''': Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. | + | * '''ComfyUI-DataSet''': Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet |
− | * '''ComfyUI Dataset Helper & Batch Node''': Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. | + | * '''ComfyUI Dataset Helper & Batch Node''': Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper |
* '''ComfyUI Dataset Generation Tutorial''': Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI. | * '''ComfyUI Dataset Generation Tutorial''': Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI. | ||
Latest revision as of 09:08, 1 April 2025
Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari Machine Learning, Deep Learning, Large Language Models (LLM), Keamanan Siber, dan ComfyUI:
Machine Learning & Deep Learning
- Kaggle Datasets: Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda. https://www.kaggle.com/datasets
- UCI Machine Learning Repository: Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning. https://archive.ics.uci.edu/
- OpenML: Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning. https://openml.org/search?type=data&sort=runs&status=active
Large Language Models (LLM)
- The Pile: The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29
- Open-Sourced Training Datasets for LLMs: Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-model
Keamanan Siber
- Real-CyberSecurity-Datasets: Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. https://github.com/gfek/Real-CyberSecurity-Datasets
- Awesome-LLM4Cybersecurity: Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. https://github.com/tmylla/Awesome-LLM4Cybersecurity
- Cyber Threat Dataset on Kaggle: Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. https://www.kaggle.com/datasets/ramoliyafenil/text-based-cyber-threat-detection/data
ComfyUI
- ComfyUI-DataSet: Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet
- ComfyUI Dataset Helper & Batch Node: Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper
- ComfyUI Dataset Generation Tutorial: Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.
Semoga sumber-sumber di atas membantu Anda dalam perjalanan belajar dan penelitian Anda di bidang-bidang tersebut.