Difference between revisions of "Dataset URL"

From OnnoWiki
Jump to navigation Jump to search
Line 3: Line 3:
 
=='''Machine Learning & Deep Learning'''==
 
=='''Machine Learning & Deep Learning'''==
  
* '''Kaggle Datasets''': Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29
+
* '''Kaggle Datasets''': Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda.  
* '''UCI Machine Learning Repository''': Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-models?utm_source=chatgpt.com
+
* '''UCI Machine Learning Repository''': Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning.  
 
* '''OpenML''': Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning.
 
* '''OpenML''': Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning.
  
 
=='''Large Language Models (LLM)'''==
 
=='''Large Language Models (LLM)'''==
  
* '''The Pile''': The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar.
+
* '''The Pile''': The Pile adalah dataset teks berbahasa Inggris yang beragam dan open-source, terdiri dari 22 sumber berbeda, dirancang khusus untuk melatih model bahasa besar. https://en.wikipedia.org/wiki/The_Pile_%28dataset%29
* '''Open-Sourced Training Datasets for LLMs''': Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting.
+
* '''Open-Sourced Training Datasets for LLMs''': Artikel ini membahas 9 dataset open-source yang digunakan untuk melatih LLM, beserta langkah-langkah pra-pemrosesan data yang penting. https://kili-technology.com/large-language-models-llms/9-open-sourced-datasets-for-training-large-language-model
  
 
=='''Keamanan Siber'''==
 
=='''Keamanan Siber'''==
  
* '''Real-CyberSecurity-Datasets''': Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya.
+
* '''Real-CyberSecurity-Datasets''': Repositori GitHub ini menyediakan kumpulan dataset publik untuk membantu Anda menangani berbagai masalah keamanan siber menggunakan Machine Learning atau metode lainnya. https://github.com/gfek/Real-CyberSecurity-Datasets
* '''Awesome-LLM4Cybersecurity''': Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait.
+
* '''Awesome-LLM4Cybersecurity''': Repositori ini memberikan tinjauan komprehensif tentang aplikasi LLM dalam keamanan siber, termasuk literatur dan sumber daya terkait. https://github.com/tmylla/Awesome-LLM4Cybersecurity
* '''Cyber Threat Dataset on Kaggle''': Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya.
+
* '''Cyber Threat Dataset on Kaggle''': Dataset ini menyediakan koleksi data untuk mendeteksi, mendiagnosis, dan mengatasi ancaman siber menggunakan data lalu lintas jaringan, konten tekstual, dan lainnya. https://www.kaggle.com/datasets/ramoliyafenil/text-based-cyber-threat-detection/data
  
 
=='''ComfyUI'''==
 
=='''ComfyUI'''==
  
* '''ComfyUI-DataSet''': Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI.
+
* '''ComfyUI-DataSet''': Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet
* '''ComfyUI Dataset Helper & Batch Node''': Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch.
+
* '''ComfyUI Dataset Helper & Batch Node''': Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper
 
* '''ComfyUI Dataset Generation Tutorial''': Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.
 
* '''ComfyUI Dataset Generation Tutorial''': Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.
  

Revision as of 08:50, 1 April 2025

Berikut adalah beberapa sumber dataset yang dapat Anda gunakan untuk mempelajari Machine Learning, Deep Learning, Large Language Models (LLM), Keamanan Siber, dan ComfyUI:

Machine Learning & Deep Learning

  • Kaggle Datasets: Kaggle menyediakan berbagai dataset untuk berbagai keperluan Machine Learning dan Deep Learning. Anda dapat menjelajahi dan mengunduh dataset sesuai kebutuhan Anda.
  • UCI Machine Learning Repository: Repositori ini menawarkan kumpulan dataset yang sering digunakan dalam penelitian Machine Learning.
  • OpenML: Platform ini menyediakan akses ke berbagai dataset, alur kerja, dan eksperimen untuk komunitas Machine Learning.

Large Language Models (LLM)

Keamanan Siber

ComfyUI

  • ComfyUI-DataSet: Repositori ini menawarkan alat untuk penelitian data, persiapan, dan manipulasi bagi pelatih model dan seniman yang menggunakan ComfyUI. https://github.com/daxcay/ComfyUI-DataSet
  • ComfyUI Dataset Helper & Batch Node: Ekstensi ini menyediakan node khusus untuk ComfyUI guna memproses dataset secara otomatis dan berurutan, berguna untuk pelatihan iteratif atau alur kerja pembuatan gambar/video dalam batch. https://comfy.icu/extension/fblissjr__ComfyUI-DatasetHelper
  • ComfyUI Dataset Generation Tutorial: Video ini memberikan panduan mendalam tentang pendekatan pembuatan, kurasi, dan persiapan dataset menggunakan ComfyUI.

Semoga sumber-sumber di atas membantu Anda dalam perjalanan belajar dan penelitian Anda di bidang-bidang tersebut.


Pranala Menarik