Datamining

From OnnoWiki
Jump to navigation Jump to search

Data mining (tahap analisis proses "knowledge discovery in databasebases" atau KDD), sub bidang ilmu komputer interdisipliner adalah proses komputasi untuk menemukan pola dalam kumpulan data yang besar ("big data") yang melibatkan metode di persimpangan buatan Kecerdasan, machine learning, statistik, dan sistem database. Tujuan keseluruhan dari proses data mining adalah mengekstrak informasi dari kumpulan data dan mengubahnya menjadi struktur yang mudah dimengerti untuk digunakan lebih lanjut. Selain tahap analisis mentah, ini mencakup aspek pengelolaan data dan data, pra-pengolahan, pertimbangan model dan pertimbangan, metrik ketertarikan, pertimbangan kompleksitas, pemrosesan pasca struktur, visualisasi, dan pemutakhiran online.

Istilahnya adalah keliru, karena tujuannya adalah ekstraksi pola dan pengetahuan dari sejumlah besar data, bukan penggalian (penambangan) data itu sendiri. Ini juga merupakan kata kunci dan sering digunakan untuk segala bentuk pemrosesan data atau data berskala besar (pengumpulan, ekstraksi, pergudangan, analisis, dan statistik) serta penerapan sistem pendukung keputusan komputer, termasuk kecerdasan buatan, pembelajaran mesin, Dan intelijen bisnis. Buku Data mining: Alat dan teknik belajar mesin praktis dengan Java (yang sebagian besar mencakup materi pembelajaran mesin) pada awalnya diberi nama hanya pembelajaran mesin Praktis, dan istilah data mining hanya ditambahkan karena alasan pemasaran. Seringkali analisis dan analisis data istilah umum (skala besar) - atau, bila mengacu pada metode aktual, kecerdasan buatan dan pembelajaran mesin - lebih tepat.

Tugas penambangan data sebenarnya adalah analisis otomatis atau semi otomatis dari sejumlah besar data untuk mengekstrak pola yang tidak diketahui sebelumnya dan menarik seperti kelompok data record (analisis cluster), catatan yang tidak biasa (deteksi anomali), dan dependensi (rules rule mining) . Ini biasanya melibatkan penggunaan teknik database seperti indeks spasial. Pola ini kemudian dapat dilihat sebagai semacam ringkasan data masukan, dan dapat digunakan untuk analisis lebih lanjut atau, misalnya, dalam pembelajaran mesin dan analisis prediktif. Misalnya, langkah data mining dapat mengidentifikasi beberapa kelompok dalam data, yang kemudian dapat digunakan untuk mendapatkan hasil prediksi yang lebih akurat oleh sistem pendukung keputusan. Baik pengumpulan data, persiapan data, maupun interpretasi dan pelaporan hasil merupakan bagian dari data mining, namun merupakan bagian dari keseluruhan proses KDD sebagai langkah tambahan.

Istilah terkait pengerukan data, pemasyarakatan data, dan pengintaian data mengacu pada penggunaan metode data mining untuk mengambil sampel bagian dari kumpulan data populasi yang lebih besar yang mungkin terlalu kecil untuk kesimpulan statistik yang dapat dipercaya mengenai validitas dari setiap Pola ditemukan Metode ini dapat digunakan untuk menciptakan hipotesis baru untuk diuji terhadap populasi data yang lebih besar.


Referensi


Konsep


Pranala Menarik