Difference between revisions of "Datamining"

From OnnoWiki
Jump to navigation Jump to search
Line 1: Line 1:
Data mining (the analysis step of the "knowledge discovery in databases" process, or KDD), an interdisciplinary subfield of computer science is the computational process of discovering patterns in large data sets ("big data") involving methods at the intersection of [[artificial intelligence]], [[machine learning]], [[statistics]], and [[database systems]]. The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use. Aside from the raw analysis step, it involves database and data management aspects, data pre-processing, model and inference considerations, interestingness metrics, complexity considerations, post-processing of discovered structures, visualization, and online updating.
+
Data mining (tahap analisis proses "knowledge discovery in databasebases" atau KDD), sub bidang ilmu komputer interdisipliner adalah proses komputasi untuk menemukan pola dalam kumpulan data yang besar ("big data") yang melibatkan metode di persimpangan buatan Kecerdasan, machine learning, statistik, dan sistem database. Tujuan keseluruhan dari proses data mining adalah mengekstrak informasi dari kumpulan data dan mengubahnya menjadi struktur yang mudah dimengerti untuk digunakan lebih lanjut. Selain tahap analisis mentah, ini mencakup aspek pengelolaan data dan data, pra-pengolahan, pertimbangan model dan pertimbangan, metrik ketertarikan, pertimbangan kompleksitas, pemrosesan pasca struktur, visualisasi, dan pemutakhiran online.
  
The term is a misnomer, because the goal is the extraction of patterns and knowledge from large amount of data, not the extraction (mining) of data itself. It also is a buzzword and is frequently applied to any form of large-scale data or information processing (collection, extraction, warehousing, analysis, and statistics) as well as any application of computer decision support system, including artificial intelligence, machine learning, and business intelligence. The book Data mining: Practical machine learning tools and techniques with Java (which covers mostly machine learning material) was originally to be named just Practical machine learning, and the term data mining was only added for marketing reasons. Often the more general terms (large scale) data analysis and analytics – or, when referring to actual methods, artificial intelligence and machine learning – are more appropriate.
+
Istilahnya adalah keliru, karena tujuannya adalah ekstraksi pola dan pengetahuan dari sejumlah besar data, bukan penggalian (penambangan) data itu sendiri. Ini juga merupakan kata kunci dan sering digunakan untuk segala bentuk pemrosesan data atau data berskala besar (pengumpulan, ekstraksi, pergudangan, analisis, dan statistik) serta penerapan sistem pendukung keputusan komputer, termasuk kecerdasan buatan, pembelajaran mesin, Dan intelijen bisnis. Buku Data mining: Alat dan teknik belajar mesin praktis dengan Java (yang sebagian besar mencakup materi pembelajaran mesin) pada awalnya diberi nama hanya pembelajaran mesin Praktis, dan istilah data mining hanya ditambahkan karena alasan pemasaran. Seringkali analisis dan analisis data istilah umum (skala besar) - atau, bila mengacu pada metode aktual, kecerdasan buatan dan pembelajaran mesin - lebih tepat.
  
The actual data mining task is the automatic or semi-automatic analysis of large quantities of data to extract previously unknown, interesting patterns such as groups of data records (cluster analysis), unusual records (anomaly detection), and dependencies (association rule mining). This usually involves using database techniques such as spatial indices. These patterns can then be seen as a kind of summary of the input data, and may be used in further analysis or, for example, in machine learning and predictive analytics. For example, the data mining step might identify multiple groups in the data, which can then be used to obtain more accurate prediction results by a decision support system. Neither the data collection, data preparation, nor result interpretation and reporting is part of the data mining step, but do belong to the overall KDD process as additional steps.
+
Tugas penambangan data sebenarnya adalah analisis otomatis atau semi otomatis dari sejumlah besar data untuk mengekstrak pola yang tidak diketahui sebelumnya dan menarik seperti kelompok data record (analisis cluster), catatan yang tidak biasa (deteksi anomali), dan dependensi (rules rule mining) . Ini biasanya melibatkan penggunaan teknik database seperti indeks spasial. Pola ini kemudian dapat dilihat sebagai semacam ringkasan data masukan, dan dapat digunakan untuk analisis lebih lanjut atau, misalnya, dalam pembelajaran mesin dan analisis prediktif. Misalnya, langkah data mining dapat mengidentifikasi beberapa kelompok dalam data, yang kemudian dapat digunakan untuk mendapatkan hasil prediksi yang lebih akurat oleh sistem pendukung keputusan. Baik pengumpulan data, persiapan data, maupun interpretasi dan pelaporan hasil merupakan bagian dari data mining, namun merupakan bagian dari keseluruhan proses KDD sebagai langkah tambahan.
  
The related terms data dredging, data fishing, and data snooping refer to the use of data mining methods to sample parts of a larger population data set that are (or may be) too small for reliable statistical inferences to be made about the validity of any patterns discovered. These methods can, however, be used in creating new hypotheses to test against the larger data populations.
+
Istilah terkait pengerukan data, pemasyarakatan data, dan pengintaian data mengacu pada penggunaan metode data mining untuk mengambil sampel bagian dari kumpulan data populasi yang lebih besar yang mungkin terlalu kecil untuk kesimpulan statistik yang dapat dipercaya mengenai validitas dari setiap Pola ditemukan Metode ini dapat digunakan untuk menciptakan hipotesis baru untuk diuji terhadap populasi data yang lebih besar.
  
  

Revision as of 08:42, 29 July 2017

Data mining (tahap analisis proses "knowledge discovery in databasebases" atau KDD), sub bidang ilmu komputer interdisipliner adalah proses komputasi untuk menemukan pola dalam kumpulan data yang besar ("big data") yang melibatkan metode di persimpangan buatan Kecerdasan, machine learning, statistik, dan sistem database. Tujuan keseluruhan dari proses data mining adalah mengekstrak informasi dari kumpulan data dan mengubahnya menjadi struktur yang mudah dimengerti untuk digunakan lebih lanjut. Selain tahap analisis mentah, ini mencakup aspek pengelolaan data dan data, pra-pengolahan, pertimbangan model dan pertimbangan, metrik ketertarikan, pertimbangan kompleksitas, pemrosesan pasca struktur, visualisasi, dan pemutakhiran online.

Istilahnya adalah keliru, karena tujuannya adalah ekstraksi pola dan pengetahuan dari sejumlah besar data, bukan penggalian (penambangan) data itu sendiri. Ini juga merupakan kata kunci dan sering digunakan untuk segala bentuk pemrosesan data atau data berskala besar (pengumpulan, ekstraksi, pergudangan, analisis, dan statistik) serta penerapan sistem pendukung keputusan komputer, termasuk kecerdasan buatan, pembelajaran mesin, Dan intelijen bisnis. Buku Data mining: Alat dan teknik belajar mesin praktis dengan Java (yang sebagian besar mencakup materi pembelajaran mesin) pada awalnya diberi nama hanya pembelajaran mesin Praktis, dan istilah data mining hanya ditambahkan karena alasan pemasaran. Seringkali analisis dan analisis data istilah umum (skala besar) - atau, bila mengacu pada metode aktual, kecerdasan buatan dan pembelajaran mesin - lebih tepat.

Tugas penambangan data sebenarnya adalah analisis otomatis atau semi otomatis dari sejumlah besar data untuk mengekstrak pola yang tidak diketahui sebelumnya dan menarik seperti kelompok data record (analisis cluster), catatan yang tidak biasa (deteksi anomali), dan dependensi (rules rule mining) . Ini biasanya melibatkan penggunaan teknik database seperti indeks spasial. Pola ini kemudian dapat dilihat sebagai semacam ringkasan data masukan, dan dapat digunakan untuk analisis lebih lanjut atau, misalnya, dalam pembelajaran mesin dan analisis prediktif. Misalnya, langkah data mining dapat mengidentifikasi beberapa kelompok dalam data, yang kemudian dapat digunakan untuk mendapatkan hasil prediksi yang lebih akurat oleh sistem pendukung keputusan. Baik pengumpulan data, persiapan data, maupun interpretasi dan pelaporan hasil merupakan bagian dari data mining, namun merupakan bagian dari keseluruhan proses KDD sebagai langkah tambahan.

Istilah terkait pengerukan data, pemasyarakatan data, dan pengintaian data mengacu pada penggunaan metode data mining untuk mengambil sampel bagian dari kumpulan data populasi yang lebih besar yang mungkin terlalu kecil untuk kesimpulan statistik yang dapat dipercaya mengenai validitas dari setiap Pola ditemukan Metode ini dapat digunakan untuk menciptakan hipotesis baru untuk diuji terhadap populasi data yang lebih besar.


Referensi


Pranala Menarik