Orange: Data Mining for Business and Public Administration

From OnnoWiki
Jump to navigation Jump to search

Sumber: https://orange.biolab.si/blog/2017/11/17/data-mining-business-public-administration/


Ketika kami mengatakan ajarkan bisnis, kami maksudkan bagaimana melakukan data mining untuk bisnis, katakan prediksi churn atau gesekan karyawan, segmen pelanggan, temukan item mana yang direkomendasikan di toko online dan lacak sentimen merek dengan text analisis.

Untuk tujuan ini, kami telah membuat beberapa pembaruan pada add-on Associate kami dan menambahkan dataset baru ke Data Sets widget yang dapat digunakan untuk segmentasi pelanggan dan menemukan grup item mana yang sering dibeli bersama. Seperti ini:

Screen-Shot-2017-11-17-at-13.06.22.png

Kita load Online Retail data set

Screen-Shot-2017-11-17-at-13.07.31.png

Karena kita memiliki transaksi di baris dan item di kolom, kami harus mengubah tabel data untuk menghitung jarak antara item (baris). Kita cukup meminta Distances widget untuk menghitung jarak antara kolom dan bukan baris. Kemudian kita mengirim tabel data yang dipindahkan ke Distances dan menghitung jarak cosinus antara item (jarak cosinus hanya akan memberi tahu kita, item mana yang dibeli bersamaan, mengabaikan jumlah item yang dibeli).

Screen-Shot-2017-11-17-at-13.10.24.png

Akhirnya, kita mengamati cluster yang ditemukan di Hierarchical Clustering. Sepertinya mug dan tanda dekoratif sering dibeli bersamaan. Kenapa begitu? Pilih grup di Hierarchical Clustering dan amati cluster di Data Table. Anggap ini sebagai latihan dalam eksplorasi data. :)

Screen-Shot-2017-11-17-at-13.04.32.png




Referensi

Pranala Menarik