Orange: Data Mining for Business and Public Administration
Sumber: https://orange.biolab.si/blog/2017/11/17/data-mining-business-public-administration/
Ketika kami mengatakan ajarkan bisnis, kami maksudkan bagaimana melakukan data mining untuk bisnis, katakan prediksi churn atau gesekan karyawan, segmen pelanggan, temukan item mana yang direkomendasikan di toko online dan lacak sentimen merek dengan text analisis.
Untuk tujuan ini, kami telah membuat beberapa pembaruan pada add-on Associate kami dan menambahkan dataset baru ke Data Sets widget yang dapat digunakan untuk segmentasi pelanggan dan menemukan grup item mana yang sering dibeli bersama. Seperti ini:
Kita load Online Retail data set
Karena kita memiliki transaksi di baris dan item di kolom, kami harus mengubah tabel data untuk menghitung jarak antara item (baris). Kita cukup meminta Distances widget untuk menghitung jarak antara kolom dan bukan baris. Kemudian kita mengirim tabel data yang dipindahkan ke Distances dan menghitung jarak cosinus antara item (jarak cosinus hanya akan memberi tahu kita, item mana yang dibeli bersamaan, mengabaikan jumlah item yang dibeli).
[[File:Screen-Shot-2017-11-17-at-13.10.24.png|center|300px|thumb
Akhirnya, kita mengamati cluster yang ditemukan di Hierarchical Clustering. Sepertinya mug dan tanda dekoratif sering dibeli bersamaan. Kenapa begitu? Pilih grup di Hierarchical Clustering dan amati cluster di Data Table. Anggap ini sebagai latihan dalam eksplorasi data. :)