Difference between revisions of "Orange: Image Analytics Clustering"

From OnnoWiki
Jump to navigation Jump to search
 
(4 intermediate revisions by the same user not shown)
Line 5: Line 5:
 
Untuk mengambil angka dari data yang tidak terstruktur, Orange dapat menggunakan deep network embedder. Orange baru saja mulai memasukkan berbagai embedders di Orange pada widget Image Embedding, dan untuk saat ini, sudah tersedia untuk teks dan gambar.
 
Untuk mengambil angka dari data yang tidak terstruktur, Orange dapat menggunakan deep network embedder. Orange baru saja mulai memasukkan berbagai embedders di Orange pada widget Image Embedding, dan untuk saat ini, sudah tersedia untuk teks dan gambar.
  
==Terkait: Video pada image clustering==
+
Pada kesempatan ini, kita akan mengambil contoh image embedding dan menunjukkan betapa mudahnya menggunakannya di Orange. Secara teknis, Orange akan mengirim gambar ke server, di mana server akan mendorong gambar melalui pre-trained deep neural network, seperti Google Inception v3. Deep network sering dilatih dengan tujuan tertentu. Inception v3, misalnya, dapat mengklasifikasikan gambar ke dalam salah satu dari 1.000 class gambar. Kita dapat saja mengabaikan klasifikasi yang bisa disarankan, sebagai gantinya mempertimbangkan penultimate layer dari network dengan 2048 node (angka) dan menggunakannya untuk image’s vector-based representation.
 
 
Di sini, kami memberikan contoh image embedding dan menunjukkan betapa mudahnya menggunakannya di Orange. Secara teknis, Orange akan mengirim gambar ke server, di mana server akan mendorong gambar melalui pre-trained deep neural network, seperti Google Inception v3. Deep network sering dilatih dengan tujuan khusus. Inception v3, misalnya, dapat mengklasifikasikan gambar ke dalam salah satu dari 1.000 kelas gambar. Kita dapat mengabaikan klasifikasi, sebagai gantinya mempertimbangkan lapisan kedua dari belakang jaringan dengan 2048 node (angka) dan menggunakannya untuk image’s vector-based representation.
 
  
 
==Contoh==
 
==Contoh==
  
Di sini kita memiliki 19 gambar hewan peliharaan. Pertama, unduh gambar dan unzip. Kemudian gunakan widget Import Images dari add-on Orange's Image Analytics dan buka direktori yang berisi gambar.
+
Dalam workflow contoh, kita akan menggunakan 19 gambar hewan peliharaan. Pertama, unduh gambar dan unzip. Kemudian gunakan widget Import Images dari add-on Orange Image Analytics dan buka direktori yang berisi gambar.
  
 
[[File:ImportImages.png|center|200px|thumb]]
 
[[File:ImportImages.png|center|200px|thumb]]
  
Kami dapat memvisualisasikan gambar dalam Image Viewer widget. Inilah workflow kami sejauh ini, dengan gambar yang ditampilkan di Image Viewer:
+
Gambar hewan bisa divisualisasikan menggunakan widget Image Viewer, seperti workflow berikut ini.
  
 
[[File:Image-viewer.png|center|200px|thumb]]
 
[[File:Image-viewer.png|center|200px|thumb]]
Line 21: Line 19:
 
[[File:Screen-Shot-2017-03-29-at-10.07.36.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.07.36.png|center|200px|thumb]]
  
Tapi apa yang kita lihat di tabel data? Hanya beberapa deskripsi gambar yang tidak berguna (nama file, lokasi file, ukurannya, dan lebar dan tinggi gambar).
+
Jika kita perhatikan baik-baik, isi tabel data hanya beberapa deskripsi gambar, seperti, nama file, lokasi file, ukurannya, dan lebar dan tinggi gambar. Informasi ini tidak bisa membantu kita untuk melakukan machine learning.
  
 
[[File:Screen-Shot-2017-03-29-at-10.11.06.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.11.06.png|center|200px|thumb]]
  
Ini tidak bisa membantu kita dengan machine learning. Seperti yang dikatakan sebelumnya, kita membutuhkan angka. Untuk memperoleh representasi numerik dari gambar-gambar ini, kita akan mengirim gambar ke Image Embedding widget.
+
Untuk melakukan machine learning kita membutuhkan angka. Untuk memperoleh representasi numerik dari gambar-gambar, kita mengirim gambar ke widget Image Embedding.
  
 
[[File:Screen-Shot-2017-03-29-at-10.15.50.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.15.50.png|center|200px|thumb]]
  
Bagus! Sekarang kita memiliki angka yang kita inginkan. Ada 2048 di antaranya (kolom n0 hingga n2047). Mulai sekarang, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.
+
Data keluaran widget Image Embedding dapat kita periksa menggunakan widget Data Table. Sekarang kita memiliki presentasi numerik / angka dari gambar-gambar. Per gambar ada 2048 representasi numerik (kolom n0 hingga n2047). Dengan feature representasi angka ini, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.
  
Mari kita ukur jarak antara gambar-gambar ini dan melihat mana yang paling mirip. Kami menggunakan Distances widget  untuk mengukur jarak. Biasanya, cosine distance paling baik untuk gambar, tetapi anda dapat bereksperimen sendiri. Kemudian kita akan mengirimkan distance matrix ke Hierarchical Clustering untuk memvisualisasikan similar pair di dendrogram.
+
Untuk mengelompokan berdasarkan kemiripan, kita dapat mengukur jarak antara gambar-gambar. Representasi angka dari gambar yang di peroleh dari widget Image Embedding, kita ukur jaraknya menggunakan widget Distances. Biasanya, cosine distance paling baik untuk gambar, tetapi anda dapat bereksperimen sendiri. Kemudian kita akan mengirimkan distance matrix ke Hierarchical Clustering untuk memvisualisasikan similar pair di dendrogram.
  
 
[[File:Screen-Shot-2017-03-29-at-10.20.38.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.20.38.png|center|200px|thumb]]
  
Ini terlihat sangat menjanjikan! Semua hewan yang tepat dikelompokkan bersama. Tapi saya tidak bisa melihat hasilnya dengan baik di dendrogram. Saya ingin melihat gambar - dengan Image Viewer!
+
Hasilnya, semua hewan secara benar masuk kelompoknya. Dalam dendogram hasil pengelompokan, kita tidak melihat gambar hewan. Kita dapat menggunakan widget Image Viewer untuk melihat gambar-nya.
  
 
[[File:Screen-Shot-2017-03-29-at-10.23.38.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.23.38.png|center|200px|thumb]]
  
Keren abis! Semua keluarga sapi dikelompokkan bersama! Sekarang kita dapat mengklik cabang dendrogram yang berbeda dan mengamati hewan mana yang termasuk dalam kelompok mana.
+
Terlihat dengan jelas bahwa keluarga sapi dikelompokkan bersama. Sekarang kita dapat mengklik cabang dendrogram yang berbeda dan mengamati hewan mana yang termasuk dalam kelompok mana.
  
Tapi saya tahu apa yang akan anda katakan. anda akan mengatakan saya curang. Bahwa saya sengaja memilih gambar yang mirip untuk menipu anda.
+
Kemungkinan anda akan berfikir, ini curang karena gambar yang dipilih sengaja di miripkan untuk menipu :) ....  
  
Saya akan membuktikan anda salah. Saya akan mengambil sapi baru, katakanlah, sapi paling terkenal di Eropa - sapi Milka.
+
Untuk membuktikan bahwa ini bukan tipuan, kita akan mengambil sapi baru, disini di ambil sapi paling terkenal di Eropa - sapi Milka.
  
 
[[File:Milka cow by miki3d.jpg|center|200px|thumb]]
 
[[File:Milka cow by miki3d.jpg|center|200px|thumb]]
  
Gambar ini sangat berbeda dari gambar lain - tidak memiliki latar belakang putih, ini foto asli (belum dipotret) dan sapi itu menghadap kami. Akankah Image Embedding menemukan representasi numerik yang tepat untuk sapi ini?
+
Gambar ini sangat berbeda dari gambar lain - tidak memiliki latar belakang putih, ini foto asli (belum dipotret) dan muka sapi Milka menghadap kemuka. Akankah widget Image Embedding menemukan representasi numerik yang tepat untuk sapi ini?
  
 
[[File:Screen-Shot-2017-03-29-at-10.30.41.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.30.41.png|center|200px|thumb]]
  
Memang dia berhasil. Milka disatukan dengan semua sapi lainnya.
+
Tampaknya berhasil. Milka disatukan dengan sapi lainnya.
  
Analisis gambar adalah bidang yang sangat menarik dalam pembelajaran mesin dan sekarang Orange juga menjadi bagian darinya! Anda perlu menginstal add Image Analytics dan Anda siap untuk penelitian Anda!
+
Analisis gambar adalah bidang yang sangat menarik dalam pembelajaran mesin dan sekarang Orange juga menjadi bagian darinya! anda perlu menginstal add-on Image Analytics dan anda siap untuk melakukan penelitian anda!
  
 
==Referensi==
 
==Referensi==

Latest revision as of 04:45, 14 March 2020

Sumber: https://orange.biolab.si/blog/2017/04/03/image-analytics-clustering/

Data tidak selalu datang dalam bentuk tabel yang bagus. Data juga dapat berupa kumpulan teks, rekaman audio, materi video atau bahkan gambar. Namun, komputer hanya dapat bekerja dengan angka, jadi untuk setiap data mining, kita perlu mengubah data yang tidak terstruktur tersebut menjadi representasi vektor.

Untuk mengambil angka dari data yang tidak terstruktur, Orange dapat menggunakan deep network embedder. Orange baru saja mulai memasukkan berbagai embedders di Orange pada widget Image Embedding, dan untuk saat ini, sudah tersedia untuk teks dan gambar.

Pada kesempatan ini, kita akan mengambil contoh image embedding dan menunjukkan betapa mudahnya menggunakannya di Orange. Secara teknis, Orange akan mengirim gambar ke server, di mana server akan mendorong gambar melalui pre-trained deep neural network, seperti Google Inception v3. Deep network sering dilatih dengan tujuan tertentu. Inception v3, misalnya, dapat mengklasifikasikan gambar ke dalam salah satu dari 1.000 class gambar. Kita dapat saja mengabaikan klasifikasi yang bisa disarankan, sebagai gantinya mempertimbangkan penultimate layer dari network dengan 2048 node (angka) dan menggunakannya untuk image’s vector-based representation.

Contoh

Dalam workflow contoh, kita akan menggunakan 19 gambar hewan peliharaan. Pertama, unduh gambar dan unzip. Kemudian gunakan widget Import Images dari add-on Orange Image Analytics dan buka direktori yang berisi gambar.

ImportImages.png

Gambar hewan bisa divisualisasikan menggunakan widget Image Viewer, seperti workflow berikut ini.

Image-viewer.png
Screen-Shot-2017-03-29-at-10.07.36.png

Jika kita perhatikan baik-baik, isi tabel data hanya beberapa deskripsi gambar, seperti, nama file, lokasi file, ukurannya, dan lebar dan tinggi gambar. Informasi ini tidak bisa membantu kita untuk melakukan machine learning.

Screen-Shot-2017-03-29-at-10.11.06.png

Untuk melakukan machine learning kita membutuhkan angka. Untuk memperoleh representasi numerik dari gambar-gambar, kita mengirim gambar ke widget Image Embedding.

Screen-Shot-2017-03-29-at-10.15.50.png

Data keluaran widget Image Embedding dapat kita periksa menggunakan widget Data Table. Sekarang kita memiliki presentasi numerik / angka dari gambar-gambar. Per gambar ada 2048 representasi numerik (kolom n0 hingga n2047). Dengan feature representasi angka ini, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.

Untuk mengelompokan berdasarkan kemiripan, kita dapat mengukur jarak antara gambar-gambar. Representasi angka dari gambar yang di peroleh dari widget Image Embedding, kita ukur jaraknya menggunakan widget Distances. Biasanya, cosine distance paling baik untuk gambar, tetapi anda dapat bereksperimen sendiri. Kemudian kita akan mengirimkan distance matrix ke Hierarchical Clustering untuk memvisualisasikan similar pair di dendrogram.

Screen-Shot-2017-03-29-at-10.20.38.png

Hasilnya, semua hewan secara benar masuk kelompoknya. Dalam dendogram hasil pengelompokan, kita tidak melihat gambar hewan. Kita dapat menggunakan widget Image Viewer untuk melihat gambar-nya.

Screen-Shot-2017-03-29-at-10.23.38.png

Terlihat dengan jelas bahwa keluarga sapi dikelompokkan bersama. Sekarang kita dapat mengklik cabang dendrogram yang berbeda dan mengamati hewan mana yang termasuk dalam kelompok mana.

Kemungkinan anda akan berfikir, ini curang karena gambar yang dipilih sengaja di miripkan untuk menipu :) ....

Untuk membuktikan bahwa ini bukan tipuan, kita akan mengambil sapi baru, disini di ambil sapi paling terkenal di Eropa - sapi Milka.

Milka cow by miki3d.jpg

Gambar ini sangat berbeda dari gambar lain - tidak memiliki latar belakang putih, ini foto asli (belum dipotret) dan muka sapi Milka menghadap kemuka. Akankah widget Image Embedding menemukan representasi numerik yang tepat untuk sapi ini?

Screen-Shot-2017-03-29-at-10.30.41.png

Tampaknya berhasil. Milka disatukan dengan sapi lainnya.

Analisis gambar adalah bidang yang sangat menarik dalam pembelajaran mesin dan sekarang Orange juga menjadi bagian darinya! anda perlu menginstal add-on Image Analytics dan anda siap untuk melakukan penelitian anda!

Referensi

Pranala Menarik