Difference between revisions of "Orange: Image Analytics Clustering"

From OnnoWiki
Jump to navigation Jump to search
Line 31: Line 31:
 
Bagus! Sekarang kita memiliki angka yang kita inginkan. Ada 2048 di antaranya (kolom n0 hingga n2047). Mulai sekarang, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.
 
Bagus! Sekarang kita memiliki angka yang kita inginkan. Ada 2048 di antaranya (kolom n0 hingga n2047). Mulai sekarang, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.
  
Let us measure the distance between these images and see which are the most similar. We used Distances widget to measure the distance. Normally, cosine distance works best for images, but you can experiment on your own. Then we passed the distance matrix to Hierarchical Clustering to visualize similar pairs in a dendrogram.
+
Mari kita ukur jarak antara gambar-gambar ini dan melihat mana yang paling mirip. Kami menggunakan Distances widget untuk mengukur jarak. Biasanya, cosine distance paling baik untuk gambar, tetapi anda dapat bereksperimen sendiri. Kemudian kita akan mengirimkan distance matrix ke Hierarchical Clustering untuk memvisualisasikan similar pair di dendrogram.
  
 
[[File:Screen-Shot-2017-03-29-at-10.20.38.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.20.38.png|center|200px|thumb]]
  
This looks very promising! All the right animals are grouped together. But I can’t see the results so well in the dendrogram. I want to see the images - with Image Viewer!
+
Ini terlihat sangat menjanjikan! Semua hewan yang tepat dikelompokkan bersama. Tapi saya tidak bisa melihat hasilnya dengan baik di dendrogram. Saya ingin melihat gambar - dengan Image Viewer!
  
 
[[File:Screen-Shot-2017-03-29-at-10.23.38.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.23.38.png|center|200px|thumb]]
  
So cool! All the cow family is grouped together! Now we can click on different branches of the dendrogram and observe which animals belong to which group.
+
Keren abis! Semua keluarga sapi dikelompokkan bersama! Sekarang kita dapat mengklik cabang dendrogram yang berbeda dan mengamati hewan mana yang termasuk dalam kelompok mana.
  
But I know what you are going to say. You are going to say I am cheating. That I intentionally selected similar images to trick you.
+
Tapi saya tahu apa yang akan anda katakan. anda akan mengatakan saya curang. Bahwa saya sengaja memilih gambar yang mirip untuk menipu anda.
  
I will prove you wrong. I will take a new cow, say, the most famous cow in Europe - Milka cow.
+
Saya akan membuktikan anda salah. Saya akan mengambil sapi baru, katakanlah, sapi paling terkenal di Eropa - sapi Milka.
  
 
[[File:Milka cow by miki3d.jpg|center|200px|thumb]]
 
[[File:Milka cow by miki3d.jpg|center|200px|thumb]]
  
This image is quite different from the other images - it doesn’t have a white background, it’s a real (yet photoshopped) photo and the cow is facing us. Will the Image Embedding find the right numerical representation for this cow?
+
Gambar ini sangat berbeda dari gambar lain - tidak memiliki latar belakang putih, ini foto asli (belum dipotret) dan sapi itu menghadap kami. Akankah  Image Embedding menemukan representasi numerik yang tepat untuk sapi ini?
  
 
[[File:Screen-Shot-2017-03-29-at-10.30.41.png|center|200px|thumb]]
 
[[File:Screen-Shot-2017-03-29-at-10.30.41.png|center|200px|thumb]]
  
Indeed it has. Milka is nicely put together with all the other cows.
+
Memang dia berhasil. Milka disatukan dengan semua sapi lainnya.
  
Image analytics is such an exciting field in machine learning and now Orange is a part of it too! You need to install the Image Analytics add on and you are all set for your research!
+
Analisis gambar adalah bidang yang sangat menarik dalam pembelajaran mesin dan sekarang Orange juga menjadi bagian darinya! Anda perlu menginstal add Image Analytics dan Anda siap untuk penelitian Anda!
  
 
==Referensi==
 
==Referensi==

Revision as of 11:25, 29 January 2020

Sumber: https://orange.biolab.si/blog/2017/04/03/image-analytics-clustering/

Data tidak selalu datang dalam bentuk tabel yang bagus. Data juga dapat berupa kumpulan teks, rekaman audio, materi video atau bahkan gambar. Namun, komputer hanya dapat bekerja dengan angka, jadi untuk setiap penambangan data, kita perlu mengubah data yang tidak terstruktur tersebut menjadi representasi vektor.

Untuk mengambil angka dari data yang tidak terstruktur, Orange dapat menggunakan deep network embedder. Kita baru saja mulai memasukkan berbagai embedders di Orange, dan untuk saat ini, mereka tersedia untuk teks dan gambar.

Terkait: Video pada image clustering

Di sini, kami memberikan contoh image embedding dan menunjukkan betapa mudahnya menggunakannya di Orange. Secara teknis, Orange akan mengirim gambar ke server, di mana server akan mendorong gambar melalui pre-trained deep neural network, seperti Google Inception v3. Deep network sering dilatih dengan tujuan khusus. Inception v3, misalnya, dapat mengklasifikasikan gambar ke dalam salah satu dari 1.000 kelas gambar. Kita dapat mengabaikan klasifikasi, sebagai gantinya mempertimbangkan lapisan kedua dari belakang jaringan dengan 2048 node (angka) dan menggunakannya untuk image’s vector-based representation.

Contoh

Di sini kita memiliki 19 gambar hewan peliharaan. Pertama, unduh gambar dan unzip. Kemudian gunakanImport Images widget dari add-on Orange's Image Analytics dan buka direktori yang berisi gambar.

ImportImages.png

Kami dapat memvisualisasikan gambar dalam Image Viewer widget. Inilah workflow kami sejauh ini, dengan gambar yang ditampilkan di Image Viewer:

Image-viewer.png
Screen-Shot-2017-03-29-at-10.07.36.png

Tapi apa yang kita lihat di tabel data? Hanya beberapa deskripsi gambar yang tidak berguna (nama file, lokasi file, ukurannya, dan lebar dan tinggi gambar).

Screen-Shot-2017-03-29-at-10.11.06.png

Ini tidak bisa membantu kita dengan machine learning. Seperti yang dikatakan sebelumnya, kita membutuhkan angka. Untuk memperoleh representasi numerik dari gambar-gambar ini, kita akan mengirim gambar ke Image Embedding widget.

Screen-Shot-2017-03-29-at-10.15.50.png

Bagus! Sekarang kita memiliki angka yang kita inginkan. Ada 2048 di antaranya (kolom n0 hingga n2047). Mulai sekarang, kita dapat menerapkan semua teknik standard machine learning, seperti, clustering.

Mari kita ukur jarak antara gambar-gambar ini dan melihat mana yang paling mirip. Kami menggunakan Distances widget untuk mengukur jarak. Biasanya, cosine distance paling baik untuk gambar, tetapi anda dapat bereksperimen sendiri. Kemudian kita akan mengirimkan distance matrix ke Hierarchical Clustering untuk memvisualisasikan similar pair di dendrogram.

Screen-Shot-2017-03-29-at-10.20.38.png

Ini terlihat sangat menjanjikan! Semua hewan yang tepat dikelompokkan bersama. Tapi saya tidak bisa melihat hasilnya dengan baik di dendrogram. Saya ingin melihat gambar - dengan Image Viewer!

Screen-Shot-2017-03-29-at-10.23.38.png

Keren abis! Semua keluarga sapi dikelompokkan bersama! Sekarang kita dapat mengklik cabang dendrogram yang berbeda dan mengamati hewan mana yang termasuk dalam kelompok mana.

Tapi saya tahu apa yang akan anda katakan. anda akan mengatakan saya curang. Bahwa saya sengaja memilih gambar yang mirip untuk menipu anda.

Saya akan membuktikan anda salah. Saya akan mengambil sapi baru, katakanlah, sapi paling terkenal di Eropa - sapi Milka.

Milka cow by miki3d.jpg

Gambar ini sangat berbeda dari gambar lain - tidak memiliki latar belakang putih, ini foto asli (belum dipotret) dan sapi itu menghadap kami. Akankah Image Embedding menemukan representasi numerik yang tepat untuk sapi ini?

Screen-Shot-2017-03-29-at-10.30.41.png

Memang dia berhasil. Milka disatukan dengan semua sapi lainnya.

Analisis gambar adalah bidang yang sangat menarik dalam pembelajaran mesin dan sekarang Orange juga menjadi bagian darinya! Anda perlu menginstal add Image Analytics dan Anda siap untuk penelitian Anda!

Referensi

Pranala Menarik