Difference between revisions of "Orange: Distance Map"

From OnnoWiki
Jump to navigation Jump to search
 
(9 intermediate revisions by the same user not shown)
Line 3: Line 3:
  
  
Visualizes distances between items.
+
Visualisasi distances antar items.
  
 
==Input==
 
==Input==
Line 14: Line 14:
 
  Features: attributes selected from the matrix
 
  Features: attributes selected from the matrix
  
The Distance Map visualizes distances between objects. The visualization is the same as if we printed out a table of numbers, except that the numbers are replaced by colored spots.
+
Distance Map memvisualisasikan jarak antar objek. Visualisasinya sama seperti jika kita mencetak tabel angka, bedanya angka-angka tersebut diganti dengan bintik-bintik berwarna.
  
Distances are most often those between instances (“rows” in the Distances widget) or attributes (“columns” in Distances widget). The only suitable input for Distance Map is the Distances widget. For the output, the user can select a region of the map and the widget will output the corresponding instances or attributes. Also note that the Distances widget ignores discrete values and calculates distances only for continuous data, thus it can only display distance map for discrete data if you Continuize them first.
+
Distances (jarak) paling banyak dihitung antara instance ("baris (row)" di widget Distances) atau atribut ("kolom (column)" di widget Distances). Satu-satunya input yang cocok untuk Distance Map adalah widget Distances. Pada output, pengguna dapat memilih wilayah peta dan widget Distance Map akan menampilkan instance atau atribut yang sesuai. Juga perhatikan bahwa widget Distances mengabaikan nilai diskrit dan menghitung jarak hanya untuk data kontinyu, sehingga widget Distance Map hanya dapat menampilkan peta jarak untuk distance map jika kita membuat data-nya kontinyu terlebih dahulu.
  
The snapshot shows distances between columns in the heart disease data, where smaller distances are represented with light and larger with dark orange. The matrix is symmetric and the diagonal is a light shade of orange - no attribute is different from itself. Symmetricity is always assumed, while the diagonal may also be non-zero.
+
Snapshot ini menunjukkan jarak antar kolom dalam data heart disease, di mana jarak yang lebih kecil diwakili dengan warna orange terang (light) dan jarak yang jauh / larger dengan oranye gelap. Matrix simetris dan diagonal adalah warna oranye terang - tidak ada atribut yang berbeda dari dirinya sendiri. Simetrisitas selalu diasumsikan, sedangkan diagonal mungkin juga bukan nol.
  
 
[[File:DistanceMap-stamped.png|center|200px|thumb]]
 
[[File:DistanceMap-stamped.png|center|200px|thumb]]
Line 34: Line 34:
 
* Produce a report.
 
* Produce a report.
  
Normally, a color palette is used to visualize the entire range of distances appearing in the matrix. This can be changed by setting the low and high threshold. In this way we ignore the differences in distances outside this interval and visualize the interesting part of the distribution.
+
Biasanya, palet warna digunakan untuk memvisualisasikan seluruh rentang jarak yang muncul dalam matriks. Ini dapat diubah dengan mengatur ambang rendah dan tinggi. Dengan cara ini kita mengabaikan perbedaan jarak di luar interval ini dan memvisualisasikan bagian yang menarik dari distribusi.
  
Below, we visualized the most correlated attributes (distances by columns) in the heart disease dataset by setting the color threshold for high distances to the minimum. We get a predominantly black square, where attributes with the lowest distance scores are represented by a lighter shade of the selected color schema (in our case: orange). Beside the diagonal line, we see that in our example ST by exercise and major vessels colored are the two attributes closest together.
+
Di bawah ini, kita memvisualisasikan atribut yang paling berkorelasi (distances by columns) dalam dataset  heart disease dengan menetapkan ambang warna untuk jarak tinggi ke minimum. Kita mendapatkan kotak hitam dominan, di mana atribut dengan skor jarak terendah diwakili oleh warna yang lebih terang dari skema warna yang dipilih (dalam kasus kita: oranye). Di samping garis diagonal, kita melihat bahwa dalam contoh kita ST dengan exercise dan major vessels berwarna adalah dua atribut yang paling dekat.
  
 
[[File:DistanceMap-Highlighted.png|center|200px|thumb]]
 
[[File:DistanceMap-Highlighted.png|center|200px|thumb]]
  
The user can select a region in the map with the usual click-and-drag of the cursor. When a part of the map is selected, the widget outputs all items from the selected cells.
+
Pengguna dapat memilih wilayah di peta dengan click-and-drag dengan kursor. Ketika bagian dari peta dipilih, widget mengeluarkan semua item data dari sel yang dipilih.
  
 
==Contoh==
 
==Contoh==
  
The first workflow shows a very standard use of the Distance Map widget. We select 70% of the original Iris data as our sample and view the distances between rows in Distance Map.
+
Workflow kerja pertama menunjukkan penggunaan widget Distance Map yang sangat standar. Kita memilih 70% dari data Iris original sebagai sampel kita dan melihat jarak antara baris dalam Distance Map.
  
 
[[File:DistanceMap-Example1.png|center|200px|thumb]]
 
[[File:DistanceMap-Example1.png|center|200px|thumb]]
  
In the second example, we use the heart disease data again and select a subset of women only from the Scatter Plot. Then, we visualize distances between columns in the Distance Map. Since the subset also contains some discrete data, the Distances widget warns us it will ignore the discrete features, thus we will see only continuous instances/attributes in the map.
+
Pada contoh kedua, kita menggunakan data heart disease dan memilih subset hanya women dari Scatter Plot. Kemudian, kita memvisualisasikan jarak antar kolom di Distance Map. Karena himpunan bagian juga berisi beberapa data diskrit, widget Distances memperingatkan kita bahwa ia akan mengabaikan fitur diskrit, sehingga kita hanya akan melihat instance / atribut kontinu dalam peta.
  
 
[[File:DistanceMap-Example.png|center|200px|thumb]]
 
[[File:DistanceMap-Example.png|center|200px|thumb]]
 
  
 
==Referensi==
 
==Referensi==

Latest revision as of 07:08, 6 March 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/unsupervised/distancemap.html


Visualisasi distances antar items.

Input

Distances: distance matrix

Output

Data: instances selected from the matrix
Features: attributes selected from the matrix

Distance Map memvisualisasikan jarak antar objek. Visualisasinya sama seperti jika kita mencetak tabel angka, bedanya angka-angka tersebut diganti dengan bintik-bintik berwarna.

Distances (jarak) paling banyak dihitung antara instance ("baris (row)" di widget Distances) atau atribut ("kolom (column)" di widget Distances). Satu-satunya input yang cocok untuk Distance Map adalah widget Distances. Pada output, pengguna dapat memilih wilayah peta dan widget Distance Map akan menampilkan instance atau atribut yang sesuai. Juga perhatikan bahwa widget Distances mengabaikan nilai diskrit dan menghitung jarak hanya untuk data kontinyu, sehingga widget Distance Map hanya dapat menampilkan peta jarak untuk distance map jika kita membuat data-nya kontinyu terlebih dahulu.

Snapshot ini menunjukkan jarak antar kolom dalam data heart disease, di mana jarak yang lebih kecil diwakili dengan warna orange terang (light) dan jarak yang jauh / larger dengan oranye gelap. Matrix simetris dan diagonal adalah warna oranye terang - tidak ada atribut yang berbeda dari dirinya sendiri. Simetrisitas selalu diasumsikan, sedangkan diagonal mungkin juga bukan nol.

DistanceMap-stamped.png
  • Element sorting arranges elements in the map by
    • None (lists instances as found in the dataset)
    • Clustering (clusters data by similarity)
    • Clustering with ordered leaves (maximizes the sum of similarities of adjacent elements)
  • Colors
    • Colors (select the color palette for your distance map)
    • Low and High are thresholds for the color palette (low for instances or attributes with low distances and high for instances or attributes with high distances).
  • Select Annotations.
  • If Send Selected Automatically is on, the data subset is communicated automatically, otherwise you need to press Send Selected.
  • Press Save Image if you want to save the created image to your computer.
  • Produce a report.

Biasanya, palet warna digunakan untuk memvisualisasikan seluruh rentang jarak yang muncul dalam matriks. Ini dapat diubah dengan mengatur ambang rendah dan tinggi. Dengan cara ini kita mengabaikan perbedaan jarak di luar interval ini dan memvisualisasikan bagian yang menarik dari distribusi.

Di bawah ini, kita memvisualisasikan atribut yang paling berkorelasi (distances by columns) dalam dataset heart disease dengan menetapkan ambang warna untuk jarak tinggi ke minimum. Kita mendapatkan kotak hitam dominan, di mana atribut dengan skor jarak terendah diwakili oleh warna yang lebih terang dari skema warna yang dipilih (dalam kasus kita: oranye). Di samping garis diagonal, kita melihat bahwa dalam contoh kita ST dengan exercise dan major vessels berwarna adalah dua atribut yang paling dekat.

DistanceMap-Highlighted.png

Pengguna dapat memilih wilayah di peta dengan click-and-drag dengan kursor. Ketika bagian dari peta dipilih, widget mengeluarkan semua item data dari sel yang dipilih.

Contoh

Workflow kerja pertama menunjukkan penggunaan widget Distance Map yang sangat standar. Kita memilih 70% dari data Iris original sebagai sampel kita dan melihat jarak antara baris dalam Distance Map.

DistanceMap-Example1.png

Pada contoh kedua, kita menggunakan data heart disease dan memilih subset hanya women dari Scatter Plot. Kemudian, kita memvisualisasikan jarak antar kolom di Distance Map. Karena himpunan bagian juga berisi beberapa data diskrit, widget Distances memperingatkan kita bahwa ia akan mengabaikan fitur diskrit, sehingga kita hanya akan melihat instance / atribut kontinu dalam peta.

DistanceMap-Example.png

Referensi

Pranala Menarik