Difference between revisions of "Orange: Box Plot"

From OnnoWiki
Jump to navigation Jump to search
 
(5 intermediate revisions by the same user not shown)
Line 1: Line 1:
 
Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/boxplot.html
 
Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/boxplot.html
  
Shows distribution of attribute values.
+
Menunjukkan distribusi nilai atribut.
  
 
==Input==
 
==Input==
Line 12: Line 12:
 
     Data: data with an additional column showing whether a point is selected
 
     Data: data with an additional column showing whether a point is selected
  
The Box Plot widget shows the distributions of attribute values. It is a good practice to check any new data with this widget to quickly discover any anomalies, such as duplicated values (e.g. gray and grey), outliers, and alike.
+
Widget Box Plot menunjukkan distribusi nilai atribut. Merupakan praktik yang baik untuk memeriksa data baru apa pun dengan widget ini untuk menemukan anomali dengan cepat, seperti nilai duplikat (mis. gray atau grey), outliers, dan sejenisnya.
  
 
[[File:BoxPlot-Continuous-stamped.png|center|200px|thumb]]
 
[[File:BoxPlot-Continuous-stamped.png|center|200px|thumb]]
Line 28: Line 28:
 
* Access help, save image or produce a report.
 
* Access help, save image or produce a report.
  
For discrete attributes, the bars represent the number of instances with each particular attribute value. The plot shows the number of different animal types in the Zoo dataset: there are 41 mammals, 13 fish, 20 birds and so on.
+
Untuk atribut diskrit, bar akan mewakili jumlah instance dengan setiap nilai atribut tertentu. Plot menunjukkan jumlah jenis hewan yang berbeda dalam dataset Zoo: ada 41 mamalia, 13 ikan, 20 burung dan sebagainya.
  
 
[[File:BoxPlot-Discrete.png|center|200px|thumb]]
 
[[File:BoxPlot-Discrete.png|center|200px|thumb]]
Line 34: Line 34:
 
==Contoh==
 
==Contoh==
  
The Box Plot widget is most commonly used immediately after the File widget to observe the statistical properties of a dataset. In the first example, we have used heart-disease data to inspect our variables.
+
Widget Box Plot paling umum digunakan segera setelah File widget untuk mengamati properti statistik dari suatu dataset. Dalam contoh ini, kita telah menggunakan heart-disease data untuk memeriksa variabel kita.
  
[[File:BoxPlot-Example1.png|center|200px|thumb]]
+
[[File:BoxPlot-Example1.png|center|600px|thumb]]
  
Box Plot is also useful for finding the properties of a specific dataset, for instance a set of instances manually defined in another widget (e.g. Scatter Plot or instances belonging to some cluster or a classification tree node. Let us now use zoo data and create a typical clustering workflow with Distances and Hierarchical Clustering.
+
Box Plot juga berguna untuk menemukan properti dari dataset tertentu, misalnya satu set instance yang ditentukan secara manual di widget lain (misalnya Scatter Plot, atau instance dari beberapa cluster, atau node klasifikasi tree).
 
 
Now define the threshold for cluster selection (click on the ruler at the top). Connect Box Plot to Hierarchical Clustering, tick Order by relevance and select Cluster as a subgroup. This will order attributes by how well they define the selected subgroup, in our case a cluster. Seems like our clusters indeed correspond very well with the animal type!
 
 
 
[[File:BoxPlot-Example2.png|center|200px|thumb]]
 
  
 +
Contoh selanjutnya, kita menggunakan zoo data dan membuat workflow clustering dengan Distances and Hierarchical Clustering. Sekarang tentukan threshold  untuk pemilihan cluster (klik pada ruler di atas). Hubungkan Box Plot ke Hierarchical Clustering, centang Order by relevance dan pilih Cluster as a subgroup. Ini akan mengurut atribut dengan seberapa baik mereka mendefinisikan subgroup yang dipilih, dalam kasus kita sebuah cluster. Sepertinya cluster kita memang sangat cocok dengan jenis hewan!
  
 +
[[File:BoxPlot-Example2.png|center|600px|thumb]]
  
 
==Referensi==
 
==Referensi==

Latest revision as of 04:18, 9 April 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/boxplot.html

Menunjukkan distribusi nilai atribut.

Input

   Data: input dataset

Output

   Selected Data: instances selected from the plot
   Data: data with an additional column showing whether a point is selected

Widget Box Plot menunjukkan distribusi nilai atribut. Merupakan praktik yang baik untuk memeriksa data baru apa pun dengan widget ini untuk menemukan anomali dengan cepat, seperti nilai duplikat (mis. gray atau grey), outliers, dan sejenisnya.

BoxPlot-Continuous-stamped.png
  • Select the variable you want to plot. Tick Order by relevance to order variables by Chi2 or ANOVA over the selected subgroup.
  • Choose Subgroups to see box plots displayed by a discrete subgroup.
  • When instances are grouped by a subgroup, you can change the display mode. Annotated boxes will display the end values, the mean and the median, while compare medians and compare means will, naturally, compare the selected value between subgroups. continuous
BoxPlot-Continuous-small.png
  • The mean (the dark blue vertical line). The thin blue line represents the standard deviation.
  • Values of the first (25%) and the third (75%) quantile. The blue highlighted area represents the values between the first and the third quartile.
  • The median (yellow vertical line).
  • If Send automatically is ticked, changes are communicated automatically. Alternatively, press Send.
  • Access help, save image or produce a report.

Untuk atribut diskrit, bar akan mewakili jumlah instance dengan setiap nilai atribut tertentu. Plot menunjukkan jumlah jenis hewan yang berbeda dalam dataset Zoo: ada 41 mamalia, 13 ikan, 20 burung dan sebagainya.

BoxPlot-Discrete.png

Contoh

Widget Box Plot paling umum digunakan segera setelah File widget untuk mengamati properti statistik dari suatu dataset. Dalam contoh ini, kita telah menggunakan heart-disease data untuk memeriksa variabel kita.

BoxPlot-Example1.png

Box Plot juga berguna untuk menemukan properti dari dataset tertentu, misalnya satu set instance yang ditentukan secara manual di widget lain (misalnya Scatter Plot, atau instance dari beberapa cluster, atau node klasifikasi tree).

Contoh selanjutnya, kita menggunakan zoo data dan membuat workflow clustering dengan Distances and Hierarchical Clustering. Sekarang tentukan threshold untuk pemilihan cluster (klik pada ruler di atas). Hubungkan Box Plot ke Hierarchical Clustering, centang Order by relevance dan pilih Cluster as a subgroup. Ini akan mengurut atribut dengan seberapa baik mereka mendefinisikan subgroup yang dipilih, dalam kasus kita sebuah cluster. Sepertinya cluster kita memang sangat cocok dengan jenis hewan!

BoxPlot-Example2.png

Referensi

Pranala Menarik