Difference between revisions of "Orange: Distributions"

From OnnoWiki
Jump to navigation Jump to search
Line 2: Line 2:
  
  
Displays value distributions for a single attribute.
+
Menampilkan distribusi nilai untuk satu atribut.
  
 
==Input==
 
==Input==
Line 8: Line 8:
 
  Data: input dataset
 
  Data: input dataset
  
The Distributions widget displays the value distribution of discrete or continuous attributes. If the data contains a class variable, distributions may be conditioned on the class.
+
Widget Distribusi menampilkan distribusi nilai atribut diskrit atau kontinu. Jika data berisi variabel class, distribusi dapat dikondisikan di class.
  
For discrete attributes, the graph displayed by the widget shows how many times (e.g., in how many instances) each attribute value appears in the data. If the data contains a class variable, class distributions for each of the attribute values will be displayed as well (like in the snapshot below). In order to create this graph, we used the Zoo dataset.
+
Untuk atribut diskrit, grafik yang ditampilkan oleh widget menunjukkan berapa kali (mis., berapa banyak instance) setiap nilai atribut muncul dalam data. Jika data berisi variabel class, distribusi class untuk setiap nilai atribut akan ditampilkan juga (seperti dalam snapshot di bawah). Untuk membuat grafik ini, kita menggunakan dataset Zoo.
  
 
[[File:Distributions-Disc-stamped.png|center|200px|thumb]]
 
[[File:Distributions-Disc-stamped.png|center|200px|thumb]]
Line 21: Line 21:
 
* Produce a report.
 
* Produce a report.
  
For continuous attributes, the attribute values are displayed as a function graph. Class probabilities for continuous attributes are obtained with Gaussian kernel density estimation, while the appearance of the curve is set with the Precision bar (smooth or precise).
+
Untuk atribut kontinu, nilai atribut ditampilkan sebagai grafik fungsi. Probabilitas class untuk atribut kontinu diperoleh dengan estimasi kepadatan kernel Gaussian, sedangkan tampilan kurva diatur dengan Precision bar (smooth atau precise).
  
 
For the purpose of this example, we used the Iris dataset.
 
For the purpose of this example, we used the Iris dataset.
Line 27: Line 27:
 
[[File:Distributions-Cont.png|center|200px|thumb]]
 
[[File:Distributions-Cont.png|center|200px|thumb]]
  
In class-less domains, the bars are displayed in gray. Here we set Bin continuous variables into 10 bins, which distributes variables into 10 intervals and displays averages of these intervals as histograms (see 2. above). We used the Housing dataset.
+
Dalam class-less domain, bar yang ditampilkan berwarna abu-abu. Di sini kita set variabel kontinu menjadi 10 bin, yang mendistribusikan variabel ke dalam 10 interval dan menampilkan rata-rata interval ini sebagai histogram (lihat 2. di atas). Kita menggunakan dataset Housing.
  
 
[[File:Distributions-NoClass.png|center|200px|thumb]]
 
[[File:Distributions-NoClass.png|center|200px|thumb]]

Revision as of 08:01, 3 February 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/distributions.html


Menampilkan distribusi nilai untuk satu atribut.

Input

Data: input dataset

Widget Distribusi menampilkan distribusi nilai atribut diskrit atau kontinu. Jika data berisi variabel class, distribusi dapat dikondisikan di class.

Untuk atribut diskrit, grafik yang ditampilkan oleh widget menunjukkan berapa kali (mis., berapa banyak instance) setiap nilai atribut muncul dalam data. Jika data berisi variabel class, distribusi class untuk setiap nilai atribut akan ditampilkan juga (seperti dalam snapshot di bawah). Untuk membuat grafik ini, kita menggunakan dataset Zoo.

Distributions-Disc-stamped.png
  • A list of variables for distributions display
  • If Bin continuous variables is ticked, the widget will discretize continuous variables by assigning them to intervals. The number of intervals is set by precision scale. Alternatively, you can set smoothness for the distribution curves of continuous variables.
  • The widget may be requested to display value distributions only for instances of certain class (Group by). Show relative frequencies will scale the data by percentage of the dataset.
  • Show probabilities.
  • Save image saves the graph to your computer in a .svg or .png format.
  • Produce a report.

Untuk atribut kontinu, nilai atribut ditampilkan sebagai grafik fungsi. Probabilitas class untuk atribut kontinu diperoleh dengan estimasi kepadatan kernel Gaussian, sedangkan tampilan kurva diatur dengan Precision bar (smooth atau precise).

For the purpose of this example, we used the Iris dataset.

Distributions-Cont.png

Dalam class-less domain, bar yang ditampilkan berwarna abu-abu. Di sini kita set variabel kontinu menjadi 10 bin, yang mendistribusikan variabel ke dalam 10 interval dan menampilkan rata-rata interval ini sebagai histogram (lihat 2. di atas). Kita menggunakan dataset Housing.

Distributions-NoClass.png


Referensi

Pranala Menarik