Orange: Distributions

From OnnoWiki
Revision as of 09:35, 4 March 2020 by Onnowpurbo (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/distributions.html


Menampilkan distribusi nilai untuk satu atribut.

Input

Data: input dataset

Widget Distributions menampilkan distribusi nilai atribut diskrit atau kontinu. Jika data berisi variabel class, distribusi dapat dikondisikan di class.

Untuk atribut diskrit, grafik yang ditampilkan oleh widget menunjukkan berapa kali (mis., berapa banyak instance) setiap nilai atribut muncul dalam data. Jika data berisi variabel class, distribusi class untuk setiap nilai atribut akan ditampilkan juga (seperti dalam snapshot di bawah). Untuk membuat grafik ini, kita menggunakan dataset Zoo.

Distributions-Disc-stamped.png
  • A list of variables for distributions display
  • If Bin continuous variables is ticked, the widget will discretize continuous variables by assigning them to intervals. The number of intervals is set by precision scale. Alternatively, you can set smoothness for the distribution curves of continuous variables.
  • The widget may be requested to display value distributions only for instances of certain class (Group by). Show relative frequencies will scale the data by percentage of the dataset.
  • Show probabilities.
  • Save image saves the graph to your computer in a .svg or .png format.
  • Produce a report.

Untuk atribut kontinu, nilai atribut ditampilkan sebagai grafik fungsi. Probabilitas class untuk atribut kontinu diperoleh dengan estimasi kepadatan kernel Gaussian, sedangkan tampilan kurva diatur dengan Precision bar (smooth atau precise).

Sebagai contoh, di bawah ini kita menggunakan dataset Iris.

Distributions-Cont.png

Dalam class-less domain, bar yang ditampilkan berwarna abu-abu. Di sini kita set variabel kontinu menjadi 10 bin, yang mendistribusikan variabel ke dalam 10 interval dan menampilkan rata-rata interval ini sebagai histogram (lihat 2. di atas). Kita menggunakan dataset Housing.

Distributions-NoClass.png

Referensi

Pranala Menarik