Orange: Distributions
Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/distributions.html
Menampilkan distribusi nilai untuk satu atribut.
Input
Data: input dataset
Widget Distributions menampilkan distribusi nilai atribut diskrit atau kontinu. Jika data berisi variabel class, distribusi dapat dikondisikan di class.
Untuk atribut diskrit, grafik yang ditampilkan oleh widget menunjukkan berapa kali (mis., berapa banyak instance) setiap nilai atribut muncul dalam data. Jika data berisi variabel class, distribusi class untuk setiap nilai atribut akan ditampilkan juga (seperti dalam snapshot di bawah). Untuk membuat grafik ini, kita menggunakan dataset Zoo.
- A list of variables for distributions display
- If Bin continuous variables is ticked, the widget will discretize continuous variables by assigning them to intervals. The number of intervals is set by precision scale. Alternatively, you can set smoothness for the distribution curves of continuous variables.
- The widget may be requested to display value distributions only for instances of certain class (Group by). Show relative frequencies will scale the data by percentage of the dataset.
- Show probabilities.
- Save image saves the graph to your computer in a .svg or .png format.
- Produce a report.
Untuk atribut kontinu, nilai atribut ditampilkan sebagai grafik fungsi. Probabilitas class untuk atribut kontinu diperoleh dengan estimasi kepadatan kernel Gaussian, sedangkan tampilan kurva diatur dengan Precision bar (smooth atau precise).
Sebagai contoh, di bawah ini kita menggunakan dataset Iris.
Dalam class-less domain, bar yang ditampilkan berwarna abu-abu. Di sini kita set variabel kontinu menjadi 10 bin, yang mendistribusikan variabel ke dalam 10 interval dan menampilkan rata-rata interval ini sebagai histogram (lihat 2. di atas). Kita menggunakan dataset Housing.