Difference between revisions of "Orange: Sieve Diagram"

From OnnoWiki
Jump to navigation Jump to search
(Created page with "Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/sievediagram.html Plots a sieve diagram for a pair of attributes. Inputs Data: input da...")
 
 
(6 intermediate revisions by the same user not shown)
Line 3: Line 3:
  
  
 +
Widget Sieve Diagram memplot sieve diagram untuk sepasang atribut.
  
 +
==Input==
  
 +
Data: input dataset
  
 +
Sieve Diagram adalah metode grafis untuk memvisualisasikan frekuensi dalam tabel kontingensi dua arah dan membandingkannya dengan frekuensi yang diharapkan dengan asumsi independensi. Itu diusulkan oleh Riedwyl dan Schüpbach dalam laporan teknis pada tahun 1983 dan kemudian disebut parquet diagram  (Riedwyl dan Schüpbach 1994). Dalam tampilan widget Sieve Diagram, luas setiap persegi panjang sebanding dengan frekuensi yang diharapkan, sedangkan frekuensi yang diamati ditunjukkan oleh jumlah kotak di setiap persegi panjang. Perbedaan antara frekuensi yang diamati dan frekuensi yang diharapkan (sebanding dengan standard Pearson residual) muncul sebagai density of shading, menggunakan warna untuk menunjukkan apakah penyimpangan dari independensi positif (biru) atau negatif (merah).
  
 +
[[File:SieveDiagram-stamped.png|center|600px|thumb]]
  
 +
* Select the attributes you want to display in the sieve plot.
 +
* Score combinations enables you to fin the best possible combination of attributes.
 +
* Save Image saves the created image to your computer in a .svg or .png format.
 +
* Produce a report.
  
 +
Cuplikan widget Sieve Diagram di bawah ini menunjukkan sieve diagram untuk dataset Titanic dan memiliki atribut jenis kelamin dan survived (yang terakhir adalah atribut class dalam dataset ini). Plot menunjukkan bahwa kedua variabel sangat terkait, karena ada perbedaan besar antara frekuensi yang diamati dan yang diharapkan di keempat kuadran. Sebagai contoh, dan seperti yang disoroti dalam balon, peluang untuk selamat dari kecelakaan jauh lebih tinggi untuk penumpang wanita daripada yang diperkirakan (0,06 vs 0,15).
  
 +
[[File:SieveDiagram-Titanic.png|center|600px|thumb]]
  
Plots a sieve diagram for a pair of attributes.
+
Pasangan atribut dengan asosiasi yang menarik memiliki strong shading, seperti diagram yang ditunjukkan pada widget Sievie Diagram di atas. Sebagai kontras, sieve diagram dari pasangan yang paling tidak menarik (usia vs bertahan hidup) ditunjukkan di bawah ini.
  
Inputs
+
[[File:SieveDiagram-Titanic-age-survived.png|center|600px|thumb]]
  
    Data: input dataset
+
==Contoh==
  
A Sieve Diagram is a graphical method for visualizing frequencies in a two-way contingency table and comparing them to expected frequencies under assumption of independence. It was proposed by Riedwyl and Schüpbach in a technical report in 1983 and later called a parquet diagram (Riedwyl and Schüpbach 1994). In this display, the area of each rectangle is proportional to the expected frequency, while the observed frequency is shown by the number of squares in each rectangle. The difference between observed and expected frequency (proportional to the standard Pearson residual) appears as the density of shading, using color to indicate whether the deviation from independence is positive (blue) or negative (red).
+
Di bawah ini, kita melihat skema sederhana menggunakan dataset Titanic, di mana kita menggunakan widget Rank untuk memilih atribut terbaik (atribut dengan highest information gain, gain ratio atau Gini index) dan memasukkannya ke dalam  widget Sieve Diagram. Di bawah ini tampilan sieve plot untuk dua atribut terbaik, yang dalam kasus kita adalah jenis kelamin dan status. Kita melihat bahwa tingkat kelangsungan hidup di Titanic sangat tinggi untuk wanita dari kelas satu dan sangat rendah untuk crew wanita.
  
../../_images/SieveDiagram-stamped.png
+
[[File:SieveDiagram-Example2.PNG|center|600px|thumb]]
  
    Select the attributes you want to display in the sieve plot.
+
Widget Sieve Diagram juga menampilkan opsi Kombinasi Skor, yang membuat peringkat atribut lebih mudah.
  
    Score combinations enables you to fin the best possible combination of attributes.
+
[[File:SieveDiagram-Example1.PNG|center|600px|thumb]]
  
    Save Image saves the created image to your computer in a .svg or .png format.
+
==Referensi==
 
 
    Produce a report.
 
 
 
The snapshot below shows a sieve diagram for the Titanic dataset and has the attributes sex and survived (the latter is a class attribute in this dataset). The plot shows that the two variables are highly associated, as there are substantial differences between observed and expected frequencies in all of the four quadrants. For example, and as highlighted in the balloon, the chance for surviving the accident was much higher for female passengers than expected (0.06 vs. 0.15).
 
 
 
../../_images/SieveDiagram-Titanic.png
 
 
 
Pairs of attributes with interesting associations have a strong shading, such as the diagram shown in the above snapshot. For contrast, a sieve diagram of the least interesting pair (age vs. survival) is shown below.
 
 
 
../../_images/SieveDiagram-Titanic-age-survived.png
 
Example
 
 
 
Below, we see a simple schema using the Titanic dataset, where we use the Rank widget to select the best attributes (the ones with the highest information gain, gain ratio or Gini index) and feed them into the Sieve Diagram. This displays the sieve plot for the two best attributes, which in our case are sex and status. We see that the survival rate on the Titanic was very high for women of the first class and very low for female crew members.
 
 
 
../../_images/SieveDiagram-Example2.PNG
 
 
 
The Sieve Diagram also features the Score Combinations option, which makes the ranking of attributes even easier.
 
 
 
../../_images/SieveDiagram-Example1.PNG
 
References
 
  
 
Riedwyl, H., and Schüpbach, M. (1994). Parquet diagram to plot contingency tables. In Softstat ‘93: Advances in Statistical Software, F. Faulbaum (Ed.). New York: Gustav Fischer, 293-299.
 
Riedwyl, H., and Schüpbach, M. (1994). Parquet diagram to plot contingency tables. In Softstat ‘93: Advances in Statistical Software, F. Faulbaum (Ed.). New York: Gustav Fischer, 293-299.

Latest revision as of 13:36, 5 April 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/visualize/sievediagram.html


Widget Sieve Diagram memplot sieve diagram untuk sepasang atribut.

Input

Data: input dataset

Sieve Diagram adalah metode grafis untuk memvisualisasikan frekuensi dalam tabel kontingensi dua arah dan membandingkannya dengan frekuensi yang diharapkan dengan asumsi independensi. Itu diusulkan oleh Riedwyl dan Schüpbach dalam laporan teknis pada tahun 1983 dan kemudian disebut parquet diagram (Riedwyl dan Schüpbach 1994). Dalam tampilan widget Sieve Diagram, luas setiap persegi panjang sebanding dengan frekuensi yang diharapkan, sedangkan frekuensi yang diamati ditunjukkan oleh jumlah kotak di setiap persegi panjang. Perbedaan antara frekuensi yang diamati dan frekuensi yang diharapkan (sebanding dengan standard Pearson residual) muncul sebagai density of shading, menggunakan warna untuk menunjukkan apakah penyimpangan dari independensi positif (biru) atau negatif (merah).

SieveDiagram-stamped.png
  • Select the attributes you want to display in the sieve plot.
  • Score combinations enables you to fin the best possible combination of attributes.
  • Save Image saves the created image to your computer in a .svg or .png format.
  • Produce a report.

Cuplikan widget Sieve Diagram di bawah ini menunjukkan sieve diagram untuk dataset Titanic dan memiliki atribut jenis kelamin dan survived (yang terakhir adalah atribut class dalam dataset ini). Plot menunjukkan bahwa kedua variabel sangat terkait, karena ada perbedaan besar antara frekuensi yang diamati dan yang diharapkan di keempat kuadran. Sebagai contoh, dan seperti yang disoroti dalam balon, peluang untuk selamat dari kecelakaan jauh lebih tinggi untuk penumpang wanita daripada yang diperkirakan (0,06 vs 0,15).

SieveDiagram-Titanic.png

Pasangan atribut dengan asosiasi yang menarik memiliki strong shading, seperti diagram yang ditunjukkan pada widget Sievie Diagram di atas. Sebagai kontras, sieve diagram dari pasangan yang paling tidak menarik (usia vs bertahan hidup) ditunjukkan di bawah ini.

SieveDiagram-Titanic-age-survived.png

Contoh

Di bawah ini, kita melihat skema sederhana menggunakan dataset Titanic, di mana kita menggunakan widget Rank untuk memilih atribut terbaik (atribut dengan highest information gain, gain ratio atau Gini index) dan memasukkannya ke dalam widget Sieve Diagram. Di bawah ini tampilan sieve plot untuk dua atribut terbaik, yang dalam kasus kita adalah jenis kelamin dan status. Kita melihat bahwa tingkat kelangsungan hidup di Titanic sangat tinggi untuk wanita dari kelas satu dan sangat rendah untuk crew wanita.

SieveDiagram-Example2.PNG

Widget Sieve Diagram juga menampilkan opsi Kombinasi Skor, yang membuat peringkat atribut lebih mudah.

SieveDiagram-Example1.PNG

Referensi

Riedwyl, H., and Schüpbach, M. (1994). Parquet diagram to plot contingency tables. In Softstat ‘93: Advances in Statistical Software, F. Faulbaum (Ed.). New York: Gustav Fischer, 293-299.


Referensi

Pranala Menarik