Difference between revisions of "Orange: Pivot Table"

From OnnoWiki
Jump to navigation Jump to search
 
(15 intermediate revisions by the same user not shown)
Line 2: Line 2:
  
  
 +
Widget Pivot Table membentuk kembali tabel data berdasarkan nilai kolom.
  
 +
==Input==
  
Reshape data table based on column values.
+
Data: input data set
  
Inputs
+
==Output==
  
    Data: input data set
+
Pivot Table: contingency matrix as shown in the widget
 +
Filtered Data: subset selected from the plot
 +
Grouped Data: aggregates over groups defined by row values
  
Outputs
+
Widget Pivot Table merangkum data dari tabel yang lebih luas ke dalam tabel statistik. Statistik dapat mencakup jumlah, rata-rata, jumlah, dll. Widget Pivot Table juga memungkinkan pemilihan subset dari tabel dan pengelompokan berdasarkan nilai baris, yang harus berupa variabel diskrit. Data dengan hanya variabel numerik tidak dapat ditampilkan dalam tabel.
  
    Pivot Table: contingency matrix as shown in the widget
+
[[File:Pivot-stamped.png|center|400px|thumb]]
  
    Filtered Data: subset selected from the plot
+
* Discrete or numeric variable used for row values. Numeric variables are considered as integers.
 +
* Discrete variable used for column values. Variable values will appear as columns in the table.
 +
* Values used for aggregation. Aggregated values will appear as cells in the table.
 +
* Aggregation methods:
 +
** For any variable type:
 +
*** Count: number of instances with the given row and column value.
 +
*** Count defined: number of instances where the aggregation value is defined.
 +
** For numeric variables:
 +
*** Sum: sum of values.
 +
*** Mean: average of values.
 +
*** Mode: most frequent value of the subset.
 +
*** Min: smallest value.
 +
*** Max: highest value.
 +
*** Median: middle value.
 +
*** Var: variance of the subset.
 +
** For discrete variables:
 +
*** Majority: most frequent value of the subset.
 +
* Tick the box on the left to automatically output any changes. Alternatively, press Apply .
  
    Grouped Data: aggregates over groups defined by row values
+
==Variable Diskrit==
  
Pivot Table summarizes the data of a more extensive table into a table of statistics. The statistics can include sums, averages, counts, etc. The widget also allows selecting a subset from the table and grouping by row values, which have to be a discrete variable. Data with only numeric variables cannot be displayed in the table.
+
[[File:Pivot-discrete.png|center|600px|thumb]]
  
../../_images/Pivot-stamped.png
+
Contoh Widget Pivot Table dengan hanya variabel diskrit yang dipilih. Kita menggunakan dataset heart-disease untuk contoh ini. Baris sesuai dengan nilai-nilai variabel penyempitan diameter. Kolom kita adalah nilai-nilai gender, yaitu perempuan dan laki-laki. Kita menggunakan thal sebagai nilai dalam sel kita.
  
    Discrete or numeric variable used for row values. Numeric variables are considered as integers.
+
Kita telah memilih Count dan Mayoritas sebagai metode agregasi. Dalam widget Pivot Table, kita dapat melihat jumlah instance yang tidak memiliki penyempitan diameter dan wanita. Ada 72 pasien seperti itu. Secara bersamaan, ada 92 pasien pria yang tidak mengalami penyempitan diameter. Nilai Thal tidak berpengaruh di sini, kita hanya menghitung kejadian dalam data.
  
    Discrete variable used for column values. Variable values will appear as columns in the table.
+
Baris kedua menunjukkan mayoritas. Ini berarti sebagian besar pasien wanita yang tidak mengalami penyempitan diameter memiliki hasil normal. Sebaliknya, pasien wanita yang mengalami penyempitan diameter paling sering memiliki reversable defect.
  
    Values used for aggregation. Aggregated values will appear as cells in the table.
+
==Variabel Numerik==
  
    Aggregation methods:
+
[[File:Pivot-continuous.png||center|600px|thumb]]
  
        For any variable type:
+
Contoh widget Pivot Table dengan variabel numerik. Kita menggunakan dataset heart-disease untuk contoh ini. Baris sesuai dengan nilai-nilai variabel penyempitan diameter. Kolom kita adalah nilai-nilai gender, yaitu perempuan dan laki-laki. Kita menggunakan sisa SBP sebagai nilai dalam sel kita.
  
            Count: number of instances with the given row and column value.
+
Kita memilih Count, Sum and Median sebagai metode agregasi. Di bawah Count, kita melihat ada 72 pasien wanita yang tidak memiliki penyempitan diameter, sama seperti sebelumnya untuk nilai diskrit. Yang berbeda adalah sum dan median agregasi. Kita melihat bahwa jumlah tekanan darah sistolik istirahat untuk pasien wanita yang tidak memiliki penyempitan diameter adalah 9269 dan nilai median adalah 130.
  
            Count defined: number of instances where the aggregation value is defined.
+
==Contoh==
  
        For numeric variables:
+
Kita menggunakan dataset Forest Fires untuk contoh ini. Data dimuat di widget Datasets dan diteruskan ke widget Pivot Table. Dataset Forest Fires melaporkan kebakaran hutan pada bulan dan hari terjadinya. Kita dapat menggabungkan semua kejadian kebakaran hutan dengan memilih Hitung sebagai metode agregasi dan menggunakan bulan sebagai baris dan hari sebagai nilai kolom. Karena jika kita menggunakan Count, nilai variabel tidak ada effek-nya.
  
            Sum: sum of values.
+
Kita dapat memplot count dalam widget Line Plot. Tapi pertama-tama, mari kita sedikit mengatur data kita. Dengan Edit Domain, kita akan menyusun ulang nilai baris sehingga bulan akan muncul dalam urutan yang benar, yaitu dari Januari hingga Desember. Untuk melakukan hal yang sama pada kolom, kami akan menggunakan widget Select Columns dan menyusun ulang hari dari Monday hingga Sunday.
 
 
            Mean: average of values.
 
 
 
            Mode: most frequent value of the subset.
 
 
 
            Min: smallest value.
 
 
 
            Max: highest value.
 
 
 
            Median: middle value.
 
 
 
            Var: variance of the subset.
 
 
 
        For discrete variables:
 
 
 
            Majority: most frequent value of the subset.
 
 
 
    Tick the box on the left to automatically output any changes. Alternatively, press Apply .
 
 
 
Discrete variables
 
 
 
../../_images/Pivot-discrete.png
 
 
 
Example of a pivot table with only discrete variables selected. We are using heart-disease data set for this example. Rows correspond to values of diameter narrowing variable. Our columns are values of gender, namely female and male. We are using thal as values in our cells.
 
 
 
We have selected Count and Majority as aggregation methods. In the pivot table, we can see the number of instances that do not have diameter narrowing and are female. There are 72 such patients. Concurrently, there are 92 male patients that don’t have diameter narrowing. Thal values don’t have any effect here, we are just counting occurrences in the data.
 
 
 
The second row shows majority. This means most female patients that don’t have diameter narrowing have normal thal results. Conversely, female patients that have diameter narrowing most often have reversable defect.
 
Numeric variables
 
 
 
../../_images/Pivot-continuous.png
 
 
 
Example of a pivot table with numeric variables. We are using heart-disease data set for this example. Rows correspond to values of diameter narrowing variable. Our columns are values of gender, namely female and male. We are using rest SBP as values in our cells.
 
 
 
We have selected Count, Sum and Median as aggregation methods. Under Count, we see there are 72 female patients that don’t have diameter narrowing, same as before for discrete values. What is different are the sum and median aggregations. We see that the sum of resting systolic blood pressure for female patients that don’t have diameter narrowing is 9269 and the median value is 130.
 
Example
 
 
 
We are using Forest Fires for this example. The data is loaded in the Datasets widget and passed to Pivot Table. Forest Fires datasets reports forest fires by the month and day they happened. We can aggregate all occurrences of forest fires by selecting Count as aggregation method and using month as row and day as column values. Since we are using Count, Values variable will have no effect.
 
 
 
We can plot the counts in Line Plot. But first, let us organize our data a bit. With Edit Domain, we will reorder rows values so that months will appear in the correct order, namely from January to December. To do the same for columns, we will use Select Columns and reorder day to go from Monday to Sunday.
 
 
 
Finally, our data is ready. Let us pass it to Line Plot. We can see that forest fires are most common in August and September, while their frequency is higher during the weekend than during weekdays.
 
 
 
../../_images/Pivot-example.png
 
  
 +
Akhirnya, data kita siap. Mari kita masukan ke widget Line Plot. Kita dapat melihat bahwa kebakaran hutan paling umum terjadi pada bulan Agustus dan September, sementara frekuensinya lebih tinggi selama akhir pekan dibandingkan pada hari kerja.
  
 +
[[File:Pivot-example.png|center|600px|thumb]]
  
 
==Referensi==
 
==Referensi==

Latest revision as of 14:47, 16 April 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/data/pivot.html


Widget Pivot Table membentuk kembali tabel data berdasarkan nilai kolom.

Input

Data: input data set

Output

Pivot Table: contingency matrix as shown in the widget
Filtered Data: subset selected from the plot
Grouped Data: aggregates over groups defined by row values

Widget Pivot Table merangkum data dari tabel yang lebih luas ke dalam tabel statistik. Statistik dapat mencakup jumlah, rata-rata, jumlah, dll. Widget Pivot Table juga memungkinkan pemilihan subset dari tabel dan pengelompokan berdasarkan nilai baris, yang harus berupa variabel diskrit. Data dengan hanya variabel numerik tidak dapat ditampilkan dalam tabel.

Pivot-stamped.png
  • Discrete or numeric variable used for row values. Numeric variables are considered as integers.
  • Discrete variable used for column values. Variable values will appear as columns in the table.
  • Values used for aggregation. Aggregated values will appear as cells in the table.
  • Aggregation methods:
    • For any variable type:
      • Count: number of instances with the given row and column value.
      • Count defined: number of instances where the aggregation value is defined.
    • For numeric variables:
      • Sum: sum of values.
      • Mean: average of values.
      • Mode: most frequent value of the subset.
      • Min: smallest value.
      • Max: highest value.
      • Median: middle value.
      • Var: variance of the subset.
    • For discrete variables:
      • Majority: most frequent value of the subset.
  • Tick the box on the left to automatically output any changes. Alternatively, press Apply .

Variable Diskrit

Pivot-discrete.png

Contoh Widget Pivot Table dengan hanya variabel diskrit yang dipilih. Kita menggunakan dataset heart-disease untuk contoh ini. Baris sesuai dengan nilai-nilai variabel penyempitan diameter. Kolom kita adalah nilai-nilai gender, yaitu perempuan dan laki-laki. Kita menggunakan thal sebagai nilai dalam sel kita.

Kita telah memilih Count dan Mayoritas sebagai metode agregasi. Dalam widget Pivot Table, kita dapat melihat jumlah instance yang tidak memiliki penyempitan diameter dan wanita. Ada 72 pasien seperti itu. Secara bersamaan, ada 92 pasien pria yang tidak mengalami penyempitan diameter. Nilai Thal tidak berpengaruh di sini, kita hanya menghitung kejadian dalam data.

Baris kedua menunjukkan mayoritas. Ini berarti sebagian besar pasien wanita yang tidak mengalami penyempitan diameter memiliki hasil normal. Sebaliknya, pasien wanita yang mengalami penyempitan diameter paling sering memiliki reversable defect.

Variabel Numerik

Pivot-continuous.png

Contoh widget Pivot Table dengan variabel numerik. Kita menggunakan dataset heart-disease untuk contoh ini. Baris sesuai dengan nilai-nilai variabel penyempitan diameter. Kolom kita adalah nilai-nilai gender, yaitu perempuan dan laki-laki. Kita menggunakan sisa SBP sebagai nilai dalam sel kita.

Kita memilih Count, Sum and Median sebagai metode agregasi. Di bawah Count, kita melihat ada 72 pasien wanita yang tidak memiliki penyempitan diameter, sama seperti sebelumnya untuk nilai diskrit. Yang berbeda adalah sum dan median agregasi. Kita melihat bahwa jumlah tekanan darah sistolik istirahat untuk pasien wanita yang tidak memiliki penyempitan diameter adalah 9269 dan nilai median adalah 130.

Contoh

Kita menggunakan dataset Forest Fires untuk contoh ini. Data dimuat di widget Datasets dan diteruskan ke widget Pivot Table. Dataset Forest Fires melaporkan kebakaran hutan pada bulan dan hari terjadinya. Kita dapat menggabungkan semua kejadian kebakaran hutan dengan memilih Hitung sebagai metode agregasi dan menggunakan bulan sebagai baris dan hari sebagai nilai kolom. Karena jika kita menggunakan Count, nilai variabel tidak ada effek-nya.

Kita dapat memplot count dalam widget Line Plot. Tapi pertama-tama, mari kita sedikit mengatur data kita. Dengan Edit Domain, kita akan menyusun ulang nilai baris sehingga bulan akan muncul dalam urutan yang benar, yaitu dari Januari hingga Desember. Untuk melakukan hal yang sama pada kolom, kami akan menggunakan widget Select Columns dan menyusun ulang hari dari Monday hingga Sunday.

Akhirnya, data kita siap. Mari kita masukan ke widget Line Plot. Kita dapat melihat bahwa kebakaran hutan paling umum terjadi pada bulan Agustus dan September, sementara frekuensinya lebih tinggi selama akhir pekan dibandingkan pada hari kerja.

Pivot-example.png

Referensi

Pranala Menarik