Difference between revisions of "Orange: Select Columns"

From OnnoWiki
Jump to navigation Jump to search
 
(9 intermediate revisions by the same user not shown)
Line 1: Line 1:
 
Sumber: https://docs.biolab.si//3/visual-programming/widgets/data/selectcolumns.html
 
Sumber: https://docs.biolab.si//3/visual-programming/widgets/data/selectcolumns.html
  
Manual selection of data attributes and composition of data domain.
+
Widget Select Columns dapat men-seleksi secara manual dari data attribute dan komposisi dari data domain.
  
 
==Input==
 
==Input==
  
    Data: input dataset
+
Data: input dataset
  
 
==Output==
 
==Output==
  
    Data: dataset with columns as set in the widget
+
Data: dataset dengan kolom yang di set di widget
  
The Select Columns widget is used to manually compose your data domain. The user can decide which attributes will be used and how. Orange distinguishes between ordinary attributes, (optional) class attributes and meta attributes. For instance, for building a classification model, the domain would be composed of a set of attributes and a discrete class attribute. Meta attributes are not used in modeling, but several widgets can use them as instance labels.
+
Widget Select Columns digunakan untuk menyusun domain data secara manual. Pengguna dapat memutuskan atribut mana yang akan digunakan dan bagaimana caranya. Orange membedakan antara atribut biasa, atribut class (opsional) dan atribut meta. Misalnya, untuk membangun model klasifikasi, domain akan terdiri dari sekumpulan atribut dan atribut class diskrit. Atribut meta tidak digunakan dalam pemodelan, tetapi beberapa widget dapat menggunakannya untuk me-label instance.
  
Orange attributes have a type and are either discrete, continuous or a character string. The attribute type is marked with a symbol appearing before the name of the attribute (D, C, S, respectively).
+
Atribut data di orange memiliki tipe discrete, continuous atau character string. Tipe atribut ditandai dengan simbol yang muncul di depan nama atribut (D, C, S).
  
[[File:SelectColumns-stamped.png|center|600px|thumb]]
+
[[File:SelectColumns-stamped.png|center|400px|thumb]]
 
 
../../_images/SelectColumns-stamped.png
 
  
 
# Left-out data attributes that will not be in the output data file
 
# Left-out data attributes that will not be in the output data file
Line 30: Line 28:
 
==Contoh==
 
==Contoh==
  
In the workflow below, the Iris data from the File widget is fed into the Select Columns widget, where we select to output only two attributes (namely petal width and petal length). We view both the original dataset and the dataset with selected columns in the Data Table widget.
+
Dalam workflow di bawah ini, data Iris dari widget File dimasukkan ke dalam widget Select Columns, di mana kita memilih untuk menampilkan hanya dua atribut (yaitu lebar daun bunga (petal width) dan panjang daun bunga (petal length)). Kemudian, kita dapat melihat dataset asli dan dataset dengan kolom yang dipilih di widget Data Table.
  
 
[[File:SelectColumns-Example1.png|center|600px|thumb]]
 
[[File:SelectColumns-Example1.png|center|600px|thumb]]
  
For a more complex use of the widget, we composed a workflow to redefine the classification problem in the heart-disease dataset. Originally, the task was to predict if the patient has a coronary artery diameter narrowing. We changed the problem to that of gender classification, based on age, chest pain and cholesterol level, and informatively kept the diameter narrowing as a meta attribute.
+
Untuk penggunaan widget Select Columns yang lebih kompleks, kita menyusun workflow untuk mendefinisikan kembali masalah klasifikasi dalam heart-disease dataset. Awalnya, tugasnya adalah untuk memprediksi apakah pasien memiliki penyempitan diameter arteri koroner. Kita mengubah masalah menjadi klasifikasi gender, berdasarkan usia, nyeri dada, dan kadar kolesterol, dan secara informal menjaga diameternya menyempit sebagai atribut meta.
  
 
[[File:SelectColumns-Example2.png|center|600px|thumb]]
 
[[File:SelectColumns-Example2.png|center|600px|thumb]]
 
 
 
 
 
 
  
 
==Referensi==
 
==Referensi==

Latest revision as of 12:56, 20 March 2020

Sumber: https://docs.biolab.si//3/visual-programming/widgets/data/selectcolumns.html

Widget Select Columns dapat men-seleksi secara manual dari data attribute dan komposisi dari data domain.

Input

Data: input dataset

Output

Data: dataset dengan kolom yang di set di widget

Widget Select Columns digunakan untuk menyusun domain data secara manual. Pengguna dapat memutuskan atribut mana yang akan digunakan dan bagaimana caranya. Orange membedakan antara atribut biasa, atribut class (opsional) dan atribut meta. Misalnya, untuk membangun model klasifikasi, domain akan terdiri dari sekumpulan atribut dan atribut class diskrit. Atribut meta tidak digunakan dalam pemodelan, tetapi beberapa widget dapat menggunakannya untuk me-label instance.

Atribut data di orange memiliki tipe discrete, continuous atau character string. Tipe atribut ditandai dengan simbol yang muncul di depan nama atribut (D, C, S).

SelectColumns-stamped.png
  1. Left-out data attributes that will not be in the output data file
  2. Data attributes in the new data file
  3. Target variable. If none, the new dataset will be without a target variable.
  4. Meta attributes of the new data file. These attributes are included in the dataset but are, for most methods, not considered in the analysis.
  5. Produce a report.
  6. Reset the domain composition to that of the input data file.
  7. Tick if you wish to auto-apply changes of the data domain.
  8. Apply changes of the data domain and send the new data file to the output channel of the widget.

Contoh

Dalam workflow di bawah ini, data Iris dari widget File dimasukkan ke dalam widget Select Columns, di mana kita memilih untuk menampilkan hanya dua atribut (yaitu lebar daun bunga (petal width) dan panjang daun bunga (petal length)). Kemudian, kita dapat melihat dataset asli dan dataset dengan kolom yang dipilih di widget Data Table.

SelectColumns-Example1.png

Untuk penggunaan widget Select Columns yang lebih kompleks, kita menyusun workflow untuk mendefinisikan kembali masalah klasifikasi dalam heart-disease dataset. Awalnya, tugasnya adalah untuk memprediksi apakah pasien memiliki penyempitan diameter arteri koroner. Kita mengubah masalah menjadi klasifikasi gender, berdasarkan usia, nyeri dada, dan kadar kolesterol, dan secara informal menjaga diameternya menyempit sebagai atribut meta.

SelectColumns-Example2.png

Referensi

Pranala Menarik