Orange: Tree

From OnnoWiki
Jump to navigation Jump to search

Sumber: https://docs.biolab.si//3/visual-programming/widgets/model/tree.html


Algoritma tree dengan kemampuan untuk melakukan forward pruning (pemangkasan ke depan).

Input

Data: input dataset
Preprocessor: preprocessing method(s)

Output

Learner: decision tree learning algorithm
Model: trained model

Tree adalah algoritma sederhana yang dapat memisahkan data menjadi node berdasarkan class purity (kemurnian kategori / class). Ini adalah pendahulu Algoritma Random Forest. Tree dalam Orange dirancang secara in-house dan dapat menangani dataset diskrit dan kontinyu.

Tree juga menggunakan kedua classification dan regression.

Tree-stamped.png
  • The learner can be given a name under which it will appear in other widgets. The default name is “Tree”.
  • Tree parameters:
    • Induce binary tree: build a binary tree (split into two child nodes)
    • Min. number of instances in leaves: if checked, the algorithm will never construct a split which would put less than the specified number of training examples into any of the branches.
    • Do not split subsets smaller than: forbids the algorithm to split the nodes with less than the given number of instances.
    • Limit the maximal tree depth: limits the depth of the classification tree to the specified number of node levels.
  • Stop when majority reaches [%]: stop splitting the nodes after a specified majority threshold is reached
  • Produce a report. After changing the settings, you need to click Apply, which will put the new learner on the output and, if the training examples are given, construct a new classifier and output it as well. * Alternatively, tick the box on the left and changes will be communicated automatically.

Contoh

Ada dua penggunaan yang biasanya digunakan pada widget tree. Pertama, kita dapat meng-induksi sebuah model dan cek menggunakan tampilan yang seperti Tree Viewer.

Tree-classification-visualize.png

Skema ke dua dengan men-train sebuah model dan mengevaluasinya terhadap Logistic Regression.

Tree-classification-model.png

Kita menggunakan iris dataset dalam ke dua contoh. Akan tetapi, Tree juga dapat bekerja untuk regression task juga. Gunakan housing dataset dan berikan itu ke Tree. Tree node yang di pilih dalam Tree Viewer di tampilkan di Scatter Plot dan kita bisa melihat bahwa contoh yang di pilih memiliki feature yang sama.

Tree-regression-subset.png

Referensi

Pranala Menarik