Orange: Bag of Words 2

From OnnoWiki
Jump to navigation Jump to search

sumber: http://orange3-text.readthedocs.io/en/latest/widgets/bagofwords.html

Workflow berikut memperlihatkan proses klasifikasi dokumen. Kita dapat menggunakan beberapa contoh yang ada di widget Corpus, seperti book-excerpt.tab. Untuk memudahkan proses klasifikasi, semua kata penghubung, tanda baca dibuang menggunakan widget Preprocess Text. Keluaran dari widget Preprocess Text dimasukan ke widget Bag of Words untuk menghitung (count) frekuensi istilah (term frequency) yang ada dalam dokumen. Selanjutnya di process pada widget Test & Score dengan learner yang kita pilih. Disini digunakan SVM. Hasilnya dapat kita lihat dalam widget Confusion Matrix, mana yang berhasil di klasifikasi dan mana yang tidak berhasil di klasifikasi. Kita dapat memilih, misalnya misclassified, dan menganalisanya di widget Corpus Viewer.


Orange-bagofwords10.png
Orange-bagofwords11.png
Orange-bagofwords12.png


Referensi