Difference between revisions of "Orange: Bag of Words 2"
Onnowpurbo (talk | contribs) (Created page with "sumber: http://orange3-text.readthedocs.io/en/latest/widgets/bagofwords.html center|400px|thumb ==Referensi== * http://orange3-text.rea...") |
Onnowpurbo (talk | contribs) |
||
(2 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
sumber: http://orange3-text.readthedocs.io/en/latest/widgets/bagofwords.html | sumber: http://orange3-text.readthedocs.io/en/latest/widgets/bagofwords.html | ||
+ | |||
+ | Workflow berikut memperlihatkan proses klasifikasi dokumen. Kita dapat menggunakan beberapa contoh yang ada di widget Corpus, seperti book-excerpt.tab. Untuk memudahkan proses klasifikasi, semua kata penghubung, tanda baca dibuang menggunakan widget Preprocess Text. Keluaran dari widget Preprocess Text dimasukan ke widget Bag of Words untuk menghitung (count) frekuensi istilah (term frequency) yang ada dalam dokumen. Selanjutnya di process pada widget Test & Score dengan learner yang kita pilih. Disini digunakan SVM. Hasilnya dapat kita lihat dalam widget Confusion Matrix, mana yang berhasil di klasifikasi dan mana yang tidak berhasil di klasifikasi. Kita dapat memilih, misalnya misclassified, dan menganalisanya di widget Corpus Viewer. | ||
[[File:Orange-bagofwords10.png|center|400px|thumb]] | [[File:Orange-bagofwords10.png|center|400px|thumb]] | ||
+ | [[File:Orange-bagofwords11.png|center|200px|thumb]] | ||
+ | [[File:Orange-bagofwords12.png|center|200px|thumb]] | ||
Latest revision as of 09:53, 21 March 2020
sumber: http://orange3-text.readthedocs.io/en/latest/widgets/bagofwords.html
Workflow berikut memperlihatkan proses klasifikasi dokumen. Kita dapat menggunakan beberapa contoh yang ada di widget Corpus, seperti book-excerpt.tab. Untuk memudahkan proses klasifikasi, semua kata penghubung, tanda baca dibuang menggunakan widget Preprocess Text. Keluaran dari widget Preprocess Text dimasukan ke widget Bag of Words untuk menghitung (count) frekuensi istilah (term frequency) yang ada dalam dokumen. Selanjutnya di process pada widget Test & Score dengan learner yang kita pilih. Disini digunakan SVM. Hasilnya dapat kita lihat dalam widget Confusion Matrix, mana yang berhasil di klasifikasi dan mana yang tidak berhasil di klasifikasi. Kita dapat memilih, misalnya misclassified, dan menganalisanya di widget Corpus Viewer.