Difference between revisions of "Orange: Corpus"
Jump to navigation
Jump to search
Onnowpurbo (talk | contribs) |
Onnowpurbo (talk | contribs) |
||
Line 14: | Line 14: | ||
* Ketika tidak ada data pada input, ia membaca teks korpora dari file dan mengirimkan instance corpus ke kanal output. History file yang terakhir dibuka disimpan di widget. Dalam Widget ini juga ada direktori dengan sampel korpora yang sudah diinstal sebelumnya dengan add-on. Widget dapat membaca data dari file Excel (.xlsx), comma-separated (.csv) dan tab-delimited (.tab). | * Ketika tidak ada data pada input, ia membaca teks korpora dari file dan mengirimkan instance corpus ke kanal output. History file yang terakhir dibuka disimpan di widget. Dalam Widget ini juga ada direktori dengan sampel korpora yang sudah diinstal sebelumnya dengan add-on. Widget dapat membaca data dari file Excel (.xlsx), comma-separated (.csv) dan tab-delimited (.tab). | ||
+ | * Ketika pengguna memberikan data ke input, itu mengubah data menjadi korpus. Pengguna dapat memilih fitur mana yang digunakan sebagai fitur teks. | ||
+ | [[File:Corpus-stamped.png|center|200px|thumb]] | ||
Revision as of 07:52, 7 January 2020
Sumber: https://orange3-text.readthedocs.io/en/latest/widgets/corpus-widget.html
Memuat kumpulan dokumen teks, (opsional) yang di-tag dengan kategori, atau mengubah input data ke corpus.
Input
- Data: Input data (optional)
Output
- Corpus: kumpulan dokumen
Corpus widget dapat bekerja dalam dua (2) mode:
- Ketika tidak ada data pada input, ia membaca teks korpora dari file dan mengirimkan instance corpus ke kanal output. History file yang terakhir dibuka disimpan di widget. Dalam Widget ini juga ada direktori dengan sampel korpora yang sudah diinstal sebelumnya dengan add-on. Widget dapat membaca data dari file Excel (.xlsx), comma-separated (.csv) dan tab-delimited (.tab).
- Ketika pengguna memberikan data ke input, itu mengubah data menjadi korpus. Pengguna dapat memilih fitur mana yang digunakan sebagai fitur teks.