Difference between revisions of "Orange: Wikipedia"
Jump to navigation
Jump to search
Onnowpurbo (talk | contribs) (→Output) |
Onnowpurbo (talk | contribs) (→Contoh) |
||
Line 26: | Line 26: | ||
==Contoh== | ==Contoh== | ||
− | Dalam workflow sederhana berikut, kita menggunakan widget Wikipedia dan menggambil tulisan tentang ‘Slovenia’ dan ‘Germany’. Kemudian, melakukan preprocessing menggunakan widget Preprocess Text dan mengamati kata yang paling sering muncul dalam tulisan-tulisan tersebut menggunakan widget Word Cloud | + | Dalam workflow sederhana berikut, kita menggunakan widget Wikipedia dan menggambil tulisan tentang ‘Slovenia’ dan ‘Germany’. Kemudian, melakukan preprocessing menggunakan widget Preprocess Text dan mengamati kata yang paling sering muncul dalam tulisan-tulisan tersebut menggunakan widget Word Cloud. |
− | |||
− | |||
− | |||
− | |||
+ | Widget Wikipedia bekerja seperti corpus widget lainnya (NY Times, Twitter) dan dapat digunakan seperti mereka. | ||
+ | [[File:Wikipedia-Example.png|center|600px|thumb]] | ||
==Referensi== | ==Referensi== |
Revision as of 17:39, 11 April 2020
Sumber: https://orange3-text.readthedocs.io/en/latest/widgets/wikipedia-widget.html
Widget Wikipedia dapat mengambil data dari MediaWiki RESTful web service API.
Input
None
Output
Corpus: A collection of documents from the Wikipedia.
Widget Wikipedia digunakan untuk mengambil text dari Wikipedia API dan ini sangat berguna terutama pada proses belajar mengajar maupun saat demonstrasi.
- Query parameters:
- Query word list, where each query is listed in a new line.
- Language of the query. English is set by default.
- Number of articles to retrieve per query (range 1-25). Please note that querying is done recursively and that disambiguations are also retrieved, sometimes resulting in a larger number of queries than set on the slider.
- Select which features to include as text features.
- Information on the output.
- Produce a report.
- Run query.
Contoh
Dalam workflow sederhana berikut, kita menggunakan widget Wikipedia dan menggambil tulisan tentang ‘Slovenia’ dan ‘Germany’. Kemudian, melakukan preprocessing menggunakan widget Preprocess Text dan mengamati kata yang paling sering muncul dalam tulisan-tulisan tersebut menggunakan widget Word Cloud.
Widget Wikipedia bekerja seperti corpus widget lainnya (NY Times, Twitter) dan dapat digunakan seperti mereka.