Difference between revisions of "Orange: Word Cloud dari File Text"

From OnnoWiki
Jump to navigation Jump to search
Line 6: Line 6:
  
 
[[File:Screenshot from 2020-02-23 13-14-45.png|center|400px|thumb]]
 
[[File:Screenshot from 2020-02-23 13-14-45.png|center|400px|thumb]]
 +
 +
 +
[[File:Screenshot from 2020-02-23 13-20-23.png|center|400px|thumb]]
 +
 +
Pada preprocess text kita dapat melakukan beberapa hal, seperti
 +
 +
* Mengubah agar semua huruf menjadi huruf kecil.
 +
* Menghilangkan (stop word), kata-kata yang kurang bermanfaat seperti, kata penghubung seperti dan, di, ke, dari dll.
 +
* Mengatur agar pemrosesan stopword dalam bahasa Indonesia.
 +
* Menghilangkan tag HTML
 +
* Menghilangkan URL
 +
* dll.
 +
 +
  
  

Revision as of 13:27, 23 February 2020

Word Cloud data dapat di bangun dari file text (ASCII) yang kita miliki. Pertama-tama data dari file text harus di segmented menjadi word. Kemudian output segmented data word perlu di konversikan dari segmented data menjadi corpus agar bisa di proses oleh toolbox text mining. Sebelum di tampilkan sebagai word cloud ada baiknya dilakukan preprocessing terlebih dulu, untuk mengurangi berbagai kata yang tidak dibutuhkan, seperti kata penghubungi dll.


ORANGE-word-cloud.png


Screenshot from 2020-02-23 13-14-45.png


Screenshot from 2020-02-23 13-20-23.png

Pada preprocess text kita dapat melakukan beberapa hal, seperti

  • Mengubah agar semua huruf menjadi huruf kecil.
  • Menghilangkan (stop word), kata-kata yang kurang bermanfaat seperti, kata penghubung seperti dan, di, ke, dari dll.
  • Mengatur agar pemrosesan stopword dalam bahasa Indonesia.
  • Menghilangkan tag HTML
  • Menghilangkan URL
  • dll.



Pranala Menarik