NLTK: Sastrawi Stemmer

From OnnoWiki
Revision as of 17:15, 8 March 2017 by Onnowpurbo (talk | contribs) (→‎Penggunaan)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Sastrawi Python adalah python library sederhana yang memungkinkan kita untuk mengubah kata dalam bahasa Indonesia ke akar katanya (stem). Ini adalah port Python dari project Sastrawi yang ditulis dalam PHP. Kita harus berterima kasih pada penulis & kontributor dari Sastrawi PHP.

Install Sastrawi

Instalasi menggunakan perintah

sudo apt install python-pip
sudo pip install Sastrawi

Penggunaan

Jalankan baris-baris kode berikut di Python interactive terminal :

# import StemmerFactory class
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory

# create stemmer
factory = StemmerFactory()
stemmer = factory.create_stemmer()

# stemming process
sentence = 'Perekonomian Indonesia sedang dalam pertumbuhan yang membanggakan'
output   = stemmer.stem(sentence)

print(output)
# ekonomi indonesia sedang dalam tumbuh yang bangga 

print(stemmer.stem('Mereka meniru-nirukannya'))
# mereka tiru


Menambahkan Kata Dasar

Menambahkan kata dasar tampaknya bisa dengan cara mengedit file di folder

/usr/local/lib/python2.7/dist-packages/Sastrawi/Stemmer/data

Nama file

kata-dasar.txt

Demo

Live demo URL : https://pysastrawi-demo.appspot.com/

Repository : https://github.com/har07/pystastrawi-demo

Lisensi

Lisensi Sastrawi Python adalah MIT License (MIT).

Project ini mengandung kamus kata dasar yang berasal dari Kateglo dengan lisensi CC-BY-NC-SA 3.0. Informasi Lebih Lanjut

   Sastrawi PHP Repository page


Referensi