NLTK: Sastrawi Stemmer
Sastrawi Python adalah python library sederhana yang memungkinkan kita untuk mengubah kata dalam bahasa Indonesia ke akar katanya (stem). Ini adalah port Python dari project Sastrawi yang ditulis dalam PHP. Kita harus berterima kasih pada penulis & kontributor dari Sastrawi PHP.
Install Sastrawi
Instalasi menggunakan perintah
sudo apt install python-pip sudo pip install Sastrawi
Penggunaan
Jalankan baris-baris kode berikut di Python interactive terminal :
# import StemmerFactory class from Sastrawi.Stemmer.StemmerFactory import StemmerFactory # create stemmer factory = StemmerFactory() stemmer = factory.create_stemmer() # stemming process sentence = 'Perekonomian Indonesia sedang dalam pertumbuhan yang membanggakan' output = stemmer.stem(sentence) print(output) # ekonomi indonesia sedang dalam tumbuh yang bangga print(stemmer.stem('Mereka meniru-nirukannya')) # mereka tiru
Menambahkan Kata Dasar
Menambahkan kata dasar tampaknya bisa dengan cara mengedit file di folder
/usr/local/lib/python2.7/dist-packages/Sastrawi/Stemmer/data
Nama file
kata-dasar.txt
Demo
Live demo URL : https://pysastrawi-demo.appspot.com/
Repository : https://github.com/har07/pystastrawi-demo
Lisensi
Lisensi Sastrawi Python adalah MIT License (MIT).
Project ini mengandung kamus kata dasar yang berasal dari Kateglo dengan lisensi CC-BY-NC-SA 3.0. Informasi Lebih Lanjut
Sastrawi PHP Repository page