Difference between revisions of "R"

From OnnoWiki
Jump to: navigation, search
(TidyText Processing)
(TidyText Processing)
Line 94: Line 94:
 
* [[R: tidytext: sentiment Most common positive and negative words]]
 
* [[R: tidytext: sentiment Most common positive and negative words]]
 
* [[R: tidytext: sentiment wordcloud]]
 
* [[R: tidytext: sentiment wordcloud]]
 +
* [[R: tidytext: tf-idf Jane Austen novels]]
  
 
===Bayesian===
 
===Bayesian===

Revision as of 04:40, 4 December 2019

R adalah bahasa pemrograman dan lingkungan perangkat lunak bebas untuk komputasi statistik dan grafik yang didukung oleh R Foundation for Statistical Computing. Bahasa R banyak digunakan di kalangan ahli statistik dan data miner untuk mengembangkan perangkat lunak statistik dan analisis data. Jajak pendapat, survei penambangan data dan studi basis data literatur ilmiah, menunjukkan peningkatan popularitas yang cukup besar dalam beberapa tahun terakhir. Pada Agustus 2018, R peringkat ke-18 dalam indeks TIOBE, ukuran popularitas bahasa pemrograman.

Paket GNU, source code untuk lingkungan perangkat lunak R ditulis terutama di C, Fortran dan R sendiri dan tersedia secara gratis di bawah GNU General Public License. Versi biner pre-compiled disediakan untuk berbagai sistem operasi. Meskipun R hanya menggunakan command line interface, ada beberapa antarmuka pengguna grafis, seperti RStudio, lingkungan pengembangan terintegrasi.

Referensi

Pranala Menarik

Data

R Studio

File Processing

Text Processing

Referensi

TidyText Processing

Ref: https://github.com/dgrtwo/tidy-text-mining

tidy data has a specific structure:

  • Each variable is a column
  • Each observation is a row
  • Each type of observational unit is a table

Bayesian

Time Series


Regression Analysis

Machine Learning

Graphics