Orange: CSV File Import

From OnnoWiki
Jump to navigation Jump to search

Sumber: https://docs.biolab.si//3/visual-programming/widgets/data/csvfileimport.html

Import data table dari CSV formatted file.

Output

Data: dataset dari .csv file
Data Frame: pandas DataFrame object

Widget CSV File Import membaca comma-separated file dan mengirimkan dataset ke output channel. Separator bisa berupa comma, semicolon, space, tab atau manually-defined delimiters. History dari file yang baru dibuka di maintain di widget.

Data Frame output dapat digunakan di Python Script widget dengan menyambungkannya ke in_object input (seperti, df = in_object). Sehingga dia bisa digunakan seperti DataFrame biasa.

Import Option

Import window tempat pengguna menetapkan parameter impor. Dapat dibuka kembali dengan menekan Opsi Impor di widget.

Klik kanan pada nama kolom untuk mengatur jenis kolom. Klik kanan pada indeks baris (di sebelah kiri) untuk menandai baris sebagai header, di skip atau baris data normal.

CSVFileImport-ImportOptions-stamped.png


  • File encoding. Default is UTF-8. See Encoding subchapter for details.
  • Import settings:
    • Cell delimiter:
      • Tab
      • Comma
      • Semicolon
      • Space
      • Other (set the delimiter in the field to the right)
    • Quote character: either “ or ‘. Defines what is considered a text.
    • Number separators:
      • Grouping: delimiters for thousands, e.g. 1,000
      • Decimal: delimiters for decimals, e.g. 1.234
  • Column type: select the column in the preview and set its type. Column type can be set also by right-clicking on the selected column.
    • Auto: Orange will automatically try to determine column type. (default)
    • Numeric: for continuous data types, e.g. (1.23, 1.32, 1.42, 1.32)
    • Categorical: for discrete data types, e.g. (brown, green, blue)
    • Text: for string data types, e.g. (John, Olivia, Mike, Jane)
    • Datetime: for time variables, e.g. (1970-01-01)
    • Ignore: do not output the column.
  • Pressing Reset will return the settings to the previously set state (saved by pressing OK in the Import Options dialogue). Restore Defaults will set the settings to their default values. Cancel aborts the import, while OK imports the data and saves the settings.

Widget

Widget setelah data berhasil diimpor.

CSVFileImport-widget-stamped.png
  1. Ikon folder membuka dialog untuk mengimpor file .csv lokal. Ini dapat digunakan untuk memuat file pertama atau mengubah file yang ada (memuat data baru). File dropdown menyimpan path ke set data yang sebelumnya dimuat.
  2. Informasi tentang set data yang diimpor. Report tentang jumlah instance (baris), variabel (fitur atau kolom) dan variabel meta (kolom khusus).
  3. Opsi Impor membuka kembali dialog impor di mana pengguna dapat mengatur delimiters, encodings, text field dan sebagainya. Cancel akan membatalkan impor data. Reload akan memuat ulang mengimpor file sekali lagi, menambah data setiap perubahan yang dibuat dalam file asli.

Encoding

Dialog untuk pengaturan custom encodings list dalam Opsi Impor - dropdown Encoding. Pilih Customize Encodings List… untuk mengubah encoding mana yang muncul dalam daftar. Untuk menyimpan perubahan, cukup tutup dialog. Menutup dan membuka kembali Orange (walaupun dengan Reset pengaturan widget) tidak akan me-re-set list. Untuk melakukan ini, tekan Restore Defaults. Untuk memiliki semua encoding yang tersedia dalam list, tekan Select all.

CSVFileImport-encodings.png

Contoh

Bekerjanya Impor File CSV hampir persis seperti widget File, dengan opsi yang ditambahkan untuk mengimpor berbagai jenis file .csv. Dalam workflow ini, widget membaca data dari file dan mengirimkannya ke Data Table untuk diperiksa.

CSVFileImport-Example.png

Referensi

Pranala Menarik