1
我正在考慮使用RapidMiner來存儲和分析由腳本過程收集的數據集合。有沒有辦法通過命令行腳本將CSV文件導入到RapidMiner存儲庫中?是否可以從命令行將CSV導入到RapidMiner存儲庫中?
我正在考慮使用RapidMiner來存儲和分析由腳本過程收集的數據集合。有沒有辦法通過命令行腳本將CSV文件導入到RapidMiner存儲庫中?是否可以從命令行將CSV導入到RapidMiner存儲庫中?
不是直接。但是,您可以使用連接到「Store」運算符的「讀取CSV」運算符創建一個流程,並將此流程存儲在存儲庫中。這個過程可以從命令行調用。如果文件和存儲庫位置是靜態的並且不更改,則這是您需要執行的所有操作。
但要動態指定輸入文件和存儲庫位置,您需要宏。這些宏可以在命令行中設置,但是不幸的是只能在RapidMiner 5.3版本中使用,目前尚未發佈(但將在幾周內)。與此同時,您可以使用the sourceforge SVN repository (Unuk branch)的最新版本。
處理存儲在CSV庫:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<process version="5.3.000">
<context>
<input/>
<output/>
<macros/>
</context>
<operator activated="true" class="process" compatibility="5.3.000" expanded="true" name="Process">
<process expanded="true" height="190" width="413">
<operator activated="true" class="read_csv" compatibility="5.3.000" expanded="true" height="60" name="Read CSV" width="90" x="45" y="30">
<parameter key="csv_file" value="%{csv-file}"/>
<list key="annotations"/>
<list key="data_set_meta_data_information"/>
</operator>
<operator activated="true" class="store" compatibility="5.3.000" expanded="true" height="60" name="Store" width="90" x="179" y="30">
<parameter key="repository_entry" value="%{repository-location}"/>
</operator>
<connect from_op="Read CSV" from_port="output" to_op="Store" to_port="input"/>
<portSpacing port="source_input 1" spacing="0"/>
<portSpacing port="sink_result 1" spacing="0"/>
</process>
</operator>
</process>
假設你已經在保存這個過程//首頁/史蒂夫/ CSV到庫和你的當前目錄是RapidMiner目錄,這是如何可以從命令行調用此:
./script/rapidminer //home/steve/csv-to-repository "-Mcsv-file=/path/to/your/csv/file" "-Mrepository-location=//repository/path/to/store/csv"
謝謝Maerch。我從SVN下載了代碼,看起來Unuk項目是5.3代碼的一個分支。爲獲得支持,我將訪問http://rapid-i.com/rapidforum/index.php/board.7.0.html上的開發論壇。 –
是的,你是對的。 Unuk是當前的主要版本5.x.應該提到它,因爲它沒有很好的記錄。 – maerch