2014-10-17 35 views
1

我正在尋找更多關於使用特定搜索詞或短語(可預測給我)轉換爲csv來處理文本行的方法的建議。例如:javascript中csv文件的輕度語言處理

一家位於中國南部的貿易公司以15%的價格提供了一批低揮發性煉焦煤,11月份的價格爲$ 167/t。 香港一家貿易公司收到24%的中量焦煤報價,11月初交付價格爲145美元/噸。

會成爲像分隔的信息: 中國南方貿易商,賣家,低揮發性,15%,十一月,laycan,$ 167 香港交易員,採購員,中揮發,24%,十一月初,送貨,$ 145

現在有javascript的答案開始我建議str.split(「\ n」)來設置數組。但在此之後......您會推薦在一行中尋找單詞/短語匹配,然後設置蒸餾信息的相應逗號分隔線(以進入電子表格)。

我是一位希望加快數據輸入速度的編輯,所以這就是爲什麼我有一個更一般的方法問題。如果我知道如何到達那裏,所有搜索參數都可以與之抗爭。在工作中,我們已經使用JavaScript來提取文件。人們說python很容易,但我希望在工作中更容易在Windows中使用。我一直在谷歌搜索我的方式沒有成功的方法...只是一個框架,我可以到達那裏。

回答

0

當你在談論短語時,這意味着,你必須分析文本。

處理包括中文在內的多種語言的一個API,我可以推薦:http://nlp.linguasys.com