google-refine

    2熱度

    1回答

    我有一個谷歌精煉項目與36k行數據。我想添加另一列從freebase url中獲取json數據。我能夠在一個小的數據集上工作,但是當我在這個項目上運行它時,它花了幾個小時來處理,然後大部分結果都是空白的。儘管我用數據得到了一些結果。有沒有辦法限制數據將被獲取的行數量或更好的方式從網址獲取數據。 謝謝!

    2熱度

    1回答

    我有一張桌子,我正在應用自定義方面以查找重複項(在列上)。現在我想在桌面上應用一個新的方面(在另一列上)。 這可能嗎?看起來它每次只能使用一個方面,而不能將它們組合在一起。 乾杯, ELISA

    3熱度

    1回答

    我試圖創建一個基於我的主要項目的日期列拉從另一個谷歌細化項目時間表事件新列: cell.cross(「Clean5 timeline「,」TimelineDate「)。cells [」TimelineEvent「]。value [0] Google Refine項目中的日期格式相同。但它沒有填充細胞,我得到這個錯誤: 錯誤:無法從空檢索領域 這 - cell.cross( 「Clean5時間軸」,

    2熱度

    2回答

    我正在調查谷歌優化以加快我的一些數據工作 - 在本週之前從未使用它,但我喜歡很多我看到的內容。 到目前爲止,我最大的問題是是否可以從Refine調用外部Python函數。我知道你可以在內部調用jython,但是不能訪問基於C的python庫(例如lxml),並且我還想在其他地方使用我想要集成的腳本,而沒有太多的複製粘貼或重寫的麻煩。 在Refine中這樣做有什麼選擇?我願意發揮創意 - 我只想要一

    3熱度

    1回答

    背景:亞當一直使用谷歌細化處理數據庫的下載量在過去的一年取得巨大成功 同事,但亞當得到了一份新的工作機會,因此他在谷歌煉化方面所做的所有工作和專業知識都在消失。 Ben希望Adam將他在Google上完成的所有工作打包,以便辦公室的用戶仍然可以從他的工作中受益,而不必知道如何使用Google精煉本身。 (即,將其作爲批處理過程的一部分運行,您將輸入文件指定爲參數,並因此得到「精煉」輸出)。 問題:

    0熱度

    1回答

    在自定義文本方面我想檢查以前的行的單元格的值。 我試過rows[row.index - 1]沒有結果。