structured-data

    1熱度

    1回答

    我有一個相當小的結構化記錄坐落在數據庫中的語料庫。給定一條記錄中包含的一小部分信息,通過一個Web表單提交(與表格模式的結構相同)(我們稱之爲測試記錄),我需要快速繪製一份記錄最有可能與測試記錄匹配,並提供關於搜索條件與記錄匹配程度的信心估計。此搜索的主要目的是發現是否有人試圖輸入與語料庫中的記錄重複的記錄。有一個合理的機會,測試記錄將是一個愚蠢的,並有一個合理的機會,測試記錄不會是一個騙局。 記

    8熱度

    1回答

    我正在尋找處理固定長度字段文本文件的.NET(更適合於C#開源)庫。編寫一個不會太多,但現有的,經過測試的工作總是更好,首先。 我將從PBX生成的文件中提取固定長度字段中的數據。每個PBX都有自己的文件格式,以及一組記錄格式。我正在尋找一個使用動態文件和記錄格式的簡單方法的庫,例如從INI或XML文件讀取。 編輯:我以前忽略的馬科斯梅利」大圖書館FileHelpers,因爲我認爲我需要創建一個類在

    1熱度

    1回答

    我正在尋找信息提取庫,我可以獲得可能具有隱藏或不完整數據的半結構化信息。我想訓練一些分類器根據結構提取內容。 我正在構建一個工具,我可以在瀏覽器中選擇文本,並且它將生成(通過某些Web服務調用)可用於其他文檔以提取文本的分類器。 我主要看看如何使用文檔的結構來指示內容是什麼。

    8熱度

    4回答

    我正在尋找有關以類似於Google日曆快速添加按鈕的方式構建非結構化文本的參考資料(教程,書籍,學術文獻)。 我理解這可能會下的NLP類,但我只在從像「李維斯牛仔褲尺寸32 A0b293」 到會的過程很感興趣:品牌:李維斯,尺寸:32,等級:牛仔褲,代碼:A0b293 我想這應該是詞法分析和機器學習技術的一些組合。 我比較語言無關,但如果推寧願蟒蛇,Matlab或C++引用 感謝

    4熱度

    2回答

    實際上,Log4j SyslogAppender是否支持MDC和NDC,因爲輸出是結構化數據,即使用協議的結構化數據特性? 此外,對於可以放入MDC併成功附加到日誌的內容是否有任何限制?