summarization

    0熱度

    2回答

    我正在嘗試構建一個新聞中心應用程序,我的目標是從其他新聞頻道中提取新聞文章,對其進行總結,並以無偏見的方式呈現子彈形式。 我已經開始運行算法,我需要的是從其他網站收集數據的代碼,如NDTV,CNN等。 請給我一個如何執行此操作的描述。代碼,鏈接,示例和屏幕截圖會有很大的幫助。 謝謝! (Y)

    2熱度

    2回答

    的邊際摘要我正在與在「R轉儲」格式輸出數據的系統的工作。例如,它可以輸出一個三維數組看起來像這樣: obs <- structure(c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24), .Dim=c(2,4,3)) 我是新於R,但我想用R檢查這個數據的邊際摘要。例如,我希望看到一個平均值在該三維平均

    2熱度

    4回答

    我想總結或彙總表而不刪除空的水平。我想知道有沒有人對此有任何想法? 作爲一個例子,在這裏 是數據幀使用鹼和doBy包 df1<-data.frame(Method=c(rep("A",3),rep("B",2),rep("C",4)), Type=c("Fast","Fast","Medium","Fast","Slow","Fast","Medium","Slow","Slow"),

    0熱度

    1回答

    選擇一些留字時,我想選擇一個字段的100個字左右,我用這個語法: SELECT LEFT (text, LOCATE(' ', text, 100)-1) AS title FROM myTable 此查詢有沒有問題我。 但今天我想在一個Unicode文本上使用它,並且此查詢無法正常工作。 例如:如果我的字段包含ماهي كيفية قضاء صوم رمضان الذي لم اصمه ؟作

    0熱度

    2回答

    我的收藏包含隨時間變化的貨幣匯率。我希望顯示一個圖表,並且我需要知道每個小時只有一個值。然而,我的數據更密集,每秒鐘都有一個記錄。 如何降低記錄的密度,每小時只留下一個記錄。我不需要平均,每個小時的任何記錄就足夠了。 { "_id" : ObjectId("52112613b45b5d057589009e"), "date" : ISODate("2013-08-18T19:5

    2熱度

    2回答

    行的限定數目和每個的位置(從-1000到+1000)並且對於每個位置的計數。一個小例子看起來這本: dt.ex <- data.table(newID=rep(c("A","B"), each = 6), pos=rep(c(-2:3), 2), count= sample(c(1:100), 12)) newID pos count 1: A -2 29 2: A -1 32

    2熱度

    2回答

    我是plyr的新手,想要在一個類中取值的加權平均值來重新構造多個變量的數據框。使用下面的代碼,我知道如何爲一個變量做到這一點,如X2: set.seed(123) frame <- data.frame(class=sample(LETTERS[1:5], replace = TRUE), x=rnorm(20), x2 = rnorm(20), weights=rnorm(2

    2熱度

    2回答

    我已經設置了所有參數,如http://kavita-ganesan.com/rouge-howto中所述。但是我得到了零值的精確回憶和f-1。請幫助我,我該怎麼辦?

    3熱度

    2回答

    我嘗試總結所有路徑,儘管樹是從根到最低的子節點之間的每個級別擴展1到10次。 我的函數對所有孩子都進行遞歸遞歸,但是我遇到這樣的問題,當我嘗試創建節點列表並在列表中執行此列表時,我將成爲列表的列表列表...列表。 我認爲我的問題是組合步驟而我試圖做一個模式匹配方法,但應該比較列表,當它成爲列表的列表的方法,並應該做出新的列表,並比較它們,如果它只是一種方式(符合與節點列表而不是列表與列表)不起作用

    3熱度

    1回答

    我使用蘇梅https://github.com/miso-belica/sumy爲Python文本摘要 ,當我使用的HTMLParser我得到這個錯誤。 Traceback (most recent call last): File "", line 1, in File "/usr/local/lib/python2.7/dist-packages/sumy/parsers/html.py"