summarization

11熱度

3回答

我們的MySQL網站分析數據庫包含一個彙總表，當導入新的活動時，彙總表會一天更新。我們使用ON DUPLICATE KEY UPDATE，以便彙總覆蓋以前的計算，但因爲彙總表的UNIQUE KEY中的一列是可選的FK並且包含NULL值，所以遇到困難。這些NULL旨在表示「不存在，並且所有這些情況都是等價的」。當然，MySQL通常將NULL視爲意義「未知的，並且所有這些情況都不相同」。基本結構如

0熱度

1回答

盤點記錄

我想組記錄分爲兩類：具有三個以上的記錄項目項目具有小於三個項目怎麼辦我去解決這個問題？我正在使用annotate（）。

2熱度

3回答

R.彙總數據，而不合並

我的按日期對陣各隊進球一個數據幀（DF） gamedate teamID Gls 1992-08-22 CHL 3 1992-08-22 MNU 1 1992-08-23 ARS 0 1992-08-23 LIV 2 1992-08-24 MNU 0 1992-08-25 LIV 2 1992-08-26 ARS 0 1992-08-26 CHL 0 我希望生產這表明玩過遊戲的

2熱度

5回答

關於「自動文本摘要（基於語言）」

我有「自動文本摘要（語言學方法）」作爲我的最後一年項目。我收集了足夠多的研究論文並通過了他們。我仍然不清楚'如何去做它'的事情。基本上我找到了「AUTOMATIC TEXT SUMMARIZER（基於統計）」，發現它比我的項目更容易。我的項目指南告訴我不要選擇這個（基於統計的），並去基於語言。任何曾經參與或甚至聽說過這類項目的人都會知道，總結任何文檔都意味着除了評分每個句子（通過涉及某些特定算法

5熱度

2回答

繪製彙總統計

對於以下的數據集， Genre Amount Comedy 10 Drama 30 Comedy 20 Action 20 Comedy 20 Drama 20 欲構建GGPLOT2線圖，其中x軸是Genre和y軸是所有量的總和（在條件Genre）。我曾嘗試以下： p = ggplot(test, aes(factor(Genre), Gross)) + geom_point()

16熱度

2回答

總結維基百科文章

我發現自己必須一直學習新事物。我一直在想辦法加速學習新科目的過程。我認爲如果我能寫一個程序來解析一篇維基百科文章併除去最有價值的信息，那麼它可能會很整潔。我首先拿PDFs的維基百科文章，並提取前100個句子。我根據我認爲它的價值給每個句子評分。我結束了創建一個文件以下格式： <sentence> <value> <sentence> <value> etc. 我再分析此文件，並試圖找

0熱度

1回答

什麼適合我？ generateAllGrams（）還是generateCollocations（）足夠我？

我正在開發一個基於wordnet的文檔summarizer.in項目，我需要提取搭配。我試圖儘可能多地進行研究，但是因爲我在理解CollocDriver.java如何工作（在API上下文中）之前沒有與Mahout合作過，所以我在網上搜索時發現： Mahout Collocations 這是問題：我有一個POSTagged輸入文本。我需要確定它的搭配。我有collocdriver.java代碼..現

1熱度

1回答

問題建築總結寶石

我試圖使用Ruby中彙總的寶石，但是當我做寶石安裝總結，我得到： Building native extensions. This could take a while... ERROR: Error installing summarize: ERROR: Failed to build gem native extension. C:/dev/Ruby/bin/ruby.exe

2熱度

2回答

在SQL Server 2008中分解彙總表

我收到了來自外部來源的數據，彙總格式爲。我需要一種分解方式來適應我所使用的系統。爲了說明，假設我接收到的數據是這樣的： receivedTable: Age Gender Count 40 M 3 41 M 2 我想這是一個像這樣的分類格式： systemTable: ID Age Gender 1 40 M 2 40 M 3 40