1

我有一個關於文本處理任務,我不知道如何從不同的表中某些列合併成一個表將兩個id結合到一個新表中?

因此,這裏的情況: 我有一個名爲listid_doc表,title列 然後我創建一個名爲term_list的新表,其中包含結果字詞列表,當我對list標題進行文本處理時。

term_list表具有id_term,term,dfidf列。最後,我想有一臺名爲term_freq具有tfidid_termid_doc,和normalized_tf

例如: 表list是這樣的:

id_doc    titles 
    11  information retrieval system 
    12   operating system 
    13   business information 

term_list是下面這個樣子:

id_term  term   df idf 
    21  information  2  -- 
    22  retrieval  1  -- 
    23  system  2  -- 
    24  operating  1  -- 
    25  business  1  -- 

我想問一下如何創建一個表term_freq這樣表becom像這樣?

id id_term  id_doc tf  normalized_tf 
31  21   11  1   -- 
32  22   11  1   -- 
33  23   11  1   -- 
34  24   12  1   -- 
35  23   12  1   -- 
36  25   13  1   -- 
37  21   13  1   -- 

主要的問題是我必須參加id_termid_doc到一個表一個id_doc有關係的幾個id_term,但我不知道如何關聯,因爲listterm_list沒有任何類似的列。

請幫助:(

回答

0

可以在term_list遍歷行:

SELECT id_term, term FROM term_list 

每個term化妝:

SELECT id_doc FROM list WHERE titles LIKE "term" 

,並保存在對錶term_freqid_termid_doc