1
我有一個關於文本處理任務,我不知道如何從不同的表中某些列合併成一個表將兩個id結合到一個新表中?
因此,這裏的情況: 我有一個名爲list
與id_doc
表,title
列 然後我創建一個名爲term_list
的新表,其中包含結果字詞列表,當我對list
標題進行文本處理時。
term_list
表具有id_term
,term
,df
和idf
列。最後,我想有一臺名爲term_freq
具有tf
列id
,id_term
,id_doc
,和normalized_tf
例如: 表list
是這樣的:
id_doc titles
11 information retrieval system
12 operating system
13 business information
表term_list
是下面這個樣子:
id_term term df idf
21 information 2 --
22 retrieval 1 --
23 system 2 --
24 operating 1 --
25 business 1 --
我想問一下如何創建一個表term_freq
這樣表becom像這樣?
id id_term id_doc tf normalized_tf
31 21 11 1 --
32 22 11 1 --
33 23 11 1 --
34 24 12 1 --
35 23 12 1 --
36 25 13 1 --
37 21 13 1 --
主要的問題是我必須參加id_term
和id_doc
到一個表一個id_doc
有關係的幾個id_term
,但我不知道如何關聯,因爲list
和term_list
沒有任何類似的列。
請幫助:(