我正在寫一個使用CC許可的中英文字典CC-CEDICT的應用程序。跟蹤數據中沒有主鍵的變化
詞典僅適用於以下列格式條目爲zipped text file (4MB):
Traditional Simplified [pin1 yin1] /English equivalent 1/equivalent 2/
這是示例數據:
是 是 [shi4] /is/are/am/yes/to be/
昰 是 [shi4] /variant of 是[shi4]/used in given names/
時 時 [Shi2] /surname Shi/
時 時 [shi2] /o'clock/time/when/hour/season/period/
我選擇那些線故意來說明我的問題。數據中沒有可以識別單個詞的可辨別鍵。
英語的定義可以改變,做作爲字典在不斷更新,但在一個更新的假設時的兩個定義時變化,所以接下來的下載包含線路:
時 時 [Shi2] /last name Shi/
時 時 [shi2] /o'clock/time period/when/hour/season/
我如何告訴哪些記錄已更新?當翻譯是完全變化的單個單詞時,這真的很明顯。
我在一個策略之後,如何能夠鍵入這本詞典。到目前爲止,我最好的想法是將(簡體,繁體)作爲關鍵,並將重複作爲一種特殊情況處理 - 在他們自己的表中可能是?
你不能 - 如果你想跟蹤更改 - 你**必須有一個主鍵。任何真正的數據表都應該有主鍵...... – 2013-02-10 10:43:14