我遇到了一個不尋常的問題,可能會突出我對MySQL的不熟悉。我有超過1000個需要上傳到MySQL服務器的excel文件。我使用mysql.connector和xlrd編寫了一個簡單的python程序(python 2.7僅供參考)。該程序基本收集相關數據,然後添加它使用MySQL,行消失
"INSERT INTO realposts "
"(PostId, Subreddit, Title, Body, Username, NumberofComments, Upvotes, CreationTime, Link, Gilded, SFW)"
"VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)"
"ON DUPLICATE KEY UPDATE NumberofComments = NumberofComments, Upvotes = Upvotes, Gilded = Gilded;"
到目前爲止,這麼好!我添加了大約400個excel文件,沒有問題。然後我再添加了400個,迄今爲止都非常好。我到了最後200但是,做數據的快速分析時,注意到,當我做了
select subreddit, count(*) from realposts
group by subreddit;
是一整類,以假想超過1000項,剛剛消失。
有人能指出我可能造成這種情況的原因,以及如何解決它?我對MySQL非常陌生,但搜索表明這不應該發生。我不知道如何開始調試。
編輯:而且不知何故,第四次運行後,該錯誤已經消失。我會放開這個,但我爲什麼沒有答案。
如果您不熟悉MySQL,那麼如果可能的話,我建議您切換到PostgreSQL ... –
realposts表的定義是什麼?特別是主鍵。 –
主鍵是PostId,其數據類型爲varchar(6)並設置爲NN。 – TheCog