我正試圖清理一些我從熊貓數據框導入到MySQL中的數據。當我使用MySQL SELECT DISTINCT不區分大小寫?
SELECT DISTINCT
Variable
似乎MySQL的對待Variable作爲equivilent到變量:
一些顯示爲:
VARIABLE
別人的。
雖然R將Variable和VARIABLE視爲不同,但我將其導入到R中。 運行
as.factor
給了我兩個因素。 如何讓MySQL的SELECT DISTINCT區分大小寫,以便我可以檢測並修復導入到R中的數據進行分析?
您可能正在使用不區分大小寫的排序規則。你想要一個大小寫敏感的。請閱讀此處:http://dev.mysql.com/doc/refman/5.7/en/charset-collate.html。 –
[使用'在這個SO後看到'BINARY'](http://stackoverflow.com/questions/19462919/mysql-select-distinct-should-be-case-sensitive) –
我把一切都設置爲UTF-8更早在熊貓代碼中如此BINARY blob的一切。我想我會考慮將MySQL COLLATION切換爲默認情況下區分大小寫。命令行上的任何指針? – KillerSnail