我運行一個查詢象下面這樣:合併使用大熊貓由文本相似度2個dataframes
select *
from sd_sms LEFT JOIN categories_phrases
on sd_sms.body like concat('%',categories_phrases.phrase1,'%')
and sd_sms.body like concat('%',categories_phrases.phrase2,'%')
and sd_sms.body like concat('%',categories_phrases.phrase3,'%')
and sd_sms.body like concat('%',categories_phrases.phrase4,'%')
基本上,它會連接兩個表,如果表A中的字段包含表B中的幾個短語,但現在我需要在Python中執行此操作。
是否有任何簡單的方法來合併使用熊貓這兩個表,所以它給了我相同的結果?
請告知
你能提供一些示例數據和你想要的輸出嗎? – Allen
您可以使用此鏈接下載示例數據:https://drive.google.com/file/d/0B9sctdRURN0PSXk2ZUxGMU9JdU0/view?usp=sharing –
基本上我需要像https://blog.ouseful.info/2012/09/26/merge-data-sets-based-partially-matched-data-elements/ –