我有一個熊貓數據框,其中一列只包含字符串。基於另一列在熊貓數據框中創建列
df= pd.DataFrame(
{
"A": [2,4,7,17,39],
"B": ["apple","apple","broccoli","rose","apple"]
}
)
我想檢查此列「B」並查找一個字符串包含某個單詞的某個部分的所有時間。然後我創建一個新的列「C」,其中包含一系列字符串,每當「app」在行中時都會顯示「fruit」,每當「ros」顯示時顯示爲「flower」,在「brocc」顯示時顯示蔬菜。
最後的數據幀的樣子:
df= pd.DataFrame(
{
"A": [2,4,7,17,39],
"B": ["apple","apple","broccoli","rose","apple"],
"C": ["fruit","fruit", "vegetable", "flower", "fruit"]
}
)
我稍微改動過的問題,這樣的實體ISN」的全名t需要。這會改變你提供的答案嗎? – John
@John你通常不應該以非平凡的方式改變問題(特別是如果你可以使答案無效)。改爲提出一個新問題。 – MSeifert
@John不,這不適用於部分匹配。問題中的規則不是很清楚。這些單詞的部分是事先確定的嗎?例如,你將能夠像這樣構造一本字典嗎?或者你想使用這個字典,但是如果有部分匹配則返回一個值?對於後者,你需要澄清什麼樣的匹配是可以接受的。如果只有'o'會發生什麼?會是蔬菜還是花? – ayhan