我有以下的熊貓數據框。Pandas Dataframe:如何將整數解析爲0和1的字符串?
import pandas as pd
df = pd.read_csv('filename.csv')
print(df)
sample column_A
0 sample1 6/6
1 sample2 0/4
2 sample3 2/6
3 sample4 12/14
4 sample5 15/21
5 sample6 12/12
.. ....
在column_A
的值不是分數,這些數據必須被操縱,使得我可以每個值轉換成0s
和1s
(不是整數轉換成它們的二元對應物)。
上面的「分子」給出總數爲1s
,而「分母」給出總數爲0s
和1s
。
因此,該表實際上應該採用以下格式:
sample column_A
0 sample1 111111
1 sample2 0000
2 sample3 110000
3 sample4 11111111111100
4 sample5 111111111111111000000
5 sample6 111111111111
.. ....
我從來沒有解析,以0和1這樣的輸出字符串的整數。如何做到這一點?是否有與lambda
表達式一起使用的「熊貓方法」? Pythonic字符串解析或正則表達式?
我想說的字符串解析,喜歡的東西' a,b = map(int,field.split('/'));結果='1'* a +'0'*(b-a)'。 – TigerhawkT3