我正在與相當雜亂數據工作需要的行:具有以下形式的資費表:正則表達式過濾從熊貓數據幀
import pandas as pd
import numpy as np
data1 = np.array([u'Free (A, B, KR, FR), 5% (JP)', u'Free (A, B, FR), 5% (JP, KR))'])
data2 = np.array(['10101010', '10101020'])
data = {'hscode': data2, 'tariff' : data1}
df = pd.DataFrame(data, columns=['hscode', 'tariff'])
第一行示出了資費是零爲國家(A,B KR,FR),JP爲5%,第二行顯示A,B,FR爲零,JP和KR爲5%。
我想找到全國KR「每一行的稅率,這樣我就可以有如下表:
'HSCODE '關稅'
10101010 0%
10101020 5%
因此,我想在每個單元中找到縣代碼'KR'的關稅稅率。
您能否更清楚地解釋data2與data1相關的數據以及與KR和(A,B,KR,FR)的關係? – Anzel
嗨Anzel,data2是「hamonized關稅代碼」,data1顯示了每個國家的實際關稅稅率。 (A,B,KR,FR,JP)都表示countires,我想找到特定國家的關稅稅率KR。謝謝。 –
我剛剛發佈了一個不使用正則表達式的答案。正則表達式是強制的嗎因爲你只是在標題中說明它們。 –