我有一個看起來像這樣文字刮痧:正則表達式
my_text = "address ae fae daq ad, 1231 asdas landline 213121233 -123 mobile 513121233 cell (132) -142-3127
email [email protected] , sdasd [email protected] - [email protected]"
文本開頭的「地址」動態文本。只要我們看到「地址」,我們就需要從那裏颳去所有的東西,直到出現「固定電話」/「移動」/「小區」。從那裏開始,我們希望在所有電話文本(不改變兩者之間的空格)的情況下進行刮擦。我們從第一次出現「固定電話」/「移動」/「小區」開始,並在我們發現「電子郵件」時立即停止。 終於我們颳了電子郵件部分(不改變之間的空間)
'座機'/'移動'/'細胞'可以以任何順序出現,有時可能不會出現。例如,文本也可能看起來像這樣。
my_text = "address ae fae daq ad, 1231 asdas
cell (132) -142-3127 landline 213121233 -123
email [email protected] , sdasd [email protected] - [email protected]"
還有一些工程需要完成,以形成包含在地址,電話和電子郵件文本中的子文本數組。 地址的子文本總是用逗號(,)分隔。 電子郵件的子文本可以用逗號(,)或連字符( - )分隔。
我的輸出應該是一個JSON字典看起來是這樣的:
resultant_dict = {
addresses: [
{ address: "ae fae daq ad" }
, { address: "1231 asdas" }
]
, phones: [
{ number: "213121233 -123", kind: "landline" }
, { number: "513121233", kind: "mobile" }
, { number: "(132 -142-3127", kind: "cell" }
]
, emails: [
{ email: "[email protected]", connector: "" }
, { email: "sdasd [email protected]", connector: "," }
, { email: "[email protected]", connector: "-" }
]
}
我想實現使用正則表達式或Python中的任何其他辦法的事情。我不知道如何寫這個,因爲我是一個新手程序員。
好的。這很好。但是我想保留空間,這是有原因的。我將嘗試相應地編輯代碼並進行更新。 – user3422637
如果你想出一個快速調整來包含空格,你可以添加它:) – user3422637