我從使用Python提取有關某些公司的信息。我已經能夠從從字符串中提取業務名稱和時間段
拿到主任/主管的名字,人物傳記,並賠償現在,我想從傳記部分,它看起來是這樣的提取以前的位置職務和公司:
Donald T. Grimes先生自2008年5月起擔任Wolverine World Wide,Inc.的高級副總裁,首席財務官兼財務主管。從2007年至2008年,他擔任Keystone Automotive Operations,Inc.的執行副總裁兼首席財務官。 ,汽車配件和設備的分銷商。在Keystone之前,Grimes先生在布朗福爾曼公司擔任高級企業和部門財務職位,高級葡萄酒和烈酒的製造商和營銷商。在Brown-Forman工作期間,Grimes先生曾擔任2006年至2007年的副總裁,飲料金融總監; 2003年至2006年擔任企業規劃與分析部副總裁兼董事;高級副總裁,財務總監布朗 - 福曼烈酒美國從1999年到2003年
我可以用簡單的regex從和年拿到的,但我在關於如何編寫正則表達式來虧損獲得標題和公司名稱。我知道字符串格式不一致,所以我會採取適用於至少70%的案例的答案。這裏是我想要的輸出:
2007-2008, executive vice president and chief financial officer, Keystone Automotive operations
bdk,非常感謝您的周到和詳細的答覆。我在想同樣的觀點。我用模式庫來提取形容詞。我也會爲此達成目的。 [http://www.clips.ua.ac.be/pages/pattern] – karlos