我正在使用perl通過.txt刮取以下內容,我最終將其帶入Stata。什麼格式選項有效?我有很多這樣的觀察,所以想用一種我可以概括的方法。Stata - 從.txt輸入數據與「」和,
原始數據的格式爲:
First Name: Allen
Last Name: Von Schmidt
Birth Year: 1965
Location: District 1, Ocean City, Cape May, New Jersey, USA
First Name: Lee Roy
Last Name: McBride
Birth Year: 1967
Location: Precinct 5, District 2, Chicago, Cook, Illinois, USA
的目標是在Stata創建變量:
First Name: Allen
Last Name: Von Schmidt
Birth Year: 1965
County: Cape May
State: New Jersey
First Name: Allen
Last Name: McBride
Birth Year: 1967
County: Cook
State: Illinois
可能導致這樣的可能是什麼.txt和我將如何加載它變成Stata?
此外,在這兩個例子中,術語數量在位置上有所不同,但我總是希望在美國之前使用2。
目前,我在表格的每個變量的周圍放置了「」,用於.txt。
"Allen","Von Schmidt","1965","District 1, Ocean City, Cape May, New Jersey, USA"
"Lee Roy","McBride","1967","Precinct 5, District 2, Chicago, Cook, Illinois, USA"
是否有更好的方式來格式化.txt文件?我如何在Stata中創建相應的變量?
謝謝你的幫助!
P.S.我知道stata使用infile或insheet,並且可以處理,或製表符來分隔變量。我不知道如何在perl中添加所有這些變量,所以我添加了「」
謝謝!根據更新後的文章,我對第一種方法有太多觀察。第二個apporach使用第一個壓縮開始?那麼,「」是沒有問題的?名稱中的空格也不是? – user1690130 2013-02-15 22:55:27
從壓縮開始。只要沒有人叫Mac「刀」Gangsterson它應該工作。內部空間正常。 – 2013-02-16 02:50:25
謝謝!一個後續如果這是好的。我注意到,地點的條款數量有所不同,但我總是希望2美國之前。這種方法仍然適用嗎? – user1690130 2013-02-16 18:49:47