我有一些繁重的任務需要做,我需要python的一些幫助。請看這個文件。從.docx文件中提取python的GPS座標
我提取文本和GPS從各行的座標。 10個docx文件中目前有超過100個座標。我的「重型」蟒蛇知識讓我知道這一點。
from docx import Document
import re
main_file = Document("D:/DOCUMENTS/Google_Link/1 Category I/1 Category
I.docx")
table = main_file.tables[1] #this is same for every document
data = []
keys = None
for i, row in enumerate(table.rows):
text = (cell.text for cell in row.cells)
if i == 0:
keys = tuple(text)
continue
row_data = tuple(text)
data.append(row_data)
regexReference = re.compile("(C.-)\w+")
colReference = [item[1] for item in data]
listReference = filter(regexReference.match, colReference)
for i in listReference:
print i.encode('UTF-8')
我可以從列2打印16個參考ID。請指導我打印這樣的內容。
C1-20701-17-1
some site, some region
The existing CMC Office at Bariyodhala (22°40'34.3"N; 91°38'28.2"E) requires
some repair/maintenance works including electrical wiring and electrical
lights and appliances like ceiling fans supplies. Detail specification of
the works are attached
x = 91°38'28.2"E
y = 22°40'34.3"N
這些XY位置和描述將用於創建KML文件並附加到每個文檔。我更喜歡上面部分的每個部分(參考ID,位置,描述,x和y)的一個變量,以便我可以自動執行。
我建議你添加一個鏈接到一個演示docx文件。 –
已添加demo docx文件鏈接。 –