1
我有一些代碼可以讀取Word文檔中的表格,並根據它製作一個數據框。在Word表格中搜索某些文本Python docx
import numpy as np
import pandas as pd
from docx import Document
#### Time for some old fashioned user functions ####
def make_dataframe(f_name, table_loc):
document = Document(f_name)
tables = document.tables[table_loc]
for i, row in enumerate(tables.rows):
text = (cell.text for cell in row.cells)
if i == 0:
keys = tuple(text)
continue
row_data = dict(zip(keys, text))
data.append(row_data)
df = pd.DataFrame.from_dict(data)
return df
SHRD_filename = "SHRD - 12485.docx"
SHDD_filename = "SHDD - 12485.docx"
df_SHRD = make_dataframe(SHRD_filename,30)
df_SHDD = make_dataframe(SHDD_filename,-60)
因爲文件是不同的(例如在SHRD有32個表,我要找的人是倒數第二,但SHDD文件有280桌,而我要找的人是60從結束。但事實可能並非總是如此。
如何通過文檔中的表格檢索,並開始在一個cell[0,0] = 'Tag Numbers'
。
謝謝。我唯一需要添加的是'first_cell_string = first_cell_string.lower()。strip()',因此搜索字符串與Word字符串匹配。 –