findall

    0熱度

    2回答

    我試圖獲得所述形式的所有子串的列表: 結腸+ 2個英文字母順序指定序列具有最小1位+數值之間 import re DATA_SUB = ':(TI|LO|TE|HU|AN|FO)[0-9\.]+' print(re.findall(DATA_SUB, '%145:TI15:LO1.6213:TE97$')) 結果: ['TI', 'LO', 'TE'] 其中它應該是: [':TI15'

    0熱度

    1回答

    我想從本網站獲取產品信息:http://megabuy.vn/Default.aspx。 我的解決方案是根據網站結構刮掉網站。所以起初,我必須在深入到子類別,然後再到每個特定產品之前,抓取有關普通類別的所有鏈接。 我有麻煩刮各個環節像一般類別: 切雙雲峯 可能小屋是 做噠糞芽BEP 等等 我認爲問題在於這些鏈接是在java腳本標記下。 這裏是我的代碼: from bs4 import Beauti

    1熱度

    2回答

    我與美麗的湯嘗試,我試圖從包含以下類型的段一個HTML文檔的信息: <div class="entity-body"> <h3 class="entity-name with-profile"> <a href="https://www.linkedin.com/profile/view?id=AA4AAAAC9qXUBMuA3-txf-cKOPsYZZ0TbWJkhgfxfpY&tr

    0熱度

    1回答

    我在看: Python regex find all overlapping matches?和re.finditer不適合我。我不想再下載另一個模塊(即regex)來替換內置的re。我以爲我可以自己寫,但我對while loops的理解是有限的。 我試圖做一個搜索包裝,發現所有模式,即使它們重疊(目前findall不在re)。 我也從來沒有試過編程這樣的東西,所以我不想嘗試使用內置模塊來構建我自

    -2熱度

    1回答

    我試圖設置一個數據集來檢查文章列表中提及多少個不同的名字。因此,對於每篇文章,我想知道提及nameA,nameB等等的頻率。但是,我在迭代列表時遇到了麻煩。 我的代碼如下: for element in list_of_names: for i in list_of_articles: list_of_namecounts = len(re.findall(element, i))

    0熱度

    1回答

    我是學習RE的新手。以下是Python代碼片段: >>>m = re.match("([abc])+", "abc") >>> m.group() 'abc' ..........(1) >>> m.groups() ('c',) .........(2) >>> m = re.findall("([abc])+", "abc") >>> m ['c'] ..........(3)

    -1熱度

    1回答

    我想知道是否可以編寫一個jess函數或規則來表現findolog的序言。 例如,我們有一個像 (person (name jason) (school nyu)) (person (name john) (school nyu)) (person (name liz) (school cmu)) 一個KB ... 和輸入(學校NYU),我們想收集的人 像[傑森,約翰所有的名字] 任何意見將

    2熱度

    2回答

    我試圖在將單詞分割爲詞的後綴和前綴(即詞素或詞綴)後得到一個列表。 我試過使用正則表達式,與re.findall函數。 (如下所示) >>> import re >>> affixes = ['meth','eth','ketone', 'di', 'chloro', 'yl', 'ol'] >>> word = 'dimethylamin0ethanol' >>> re.findall('

    1熱度

    1回答

    我試圖構建一個從網頁中收集文本的刮板。我正在研究具有不同類名的兩個特定div(「產品圖像」和「產品詳情」)。我通過它們循環,抓住div中每個「a」和「dd」標籤的文本。 值得一提的,這是我曾經寫過的第一個Python程序... 這裏是我的代碼: list_of_rows = [] for row in soup.findAll(True, {"class":["product-image", "

    0熱度

    1回答

    我在Python中使用re.findall匹配日誌文件的每一行,並從該行中提取json數據。下面是一個例子行: <134>1 2017-01-23T10:54:47.111-01:11 bla blabla - - <-- '{"jsondata": "1.0", "result": null, "id": 0}' 而且我使用它的代碼:返回此 for line in jsonlog: