findall

    -2熱度

    1回答

    我試圖從html代碼中提取文本。這裏是我的代碼: import re Luna = open('D:\Python\Luna.txt','r+') text=Luna.read() txt=re.findall('<p>\s+(.*)</p>',text) print txt 然而,只有第一<p>之前消除一部分,一切都在第一<p>保持了。我應該怎樣做才能改進我的代碼,以便它只返回<p>

    0熱度

    2回答

    我試圖找到一個使用Python的CSS文件中的圖像文件重新找到所有。以下工作除了它只發現CSS文件中的第一個圖像並忽略其餘部分。我如何使它抓住所有圖像鏈接? img_links_in_css = re.findall('^ (URL |網址|網址|網址|網址)\ S(\ S *(+(PNG |。JPG | GIF | JPEG | SVG))\ S *)。*?$',str(css))

    0熱度

    1回答

    正則表達式的findall沒有預期的多個結果我在Python以下兩個片段(short_sentence是long_sentence這兒的一部分) short_sentence = '<p data-reactid="389">THE prospect of deregulation helps explain why, since Donald Trump\xe2\

    0熱度

    2回答

    以下是我與龐大的數據在表1和表2做: 比較sheet1.columnnames(基於多重比較)的所有匹配的行在sheet2中。突出顯示差異並將其粘貼到結果表。 在結果表中,對於列1中具有相同值的所有行,請檢查其他字段的字體顏色。如果它是紅色,則將column1複製到新的結果表單中。 我完成了(1)。對於(2)我在(http://www.cpearson.com/excel/findall.aspx

    1熱度

    1回答

    我無法找到我有的正則表達式問題的解決方案。這實際上是一種跟進質詢,這個帖子的: Find string between two substrings AND between string and the end of file 我已經創建了下面的示例文本(在我的應用程序中的文本是一個很多時間和多個文件等): 課程22/09/2010 1.早期工作Josephine,Jansen 22-09-201

    1熱度

    2回答

    我想要得到的只有「文本3」的部分用下面的代碼: import re stringtotest = "begin:Text1<wrong>Text2<wrong>Text3<right>Text4<wrong>" right = re.findall("<wrong>(.+?)<right>",stringtotest) >>> right ['Text2<wrong>Text3'] 爲

    0熱度

    2回答

    我有一個字符串,如「嘿人#Greetings我們怎麼樣?#令人敬畏」,每次有一個hashtag我需要用另一個字符串替換該字。 我有下面的代碼,當只有一個hashtag工作,但問題是因爲它使用sub來替換所有實例,它會覆蓋每個字符串與最後一個字符串。 match = re.findall(tagRE, content) print(match) for matches in match:

    0熱度

    2回答

    <div class="columns small-5 medium-4 cell header">Ref No.</div> <div class="columns small-7 medium-8 cell">110B60329</div> 網站是https://www.saa.gov.uk/search/?SEARCHED=1&ST=&SEARCH_TERM

    0熱度

    1回答

    我想使用mongo.find.all()獲取一個集合中的所有記錄。但是,我發現結果中的某些字段被截斷。像下面, ..... $onefiled [1] xxxxxxxx... <truncated> ...... 我不知道如何才能避免這一問題,並得到該領域的全部內容?我無法在mongo.find.all()中找到一個參數來控制它。

    0熱度

    1回答

    我有一個大型文件,基本上看起來像日記,並希望提取有關每個日期的所有信息以進一步處理它。 File looks like this: Mittwoch, 13. September 2017 19:00 Uhr 20:00 Uhr Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod