從mysql數據庫字符串字段中提取所有文件鏈接url到列表

我需要在我的數據庫字段之一中獲取所有文件url的列表。從mysql數據庫字符串字段中提取所有文件鏈接url到列表

mysql數據庫，article表

`id` | `subject` | `content`

的content值是HTML文本與一個或多個文件的URL，例如：

<p>this is the answer for ..., you can refer to below screenshot:</p> 
<img src="http://the_url_of_image_here/imagename.jpg/> 

<p>or refer to below document</p> 

<a href="http://the_url_of_doc_here/guide.ppt>guide</a> 
<a href="http://the_url_of_doc_here/sample.dox>sample</a>

有2種類型的文件

圖片，擴展名爲jpg，jpeg，png，bmp，gif
文件，擴展名爲DOC，DOCX，PPT，PPTX，XLS，XLSX，PDF，XPS

我做了很多GOOLGE，看起來很難只用MySQL來做到這一點，PHP將使它容易，我寫我的代碼，但它不能工作。

謝謝cars10，我解決了它。

function export_articles_link() 
{ 
    global $date_from, $date_to; 
    $filename = "kb_articles_link_".$date_from."_".$date_to.".xlsx"; 
    header('Content-disposition: attachment;  filename="'.XLSXWriter::sanitize_filename($filename).'"'); 
    header("Content-Type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"); 
    header('Content-Transfer-Encoding: binary'); 
    header('Cache-Control: must-revalidate'); 
    header('Pragma: public'); 
    $query = 'SELECT `content` FROM `kb_articles` WHERE ((DATE(`dt`) BETWEEN \'' . $date_from . '\' AND \'' . $date_to . '\') AND (`content` LIKE \'%<img src=%\' or `content` LIKE \'%<a href="http:%\')) order by id asc'; 
    $result = mysql_query($query); 
    $writer = new XLSXWriter(); 
    $img_list = array(); 
    while ($row=mysql_fetch_array($result)) 
    { 
     $text = $row['content']; 
     preg_match_all('!http://.+\.(?:jpe?g|png|gif|ppt?|xls?|doc?|pdf|xdw)!Ui', $text, $matches); 
     $img_list = $matches[0]; 
     foreach ($img_list as $url) 
     { 
     $writer->writeSheetRow('Sheet1', array($url)); // if more than one url it will be put on first column 
     } 
    }; 
    $writer->writeToStdOut(); 
    exit(0); 
}

與其他需要工作示例的人分享，希望能節省您的時間。

來源

2017-04-05 user3009410

「我寫我的代碼，但它不能正常工作」有什麼錯誤？這裏的問題？ – hassan

您應該將中央環更改爲類似

$image_list=array(); // prepare an empty array for collection 
while ($row=mysql_fetch_array($result)) 
{ 
    $text = $row['content']; 
    preg_match_all('!http://.+?\.(?:jpe?g|png|gif|pptx?|xlsx?|docx?|pdf|xdw)!i', $s, $matches); 
    $img_list=array_merge($image_list,$matches[0]); // append to array  
} 
$writer->writeSheetRow('Sheet1', $image_list);

既然你沒有明確地指出什麼是錯了，我只是猜測，並徑自：正則表達式是從原始的，也是略有不同我構建循環的方式（是的，只需要一個）。 preg_match_all只需要爲每個$text調用一次，然後將$matches[0]的結果合併到您的$img_list-陣列中。

我還刪除了U-修飾符，它反轉了整個正則表達式的「貪婪」。相反，我在+之後添加了一個?，以使這個量詞「非貪婪」。

我準備了一個小簡約的演示在這裏：http://rextester.com/JDVMS87065

來源

2017-04-05 13:45:25 cars10m

我會盡力回覆，謝謝。 – user3009410

感謝cars10，幻想正則表達式！ – user3009410

從mysql數據庫字符串字段中提取所有文件鏈接url到列表

回答

相關問題