可以說,我發現一個網站,有以下標記:Laravel - 是否可以從外部網站將數據保存到mySQL數據庫?
<body>
<div id="paper">
<div id="contentwrapper">
<div id="rightcontent">
<h1>1967-002A</h1>
<p>
<strong>NSSDCA/COSPAR ID:</strong> 1967-002A</p>
<div class="twocol">
<div class="urone">
<h2>Description</h2>
<p>
This US Air Force photo surveillance satellite was launched from Vandenberg AFB aboard a Thor Agena D rocket. It was a KH-4A (Key Hole-4A) type satellite. The satellite had fair image quality.
</p>
</div>
<div class="urtwo">
<h2>Alternate Names</h2>
<ul>
<li>02642</li>
</ul>
<h2>Facts in Brief</h2>
<p>
<strong>Launch Date:</strong> 1967-01-14
<br/>
<strong>Launch Vehicle:</strong> Thor
<br/>
<strong>Launch Site:</strong> Vandenberg AFB, United States
<br/>
<strong>Mass:</strong> 1500.0 kg
<br/>
</p>
<h2>Funding Agency</h2>
<ul>
<li>Department of Defense-Department of the Air Force (United States)</li>
</ul>
<h2>Discipline</h2>
<ul>
<li>Surveillance and Other Military</li>
</ul>
</div>
</div>
</div>
</div>
</div>
</body>
這包含的信息,如說明,發佈日期,運載火箭,發射場和羣衆,資助機構和紀律。 - 這些都可以是mySQL數據庫中的列。
該網頁的鏈接/spacecraftDisplay.do?id=1967-002A
。我已經有了一個數據庫 - 1967-002A
- 航天器標識符。所以我猜測要從我的數據庫中獲取每個標識符並使用相同的標識符保存來自URL的數據。每個網頁都是一樣的
我已經知道如何使用Guzzle從具有JSON格式的外部API保存數據。我們正在處理外部網站的HTML,而不是JSON。
我首先想知道的是,如果它甚至可能從網頁上保存這些數據,或者您可以做什麼的限制?
我有類似的問題,我用硒來讀取HTML並從中獲取值。 –
你在找什麼叫做「DOM解析器」。您可以使用它來解析來自結構化HTML的信息。 – David