我試圖從MLS網站上抓取玩家信息來創建玩家來自哪裏的地圖以及其他信息。隨着它的發展,我對這件事情是新的。Nokogiri:清理數據輸出
到目前爲止,我已經使用這個代碼:
require 'HTTParty'
require 'Nokogiri'
require 'JSON'
require 'Pry'
require 'csv'
page = HTTParty.get('https://www.atlutd.com/players')
parse_page = Nokogiri::HTML(page)
players_array = []
parse_page.css('.player_list.list-reset').css('.row').css('.player_info').map do |a|
player_info = a.text
players_array.push(player_info)
end
#CSV.open('atlantaplayers.csv', 'w') do |csv|
# csv << players_array
#end
pry.start(binding)
撬函數的輸出是:
:"Miguel Almirón10\nMidfielder\n-\nAsunción, ParaguayAge:\n23\nHT:\n5' 9\"\nWT:\n140\n"
其中投入CSV時,在一個單元格創建此
"Miguel Almirón10
Midfielder
-
Asunción, ParaguayAge:
23
HT:
5' 9""
WT:
140
"
我查看過東西,並確定它可能是節點(\ n)?這是拋棄格式。
我想要的結果,在這裏是要弄清楚如何獲得撬輸出到數組如下:
Miguel, Almiron, 10, Midfielder, Asuncion, Paraguay, 23, 5'9", 140
獎勵積分,如果你能與名字重音符號幫助。另外,如果高度有問題,是否有方法將其轉換爲度量標準?
預先感謝您!