我試圖提取頂級網址並忽略路徑。我使用下面的代碼:熊貓功能花費時間太長
for row in Mexico['Page URL']:
parsed_uri = urlparse('http://www.one.com.mx/furl/Conteúdo Raiz/Meu')
Mexico['SubDomain'] = '{uri.scheme}://{uri.netloc}/'.format(uri=parsed_uri)
此腳本已運行過去一小時。當我運行它,它給了以下警告:
/anaconda/lib/python3.6/site-packages/ipykernel_launcher.py:3: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
This is separate from the ipykernel package so we can avoid doing imports until
我會很感激,如果任何人都可以在一個更快的方法提出建議,也許對方法的「警告」指針顯示
一開始移動'urlparse'外循環調用。它每次都做同樣的事情。你甚至不會在你的循環中使用'row',那麼爲什麼有循環?你輸錯了你的代碼嗎? –
感謝您的協助。數據幀的URL不同。如果我將這一點從循環中移出,我將如何爲此進行調整? –
這可能是我isse的一部分。我試圖循環遍歷數據框並複製域/子域,忽略路徑 –