google-scholar

    6熱度

    1回答

    我試圖獲取大量學術文章的信息作爲我的研究的一部分。文章的數量是數千。由於Google學術搜索沒有API,我正試圖抓取或抓取學者。現在我現在說,這在技術上反對EULA,但我試圖對此非常有禮貌和合理。我瞭解Google不允許漫遊器將流量限制在合理範圍內。我在每次請求之間以1秒爲單位開始測試一批約500個請求。大約前100個請求後我被阻止。我試過其他多種策略,包括: 延長暫停到〜20多歲和加入一些隨機噪

    2熱度

    1回答

    我有一個問題,使用R包scholar 什麼工作的引文歷史: get_citation_history(SSalzberg) 什麼不: get_article_cite_history(SSalzberg, "any article") 代碼: article <- "Ultrafast and memory-efficient alignment of short DNA sequence

    2熱度

    1回答

    每當我在Safari和Google Chrome的私人窗口中運行網址https://scholar.google.com/citations?user=N7m4vIQAAAAJ&hl=en時,Google都會給出錯誤信息。 它只發生在隱私瀏覽模式下的第一個請求。 有人知道爲什麼只有在特定的環境中才會發生這種情況嗎? 3天前發生這種事情。 - 錯誤消息,並且捕獲 Server Error We're

    -1熱度

    1回答

    我正在開發一個項目,希望從Google學術搜索中獲取數據。我想刮掉所有在某個類別中標記的作者(例如,Anaphylaxis),並將他們的引用次數,h-index和i-10索引存儲在CSV文件中。但是,鑑於Google學術搜索沒有API,我不確定如何執行此操作。我知道我可以使用刮刀像美麗的湯,但我不確定如何刮取數據而不被阻塞。 所以,我的問題是如何使用bs4來存儲標記爲過敏反應的所有作者以及每個作者

    0熱度

    1回答

    我有一個這樣的字符串: url = 'http://scholar.google.pl/citations?view_op\x3dsearch_authors\x26hl\x3dpl\x26oe\x3dLatin2\x26mauthors\x3dlabel:security\x26after_author\x3drukAAOJ8__8J\x26astart\x3d10' 我想將它轉化成這樣:

    3熱度

    1回答

    我寫了下面的代碼來從Google Scholar security page.刮數據。但是,每當我運行它我收到此錯誤: Traceback (most recent call last): File "/Users/.../Documents/GS_Tag_Scraper/scrape-modified.py", line 53, in <module> getProfileF

    1熱度

    1回答

    我正在使用bs4和urllib從Google Scholar中抓取數據。我正試圖讓第一年發佈一篇文章。例如,從this page我試圖得到1996年。這可以從條形圖中讀取,但只能在單擊條形圖後讀取。我已經編寫了下面的代碼,但它會在單擊條形圖之前打印出可見年份。 from bs4 import BeautifulSoup import urllib.request url = 'https:/

    0熱度

    1回答

    我目前的Android應用程序使用WebView來允許用戶搜索科學期刊(文章)。 當我嘗試瀏覽到谷歌學術我收到一個屏幕,上面寫着 We're Sorry... ...but your computer or network may be sending automated queries. To protect our user's we can't process your request ri

    0熱度

    1回答

    我正在嘗試使用BeautifulSoup從Google學者的作者處獲得作者的所有出版物的完整作者列表。由於作者的主頁只有每篇論文的作者的截斷列表,我必須打開論文的鏈接以獲得完整列表。結果,我每遇到一次嘗試都會遇到CAPTCHA。 有沒有辦法避免驗證碼(例如在每次請求後暫停3秒)?或者讓原始Google Scholar個人資料頁面顯示完整的作者列表?

    0熱度

    1回答

    我使用了一個名爲谷歌學術文獻資源管理器的腳本,它一個很好的腳本,讓一個搜索科學文章。但是,較新版本的Google Chrome或Firefox無法使用它。我使用了可用的firefox 3.6版本。 但是在Firefox 3.6版本的驗證碼是不行的,所以我從使用谷歌的學者受阻。 有誰知道解決方法嗎?有什麼方法可以使用鍵盤來解決reCAPTCHA?。