這似乎是一個不錯的問題,現在我看到,有可能是比我剛花了整整一天的方式更直接剛愎答案編碼。
我發現你可以把它放在.htaccess文件中,並且搜索引擎不會索引PDF文件。太簡單了。我想這不是很出名,或者有人會爲我解決7個小時的問題,因爲我在接近一個答案的地方編碼了一些東西。
<FilesMatch "\.pdf$">
header set x-robots-tag: noindex
</FilesMatch>
我有一個網站,讓PDF文件的路程,廣告支持。最近谷歌已經鏈接到PDF,而不是具有嵌入式廣告和網頁廣告的網頁。看起來很瘋狂,因爲它們是Google的廣告,但對於用戶來說我覺得很好。我的收入減少了一半。我可以通過創建一個名爲.pdf的目錄並將文件index.php與適當的頭文件重定向,從而使網頁結果轉到另一個頁面。在新文件中,我可以重命名PDF,但這只是將問題延遲到索引新位置時。這樣做到700個文件是不是我想每週都做。
我已經考慮將pdf文件翻譯爲html,並且已經測試過zamzar windershare,somepdf,intrapdf,而且他們都沒有做好。一些翻譯幾乎是可讀的,有些只是一個白頁,一個黑頁,一個是一個黑色的頁面,在這裏和那裏都有一些斑點。幾個小時前我嘗試了一個在線服務,但還沒有收到我的文件的電子郵件。
我沒有設置pdf到html,這正是我能想到的。
也許有更好的解決方案。其他人必須有這個問題,並以某種方式解決它。很明顯,我需要頁面可搜索以及只是將所有內容轉換爲圖像不是一個解決方案。我不知道該怎麼辦。
我會研究基於Flash的觀衆。對我來說這是一個新想法。可能很容易找到它的鏈接,如果我這樣做,我會發布它。現在,我放入一個「預覽」滾動區域,用戶可以在加載時從pdf中看到文本。這使得Google可以對文本進行索引,同時能夠阻止PDF本身的索引。但閃光的想法對我來說是一件好事。謝謝。 –
我將PDF設置爲noindex,並在滾動區域的頁面上打印出文本。我同意,你不能雙方都有,所以這是我的妥協。 –