2014-01-11 93 views
0

編輯:放PDF文檔,而不必搜索enginees他們索引

這似乎是一個不錯的問題,現在我看到,有可能是比我剛花了整整一天的方式更直接剛愎答案編碼。

我發現你可以把它放在.htaccess文件中,並且搜索引擎不會索引PDF文件。太簡單了。我想這不是很出名,或者有人會爲我解決7個小時的問題,因爲我在接近一個答案的地方編碼了一些東西。

<FilesMatch "\.pdf$"> 
     header set x-robots-tag: noindex 
    </FilesMatch> 

我有一個網站,讓PDF文件的路程,廣告支持。最近谷歌已經鏈接到PDF,而不是具有嵌入式廣告和網頁廣告的網頁。看起來很瘋狂,因爲它們是Google的廣告,但對於用戶來說我覺得很好。我的收入減少了一半。我可以通過創建一個名爲.pdf的目錄並將文件index.php與適當的頭文件重定向,從而使網頁結果轉到另一個頁面。在新文件中,我可以重命名PDF,但這只是將問題延遲到索引新位置時。這樣做到700個文件是不是我想每週都做。

我已經考慮將pdf文件翻譯爲html,並且已經測試過zamzar windershare,somepdf,intrapdf,而且他們都沒有做好。一些翻譯幾乎是可讀的,有些只是一個白頁,一個黑頁,一個是一個黑色的頁面,在這裏和那裏都有一些斑點。幾個小時前我嘗試了一個在線服務,但還沒有收到我的文件的電子郵件。

我沒有設置pdf到html,這正是我能想到的。

也許有更好的解決方案。其他人必須有這個問題,並以某種方式解決它。很明顯,我需要頁面可搜索以及只是將所有內容轉換爲圖像不是一個解決方案。我不知道該怎麼辦。

回答

1

您必須選擇:要麼Google會閱讀PDF併爲其編制索引 - 因此它們會獨立出現在搜索結果中,或者您可以在robots.txt中排除PDF,Google不會讀取PDF並且不會將它們編入索引所有。

您不能要求Google爲PDF索引,只能將此結果應用於父級。要做你想做的事情,你需要停止鏈接到PDF文件。

如果您使用基於Flash的PDF閱讀器或其他東西,而不是實際鏈接到iframe中的PDF,那麼這可能會解決您的問題。

+0

我會研究基於Flash的觀衆。對我來說這是一個新想法。可能很容易找到它的鏈接,如果我這樣做,我會發布它。現在,我放入一個「預覽」滾動區域,用戶可以在加載時從pdf中看到文本。這使得Google可以對文本進行索引,同時能夠阻止PDF本身的索引。但閃光的想法對我來說是一件好事。謝謝。 –

+0

我將PDF設置爲noindex,並在滾動區域的頁面上打印出文本。我同意,你不能雙方都有,所以這是我的妥協。 –

0

您的搜索引擎優化是否依賴於pdf內容?如果沒有,您可以創建一個robot.txt,禁止搜索引擎訪問包含pdf文件的文件夾。

+0

然後他們無法搜索內容。 –

+0

這就是爲什麼我用'你的搜索引擎優化依賴於內容?如果不,...'。對不起,這不適合你。 – kjid

+0

完美,謝謝你的嘗試。 –