2011-11-02 49 views
3

我想將幻燈片中的所有信息(格式化文本,圖像等)提取爲流暢可讀(MS Word樣式)格式。以編程方式將PowerPoint幻燈片的內容提取爲MS Word格式?

我對保持幻燈片的概念根本不感興趣 - 想想參加大學課程的課堂幻燈片,並將它們批量轉換爲一本集體學習指南。

  1. 我不能找到一種方法,這種做(但如果你知道一個的,請分享!),並
  2. 我沒有經驗的腳本Office應用程序。這種事很容易完成嗎?這種腳本是否已經存在?

澄清
在這篇文章中的早期版本中,我使用的詞「流」來指代一個滑動自由(MS字等)的格式。但是,這並不涉及幻燈片內容的實際格式。所以保留子彈列表等是很好的,甚至是可取的。

+0

你仍然可以更清楚你想要什麼。例如,你是否需要這個適用於任何ppt文件的'vbscript'?您可以通過菜單手動執行它,因爲當前的答案建議 – brettdj

+0

代碼[here](http://www.pptfaq.com/FAQ00274_Export_Text_to_a_text_file-_extract_text_from_PowerPoint_-Mac_or_PC-.htm)將轉儲文本並區分標題,副標題,正文和其他文字。這是一個更詳細的代碼版本,比Steve Rindberg發佈的版本低於 – brettdj

回答

2

我不認爲這是一個簡單的任務。在我的經歷中,大學教授使用「標題:BULLET POINTS或IMAGE」的格式或「我想說的每一個字」作爲他們幻燈片的格式,而且你只是不會從前者得到流暢可讀的文本。不管你做什麼。對於後者,你已經有了你的文本,你只需要將它複製到另一個文檔。

我想你可能只是打開PowerPoint,選擇所有的文本,並複製粘貼到Word/Publisher/InDesign /您最喜歡的頁面佈局程序。除非沒有編寫程序的麻煩,否則您將獲得相同的效果和相同的編輯量。

使用N-up選項對PDF進行打印操作可能是一個很好的解決方案,如果這是您所需要的。您可以擴大想法,將所有幻燈片集合成一個,打印出來(每頁有N張幻燈片和旁邊的音符空間)並裝訂,即時學習指南。我已經看到了,然後你可以選擇記筆記。

如果你只是因爲可以 - 不要讓我阻止你,而讓你更有力量。有這麼多的好學習。您可能需要考慮使用.NET中的Microsoft.Office.Interop命名空間編寫程序(從http://msdn.microsoft.com/en-us/library/bb772069.aspx開始),或者查看CPAN(http://search.cpan.org/search?mode=all&query=powerpoint)並使用Perl進行編程!有很多方法可以做到,但你必須迎接挑戰。

2

文字提取相當簡單,但您要什麼文字?僅來自標題和正文文本佔位符的文字?文件,另存爲,然後選擇保存大綱。

幻燈片上的其他文字?這可以通過編程方式拉出到一個文本文件,但按照什麼順序?假設你有一個複雜的圖表和文字標註。提取文本會給你一個亂碼。除了人類觀察者提供的內容外,沒有任何明顯的/有意義的順序,通過注意到「啊,這一點文本旁邊的箭頭指向了搖桿子組件,因此必須以某種方式與之相關。嘗試在代碼中做到這一點。 ;-)

您可以爲作者提供一種將文本排序爲閱讀順序的方法,以便代碼知道提取它的順序,但這需要作者的大量工作。

如果你能確定所有的內容是標題+子彈形式,不用擔心。否則,你必須能夠清楚地表達你想要提取的內容,以何種形式和順序,然後才能使用它。

+0

假定標題+子彈形式。 – user456584

+0

在這種情況下,看看這個和後續頁面:導出幻燈片編號和標題文本到一個文本文件 http://www.pptfaq.com/FAQ00332_Export_Slide_Number_and_Title_Text_to_a_text_file.htm –

0

既然您提到標題+子彈形式正常,請打開文件,選擇另存爲並選擇Outline作爲保存類型。

+0

但會保留「所有的信息(格式化文本,圖像等)「? – user456584

+0

不,只是文字。對不起......被標題+子彈注意力分散,並且在原始查詢中丟失了對圖像要求的跟蹤。但是,您是否嘗試了各種發送至Word選項? –

1

MS Word風格不僅可讀,而且可寫(在您的要求中未指定)。如果你想要一個只讀指南,PDF是你的自然選擇(通過Acrobat Distiller或LibreOffice)。將單獨的Acrobat演示文稿與PDFtk,Acrobat或Foxit結合在一起,您無需任何編程即可輕鬆完成任務。

「這種事很容易做到嗎?」 - 是的,你不起眼的僕人在幾年前做過幾個類似的腳本(從Powerpoint幻燈片中提取增強的元文件)。

「這種腳本是否已經存在?」 - 是的。可能有數百個地方,但不知道他們中的任何一個是否被髮布到「網絡」。所有考慮的事情都認爲你最好自己學習一些腳本編程和宏編程,因爲現成的腳本可能不太適合你的需求 - 爲了理解和重寫它,你需要更多的時間而不是代碼&從頭開始調試。

0

我想你可以通過PowerPoint文件解析格式,文本和圖片。有Visual Studio命名空間可用於這樣的任務。您打開文件,解析並從這些文件創建Word文件。複雜的工作,因爲你必須考慮元素的類型和他們的位置,你將不得不爲每個幻燈片使用臨時結構。

0

看一看此示例代碼:

http://msdn.microsoft.com/en-us/library/office/gg278331.aspx

如何:獲取的所有幻燈片的所有文本在演示

基本上,使用C#和OpenXML的SDK 2.0,它循環顯示演示文稿中的所有幻燈片,然後將每個幻燈片中的每個文本添加到字符串構建器中。如果您喜歡(需要修改),您可以將結果寫入文本文件。

建議:< 2012年10月25日>

爲了您的學習指南,也許你可以提取每張幻燈片的所有文字,並以編程方式轉儲這些文本(通過添加功能到上面的示例代碼,而它的迭代幻燈片)到每張幻燈片的「註釋」部分。這樣,您可以在Notes頁面視圖中打印它。您將在頁面的上半部分獲得整個幻燈片圖像,並在Notes頁面視圖中獲取其底部的實際幻燈片文本。它肯定會嘗試將幻燈片中的所有文本複製並粘貼到註釋部分。你甚至可以打印每頁2張幻燈片,因爲小文本不會成爲幻燈片圖像內部的問題,圖表仍然可以或多或少地顯示出來。

不幸的是,這種方法適用於簡單的標準幻燈片格式...這意味着,如果您的幻燈片只有一個標題,還有一個帶有所有項目符號點的中心文本框......任何複雜的幻燈片佈局(可能是文本框無處不在)將會無序出現並且會令人困惑。但至少你仍然可以看看上面的幻燈片圖像來理解它:)

+0

會保留「所有的信息(格式文本,圖像等)」? – user456584

+0

不,它不會保留格式化的文本和圖像不幸。此示例代碼爲您提供每個幻燈片每天結束時的列表。雖然您可以在技術上保留格式並獲取圖像......但需要大量代碼才能展開上述示例。我在上面的原始答案上提出了一些建議。 ^ –

相關問題