2010-06-10 30 views
4

有誰知道有哪些支持良好的/可靠的將Microsoft Word文檔轉換爲MP3或WAV格式的方法,這樣聽力受損的人就可以「聆聽」我存儲在基於Web的文檔管理系統中的文檔?是否有.NET庫/實用工具將Word文檔轉換爲MP3格式?

我已經建立了這樣的界面,使得有人可以使用電話來獲取可用文檔列表,並且日期和標題通過電話「讀取」給他們,但是現在我希望能夠讓其他人真正地收聽存儲在系統中的Word文件的內容。

理想情況下,一個.NET庫或實用工具可以讓我在每次上傳後轉換DOC - > MP3,但是按需讀取文件也是可以的。

+1

所以,你已經有一個文本到語音麗brary?你只需要從word doc中獲取文本? – dotjoe 2010-06-10 18:25:02

+0

這是一種可能性,你有建議嗎?我可以做這項工作。 – 2010-06-10 18:44:56

+0

如果你不是無條件限制.NET,並且至少部分涉及Java的解決方案是一個選項,你可以看看_Apache POI_('http:// poi.apache.org /')。您可以使用它從Word'.doc'文件中提取文本,然後通過文本到語音轉換器來獲取文本。 – stakx 2010-06-10 20:06:04

回答

2

如果您的Word文檔以採用Office 2007引入的新OpenXML格式存儲,則可能需要查看菊花工具鏈。

SourceForge上有一個免費的轉換器,用於從您的Word文檔創建一個Daisy文件。屏幕閱讀器可以理解Daisy格式,並且還有轉換器可用於將Daisy文件轉換爲音頻文件。

有關詳細信息,請參閱:

1

你可以試試Panopreter它有一個免費的專業版本。我以前用過它,取得了相當不錯的成功。

我不確定免費版本是否可以直接保存到mp3,但您可以隨時使用另一個程序將輸出錄製到mp3。

1

我想可能使用mintext命令行版本首先.doc文件轉換爲文本,然後在數據庫中存儲本文(上傳時,也許?)

然後使用任何文本到語音庫轉換和保存這個文件,可能有一個引用ID將這個文件鏈接到數據庫中。

2

從Word中獲取文本是很容易的部分。有一些tts圖書館可用,但貨物往往很貴。 Acapela(http://www.acapela-group.com)可能是我找到的最好的,API支持輸出到聲音文件。我不確定是否支持MP3,但轉換聲音格式很簡單。

祝你好運。

4

您可以使用System.Speech.Recognition來配置您的TTS引擎和System.Speech.Synthesis命名空間進行錄製/保存(保存爲.WAV)。在System.Speech.AudioFormat中,您可以配置WAV文件的輸出參數。對於Word,您只需使用COM Interop即可獲取文件,打開文件並獲取所需的任何類型的文本,然後將其輸入到受管理的SAPI中。我可能會將其分成Paragraphs/Runs,Tables,References和Other。

如果您正在尋找更強大的技術,其中一個更知名的TTS引擎是NaturallySpeaking's Server SDK--他們最近添加了「音頻流」功能,允許即時TTS,因此不需要預先錄製永久音頻文件(但是如果你願意,它也可以預先錄製)。您還可以查看他們的AudioMining SDK,它允許在音頻文件中對語音文本進行全面索引和搜索。他們的SDK雖然都是COM,而不是.NET。