2010-08-25 223 views
38

我需要一個能夠掃描複雜打印的數學公式的開放式OCR庫(例如通過LaTeX生成的一些公式)。我想得到一些類似LaTeX的輸出(或者只是一些類AST數據)。用於數學公式的OCR庫

有沒有這樣的事情?還是目前的OCR技術只能解析面向行的文本?

(請注意,我也貼this question on Metaoptimize因爲有些人有可能有更多的知識。)

的問題也被OpenAI描述爲im2latex

+0

您的公式是手寫的還是印刷的?現在打印 – Jasper 2010-08-25 21:17:50

+0

對我來說很好。否則它可能太困難了:)因此,我猜一些能夠處理手寫公式的引擎也能夠處理打印的公式。 – Albert 2010-08-25 21:21:58

+1

您是否找到解決方案? – tan9p 2014-03-11 00:14:23

回答

10

不確定如果輸入的性質接受是你需要的,或者如果這個工作足夠好,或者你已經看到了這個,

SESHAT是一個用C++編寫的用於識別手寫數學表達式的開源系統SESHAT was作爲瓦倫西亞理工大學PRHLT研究中心博士論文的一部分開發。

在線演示:http://cat.prhlt.upv.es/mer/

來源:https://github.com/falvaro/seshat

塞莎特是識別手寫數學表達式的開源系統。給定一個表示爲筆畫序列的樣本,解析器可以將其轉換爲LaTeX或其他格式,如InkML或MathML。

+0

第一次看,這正是我正在搜索的內容 – Albert 2015-05-01 16:33:05

+0

Glad我可以幫助:) – Slothworks 2015-05-02 06:17:17

2

考慮到當前技術一次只讀取一個符號(請參見http://detexify.kirelabs.org/classify.html),我懷疑是否存在用於完整數學方程式的OCR。

+0

是的,這是我所瞭解的大多數引擎。儘管我希望在這方面可能取得一些進展。無論如何,哇,謝謝你的鏈接,非常有趣和有用! :)這將幫助我在將來識別一些符號,我不知道他們被稱爲什麼,他們代表什麼,所以我會得到一些我至少可以用Google的文本! – Albert 2010-08-25 21:24:52

2

Infty工作得很好。我以前的公司將其整合到一個應用程序中,該應用程序爲盲人大聲朗讀方程式,並從用戶那裏得到良好的反饋

http://www.inftyproject.org/en/download.html

+0

下載鏈接似乎中斷。另外,這是開放的嗎?它必須是跨平臺的,並且可以是我可以使用的圖書館的形式。 – Albert 2010-08-27 14:22:38

+0

鏈接適用於我。我通過谷歌搜索「infty」找到了它。它不是開放的,「大部分」是商業的。這意味着它是商業性的,但它是由一羣大學開發和維護的,有時候這些大學願意爲非營利組織開展交易。在我們評估過的所有軟件包中,這是唯一一個在數學公式中獲得超過可通過性能的軟件包,讓我知道如果你找到更好的東西。 – 2010-08-27 18:37:52

+0

+1)鏈接也適用於我,確實很有趣。你是否測試瞭如何將手寫數學(在一張紙上)掃描到LaTeX? – 2012-10-05 11:39:03

5

按照answers on Metaoptimizediscussion on the Tesseract mailinglist,似乎沒有成爲一個開放/免費的解決方案還能夠做到這一點。

似乎能夠做到這一點的唯一解決方案(但我無法驗證,因爲它是僅限Windows和非自由的),就像其他人提到的InftyProject一樣。

+4

InftyProject OCR(現在位於http://www.inftyreader.org/?p=29我相信)不是很好:(http://img402.imageshack.us/img402/7875/testinftyproject.png – 2012-10-13 20:01:43

0

你知道,在Win7中有一個應用程序只是爲了:Math Input Panel。它甚至可以處理手寫輸入(它實際上是爲此而做的)。給它一個鏡頭,如果你有Win7,它是免費的!

+0

我沒有Windows,我需要一個開源的解決方案,但看起來很有趣! – Albert 2010-08-29 02:15:04

+0

確實,這看起來很有前景! – 2012-09-04 10:40:48

6

InftyReader是我所知道的唯一一個。它不是免費的軟件(看起來錢花在非營利機構IIRC上)。

http://www.sciaccess.net/en/InftyReader/

我不知道爲什麼PDF不能有元數據的LaTeX?如下:將LaTeX公式放入其中!這很難嗎? (我沒有關於PDF語法的任何內容,但我想它可以完成)。

LaTeX語法是數學符號的唯一標準和真實標準。製作MathML和其他內容的人不考慮這一點似乎非常愚蠢。 InftyReader生成MathML或LaTeX語法。

如果我想要HTML(純)然後我使用TTH來讀取LaTeX語法。只是工作。

ABBYY FineReader(一個偉大的OCR程序)聲稱可以培養對數學的軟件,但是這是非常新空房禁地(誰的時間?)

和Unicode有很多的數學符號。今天的OCR讀者無法理解它們,顯示了這項活動中軟件的糟糕狀態和大腦缺陷。對於「一次一個符號」,TeX明顯規定了它將在哪裏放置符號。他們不能編寫知道這些規則的軟件?! TeX甚至是公有領域!他們可以在商業產品中「使用它」。

0

有這個偉大的短視頻:http://www.youtube.com/watch?v=LAJm3J36tLQ 解釋如何你可以訓練你的精讀者認識數學公式。如果您已經使用Fine Reader,最好使用一種工具。當然,這是不是免費的潔具:(

+0

這不是我真正想問的問題,我的意思是複雜的公式 - 這就是問題的全部和難點部分,它使得它與傳統的OCR如FineReader不同, – Albert 2012-11-25 11:30:48

5

退房「Web Equation。」它可以手寫公式轉換爲乳膠,MathML和或SymbolTree,我不知道,如果引擎是開源的。

+0

什麼是「SymbolTree」格式? – CMCDragonkai 2016-04-09 04:35:11

0

由於複雜公式的數學OCR輸出可能會有錯誤 - 即使人類遇到問題 - 您也必須校正結果,至少如果它們很重要。然後(人類)校對者必須糾正結果,這意味着你需要有一個數學公式編輯器。鑑於人類需要付出的努力,可能有限的複雜公式語料庫,您可能會發現將任務分配給人類更容易。

作爲一個研究問題,通過OCR閱讀數學很有趣 - 你需要一個二維語法和符號識別器的形式化。
除了這裏已經提到的參考,爲什麼不穀歌呢?在加州理工,羅切斯特,美國滑鐵盧和加州大學伯克利分校完成了一些工作。它有多少可用於開箱即用?不知道。

1

Mathpix是專門爲從數學圖像中提取LaTex而設計的。這是一個高度準確的利基工具。此外,它可以識別手寫和印刷的數學。

+0

圖書館在哪裏?這是開源嗎? – Albert 2017-02-21 08:37:50

+0

但它只適用於單個方程而不是整個頁面 – 2018-02-13 10:42:24