2012-03-12 60 views
10

我已經讀了很多關於車牌定位/檢測算法,這裏所說的論文,如設置:公共數據車牌定位/檢測

What are good algorithms for vehicle license plate detection?

我希望我的運行在具有已知許可證號碼的汽車圖像的數據集上,以便我可以測量錯誤。

相當數量打探後,我無法找到任何這類公開數據集。有人知道嗎?如果沒有,我的下一步將是發送電子郵件的作者。

+0

你可能在這一個運氣不好。出於數據保護行爲的目的,車輛牌照被視爲個人可識別信息。因此,任何有關此類信息的公共數據庫幾乎肯定會違法。可能有一些組織出售這種信息後,過濾它(希望),以消除車主不希望他們包括在內的任何車輛的圖像,但這在許多國家仍然是非法的。 – 2012-03-12 19:50:28

+0

爲什麼不首先向作者發送有關數據集的電子郵件? – monksy 2012-03-12 20:09:32

+0

我很擔心公共場合的合法性。我想我會提出這個問題,看看是否有人發現了我錯過的一件明顯的事情,所以會有其他人尋找相同的公共記錄,因爲這個問題以前沒有問過。 – 2012-03-12 20:13:18

回答

5

媒體實驗室的網站,(2012年,DEC,9)。 [汽車圖片]。可用:

http://www.medialab.ntua.gr/research/LPRdatabase.html

+0

鏈接已關閉,請您更新鏈接? – iratzhash 2016-01-18 14:08:59

+2

@iratzhash,評論只是爲了告訴你,現在鏈接正在工作。 – 2017-01-17 23:33:47

11

我不知道它是如何非法的出版在公共場所採取任何形式的圖像數據集的測試,因爲它已經完成,他們在論文的被使用交叉檢查結果的目的,但我不知道發佈數據集需要獲得什麼級別的權限。它確實讓你在出門之前想要考慮一些照片然後發佈。我知道谷歌的街景模糊了所有的板塊,徹底搞亂了幾乎無限的板塊分析數據。它仍然是從自然場景數據中定位汽車的金礦,但從板塊角度來看令人沮喪。這也許可以解釋爲什麼很難找到任何可用的好數據集。你會認爲我們會有一個相當標準的成千上萬個盤子的集合。谷歌搜索「汽車後部」的搜索結果實際上產生的結果比預期的要少,因此必須進行一些櫻桃採摘才能清除不起作用的圖像。

的媒體實驗室網站發佈的@Abosamra好纔是真的好,雖然他們是希臘,而不是美國的板塊。

隨着http://www.vision.caltech.edu/html-files/archive.html的汽車1999年(後)2圖像是偉大的,但只有126人。這是迄今爲止我發現的最好的美國數據集,可以立即下載,包括自然場景中的汽車,車牌清晰可讀。

來自同一個站點的功能大量重複的2001個影像和多分辨率太低是用於測試OCR有用的,儘管它們可以用於測試板的定位,有超過他們的500。

牛津是從汽車的1155個圖像太小,OCR,但可能是汽車檢測過程中有用的一個更大的數據集沿第一鏈接重新發布了加州理工學院的汽車:

http://www.robots.ox.ac.uk/~vgg/data3.html

麻省理工學院有一個數據集,起初看起來很有前途,但事實證明,這些平板太小而無法進行OCR,並且採用ppm格式,因此可能需要額外的額外步驟才能將它們轉換爲更常用的文件格式。它們可以用於本地化測試。

http://cbcl.mit.edu/projects/cbcl/software-datasets/CarData1Readme.html

UCSD有一組關於878的圖像,但需要從盧卡Dlagnekov或嗶嘰Belongie得到允許訪問數據集。 http://vision.ucsd.edu/belongie-grp/research/carRec/car_data.html

如果你不介意使用在美國以外的板,你可以找到更多的數據集。這裏有一個,例如在克羅地亞,但有510個圖像,質量很好。它們有點放大,因此不太適合測試將汽車拉出自然景物的能力,但對於識別車牌非常有用。

http://www.zemris.fer.hr/projects/LicensePlates/hrvatski/rezultati.shtml

由於真正的板塊是這麼辛苦汽車場景,找到,有可能使使用假板的數據集。這裏是一個可以製造假板網站:

http://acme.com/licensemaker/

假板可理想用於製作板的測試數據集本身的分割,並與許多不同板塊的背景問題的字符識別階段和字體。

所以剩下的唯一一件事情就是找到一種方法,將一些隨機生成的假板嵌入到模糊板塊的某些圖像中。

我可以更新我的帖子,如果我發現更多。