實時的基于機器學習的檢測圖像的車的快速訓練米洛斯 Stojmenovic收到:2005 / 23十一月接受: 2006日28 / 發(fā)表于:30 2006 施普林格出版社2006[摘要]我們的主要興趣是建立快速基于小圖像可靠的目標識別 ING 集需要構建大多是手動的,如我們研究的本田雅閣,識別2004從后方的看法。我們描述了一種新的變種基于 AdaBoost 的學習算法,建立了一個強分類器的弱分類增量—sifiers(WCS) ,最小的組合誤差已選定的廁所。每個 WC 訓練只有一次,例子并不改變它們的權重。我們描述一組為考慮適當類型的特征識別問題,包括發(fā)紅措施和占主導地位的邊緣取向?,F(xiàn)有的邊緣定位—水平(垂直,分別)邊緣屬于同一倉。我們提出了預先消除功能的最佳的閾值附近的迷你瑣碎的位置—所有的媽媽或最大值。這是一個新的的方法,減少了訓練集 WC 的數(shù)量不到原來的10% ,大大加快—建立培訓時間,并沒有負面影響最終的分類器的質量。我們還修改了實驗。表明,Viola 和瓊斯使用的功能集人臉識別是低效的和別人對我們的的問題,準確和實時識別的汽車快速訓練。我們的培訓方法,找到一個非常準確的分類只含有30廁所后1h 訓練。與現(xiàn)有的文獻相比,我們的整體實現(xiàn)一個真正的設計用最少的時間目標檢測機的例子,廁所數(shù)量最少的,最快的訓練時間,具有競爭力的檢測和假陽性率。1引言本文的目的是分析能力—在當前的機器學習技術,解決“能力” ,我們的意思是實時性,較高的檢測率,假陽性率低,快速的訓練和學習用在訓練集是不容易的,和最它需要手動創(chuàng)建。我們將應用機器學習的檢測具體地說,能夠認識到某種類型的如本田汽車協(xié)議,2004。因此,應該是一個任意的輸入圖像,和的結果應該是相同的圖像一個矩形的發(fā)生在我們的車尋找。此外,檢測精度,其第二個主要的目的是實時性能。Pro—克應迅速找到給定類型的所有汽車位置在圖像中,在相同的方式和瓊斯認為所有的頭。定義房我們想得到一個回答測試圖像在第二個左右的響應時間取決于。的測試圖像的大小,因此似乎是真實的對于較小的圖像的時間可能不那么大的。最后,我們的目標是設計對象檢測—基于一個小數(shù)量的培訓考試系統(tǒng)樣品。我們設想在訓練的例子是不容易獲得的情況下的應用。例如,在的情況下,我們的研究,我們必須采取的照片幾百個本田協(xié)定和其他汽車的看法創(chuàng)建訓練集,因為幾乎沒有正面的形象在網上找到的。在這種情況下,它是很難的希望能有數(shù)萬成千上萬的圖像現(xiàn)成的,這是人臉檢測的情況—問題。一個小的額外訓練集,訓練時間減少。這使我們進行了大量的嘗試訓練,調整設置例子,調整設置的功能,不同的測試集弱分類器(WCS) ,否則分析通過觀察生成的類的行為過程。由于與一個小數(shù)量的訓練的成功的例子是不清楚的,我們還必須設置快速列車—進行了一些調整和改進系統(tǒng)。本文的兩個主要的貢獻,預—為滿足所有目標。我們將在一個機器學習的方法試圖解決的問題檢測出來特殊的車型自他們似乎是適當?shù)蔫b于問題的設置。機器學習相似圖像檢索已被證明是可靠的坐—評估的目標對象不改變方向,一個經典的應用已成為檢測直立向前頭所提出的中提琴瓊斯。汽車通常是在相同的發(fā)現(xiàn)相對于道路的方向。他們可以照片—(正面,側面……)但其實很少發(fā)現(xiàn)了邊。我們是國際形勢莎莉在車輛的后部。這也是目標對警察的交通監(jiān)控設備的選擇,因為他們的相機的位置通常是電影的許可證用于車輛識別的目的板。那里—前,硬件已經到位,各種軟件在車輛檢測中的應用。積極的圖像采取的,所有本田有相同的一般正交方相對于相機。一些偏差的發(fā)生在球場上,這些圖像,偏航和滾動,這可能可為什么產生的檢測器具有如此廣泛的有效性。這是建立機器是有效的在角以下偏差:?15?,偏航?30?30?,卷15至18。這意味著圖片本田從角度是由規(guī)定的的數(shù)量依然由程序檢測。算法用于目標檢測問題。實驗結果給出了。4。結論會議,只討論版在我們的汽車檢測系統(tǒng)的功能設置。 任何特定類型的車后視圖。因此我們回顧了解決更一般的問題。存在—ING 的車輛檢測系統(tǒng),如那些嘗試自動駕駛汽車沿公路實際上不檢測道路上的汽車。他們只是認為任何—事情正在高速公路上的車輛。在科學文獻,一些汽車識別方案的存在是基于形狀的探測器?,F(xiàn)有的基于形狀的方法報道已匹配 A60–85%提高。基于最近鄰匹配的方法對視角變化過于敏感,而方法基于 PCA(主成分分析)不一個實時系統(tǒng)。目標檢測的最普遍的例子是人臉檢測?;緫脼橹刑崆俸铜偹沟膶崟r人臉識別系統(tǒng)。是具體的機器學習方法由 Viola 和瓊斯用來實現(xiàn)他們的系統(tǒng)。在這種方法中,正和負的訓練集通過級聯(lián)分類器分開,每個構造采用 AdaBoost。實時性能的實現(xiàn)(一個預處理步驟后) 。的訓練時間人臉檢測器,似乎是緩慢的,甚至用了幾個月根據(jù)一些報道。Viola 和 Joss 的臉,發(fā)現(xiàn)系統(tǒng)已經證實在文獻中的一些文章。修正—陽離子包括新功能的添加。特別的,和那些基于一個特定部分的顏色圖像。機器本身的修改在幾個方面的文獻。我們已經考慮到了所有的在文獻提出的修改,并通過思想被認為是有助于實現(xiàn)我們的目標。我們再次強調,最成功的應用:使用一個大的訓練集。在中提琴瓊斯的原始的人臉檢測器,圖像用于訓練集。已知的最小的訓練他們開始在90%只貓實現(xiàn)的檢出率—類型時正例數(shù) reached250。負的實例數(shù)是未指定在這個階段,但作者說,他們隨機10000圖像從互聯(lián)網下載包含100000000子窗口。他們只是適度增加了檢測的陽性率的大小將大幅增長的對象。的大小等于或大于24×24像素(用于面搜索) , (我們有車限100×150搜索)作為輸入,并宣布是否這個地區(qū)包含搜索的對象。我們用這樣的機器整個圖像分析。我們通過每個子窗口包含的面孔。一個滑動窗口技術有—前使用。在窗口被移動后1pixel 的一個子窗口分析(我們使用的2pixel 移為了加快速度,沒有顯著的負面影響) 。子窗口的尺寸增加的長度和寬度10%每次的所有子窗口以前的大小進行了詳盡地搜索。3中使用的特征識別一個特征是一個函數(shù)的圖像映射到一個真正的數(shù)。這里的訓練程序。兩種類型的基本特征使用。他們是發(fā)紅的特點和優(yōu)勢邊緣方向特征。占主導地位的邊緣定位—、紅腫特征證明自己是多比 Viola 和 Joss 在原來的設置,為我們研究的問題,本田雅閣的檢測2004從后面進行。3.1紅斑的特點我們指的是紅的特點是不可測的。他們致力于尋找圓形紅色在圖像中的區(qū)域。他們的目標是發(fā)現(xiàn)和解決的紅眼睛在以人的照片。他們的大部分工作集中在紅色區(qū)域的形狀,而不是參與找到紅色技術。我們借他們的發(fā)現(xiàn)是紅色的區(qū)域觀念。我們的不同的工作事實上我們尋找紅色區(qū)域意味著本田雅閣的剎車燈,而不是人類的眼睛。因此,我們的紅色區(qū)域的方—奇異的,和更大的比他們的。圖1顯示了一個通過訓練確定發(fā)紅特征的例子過程。一個特殊的發(fā)紅的色彩空間的過程中形成的協(xié)助在紅色區(qū)域的檢測預處理。這個色彩空間是從,和一一維度將 RGB 顏色空間的二維線性組合。所有的在訓練集的正、負輸入 RGB 彩色圖像,這意味著他們的照片—ELS 是由三個8位數(shù)字,代表紅色的數(shù)量,在一個像素的綠色和藍色,分別—地。紅色的顏色空間的每個像素的定義如下:紅色= 4R?3G + B。積分圖像計算(該技術是在[ 13 ]提出的)應用于紅色圖像產生的一個在訓練過程中輸入。紅色的區(qū)域—確定在固定的時間進行性培訓的特點利用紅圖像的整體形象。3.2邊緣方向特征使用幾個占主導地位的邊緣方向特征在訓練算法。一個眾所周知的灰階梯度掩模(三× 三像素)用在圖像中的邊緣位置的確定。的掩模被施加在兩個坐標方向,和基礎執(zhí)行是放在門檻上的拉普拉斯值強度。我們用一個閾值80消除不暈邊有用。一個類似的閾值進行。定位—每個像素” 是從它的強度計算在兩個方向。方向分為六整個圓分成六箱。重要的是要注意,0?,方位90?,和180?垃圾箱在識別本田是至關重要的。他們是重要的—經常因為本田主要有水平和垂直邊緣。的垃圾箱的地方,0或90??處兩箱構成問題,因為所有的垂直邊界和水平邊緣可以分為兩箱。我們將所有的垃圾箱。沒有提到任何本移動,所以我們相信他們用非移箱。不過他們真的,不同的箱從4到8的數(shù)字。有效數(shù)字—BER 箱不多的沖擊性能,但避免這些邊界。將所有的方向—全文為0–180?范圍,我們增加了180? 如果角小于0?,減去180如果角度大超過180?。這些變革的影響可以在圖2中看到的。在圖3中,我們看到一個本田雅閣和其在第一站相應的邊緣方向的圖像?15? ,+ 15?,+ 165,+ 195?。檢測系統(tǒng)。從74.3提高到89.1%,而一些假陽性率從168下降到26。圖像的邊緣方向看。每個值 B(I,J)的每個方向的bin 圖像對應—ING 拉普拉斯強度的方向是否屬于這本,3和4,在圖像中的特定區(qū)域,通常有一個方向—這是占主導地位的。我們利用這一事實,我們使用占主導地位的邊緣取向。這個主意首先發(fā)展—利用[。占主導地位的邊緣取向的計算同一區(qū)域。占主導地位的邊緣方向特征進行訓練。我們看到一些不區(qū)分,但盡管如此明顯的邊緣在一些其他的垃圾箱圖。一個最成功的邊緣取向是一個水平如圖3所示。所有的 POS—可能占主導地位的邊緣箱提供培訓程序除了因為它視覺上沒有什么區(qū)分了。
鏈接地址:http://m.italysoccerbets.com/p-499366.html