比人類(lèi)視覺(jué)更具優(yōu)勢
在我們通常的印象中,一個(gè)視力正常的人可以迅速且毫不費力地感知世界,甚至可以詳細生動(dòng)地感知整個(gè)視覺(jué)場(chǎng)景;但其實(shí)這只是一個(gè)錯覺(jué)。
“人類(lèi)生理視覺(jué)有著(zhù)天然的局限,只有投射到眼球中心視覺(jué)場(chǎng)景的中間部分,我們才能看清楚。比起人眼來(lái),嵌入視覺(jué)芯片的機器將具備相當多的優(yōu)勢,因為可以傳感更寬的頻譜范圍、更高的清晰度、更寬的視角,其視力遠不止5.0,在夜間也可以看得很清楚。如同AlphaGo戰勝‘圍棋天才’一樣,在某些應用場(chǎng)景,其視覺(jué)在準確性、客觀(guān)性、穩定性等方面都要比人類(lèi)視覺(jué)更具優(yōu)勢!弊T茗洲指出。
目前,國內外在人工視覺(jué)芯片領(lǐng)域的研究主要是CMOS圖像傳感器芯片技術(shù)、并行圖像處理技術(shù)和CMOS集成技術(shù)。在CMOS圖像傳感器領(lǐng)域,國際技術(shù)水平朝著(zhù)高分辨率、寬動(dòng)態(tài)范圍、高幀率、高智能化、寬波長(cháng)范圍和三維成像的方向發(fā)展。人工視覺(jué)系統芯片能夠完成圖像獲取和初級(圖像濾波)、中級(特征提。、高級(特征識別和不規則處理)3個(gè)圖像處理步驟。
視覺(jué)芯片關(guān)鍵要解決運行效率和處理3D影像這兩個(gè)問(wèn)題。以往視覺(jué)芯片處理信號面臨的最大問(wèn)題是因運算量太大導致處理信息速度低,以及攝取的照片是把三維世界‘壓縮’成二維影像,在一張平面上已分不清物體距離遠近、立體空間形狀、空間位置等,而人眼可把這個(gè)還原。
據了解到,新型人工智能視覺(jué)系統芯片,是將高速CMOS圖像傳感器、并行信號處理單元和輸出電路集成于單一芯片內,實(shí)現實(shí)時(shí)視覺(jué)芯片系統。將不同功能的技術(shù)集成在一個(gè)芯片上有很多優(yōu)勢,實(shí)現圖像獲取和圖像信息處理每秒一千幀的系統速度,可廣泛應用于高速圖像處理、快速圖像識別解釋、高速運動(dòng)目標的實(shí)時(shí)追蹤等領(lǐng)域。
目前,中科院設計的新型視覺(jué)系統芯片理念非常先進(jìn),仿照人類(lèi)視網(wǎng)膜神經(jīng)元機制設計,感光對信號的處理方式,揀取有用的信號進(jìn)行處理,極大地減少了運算的體量。
|