一片小小的人工智能視覺(jué)芯片能做什么?無(wú)人駕駛汽車(chē)主動(dòng)識別并避讓行人、攝像頭實(shí)時(shí)甄別在逃犯……這些影視作品中的情節,或許不久將可通過(guò)基于嵌入式人工智能視覺(jué)芯片的“解決方案”成為現實(shí)。
人工智能芯片被視為未來(lái)人工智能時(shí)代的戰略制高點(diǎn)。在視覺(jué)感知領(lǐng)域,人工智能視覺(jué)芯片正逐步應用于智能手機、安防監控、自動(dòng)駕駛、醫療成像和智能制造等領(lǐng)域。
可根據AI需求成像
縱觀(guān)信息產(chǎn)業(yè)發(fā)展歷程,從個(gè)人電腦時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,承載高性能計算的芯片決定新型計算平臺的基礎架構和發(fā)展生態(tài),并掌握著(zhù)產(chǎn)業(yè)鏈最核心的話(huà)語(yǔ)權。
中國科學(xué)院院士張鈸指出,傳統硬件架構難以滿(mǎn)足人工智能時(shí)代深度學(xué)習的要求,新的算法需要新的硬件來(lái)支撐。同時(shí),芯片的結構將越來(lái)越像“大腦”,類(lèi)腦芯片、智能芯片等將是人工智能的發(fā)展方向。
“所謂視覺(jué)芯片,實(shí)際上是一種具有高速圖像采集和實(shí)時(shí)圖像處理功能的片上集成系統芯片!敝袊茖W(xué)院半導體研究所半導體超晶格國家重點(diǎn)實(shí)驗室研究員吳南健介紹說(shuō),在日前舉辦的國家自然科學(xué)基金優(yōu)秀成果北京對接會(huì )上,吳南健帶領(lǐng)研究團隊展示的新型視覺(jué)芯片(Vision Chip)科研成果很是引人注目。
據介紹,這種視覺(jué)芯片集成高速圖像傳感器和大規模并行圖像處理電路,能夠模仿人類(lèi)視覺(jué)系統視覺(jué)信息并行處理機制,解決現有視覺(jué)圖像系統中數據串行傳輸和串行處理的速度限制瓶頸問(wèn)題。
人工視覺(jué)的架構分兩部分,類(lèi)似于人的眼睛和大腦。人的眼睛是一個(gè)典型的圖像傳感器,能夠攝取圖像并且進(jìn)行一些噪音去除等初級圖像處理;人的大腦神經(jīng)元網(wǎng)絡(luò )是一個(gè)視覺(jué)圖像處理系統,具有非常強的對所攝取的視覺(jué)信息進(jìn)行并行處理的能力。
AI視覺(jué)芯片與攝像頭的關(guān)系是——芯片做的是大腦,攝像頭做的是眼睛。這里就存在一個(gè)問(wèn)題:大腦該如何控制眼睛?遠望智庫人工智能事業(yè)部部長(cháng)、圖靈機器人首席戰略官譚茗洲解釋道,傳統的技術(shù)方法是定義一個(gè)通信控制接口,但在視覺(jué)應用中這種做法會(huì )非常復雜。人眼的成像是非常聚焦的,只看到關(guān)注的東西。當AI算法解決了“要看什么”的問(wèn)題后,前端成像就有了目標,可以把所有的資源都調配到關(guān)注的對象上,做到“指哪打哪”,也就是取出噪音的處理過(guò)程,可以更高效智能地處理視覺(jué)信息。這種根據AI的需求來(lái)成像,能解決很多以前解決不了的問(wèn)題。
“通常以前處理的方式,是通過(guò)攝像頭把信息攝錄,傳到服務(wù)器或云端后,利用服務(wù)器上的顯卡進(jìn)行運算,現在是將視覺(jué)芯片嵌入攝像頭,讓其本身可以處理信息,做成專(zhuān)用芯片,如果芯片大批量生產(chǎn),在價(jià)格上會(huì )便宜非常多,極大降低成本。這就是目前這項技術(shù)突破的核心價(jià)值!弊T茗洲在接受科技日報記者采訪(fǎng)時(shí)指出。
比人類(lèi)視覺(jué)更具優(yōu)勢
在我們通常的印象中,一個(gè)視力正常的人可以迅速且毫不費力地感知世界,甚至可以詳細生動(dòng)地感知整個(gè)視覺(jué)場(chǎng)景;但其實(shí)這只是一個(gè)錯覺(jué)。
“人類(lèi)生理視覺(jué)有著(zhù)天然的局限,只有投射到眼球中心視覺(jué)場(chǎng)景的中間部分,我們才能看清楚。比起人眼來(lái),嵌入視覺(jué)芯片的機器將具備相當多的優(yōu)勢,因為可以傳感更寬的頻譜范圍、更高的清晰度、更寬的視角,其視力遠不止5.0,在夜間也可以看得很清楚。如同AlphaGo戰勝‘圍棋天才’一樣,在某些應用場(chǎng)景,其視覺(jué)在準確性、客觀(guān)性、穩定性等方面都要比人類(lèi)視覺(jué)更具優(yōu)勢!
目前,國內外在人工視覺(jué)芯片領(lǐng)域的研究主要是CMOS圖像傳感器芯片技術(shù)、并行圖像處理技術(shù)和CMOS集成技術(shù)。在CMOS圖像傳感器領(lǐng)域,國際技術(shù)水平朝著(zhù)高分辨率、寬動(dòng)態(tài)范圍、高幀率、高智能化、寬波長(cháng)范圍和三維成像的方向發(fā)展。人工視覺(jué)系統芯片能夠完成圖像獲取和初級(圖像濾波)、中級(特征提。、高級(特征識別和不規則處理)3個(gè)圖像處理步驟。
“視覺(jué)芯片關(guān)鍵要解決運行效率和處理3D影像這兩個(gè)問(wèn)題。以往視覺(jué)芯片處理信號面臨的最大問(wèn)題是因運算量太大導致處理信息速度低,以及攝取的照片是把三維世界‘壓縮’成二維影像,在一張平面上已分不清物體距離遠近、立體空間形狀、空間位置等,而人眼可把這個(gè)還原!弊T茗洲表示。
據了解,新型人工智能視覺(jué)系統芯片,是將高速CMOS圖像傳感器、并行信號處理單元和輸出電路集成于單一芯片內,實(shí)現實(shí)時(shí)視覺(jué)芯片系統。將不同功能的技術(shù)集成在一個(gè)芯片上有很多優(yōu)勢,實(shí)現圖像獲取和圖像信息處理每秒一千幀的系統速度,可廣泛應用于高速圖像處理、快速圖像識別解釋、高速運動(dòng)目標的實(shí)時(shí)追蹤等領(lǐng)域。
譚茗洲指出:“目前,中科院設計的新型視覺(jué)系統芯片理念非常先進(jìn),仿照人類(lèi)視網(wǎng)膜神經(jīng)元機制設計,感光對信號的處理方式,揀取有用的信號進(jìn)行處理,極大地減少了運算的體量!
未來(lái)市場(chǎng)空間巨大
“以我個(gè)人的觀(guān)點(diǎn),視覺(jué)系統芯片會(huì )成為必然的趨勢,就像手機和相機結合成就智能手機一樣,目前在技術(shù)上已突破填充率低、分辨率低和信號干擾嚴重的難題,將科研成果轉化并投放市場(chǎng)只不過(guò)是時(shí)間問(wèn)題!眳悄辖”硎。
記者了解到,目前基于該技術(shù)的產(chǎn)成品已經(jīng)試用于一些創(chuàng )新企業(yè),比如在工業(yè)產(chǎn)品的自動(dòng)化檢測領(lǐng)域完全可以使用視覺(jué)系統芯片代替人工檢測;在智能監控領(lǐng)域,過(guò)去需要將視覺(jué)處理芯片裝在具有傳感器技術(shù)的攝像頭上,通過(guò)把數據結構化、再壓縮送到數據中心的復雜方式完成數據傳輸和計算。
那么,視覺(jué)系統芯片如果在未來(lái)實(shí)現產(chǎn)業(yè)化,其市場(chǎng)空間有多大?據推算,2018年,圖像傳感器的市場(chǎng)規模在150億美元左右,雖然其中120億美元發(fā)生在智能手機領(lǐng)域,但未來(lái)發(fā)展比較快的4個(gè)領(lǐng)域是安防、國防、汽車(chē)、醫療,到2021年將會(huì )迎來(lái)40億美元的市場(chǎng)空間,年增長(cháng)率約10%—20%。
“視覺(jué)處理器的需求增長(cháng)會(huì )更快,目前該市場(chǎng)的整體規模(包括硬件、軟件、服務(wù))在170億美元至180億美元,單從硬件來(lái)看也占到約30億美元。如果視覺(jué)系統芯片可以覆蓋70億美元的市場(chǎng)規模,企業(yè)在這中間拿到1%的話(huà),其盈利空間就已經(jīng)很大了!眳悄辖≈赋。
近年來(lái),國內外一批新型人工智能企業(yè),依托人工智能領(lǐng)域技術(shù)和算法優(yōu)勢向芯片行業(yè)滲透,加強人工智能芯片基礎層研發(fā)。從市場(chǎng)格局來(lái)看,已經(jīng)發(fā)展成為一個(gè)相對獨立又相互依存的產(chǎn)業(yè)生態(tài)。在前端,索尼是圖像傳感器市場(chǎng)、生產(chǎn)和技術(shù)的領(lǐng)導者,緊隨其后的三星和豪威科技也保持著(zhù)不錯的競爭力;在后端,Mobileye和英偉達(NVIDIA)是提供視覺(jué)處理芯片的主要廠(chǎng)商,在國內該領(lǐng)域的公司有地平線(xiàn)等。
然而,截至目前,尚未有企業(yè)實(shí)現“圖像傳感器+視覺(jué)處理器”集成式芯片的大規模量產(chǎn)。不管是現在的創(chuàng )業(yè)企業(yè),還是已經(jīng)在市場(chǎng)上占有一定份額的大企業(yè),不是做圖像傳感器,就是做后端的視覺(jué)處理器。正如吳南健所言,這將給初創(chuàng )企業(yè)帶來(lái)機會(huì )。
|