事實(shí)上,二者經(jīng)常會(huì )被混淆,甚至有些“專(zhuān)家”也沒(méi)分清。
簡(jiǎn)單的說(shuō),二者最大的區別,在于技術(shù)要求的側重點(diǎn)不一樣,甚至差別很大。 計算機視覺(jué)(CV),主要是對質(zhì)的分析,比如分類(lèi)識別,這是一個(gè)杯子那是一條狗;蛘咦錾矸荽_認,比如人臉識別,車(chē)牌識別;蛘咦鲂袨榉治,比如人員入侵,徘徊,遺留物,人群聚集等。
機器視覺(jué)(MV),主要側重對量的分析,比如通過(guò)視覺(jué)去測量一個(gè)零件的直徑,一般來(lái)說(shuō),對準確度要求很高。
三計算機視覺(jué)主要任務(wù)是什么?
計算機視覺(jué)的主要任務(wù)就是通過(guò)對采集的圖片或視頻進(jìn)行處理以獲得相應場(chǎng)景的信息。計算機視覺(jué)任務(wù)的主要類(lèi)型有以下幾種:
1、物體檢測
物體檢測是視覺(jué)感知的第一步,也是計算機視覺(jué)的一個(gè)重要分支。物體檢測的目標,就是用框去標出物體的位置,并給出物體的類(lèi)別。
物體檢測和圖像分類(lèi)不一樣,檢測側重于物體的搜索,而且物體檢測的目標必須要有固定的形狀和輪廓。圖像分類(lèi)可以是任意的目標,這個(gè)目標可能是物體,也可能是一些屬性或者場(chǎng)景。
2、物體識別(狹義)
計算機視覺(jué)的經(jīng)典問(wèn)題便是判定一組圖像數據中是否包含某個(gè)特定的物體,圖像特征或運動(dòng)狀態(tài)。這一問(wèn)題通?梢酝ㄟ^(guò)機器自動(dòng)解決,但是到目前為止,還沒(méi)有某個(gè)單一的方法能夠廣泛的對各種情況進(jìn)行判定:在任意環(huán)境中識別任意物體。
現有技術(shù)能夠也只能夠很好地解決特定目標的識別,比如簡(jiǎn)單幾何圖形識別、人臉識別、印刷或手寫(xiě)文件識別,或者車(chē)輛識別。而且這些識別需要在特定的環(huán)境中,具有指定的光照,背景和目標姿態(tài)要求。
3、圖像分類(lèi)
一張圖像中是否包含某種物體,對圖像進(jìn)行特征描述是物體分類(lèi)的主要研究?jì)热。一般說(shuō)來(lái),物體分類(lèi)算法通過(guò)手工特征或者特征學(xué)習方法對整個(gè)圖像進(jìn)行全局描述,然后使用分類(lèi)器判斷是否存在某類(lèi)物體。
圖像分類(lèi)問(wèn)題就是給輸入圖像分配標簽的任務(wù),這是計算機視覺(jué)的核心問(wèn)題之一。這個(gè)過(guò)程往往與機器學(xué)習和深度學(xué)習不可分割。
4、物體定位
如果說(shuō)圖像識別解決的是what,那么,物體定位解決的則是where的問(wèn)題。利用計算視覺(jué)技術(shù)找到圖像中某一目標物體在圖像中的位置,即定位。
目標物體的定位對于計算機視覺(jué)在安防、自動(dòng)駕駛等領(lǐng)域的應用有著(zhù)至關(guān)重要的意義。
5、圖像分割
在圖像處理過(guò)程中,有時(shí)會(huì )需要對圖像進(jìn)行分割來(lái)提取有價(jià)值的用于后繼處理的部分,例如篩選特征點(diǎn),或者分割一或多幅圖片中含有特定目標的部分等。
圖像分割指的是將數字圖像細分為多個(gè)圖像子區域(像素的集合,也被稱(chēng)作超像素)的過(guò)程。圖像分割的目的是簡(jiǎn)化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說(shuō),圖像分割是對圖像中的每個(gè)像素加標簽的一個(gè)過(guò)程,這一過(guò)程使得具有相同標簽的像素具有某種共同視覺(jué)特性。
“圖像語(yǔ)意分割”是一個(gè)像素級別的物體識別,即每個(gè)像素點(diǎn)都要判斷它的類(lèi)別。它和檢測的區別是,物體檢測是一個(gè)物體級別的,他只需要一個(gè)框,去框住物體的位置,而通常分割是比檢測要更難的問(wèn)題。
計算機視覺(jué)是通過(guò)創(chuàng )建人工模型來(lái)模擬本由人類(lèi)執行的視覺(jué)任務(wù)。其本質(zhì)是模擬人類(lèi)的感知與觀(guān)察的一個(gè)過(guò)程。這個(gè)過(guò)程不止識別,而是包含了一系列的過(guò)程,并且最終是可以在人工系統中被理解和實(shí)現的。
四“視覺(jué)五虎將”都是誰(shuí)?
目前在計算機視覺(jué)領(lǐng)域已經(jīng)涌現出商湯科技、曠視科技、深蘭科技、依圖科技、云從科技等一批技術(shù)領(lǐng)先的獨角獸公司,行業(yè)稱(chēng)為“視覺(jué)五虎將”,我們對這些公司作個(gè)簡(jiǎn)單介紹。
商湯科技:
公開(kāi)資料顯示,商湯科技成立于2014年11月,是中國一家計算機視覺(jué)和深度學(xué)習原創(chuàng )技術(shù)的創(chuàng )新型科技公司,也是一家知名獨角獸企業(yè),致力于引領(lǐng)人工智能核心“深度學(xué)習”的技術(shù)突破,構建人工智能、大數據分析行業(yè)解決方案。
目前,商湯科技已與眾多知名戰略合作伙伴和大客戶(hù)建立合作,賦能AI于多個(gè)行業(yè),迅速落地包括人臉識別、圖像識別、視頻分析、無(wú)人駕駛、醫療影像識別等各類(lèi)應用技術(shù)。此外,商湯科技以人工智能技術(shù)服務(wù)于各大安防監控公司、銀行金融機構、手機廠(chǎng)商、機器人廠(chǎng)商、多家移動(dòng)APP廠(chǎng)商以及政府公安等客戶(hù)。
曠視科技:
曠視科技成立于2011年10月,以深度學(xué)習和物聯(lián)傳感技術(shù)為核心,立足于自有原創(chuàng )深度學(xué)習算法引擎Brain++,深耕金融安全,城市安防,手機AR,商業(yè)物聯(lián),工業(yè)機器人五大核心行業(yè)。發(fā)展至今,曠視已在北京、西雅圖、南京設立獨立研究院,并在十余個(gè)核心城市設立分部。
曠視的核心人臉識別技術(shù)Face++曾被美國著(zhù)名科技評論雜志《麻省理工科技評論》評定為2017全球十大前沿科技,同時(shí)公司入榜全球最聰明公司并位列第11名。在中國科技部火炬中心“獨角獸”榜單中,曠視排在人工智能類(lèi)首位。
深蘭科技:
深蘭科技,2014年由歸國博士團隊創(chuàng )建,致力于人工智能基礎研究和應用開(kāi)發(fā)。在全球擁有近百位全職博士和博士后學(xué)術(shù)帶頭人,幾百位名校碩士研發(fā)人員,團隊曾多次獲得多項世界大賽和國內大賽獎項。團隊利用自主知識產(chǎn)權的深度學(xué)習架構、機器視覺(jué)、生物智能識別等人工智能算法、無(wú)媒介支付等核心技術(shù),在自動(dòng)駕駛及整車(chē)制造、智能機器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育軍工等領(lǐng)域都有深入布局,擁有包括英特爾在內6家人工智能聯(lián)合實(shí)驗室。
依圖科技:
成立于2012年,公司核心業(yè)務(wù)包括智能安防平臺、智慧健康醫療、城市數據大腦、智能硬件設備等。目前,依圖的技術(shù)早已經(jīng)服務(wù)全國20余省安防,為海關(guān)總署及中國邊檢等提供人像比對系統,并在招商銀行、浦發(fā)銀行,遺跡互聯(lián)網(wǎng)金融等多個(gè)業(yè)務(wù)場(chǎng)景中廣泛應用,車(chē)輛識別產(chǎn)品亦被公安系統廣泛采用,依圖也是目前國內唯一擁有10億級人像庫比對能力的公司,搭建了全球最大的人像系統,覆蓋超過(guò)15億人像。
云從科技:
成立于2015年4月,是一家從中科院重慶研究院孵化的專(zhuān)注于計算機視覺(jué)與人工智能的高科技企業(yè)。是計算機視覺(jué)頭部企業(yè)中的國家隊,承建了國家發(fā)改委的基礎項目重大工程——“人工智能基礎資源公共服務(wù)平臺”與產(chǎn)業(yè)化項目重大工程“人臉識別系統產(chǎn)業(yè)化應用平臺”。與公安部、四大銀行、證通、民航總局建立聯(lián)合實(shí)驗室,推動(dòng)人工智能產(chǎn)品標準的建立,成為唯一同時(shí)制定國標、部標、行標的人工智能企業(yè)。國家發(fā)改委公布的《2017年“互聯(lián)網(wǎng)+”重大工程擬支持項目名單》中包含四個(gè)AI公司,云從科技是其中唯一一家創(chuàng )業(yè)公司。