據外媒報道,谷歌母公司Alphabet旗下DeepMind最近開(kāi)發(fā)了一種人工智能技術(shù),它可以在觀(guān)察2D平面圖像之后以3D渲染整個(gè)場(chǎng)景。目前一些人工智能研究人員正在試圖教機器學(xué)習像人類(lèi)一樣。我們不是以像素為單位看世界,而是環(huán)顧我們的環(huán)境并對其中的一切進(jìn)行假設。
DeepMind團隊則訓練了一個(gè)人工智能如何從其未見(jiàn)的角度猜測事物的樣子。 DeepMind的科學(xué)家提出了一個(gè)生成查詢(xún)網(wǎng)絡(luò )(Generative Query Network,GQN),這是一個(gè)神經(jīng)網(wǎng)絡(luò ),旨在教人工智能如何從不同的角度想象物體的場(chǎng)景會(huì )是什么樣子;旧,人工智能觀(guān)察場(chǎng)景的2D平面圖像,然后嘗試重新創(chuàng )建它。在這種情況下,重要的是DeepMind的人工智能不使用任何人為標記的輸入等。它只觀(guān)察三幅圖像,并開(kāi)始預測場(chǎng)景的3D版本是什么樣子。
研究人員正在努力實(shí)現“完全無(wú)監督的場(chǎng)景理解”。目前人工智能尚未接受真實(shí)世界的圖像訓練,因此下一步將從照片中渲染逼真的場(chǎng)景。未來(lái),DeepMind基于GQN的人工智能可能只使用照片就可以生成與現實(shí)世界幾乎完全相同的按需3D場(chǎng)景。 |