【ZiDongHua 之品牌自定位收錄關(guān)鍵詞:微鏈視覺   人工智能   通用人工智能  機(jī)器視覺

五道口人 | 成為通用人工智能機(jī)器人認(rèn)知技術(shù)引領(lǐng)者——訪2020級(jí)GELP校友冉祥

冉祥,2020級(jí)GELP校友,微鏈視覺董事長(zhǎng)。

問:請(qǐng)您和我們簡(jiǎn)單介紹一下最早創(chuàng)辦微鏈視覺的契機(jī)和初衷。

冉祥:我們是從2016年開始調(diào)研,并在2019年正式啟動(dòng)這個(gè)項(xiàng)目的。當(dāng)時(shí),我們注意到制造業(yè)的工作環(huán)境相對(duì)惡劣,與寫字樓里舒適的條件形成鮮明對(duì)比。工廠在冬天可能會(huì)達(dá)到零下10度到零下20度的低溫,夏天也會(huì)非常炎熱。此外,一些例如焊接和涂膠的工作,還存在一定的危害性,對(duì)人體健康有影響。因此,我們預(yù)測(cè)未來的年輕人不太可能再?gòu)氖逻@些工作。在這種背景下,我們開始思考如何利用數(shù)據(jù)和技術(shù)替代這些繁重、危險(xiǎn)且對(duì)健康有害的工作場(chǎng)景。

工業(yè)自動(dòng)化這個(gè)相對(duì)傳統(tǒng)的領(lǐng)域已經(jīng)發(fā)展了很多年,但為什么仍然有如此多的產(chǎn)業(yè)工人?以汽車行業(yè)為例,為什么仍然需要大量的人力?根本原因在于產(chǎn)品的復(fù)雜性。例如,如果我們想將車門安裝在汽車上,當(dāng)車門從傳送帶上運(yùn)送過來時(shí),可能存在位置上的偏移。但傳統(tǒng)的工業(yè)自動(dòng)化并不能解決這類問題。

因此,我們認(rèn)為人工智能和視覺技術(shù)是解決問題的關(guān)鍵,特別是傳統(tǒng)的二維視覺無法解決的情況,可能需要運(yùn)用三維視覺技術(shù)。隨著技術(shù)儲(chǔ)備的積累和技術(shù)進(jìn)步,這個(gè)問題終將被解決。因此,我們決定進(jìn)入這個(gè)行業(yè),在這個(gè)過程中我們也遇到了很多以前沒有想過的問題。

問:遇到了哪些問題?

冉祥:在工業(yè)領(lǐng)域,不論是使用視覺技術(shù)、運(yùn)動(dòng)控制還是人工智能,工業(yè)場(chǎng)景都需要一個(gè)綜合性的跨學(xué)科技術(shù)。特別是在人工智能受到廣泛關(guān)注后,大家開始思考人工智能如何進(jìn)入物理世界。因此,我們非常早就開始研究如何讓人工智能認(rèn)知我們的物理世界、控制我們的物理世界,并真正取代物理世界中的工作。在這個(gè)過程中,會(huì)面臨一些挑戰(zhàn)。

首先是精度的問題。例如,在光線條件下,許多物料會(huì)反光,比如金屬,而反光會(huì)導(dǎo)致在拍照時(shí)信息的丟失。我們就需要思考在這種情況下如何實(shí)現(xiàn)精確的識(shí)別。其次是運(yùn)動(dòng)控制的問題。舉個(gè)例子,當(dāng)我們使用工業(yè)機(jī)器人分揀抓取一個(gè)深箱里面的物體的時(shí)候,機(jī)械運(yùn)動(dòng)抓取上面物體的時(shí)候容易實(shí)現(xiàn),但當(dāng)我們的機(jī)器人開始抓取下層物體的時(shí)候,就可能會(huì)撞到箱子甚至撞壞物體,機(jī)器很難理解空間,并學(xué)會(huì)如何繞過障礙物和根據(jù)空間和目標(biāo)的姿態(tài)變化來生產(chǎn)新的運(yùn)動(dòng)軌跡。因此,我們需要思考如何讓人工智能理解三維空間,結(jié)合空間里的目標(biāo)和之間的障礙物與運(yùn)動(dòng)控制的規(guī)則,并讓機(jī)器人可以實(shí)時(shí)生成最優(yōu)的運(yùn)動(dòng)軌跡規(guī)劃,實(shí)現(xiàn)智能化的機(jī)械操作。想要解決這些問題需要研究精細(xì)的技術(shù)解決方案,而不僅僅是一個(gè)算法、一個(gè)模型,因?yàn)槠渲猩婕霸S多細(xì)節(jié)上的挑戰(zhàn)。

實(shí)際上,許多學(xué)術(shù)研究機(jī)構(gòu)也在探索人工智能在物理世界的應(yīng)用,但它們做的任務(wù)相對(duì)簡(jiǎn)單,比如抓取零食、倒咖啡等。這與我們所面對(duì)的工業(yè)場(chǎng)景相比存在很大的差距。在工業(yè)場(chǎng)景中,倒水的精度肯定是不夠的,如果我們想要將兩個(gè)物體安裝在一起,通常需要達(dá)到亞毫米級(jí)別的精度。在這種級(jí)別下,光線的明暗變化、溫度的升降和地面輕微的振動(dòng)等因素都會(huì)影響識(shí)別和抓取的失敗。因此,在工業(yè)領(lǐng)域,想要打造一個(gè)產(chǎn)品并使其可用、可交互,其中需要突破無數(shù)個(gè)技術(shù)難點(diǎn)和技術(shù)極限。同時(shí),作為走在前沿的人,我們會(huì)遇到許多前人從未遇到過的問題,也很難獲得別人的開源算法。所以,工業(yè)領(lǐng)域的技術(shù)研究是相當(dāng)艱辛的。

問:請(qǐng)您具體講一講,微鏈視覺AI技術(shù)具體的運(yùn)用場(chǎng)景有哪些?

冉祥:我們大約70%到80%的技術(shù)都用于解決生產(chǎn)線上的工人問題。首先解決的是一些比較危險(xiǎn)的情況,就像前面提到的焊接、涂膠等損害人體健康的場(chǎng)景,我們的目標(biāo)是盡量讓工人不參與這些任務(wù)。逐步地,我們還會(huì)讓機(jī)器替代人工進(jìn)行一些較重、較大物件的搬運(yùn)工作。我們最終的目標(biāo)是實(shí)現(xiàn)無人工廠,即逐步減少工人的參與,包括螺絲的擰緊、裝配以及物流分揀等環(huán)節(jié)。我們?cè)谄渌I(lǐng)域也有一些拓展應(yīng)用,例如,垃圾處理站的檢測(cè)、分揀和投爐焚燒發(fā)電,大件貨物的卡車裝載,具有污染排放和輻射風(fēng)險(xiǎn)場(chǎng)景的作業(yè),自動(dòng)化的糧食種植、智能化的畜牧業(yè)養(yǎng)殖,等等。

目前我們的產(chǎn)品在某些方面還未得到廣泛應(yīng)用,主要有兩個(gè)原因。第一個(gè)原因是,從客觀條件來看,在標(biāo)準(zhǔn)的工業(yè)自動(dòng)化產(chǎn)品領(lǐng)域,我們現(xiàn)有的技術(shù)和產(chǎn)品只能解決大約30%的問題,還有70%的問題是現(xiàn)有技術(shù)無法解決的。技術(shù)是不斷進(jìn)步的,所以需要年輕人去研究和突破這70%的難題。第二個(gè)原因是,有一些問題盡管現(xiàn)有技術(shù)也可以解決,但投資成本太高,在目前階段廣泛應(yīng)用的成本并不劃算。但隨著技術(shù)的進(jìn)步和規(guī)?;?,技術(shù)價(jià)格是在下降的,成本最終也會(huì)降到非常低的水平,這時(shí),大規(guī)模應(yīng)用就會(huì)變得普遍。就像我們看到的早期電腦和手機(jī)的價(jià)格很高,只有公司、大老板才能用,而現(xiàn)在電腦和手機(jī)已經(jīng)變得非常普遍。所以,雖然現(xiàn)在存在一些限制,但我相信隨著技術(shù)的發(fā)展,我們的愿景最終將實(shí)現(xiàn)。

我認(rèn)為AI進(jìn)步的重要價(jià)值應(yīng)該不僅僅在于提高人類社會(huì)的效率和價(jià)值,還可以解決一些我們目前無法解決的問題,如星際探索。為什么人類不能在月球、火星上建立基地?是因?yàn)槟切┑胤經(jīng)]有氧氣,不適合人類長(zhǎng)時(shí)間生存。但如果我們的AI機(jī)器人能夠自己工作,我們就可以把機(jī)器人送上去。因?yàn)闄C(jī)器人只需要電能,不需要氧氣。它可以在那里建造大型建筑物,在里面建立一個(gè)封閉的生態(tài)系統(tǒng),實(shí)現(xiàn)循環(huán)的氧氣供應(yīng)。這樣,我們就可以逐步解決星際探索中的難題。

問:AI發(fā)展到今天,其應(yīng)用的難點(diǎn)是什么?

冉祥:事實(shí)上,AI已經(jīng)經(jīng)歷了多個(gè)發(fā)展階段。第一代AI主要是通過讀取大數(shù)據(jù)并預(yù)測(cè)多種可能性來應(yīng)對(duì)各種情況。然后,我們通過不斷投喂數(shù)據(jù)的方式讓AI成為了所謂的“文科生”,即通過對(duì)大量數(shù)據(jù)的死記硬背,用匹配的方式應(yīng)答各種問題。

然而,我認(rèn)為現(xiàn)在的AI已經(jīng)從匹配開始走向理解。新一代的AI需要學(xué)會(huì)識(shí)別物體,更進(jìn)一步地,AI還要理解空間,知道物體的空間位置。理解空間和匹配空間是不同的,因?yàn)槠ヅ淇臻g需要大量的數(shù)據(jù),比如想要識(shí)別杯子在桌子上的空間位置,這個(gè)杯子在桌面上每一個(gè)微小的變化就會(huì)產(chǎn)生一個(gè)數(shù)據(jù),那如果想定位杯子的三維位置,就需要海量的數(shù)據(jù),這是難以完全標(biāo)記出來的。但我們?nèi)祟惿钤谌S空間中,如果我們想讓AI進(jìn)入我們的物理世界,就必須讓它首先具備識(shí)別三維空間的能力。既然我們無法標(biāo)記出所有的三維數(shù)據(jù)讓AI去匹配,那么我們就可以采用一種教“理科生”的方法來讓它理解空間。簡(jiǎn)單來說,我們需要一個(gè)通用人工智能(Artificial General Intelligence),就是像教小孩子認(rèn)識(shí)杯子一樣,我們不可能教他認(rèn)識(shí)世界上的每一個(gè)杯子,我們只需要拿一個(gè)杯子告訴他,經(jīng)過幾次訓(xùn)練,下次他就能夠自己識(shí)別出來。目前,通用人工智能(AGI)盡管還沒有商業(yè)化,但在實(shí)驗(yàn)室中,我們的AI不要提前投喂任何新的數(shù)據(jù),他就已經(jīng)能夠識(shí)別出任何新的物體,并計(jì)算出它們?cè)诳臻g中的位置,你可以定義讓他做任何工作。當(dāng)然,我們更愿意叫這個(gè)為微鏈DaoAI強(qiáng)機(jī)器人智能。因?yàn)樗粌H僅是識(shí)別和理解,他還需要自主工作。

問:您認(rèn)為未來AI的發(fā)展是否存在安全性的問題?

冉祥:失控的可能性存在,但從根本上來說,這是人類的問題。人工智能本質(zhì)上是由人類創(chuàng)造的工具。AI目前掌握的所謂認(rèn)知能力和推理能力,都是人類利用數(shù)學(xué)模型構(gòu)建出來的。我們賦予它什么樣的能力,它就具備什么樣的能力。就像人類自身也受到社會(huì)馴化的影響,中國(guó)人受到儒家文化的影響,西方人受到基督教文化的影響。為什么我們無法跳脫這些影響呢?原因在于我們被一套模型所塑造,人工智能也是如此。人類是否存在殺人犯,是的,有些人失控了,變得反社會(huì)。因此人工智能也可能出現(xiàn)這種情況。

因此,我認(rèn)為問題的本質(zhì)仍然是人類的問題。我們現(xiàn)在需要關(guān)注的并不是如何防范人工智能,而是防范那些創(chuàng)造和控制人工智能的人。如果人工智能的進(jìn)步帶來了不好的后果,那也是人類造成的,而不是人工智能本身造成的。我認(rèn)為真正的風(fēng)險(xiǎn)在于人類,管理人工智能的本質(zhì)是管理人類。我比較同意采取類似核武器管理的方法,建立一個(gè)人工智能保護(hù)傘組織。

問:對(duì)于AI在發(fā)展過程中數(shù)據(jù)的安全性問題,您是怎么看的?

冉祥:數(shù)據(jù)的安全問題歸根結(jié)底是利益的問題。在我們社會(huì)的基本形態(tài)中,無論是國(guó)家,還是個(gè)體、組織,都有各自的利益,因此,數(shù)據(jù)保護(hù)的核心在于保護(hù)利益。各方為了保護(hù)自身的核心數(shù)據(jù)會(huì)采取一些方法和措施,數(shù)據(jù)的安全邊界也因此而存在。AI公司的員工通常不會(huì)人為去看數(shù)據(jù),都是直接將數(shù)據(jù)投喂給AI模型去訓(xùn)練,也就是說工作人員并不會(huì)知道投喂的是什么數(shù)據(jù),而且數(shù)據(jù)的流向在服務(wù)器上都是有日志的,他是受到企業(yè)嚴(yán)格監(jiān)管的,也就是任何人非法使用了數(shù)據(jù),從技術(shù)路徑上都是可以追責(zé)的。

從另一個(gè)角度來看,數(shù)據(jù)的安全性問題也可以說是一個(gè)相對(duì)的概念。隨著社會(huì)的發(fā)展和開放程度的提高,我們對(duì)數(shù)據(jù)的安全邊界也在不斷變化。同樣,工業(yè)數(shù)據(jù)也是如此。過去,工廠的生產(chǎn)線數(shù)據(jù)和視頻是不允許外泄的,但最近大眾汽車公司卻將自己的生產(chǎn)工藝視頻公開給大家觀看。類似的例子,比如過去我們非常注重信息的隱私,但現(xiàn)在我們刷個(gè)短視頻,類似的視頻馬上就會(huì)涌現(xiàn)出來,它知道我們?cè)诳词裁础R虼?,?shù)據(jù)的安全邊界是相對(duì)的,并且隨著社會(huì)的發(fā)展和技術(shù)的進(jìn)步,隱私的概念可能會(huì)進(jìn)一步改變。

此外,我認(rèn)為開源對(duì)于學(xué)術(shù)研究和技術(shù)進(jìn)步也是非常重要的。將學(xué)術(shù)研究成果公開,可以促進(jìn)學(xué)術(shù)和技術(shù)的進(jìn)步,避免重復(fù)造輪子,良性地推動(dòng)研究的快速迭代和創(chuàng)新。當(dāng)然,企業(yè)技術(shù)的開源也是有益的,它可以幫助建立一個(gè)生態(tài)系統(tǒng),讓更多的人參與其中,推動(dòng)整個(gè)行業(yè)的發(fā)展。

問:您認(rèn)為未來AI會(huì)發(fā)展到什么程度?

冉祥:我認(rèn)為未來人工智能的發(fā)展將極其深遠(yuǎn)。最終,我相信人類將不需要親自去做任何事情,一切都可以由人工智能來完成。更重要的是,我預(yù)見未來所有人都會(huì)使用人工智能來處理事務(wù),就像現(xiàn)在如果你不會(huì)使用電腦,你幾乎無法完成任何工作一樣?,F(xiàn)在的人工智能正在不斷迭代,直接的結(jié)果是我們過去十年、二十年甚至一百年、兩百年都無法突破的一些技術(shù)可能在未來的五到十年會(huì)有爆發(fā)式的突破。因此,人工智能的進(jìn)步不僅僅是人工智能本身的進(jìn)步,更是整個(gè)人類文明的進(jìn)步,人工智能只是提供了一個(gè)讓人類文明前進(jìn)的工具。

對(duì)于人們對(duì)人工智能的恐懼,他們所害怕的不是人工智能本身,而是人工智能強(qiáng)大工具所帶來的后果。但就像過去有了汽車,馬車夫就失業(yè)了一樣,這是人類社會(huì)文明進(jìn)步的一個(gè)附帶屬性。因此,我們不應(yīng)該停留在過去,而是要趕緊學(xué)習(xí)人工智能,不要一直學(xué)習(xí)騎馬,而是要學(xué)習(xí)開車。

問:是什么契機(jī)讓您選擇來到五道口金融學(xué)院深造?在這里您有哪些收獲?對(duì)于企業(yè)的發(fā)展有哪些幫助?

冉祥:在過去,我對(duì)金融和資本并不了解,因?yàn)槲乙恢睂W⒂趯?shí)施自己的想法和愿景,對(duì)未來充滿樂觀。后來,我認(rèn)識(shí)到資本能夠極大地提高效率,借助資本的力量,我們可以將原本需要花費(fèi)十年時(shí)間完成的事情,在一兩年內(nèi)實(shí)現(xiàn)。我希望通過在五道口金融學(xué)院的學(xué)習(xí),了解如何利用資本賦能來加速公司的發(fā)展。我相信除了技術(shù)壁壘之外,人才和資本也是成功的要素。

在創(chuàng)業(yè)領(lǐng)袖項(xiàng)目中,與同學(xué)們,特別是與更年輕的創(chuàng)業(yè)者的互動(dòng)對(duì)我來說也非常重要。通過交流,我從他們身上學(xué)到了不同的思維方式,也開闊了自己的視野,找到了進(jìn)步的關(guān)鍵點(diǎn),這對(duì)我的第二次創(chuàng)業(yè)非常有幫助。

問:對(duì)于那些希望了解并應(yīng)用AI技術(shù)的校友和同學(xué),您對(duì)他們有什么建議?

冉祥:首先,對(duì)于任何技術(shù),尤其是新技術(shù)和顛覆性創(chuàng)新技術(shù)的出現(xiàn),在社會(huì)上總是會(huì)有很多爭(zhēng)議和不同的觀點(diǎn)。但我認(rèn)為,無論是哪種技術(shù),我們都應(yīng)該擁抱它。因?yàn)榧夹g(shù)推動(dòng)了人類的進(jìn)步和發(fā)展。從最早的鉆木取火到青銅器、鐵器的運(yùn)用,再到蒸汽機(jī)、電氣時(shí)代,以及現(xiàn)在的信息技術(shù)和人工智能時(shí)代,我們一直處于技術(shù)不斷發(fā)展的過程中。

當(dāng)今信息技術(shù)的發(fā)展帶來了人工智能,我們無法拒絕它,只能好好利用它。任何技術(shù)都會(huì)帶來負(fù)面影響,但這些都只是其副作用。最好的情況是,我們能夠引領(lǐng)技術(shù)的發(fā)展,如果無法引領(lǐng),我們也應(yīng)該緊跟其后,但不要成為因技術(shù)進(jìn)步而被拋棄的人。

《五道口校友通訊》2023年7月刊(2023年第3期總第48期)