想要推理能力比肩人類 AI先得換種學(xué)習(xí)方式
來源:
科技日報
日期:2020-06-12
責(zé)編:
殷緒江
不管是人類,還是動物,在學(xué)習(xí)大多數(shù)事物時,都是在自我監(jiān)督的模式下進行的,而不是強化學(xué)習(xí)模式。這個模式本質(zhì)上就是觀察這個世界,然后不斷與之互動,這種觀察是自發(fā)的,而不是在測試條件下完成的。
人類在漫長的進化中,獲得了一種能通過感知、邏輯推理來與世界互動、認(rèn)識世界的能力。當(dāng)一個梨擺在我們面前時,我們能夠通過嗅覺、視覺等,判斷出它是梨而非蘋果。當(dāng)在路上行駛時,即使行人被部分遮擋住,我們也能從露出的部分體貌特征判斷出這是一個人,從而進行避讓。在人工智能領(lǐng)域,科學(xué)家們也一直試圖讓機器擁有像人一樣的邏輯思維能力,幫助人完成更多工作。
近日,在2020 ICLR大會上,圖靈獎得主舒亞·本吉歐(Yoshua Bengio)和揚·勒昆(Yann LeCun)發(fā)表觀點稱,自監(jiān)督學(xué)習(xí)有望使AI產(chǎn)生類人的推理能力。本吉歐相信機器最終可以習(xí)得關(guān)于這個世界的各種知識,這種知識的獲得并不需要機器去親身體驗各種真實發(fā)生的事件,而是通過習(xí)得語言化的知識來實現(xiàn)。那么機器如何具備類人的推理能力?想具備類人的推理能力還要逾越哪些障礙?
“死記硬背”讓機器難有邏輯能力
購物時,無需出示支付碼,將面部特征綁定銀行卡就能輕松消費;回家路上,查詢手機地圖,可以看出哪些地段擁堵;到飯點了,跟機器人對話叫外賣……這些基于機器學(xué)習(xí)的應(yīng)用,正在讓人工智能變得可觀可感。但機器學(xué)習(xí)面臨的挑戰(zhàn)便是,需要大量數(shù)據(jù)的積累以及很強的算力。
機器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。“監(jiān)督學(xué)習(xí)需要對數(shù)據(jù)進行標(biāo)簽分類,數(shù)據(jù)需要涵蓋所有可能的場景,此外,完成學(xué)習(xí),機器還需要大量的算力。例如,如果希望創(chuàng)建圖像分類模型,則必須為系統(tǒng)提供經(jīng)過適當(dāng)分類標(biāo)記的大量圖像,讓模型在其中進行充分訓(xùn)練。有時數(shù)據(jù)量達(dá)到百萬、千萬級規(guī)模,需要幾百萬、上千萬次的迭代。”中國科學(xué)院自動化研究所研究員、視語科技創(chuàng)始人王金橋告訴科技日報記者。
因此,減少對數(shù)據(jù)的依賴,一直是研究人員最重要的探索方向之一。在南京航空航天大學(xué)計算機學(xué)院教授陳松燦看來,監(jiān)督學(xué)習(xí)往往需要大量的帶有注釋、標(biāo)記的數(shù)據(jù),而標(biāo)記這些數(shù)據(jù),需要人工完成,既耗時又昂貴。
然而,即使是在有大量數(shù)據(jù)“打底”的監(jiān)督學(xué)習(xí)環(huán)境中,一旦機器遇到不同于訓(xùn)練示例的全新狀況,也面臨著失控的風(fēng)險。“例如無人駕駛汽車行駛在一條陌生的道路上,前方雖然出現(xiàn)了路桿,但如果此前系統(tǒng)沒有遇到過這種道路模式,就會撞上去。進入攝像頭視野的行人,如果未露出全貌,那系統(tǒng)就無法判斷出這是一個人,也會撞上去。還有我們進入停車場時,有些停車桿不能及時抬起,是因為靠近停車桿的行駛角度超出了此前設(shè)定的范圍。”王金橋表示,雖然數(shù)據(jù)標(biāo)簽的質(zhì)量,對于監(jiān)督學(xué)習(xí)的效果非常重要,但監(jiān)督學(xué)習(xí)不應(yīng)局限于這種模式,應(yīng)該提高對未知環(huán)境的探索和理解能力。
自監(jiān)督學(xué)習(xí)可利用規(guī)律舉一反三
對于機器學(xué)習(xí)的未來,揚·勒昆和約舒亞·本吉歐有著相同的期待,他們認(rèn)為,自監(jiān)督學(xué)習(xí)會創(chuàng)造出更像人類的人工智能。正如勒昆所解釋的,大多數(shù)人可以在30小時內(nèi)學(xué)會駕駛汽車,因為他們已經(jīng)憑借直覺構(gòu)建了一個關(guān)于汽車行動方式的物理模型。“自監(jiān)督學(xué)習(xí)是無監(jiān)督學(xué)習(xí)中的一種,它可以通過揭示數(shù)據(jù)各部分之間的關(guān)系、內(nèi)在結(jié)構(gòu),從數(shù)據(jù)中生成標(biāo)簽,這種標(biāo)簽便于對數(shù)據(jù)進行分類。自監(jiān)督學(xué)習(xí)需要學(xué)習(xí)的樣本量很少,但需要有基礎(chǔ)知識的積累。”王金橋說。王金橋進一步解釋,例如下圍棋,如果機器可以將頂尖高手的棋路都學(xué)會,就能舉一反三。又例如,假設(shè)世界上有5000種蘋果的類型,植物學(xué)家又培育出一種新蘋果,與其他蘋果長得很像,那么自監(jiān)督學(xué)習(xí)就可以通過數(shù)據(jù)的分析,識別出這是蘋果,但又能認(rèn)識到它是不同于以往的蘋果類型。也就是說,通過自監(jiān)督學(xué)習(xí),機器不需要訓(xùn)練,就可以通過自動分析內(nèi)部數(shù)據(jù)的結(jié)構(gòu)關(guān)系,并且應(yīng)用分析數(shù)據(jù)得到的規(guī)律,對各種新情況作出判斷。這種能力類似于人,在嬰幼兒時期,人類能用嗅覺、觸覺、視覺等感知世界,進入學(xué)校學(xué)習(xí)后,能將萬事萬物的物理特征,與知識結(jié)合起來,慢慢形成推理能力。
王金橋認(rèn)為,這有點類似于勒昆說的,自監(jiān)督學(xué)習(xí)無需創(chuàng)建大量帶有標(biāo)簽的數(shù)據(jù)集,例如用大量貓和狗的圖片,讓機器認(rèn)識貓和狗的不同;也不用花費數(shù)千個小時訓(xùn)練“Alpha Zero”這樣的國際象棋游戲機器人,而是只需獲取一些豐富的原始數(shù)據(jù),例如視頻,然后“喂”給計算機,訓(xùn)練機器預(yù)測視頻中即將出現(xiàn)的畫面。
“不管是人類,還是動物,在學(xué)習(xí)大多數(shù)事物時,都是在自我監(jiān)督的模式下進行的,而不是強化學(xué)習(xí)模式。這個模式本質(zhì)上就是觀察這個世界,然后不斷與之增進互動,這種觀察是自發(fā)的,而不是在測試條件下完成的。”勒昆在2020 ICLR大會上表示。
達(dá)到類人水平還需算法理論突破
在幾位專家看來,目前想通過自監(jiān)督學(xué)習(xí)實現(xiàn)機器的類人邏輯能力,還前路漫漫。陳松燦認(rèn)為,自監(jiān)督學(xué)習(xí)需要解決數(shù)據(jù)的不確定性問題,即積累的數(shù)據(jù)與要完成的任務(wù)的匹配性問題。“例如,利用自監(jiān)督學(xué)習(xí)訓(xùn)練的自動駕駛系統(tǒng),可以通過機載的測速儀、方向儀,學(xué)習(xí)安全行駛的方向和速度信息。但以現(xiàn)在的技術(shù)水平來說,如果行人橫穿馬路,而此前標(biāo)記的信息與行人橫穿馬路不搭界,那自動駕駛系統(tǒng)就會無法做出判斷,發(fā)出指令。”
王金橋表示:“從監(jiān)督學(xué)習(xí)到自監(jiān)督學(xué)習(xí),就像先讓機器知道什么是1234,才能算加減乘除一樣。目前的自監(jiān)督學(xué)習(xí)還非常初級,僅有一些小的、封閉的數(shù)據(jù)集。”
他說,目前制約自監(jiān)督學(xué)習(xí)的因素涉及大數(shù)據(jù)積累、小樣本監(jiān)督,以及自主進化、認(rèn)知未知數(shù)據(jù)的能力。“在數(shù)據(jù)積累階段,還需要把數(shù)據(jù)做得更規(guī)范,搭建的深度學(xué)習(xí)網(wǎng)絡(luò)要有能支持自監(jiān)督學(xué)習(xí)的能力,能讓機器自己生成標(biāo)簽。在樣本監(jiān)督學(xué)習(xí)階段,要解決樣本不均衡的問題,例如要讓機器學(xué)會分辨貓和狗,那么貓和狗的案例數(shù)量要匹配,同時要去除數(shù)據(jù)噪音,不要把干擾圖像混入。”
“關(guān)鍵是要讓自監(jiān)督學(xué)習(xí)產(chǎn)生認(rèn)知的能力,而不只是代替人類的視覺、聽覺、觸覺,要從感知智能過渡到認(rèn)知智能,讓機器建立自己的知識圖譜,能與人的思辨能力和知識圖譜對接,能進行知識表述和高階推理。”王金橋說。
但目前所有的不完美,并不影響兩位圖靈獎得主的信心。本吉歐認(rèn)為,相比于動物,人類之所以聰明,是因為我們有自己的文化,讓我們能夠解決這個世界的問題。要想讓人工智能在現(xiàn)實世界中發(fā)揮作用,我們需要它不僅僅是有翻譯功能,更需要它能夠真正理解自然語言。
而在勒昆看來,如果說人工智能是一塊蛋糕,那么自監(jiān)督學(xué)習(xí)就是其中最大的一塊。
【免責(zé)聲明】:
凡注明 “環(huán)球科技網(wǎng)” 字樣的圖片或文字內(nèi)容均屬于本網(wǎng)站專稿,如需轉(zhuǎn)載圖片請保留 “環(huán)球科技網(wǎng)” 水印,轉(zhuǎn)載文字內(nèi)容請注明來源“環(huán)球科技網(wǎng)”;凡本網(wǎng)注明“來源:XXX(非環(huán)球科技網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其作品內(nèi)容的實質(zhì)真實性負(fù)責(zé),轉(zhuǎn)載信息版權(quán)屬于原媒體及作者。如轉(zhuǎn)載內(nèi)容涉及版權(quán)或者其他問題,請投訴至郵箱;1978751725@qq.com
本網(wǎng)公告
環(huán)球科技網(wǎng)從不發(fā)布負(fù)面新聞資訊,也絕不會發(fā)布負(fù)面信息。如發(fā)現(xiàn)負(fù)面信息鏈接請甄別是否為環(huán)球科技網(wǎng)所發(fā)。
本網(wǎng)系北京伯樂傳媒廣告有限公司主辦、所有。本網(wǎng)唯一域名(www.lzsczx.com),其它域名鏈接均為假冒。望廣大網(wǎng)民及企業(yè)主認(rèn)真甄別。
咨詢、采訪、合作、投稿等請致電:13911566744(含微信)