下一個(gè)AI王炸,別只盯著OpenAI,DeepMind也在憋大招 |
發(fā)布時(shí)間:2023-04-10 文章來(lái)源:本站 瀏覽次數(shù):1982 |
過(guò)去幾個(gè)月,OpenAI風(fēng)頭無(wú)兩,各大科技公司力爭(zhēng)上游地跟進(jìn)大言語(yǔ)模型(LLM)這一技術(shù)道路。 比照之下,OpenAI的老對(duì)手DeepMind,顯得有些低調(diào)和緘默。微軟靠OpenAI打了一場(chǎng)勝仗,而谷歌推出的Bard翻了車(chē),和谷歌同屬AlphaBeta的DeepMind卻沒(méi)有出來(lái)力挽狂瀾的意義。 同樣是半學(xué)術(shù)、半企業(yè)科研性質(zhì)的前瞻性AI Lab,DeepMind也瞄準(zhǔn)了通用人工智能AGI,但完成途徑上,卻有著和OpenAI不同的選擇。 這段時(shí)間我們能看到科技圈在集體“追風(fēng)口”,大量資源(留意力、算力、人才、政策等)都被投入到OpenAI引領(lǐng)的大言語(yǔ)模型熱潮中,有些高校以至呈現(xiàn)了“不做LLM就沒(méi)有算力用”的場(chǎng)面。“中國(guó)沒(méi)有本人的OpenAI”也被以為是創(chuàng)新滯后的理想證明。 有人說(shuō)OpenAI的AI屬于“精英教育道路”,一路砸錢(qián)供它讀到博士,一畢業(yè)就是王炸,冷艷全場(chǎng),這點(diǎn)的確沒(méi)錯(cuò),也是十分值得很多國(guó)內(nèi)AI Lab學(xué)習(xí)的。 追逐OpenAI的賽道曾經(jīng)非常擁堵。別忘了,DeepMind默默燒錢(qián)、長(zhǎng)期錨定的很多研討方向,也十分具有前沿性和想象力,2016年的AlphaGo、2020年的AlphaFold都曾一鳴驚人。下一個(gè)“AI王炸”,可能就是DeepMind做出來(lái)的。 大家曉得有種新聞叫“震驚體”,每一次呈現(xiàn)“AI王炸”級(jí)產(chǎn)品,就會(huì)有大量“震驚體”呈現(xiàn),比方“阿爾法狗要取代人類(lèi)”“AlphaFold搶了生物學(xué)家的工作”“有了ChatGPT人類(lèi)還有價(jià)值嗎?” 感到“震驚”,有時(shí)真的只是由于曉得的太少、太晚,在這些“AI王炸”技術(shù)尚在生長(zhǎng)階段,無(wú)視了它們,等才能開(kāi)展到適用水平,又開(kāi)端恐慌、焦慮。 屆時(shí),我們會(huì)不會(huì)又會(huì)墮入新一輪的追逐跟風(fēng),接著埋怨“中國(guó)沒(méi)有本人的DeepMind”呢? 所以,我們無(wú)妨來(lái)預(yù)測(cè)一下,DeepMind正在憋的大招里,哪些可能成為下一個(gè)王炸,讀者們能夠有個(gè)心理準(zhǔn)備,提早對(duì)“震驚體”脫敏。 AI要取代科學(xué)家,夠不夠震驚? ChatGPT走紅之后,很多白領(lǐng)人士都擔(dān)憂(yōu)本人的崗位要被取代了。而科學(xué)家可是智力程度站在金字塔頂端的人類(lèi),職業(yè)生活肯定穩(wěn)穩(wěn)的吧? AI+科學(xué),正是DeepMind長(zhǎng)期錨定的賽道,曾經(jīng)產(chǎn)出了很多打破性的研討成果,掩蓋了數(shù)學(xué)家、物理學(xué)家、生物學(xué)家的專(zhuān)業(yè)范疇。 曾經(jīng)問(wèn)世的AlphaFold和AlphaFold 2就在生物學(xué)界掀起了海嘯級(jí)的影響,徹底改動(dòng)了蛋白質(zhì)構(gòu)造預(yù)測(cè)的傳統(tǒng)辦法,也引發(fā)了各大高校和科研機(jī)構(gòu)的復(fù)現(xiàn)、優(yōu)化、應(yīng)用。基于這一新技術(shù),DeepMind一夜之間改動(dòng)了生物制藥行業(yè),也因而成為“數(shù)字生物學(xué)”這一新興范疇的先驅(qū)。 目前,AI+生物學(xué)的潛力還沒(méi)有完整釋放出來(lái),AI技術(shù)在生物制藥和生命科學(xué)中的應(yīng)用,還停留在少數(shù)環(huán)節(jié)中探究、案例級(jí)嘗試的階段。DeepMind也正在與行業(yè)展開(kāi)協(xié)作,比方與Isomorphic Labs 協(xié)作,以“AI-FIRST”準(zhǔn)繩重構(gòu)藥物發(fā)現(xiàn)過(guò)程,在著名的生物醫(yī)學(xué)研討中心弗朗西斯·克里克研討所(Francis Crick Institute),建了一個(gè)濕實(shí)驗(yàn)室,增強(qiáng)AI技術(shù)與生物實(shí)驗(yàn)的分離,同時(shí)還在不時(shí)擴(kuò)展AI for science團(tuán)隊(duì),加快根底生物學(xué)的研討。 或許,下一個(gè)抗癌新藥、生物計(jì)算范疇的大打破,就會(huì)在DeepMind降生。 (AlphaFold提醒了蛋白質(zhì)宇宙的構(gòu)造) 你可能會(huì)說(shuō),生物學(xué)是一門(mén)實(shí)驗(yàn)科學(xué),有成熟的程式,被AI技術(shù)改動(dòng)很合理。數(shù)學(xué)、物理這樣的根底科學(xué),打破簡(jiǎn)直來(lái)自天才式的直覺(jué)和靈感,有的數(shù)學(xué)家以至是在夢(mèng)中獲得打破。比方阿基米德就是在洗澡時(shí)靈光一現(xiàn),發(fā)現(xiàn)了浮力定律;拉馬努金在夢(mèng)中發(fā)現(xiàn)了3900個(gè)公式……AI估量就不好使了吧? 數(shù)學(xué)、物理,這些觸及籠統(tǒng)世界和人類(lèi)深層直覺(jué)的范疇,DeepMind也曾經(jīng)獲得了打破。 協(xié)助數(shù)學(xué)家發(fā)現(xiàn)他們從未發(fā)現(xiàn)的發(fā)現(xiàn)——DeepMind發(fā)表在《自然》雜志上的一篇論文顯現(xiàn),研討人員與頂級(jí)數(shù)學(xué)家協(xié)作,為一個(gè)幾十年來(lái)都沒(méi)有結(jié)局的數(shù)學(xué)猜測(cè),經(jīng)過(guò)機(jī)器學(xué)習(xí)(ML)找到了打破口。 運(yùn)用AI來(lái)處置海量或無(wú)法直接推理的數(shù)據(jù),能夠大大加強(qiáng)數(shù)學(xué)家的洞察力,從而更快地找到證明猜測(cè)和新公式的辦法,曾經(jīng)被DeepMind證明是可行的。 牛津大學(xué)數(shù)學(xué)系教授Marcus Du Sautoy形容AI技術(shù)在純數(shù)學(xué)中的應(yīng)用,“就像伽利略拿起望遠(yuǎn)鏡,可以深化注視數(shù)據(jù)宇宙,看到以前從未發(fā)現(xiàn)過(guò)的東西”。 將來(lái)隨著探究的增加,很多未被證明的數(shù)學(xué)猜測(cè),都有可能因AI的參加而打破。希望屆時(shí)大家不會(huì)又以為AI進(jìn)化出了什么超才能,被“AI取代數(shù)學(xué)家”之類(lèi)的標(biāo)題給騙了。
AI參與核聚變的研討進(jìn)程——核物理無(wú)論從學(xué)術(shù)還是社會(huì)政治經(jīng)濟(jì)的角度,都是十分重要的。大家可能都聽(tīng)過(guò)中國(guó)核物理學(xué)家造原子彈的艱辛故事,其中很多工作和犧牲能不能由AI來(lái)代勞呢?DeepMind還真搞成了。 它們與瑞士等離子體中心,協(xié)作開(kāi)發(fā)了一個(gè)AI系統(tǒng),經(jīng)過(guò)強(qiáng)化學(xué)習(xí),控制系統(tǒng)能夠很好地諧和TCV(由許多磁線(xiàn)圈組成),確保等離子體永遠(yuǎn)不會(huì)接觸容器壁,這樣就能夠減少核聚變的熱量損失。同時(shí),還能將等離子體準(zhǔn)確地雕琢成不同的外形,便當(dāng)科學(xué)家研討等離子體在不同條件下的反響,從而進(jìn)步對(duì)核聚變反響堆的了解。 總之,在過(guò)去的幾年里,DeepMind在數(shù)學(xué)、物理、化學(xué)、生物學(xué)、量子、氣候、資料等多個(gè)科學(xué)范疇,發(fā)明性地探究了大量AI for science的可能,帶來(lái)了全新的科學(xué)研討辦法,必然會(huì)催生全新的科學(xué)發(fā)現(xiàn)和技術(shù)打破,下一個(gè)“AI王炸”很可能就在其中。 理想版《西部世界》夠不夠炸裂? DeepMind的目的也是完成通用人工智能。詳細(xì)怎樣做呢?OpenAI專(zhuān)心搞言語(yǔ),DeepMind就專(zhuān)注“訓(xùn)狗”——搞強(qiáng)化學(xué)習(xí)。 弱人工智能,只能在有限的環(huán)境中處理特定問(wèn)題,沒(méi)有開(kāi)展出人類(lèi)身上那種通識(shí)智能。那種“通用”智能的機(jī)器,大約就相似于《西部世界》或者《底特律》中的機(jī)器人,可以在復(fù)雜的環(huán)境里執(zhí)行任務(wù)。 完成AGI,OpenAI是用大量數(shù)據(jù)和充沛鍛煉來(lái)促成大言語(yǔ)模型的“智能涌現(xiàn)”,而DeepMind則選擇了“正向教育”——希望經(jīng)過(guò)強(qiáng)化學(xué)習(xí),給AI系統(tǒng)以“獎(jiǎng)勵(lì)大化”的刺激,差遣智能體自主去學(xué)習(xí)復(fù)雜的才能。由于只要表現(xiàn)出這些才能,智能體才干取得獎(jiǎng)勵(lì)(比方生存下去)。 聽(tīng)起來(lái),是不是跟工作犬執(zhí)行主人的口令,主人依據(jù)結(jié)果來(lái)停止獎(jiǎng)勵(lì)或懲罰是一個(gè)路子? 在一篇論文中,DeepMind的研討人員寫(xiě)道:“獎(jiǎng)勵(lì)足以推進(jìn)智能體表現(xiàn)出通用智能的跡象和行為,包括學(xué)習(xí)、感知、社會(huì)智能、言語(yǔ)、概括和模擬。” 上一只震驚世界的狗是擊敗人類(lèi)棋手的“阿爾法狗(AlphaGo)”,而下一只可能就是被DeepMind用強(qiáng)化學(xué)習(xí)鍛煉出來(lái)的AI了。 (ANYmal機(jī)器人的運(yùn)動(dòng)技藝是經(jīng)過(guò)模擬狗MoCap來(lái)學(xué)習(xí)的) 比方這只機(jī)器狗,就經(jīng)過(guò)強(qiáng)化學(xué)習(xí)不時(shí)試錯(cuò),從而具備了兩個(gè)重要的才能: 一是運(yùn)用歷史經(jīng)歷,普通來(lái)說(shuō)電機(jī)控制的AI智能體,一開(kāi)端不曉得對(duì)每個(gè)關(guān)節(jié)施加什么力,需求大量數(shù)據(jù)才干邁出步子,不然就會(huì)隨機(jī)抽搐并疾速摔倒,而借助RL能夠應(yīng)用以前學(xué)到的運(yùn)動(dòng)技藝,從而緩解“起步”時(shí)的為難。 二是減少特殊行為,此前智能機(jī)器人普通會(huì)用一種很不自然、不夠人性化的方式來(lái)避障,固然看起來(lái)很有趣,但不夠適用。DeepMind采用強(qiáng)化學(xué)習(xí)鍛煉,傾向于讓智能體學(xué)習(xí)更多的自然行為,能夠平安高效地控制真實(shí)世界的機(jī)器人/機(jī)器狗,將機(jī)械控制與認(rèn)知聰慧相分離。 相似的強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)還有很多,比方讓智能體在網(wǎng)絡(luò)游戲中展開(kāi)隨機(jī)互動(dòng),讓智能體在模仿的三維世界里搭積木、清掃房間……根本邏輯都是基于人類(lèi)反應(yīng)的獎(jiǎng)勵(lì)模型。 ChatGPT只能處理言語(yǔ)問(wèn)題,《西部世界》里的人機(jī)交融新物種,更靈敏的通用家政機(jī)器人,可能還真得靠DeepMind的強(qiáng)化學(xué)習(xí)道路來(lái)完成。 像人腦一樣考慮的AI,夠不夠有趣? DeepMind固然沒(méi)有跟風(fēng)推出類(lèi)ChatGPT的大言語(yǔ)模型,但并不代表它對(duì)這個(gè)范疇毫無(wú)建樹(shù),只不過(guò)二者關(guān)注的技術(shù)方向不太一樣而已。 隨著運(yùn)用者的增加,大家可能都發(fā)現(xiàn)了類(lèi)ChatGPT模型的一些限制,比方十分注重?cái)?shù)據(jù)和語(yǔ)料。 深度學(xué)習(xí)靠范圍數(shù)據(jù)、龐大算力、充沛鍛煉而“鼎力出奇觀”的暴力美學(xué),在大模型時(shí)期發(fā)揮到了極致。 這帶來(lái)了一系列問(wèn)題,比方中文語(yǔ)料缺乏,訓(xùn)出來(lái)的大模型效果不好,有的中文LLM會(huì)用英文語(yǔ)料停止鍛煉,再將答案翻譯回中文,這種做法當(dāng)然是契合業(yè)界常規(guī)的,但問(wèn)題在于很多價(jià)值觀、常識(shí)性的東西,是沒(méi)有方法對(duì)齊和翻譯的。 而且“暴力計(jì)算出奇觀”的大煉模型,打造的言語(yǔ)模型是不可解釋的黑盒,金融、政務(wù)、工業(yè)等行業(yè)是不敢用的,無(wú)法支撐牢靠的決策。 不曉得OpenAI和國(guó)內(nèi)廠(chǎng)商打算怎樣處理“暴力計(jì)算”的弊病,反正DeepMind倒是不斷在揣摩不同的道路——不搞暴力美學(xué),大搞神經(jīng)科學(xué)。 DeepMind以為大腦才是機(jī)器智能模擬的對(duì)象,希望經(jīng)過(guò)對(duì)腦科學(xué)、神經(jīng)運(yùn)動(dòng)學(xué)、元學(xué)習(xí)等“人類(lèi)本位”的研討,來(lái)提升深度學(xué)習(xí)模型的魯棒性、可解釋性、牢靠性等,讓AI到達(dá)人類(lèi)程度的了解才能。 比方重新認(rèn)識(shí)大腦的工作機(jī)制,自創(chuàng)多巴胺經(jīng)過(guò)調(diào)理神經(jīng)元之間突觸銜接的強(qiáng)度,提出了一種基于獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)理論; 在3D游戲世界中創(chuàng)立了模仿心理學(xué)實(shí)驗(yàn)室Psychlab,可以施行經(jīng)典的心理實(shí)驗(yàn),顯著改良了智能體UNREAL的性能; 發(fā)如今人工神經(jīng)網(wǎng)絡(luò)傾向于避開(kāi)準(zhǔn)確設(shè)計(jì)的代碼,傾向于對(duì)本錢(qián)函數(shù)停止暴力優(yōu)化(不追求獎(jiǎng)勵(lì)大化,而是追求本錢(qián)小化,不做錯(cuò)就沒(méi)有損失),而人腦的機(jī)制卻常常會(huì)專(zhuān)注在任務(wù)完成和獎(jiǎng)勵(lì)上,從這個(gè)角度去優(yōu)化深度神經(jīng)網(wǎng)絡(luò)的構(gòu)造。 2023年發(fā)表的一篇新論文中,DeepMind則針對(duì)大腦中的回放(replay)機(jī)制,提出這是一種組合計(jì)算的方式,能夠衍生出新的學(xué)問(wèn),在神經(jīng)網(wǎng)絡(luò)中整合回放機(jī)制,有望讓AI用極少的數(shù)據(jù)學(xué)到新東西,進(jìn)步認(rèn)知智能,更接近“智能涌現(xiàn)”。 大腦的聰慧讓人類(lèi)爬上了萬(wàn)物之靈的寶座,AI不靠人工而靠智能,為什么不可能呢? 當(dāng)初OpenAI要走NLP這條“冷門(mén)”的路,很多人也覺(jué)得不可能,直到產(chǎn)品雖不成熟、但才能非常冷艷的ChatGPT呈現(xiàn),人們才開(kāi)端紛繁夸獎(jiǎng)OpenAI的長(zhǎng)期主義。這些年DeepMind默默搞的研討,可能就是下一個(gè)“王炸”。 我們都希望中國(guó)AI也能降生影響世界的元?jiǎng)?chuàng)新,其實(shí)AI范疇并沒(méi)有那么多獨(dú)門(mén)秘技,很多靈感或技術(shù)道路都是公開(kāi)的,但我們?yōu)槭裁纯偸锹?tīng)過(guò)就算、見(jiàn)過(guò)就忘呢? 除了靈光一現(xiàn)的idea, OpenAI和DeepMind不時(shí)投入的耐煩,強(qiáng)大的工程才能,前沿研討與商業(yè)化的均衡,也是值得學(xué)習(xí)和自創(chuàng)的。 不能總是百感交集,總是不長(zhǎng)忘性,直到下一個(gè)《震驚!XXX的XXX又推翻世界了》…… |
|