技術(shù)的不足,都可以通過(guò)技術(shù)的手段糾正和彌補(bǔ),畢竟沒有任何技術(shù)是完美無(wú)缺的,更不用說(shuō)剛推出的技術(shù)。無(wú)論有什么缺陷,我們必須正視——大模型孕育的讓人驚嘆的人工智能誕生了。
6年前,當(dāng)AlphaGo在烏鎮(zhèn)打敗被稱為“人類最強(qiáng)棋手”的柯潔時(shí),很多人不由感慨:人工智能遲早要超越人類。
2022年底,一款名為ChatGPT的人工智能聊天應(yīng)用突然火遍互聯(lián)網(wǎng)。ChatGPT不是一個(gè)簡(jiǎn)單的聊天機(jī)器人,更像人們想象中的人工智能——可以理解人類,可以幫人類做更多的事情,比如寫代碼、總結(jié)、翻譯等。同時(shí),以Midjourney為代表的智能繪畫應(yīng)用讓人工智能的應(yīng)用范圍更加廣泛。這一切似乎在告訴我們,人工智能時(shí)代真的到來(lái)了。
人工智能(Artificial Intelligence,AI)是指由計(jì)算機(jī)系統(tǒng)或機(jī)器執(zhí)行的智能行為,包括感知、推理、學(xué)習(xí)、決策和創(chuàng)造等。人工智能的發(fā)展歷史可以追溯到1950年代,當(dāng)時(shí)圖靈提出了著名的圖靈測(cè)試,用于判斷機(jī)器是否具有智能。從那時(shí)起,人工智能經(jīng)歷了多次興衰,涌現(xiàn)出許多重要的理論和技術(shù),如神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等。其中,深度學(xué)習(xí)是近年來(lái)人工智能領(lǐng)域最具影響力的技術(shù)之一,它利用多層神經(jīng)網(wǎng)絡(luò)來(lái)模擬人類大腦的信息處理過(guò)程,從而實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的高效學(xué)習(xí)和表達(dá)。
人工智能從提出到今天已經(jīng)有近百年的歷史,回顧這段歷史我們會(huì)發(fā)現(xiàn),人工智能的發(fā)展可謂一波三折。而今天,我們正站在一個(gè)關(guān)鍵的時(shí)間節(jié)點(diǎn)上,可能會(huì)見證人工智能的一次重大飛躍。
說(shuō)起人工智能,對(duì)這個(gè)領(lǐng)域稍有了解的人都會(huì)知道一個(gè)概念:圖靈測(cè)試。
圖靈測(cè)試的提出者阿蘭·圖靈是生活在上個(gè)世紀(jì)中葉的英國(guó)數(shù)學(xué)家,他不但是一個(gè)數(shù)學(xué)天才,對(duì)機(jī)器和人類思維也非常好奇。他想知道,機(jī)器能不能像人一樣思考呢?不過(guò),那時(shí)候還沒有現(xiàn)代的電腦,只有一些簡(jiǎn)單的機(jī)械計(jì)算器。為了回答這個(gè)問題,圖靈設(shè)計(jì)了一個(gè)思維實(shí)驗(yàn):
讓一個(gè)人(我們可以稱之為C)通過(guò)鍵盤和屏幕跟另外兩個(gè)對(duì)象(我們稱之為A和B)聊天,其中一個(gè)對(duì)象是正常的人類,另一個(gè)對(duì)象是機(jī)器。C不知道A和B哪個(gè)是人哪個(gè)是機(jī)器,他只能通過(guò)提問來(lái)判斷。如果C無(wú)法分辨出A和B的不同,那么就說(shuō)明這臺(tái)機(jī)器具有人類的智能。這個(gè)測(cè)試后來(lái)被稱為“圖靈測(cè)試”。
這個(gè)實(shí)驗(yàn)很有趣,也很有挑戰(zhàn)性。想象一下,如果你是C,你會(huì)問A和B什么問題呢?你會(huì)問他們喜歡什么顏色嗎?會(huì)問他們有沒有朋友嗎?會(huì)問他們?cè)趺纯创澜鐔幔磕阌X得這些問題能夠幫助你區(qū)分出人和機(jī)器嗎?其實(shí),圖靈測(cè)試并不容易通過(guò)。要讓一臺(tái)機(jī)器能夠像人一樣回答各種問題,需要解決很多技術(shù)難題。比如,機(jī)器要能夠理解自然語(yǔ)言,也就是我們平時(shí)說(shuō)話用的語(yǔ)言;機(jī)器要能夠表示知識(shí),也就是存儲(chǔ)和處理各種信息;機(jī)器要能夠進(jìn)行自動(dòng)推理,也就是根據(jù)已知的事實(shí)推出新的結(jié)論;機(jī)器還要能夠進(jìn)行機(jī)器學(xué)習(xí),也就是根據(jù)經(jīng)驗(yàn)不斷改進(jìn)自己的性能。
人工智能先驅(qū)阿蘭·圖靈和早期的計(jì)算機(jī)。
圖靈測(cè)試示意圖
圖靈測(cè)試在那個(gè)年代是不可能完成的任務(wù),在這個(gè)思想實(shí)驗(yàn)提出后,無(wú)數(shù)的數(shù)學(xué)家、科學(xué)家、工程師投入到計(jì)算機(jī)和人工智能領(lǐng)域,試圖創(chuàng)造出能像人類一樣思考的機(jī)器。
1964年,約瑟夫?韋岑鮑姆開發(fā)了ELIZA程序,它是一個(gè)模擬心理治療師的對(duì)話系統(tǒng),能夠用自然語(yǔ)言回答用戶的問題,被認(rèn)為是最早的圖靈測(cè)試候選者之一。
1972年,肯尼斯?科爾比開發(fā)了PARRY程序,這是一個(gè)模擬患有偏執(zhí)型精神分裂癥的對(duì)話系統(tǒng),能夠用自然語(yǔ)言與用戶交流,并表現(xiàn)出一些情緒和個(gè)性特征。后來(lái),PARRY和ELIZA在一個(gè)名為“PARRY遇見ELIZA”的實(shí)驗(yàn)中進(jìn)行了對(duì)話,并成功地欺騙了一些觀察者。
上世紀(jì)80年代,圖靈測(cè)試開始受到一些哲學(xué)家和科學(xué)家的批評(píng)和質(zhì)疑,例如約翰?西爾和羅杰?彭羅斯,他們認(rèn)為圖靈測(cè)試只是考察了機(jī)器的模仿能力,并不能真正反映機(jī)器的思維、理解和意識(shí)。
1990年,雨果?德?加里斯創(chuàng)立洛布納爾杯(Loebner Prize),這是一個(gè)每年舉辦的圖靈測(cè)試競(jìng)賽,旨在評(píng)選出最能通過(guò)圖靈測(cè)試的對(duì)話系統(tǒng)。該競(jìng)賽至今仍在進(jìn)行中,但也受到了一些人工智能研究者的批評(píng)和抵制。
2014年,尤金?古斯特曼(Eugene Goostman)程序宣稱通過(guò)了圖靈測(cè)試,這是一個(gè)模擬13歲烏克蘭男孩的對(duì)話系統(tǒng),能夠用英語(yǔ)與用戶聊天,并利用其年齡和背景作為借口來(lái)掩蓋其不足之處。然而,這一結(jié)果也受到了一些質(zhì)疑和爭(zhēng)議。
2022年底ChatGPT出現(xiàn)之后,很多人認(rèn)為它已經(jīng)可以通過(guò)圖靈測(cè)試了,他們認(rèn)為,ChatGPT表現(xiàn)出來(lái)的那些明顯區(qū)別于人類的特征,是其發(fā)明者故意留下的破綻。也許吧,畢竟你在和ChatGPT對(duì)話的時(shí)候,經(jīng)常會(huì)誤認(rèn)為對(duì)方是人類。
圖靈測(cè)試的提出成為現(xiàn)代人工智能研究的濫觴,但人類對(duì)人工智能(或曰機(jī)器智能)的興趣很早就出現(xiàn)了。在古希臘神話中,有一個(gè)叫做塔洛斯(Talos)的青銅巨人,是宙斯贈(zèng)送給克里特島國(guó)王米諾斯的禮物,用來(lái)保衛(wèi)島嶼。塔洛斯每天繞著島嶼跑三圈,用熾熱的身體和巨石攻擊敵人。他的身體里有一根青銅管道,從頭到腳流動(dòng)著一種叫伊卡洛斯(Ichor)的神奇的液體,是神靈的血液。塔洛斯的腳踝上有一個(gè)螺栓,如果擰開了,伊卡洛斯就會(huì)流出來(lái),塔洛斯就會(huì)死亡。這個(gè)故事可以說(shuō)是最早的機(jī)器人和人工智能的想象之一。
中世紀(jì)的歐洲,有一位名叫阿爾貝圖斯·馬格努斯(Albertus Magnus)的神學(xué)家和哲學(xué)家,據(jù)說(shuō)他用黃金和黏土制造了一個(gè)會(huì)說(shuō)話的自動(dòng)人偶,并用星相術(shù)賦予了它生命。這個(gè)自動(dòng)人偶可以回答任何問題,甚至預(yù)言未來(lái)。但是,阿爾貝圖斯的學(xué)生托馬斯·阿奎那(Thomas Aquinas)認(rèn)為這個(gè)自動(dòng)人偶是惡魔的工具,于是用一把錘子把它打碎了。這個(gè)故事反映了中世紀(jì)的人們對(duì)于人工智能的恐懼和排斥。
到了17世紀(jì)末18世紀(jì)初,法國(guó)數(shù)學(xué)家和哲學(xué)家布萊茲·帕斯卡(Blaise Pascal)發(fā)明了一種叫做帕斯卡林(Pascaline)的機(jī)械計(jì)算器,可以進(jìn)行加減法運(yùn)算。這是最早的計(jì)算機(jī)原型之一,也是最早利用機(jī)械原理實(shí)現(xiàn)計(jì)算功能的設(shè)備之一。帕斯卡林對(duì)當(dāng)時(shí)的數(shù)學(xué)和科學(xué)界產(chǎn)生了很大的影響,為后來(lái)的計(jì)算機(jī)科學(xué)奠定了基礎(chǔ),也為人工智能的出現(xiàn)提出了可行性路徑。
再后來(lái),就是阿蘭·圖靈在想象圖靈測(cè)試之后提出了圖靈機(jī)的概念,這是一種抽象的計(jì)算模型,可以模擬任何可計(jì)算函數(shù),圖靈也被稱為“計(jì)算機(jī)科學(xué)之父”和“人工智能之父”,他的研究對(duì)計(jì)算理論和人工智能的發(fā)展都具有奠基性的意義。
人工智能的誕生和發(fā)展與計(jì)算機(jī)技術(shù)相輔相成,又和計(jì)算機(jī)有所不同。人工智能領(lǐng)域非常重要的兩個(gè)概念“控制論”與“神經(jīng)網(wǎng)絡(luò)”誕生在上世紀(jì)中期。1943年,麥卡洛克和皮茨提出了神經(jīng)元的數(shù)學(xué)模型,這是現(xiàn)代人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。1948年,維納提出了“控制論”的概念,認(rèn)為機(jī)器和生物都可以通過(guò)反饋機(jī)制來(lái)實(shí)現(xiàn)自適應(yīng)行為。1951年,圖靈設(shè)計(jì)了一種早期的神經(jīng)網(wǎng)絡(luò)機(jī)器,稱為“圖靈機(jī)器人”,可以玩井字棋游戲。1957年,羅森布拉特發(fā)明了感知機(jī),這是一種單層的神經(jīng)網(wǎng)絡(luò),可以進(jìn)行簡(jiǎn)單的分類任務(wù)。
提到人工智能,給我們留下深刻印象的,可能是1997年IBM的計(jì)算機(jī)“深藍(lán)”打敗國(guó)際象棋大師卡斯帕羅夫、2017年AlphaGo打敗柯潔。事實(shí)上,人工智能發(fā)展史上,下棋一直是其重要的能力。1950年,信息論創(chuàng)始人香農(nóng)提出了計(jì)算機(jī)博弈的理論,并設(shè)計(jì)了一個(gè)下國(guó)際象棋的程序。1951年,塞繆爾開發(fā)了一個(gè)下跳棋的程序,這是首個(gè)能夠從自己的經(jīng)驗(yàn)中學(xué)習(xí)的程序。1956年,紐厄爾和西蒙開發(fā)了一個(gè)下西洋跳棋的程序,并在達(dá)特茅斯會(huì)議上展示了它。
1997年,IBM的計(jì)算機(jī)“深藍(lán)”打敗國(guó)際象棋大師卡斯帕羅夫。
1950年圖靈測(cè)試的提出,讓人工智能有了更簡(jiǎn)單(但技術(shù)上更難)的測(cè)試標(biāo)準(zhǔn)。1955年,紐厄爾、西蒙和肖開發(fā)了一個(gè)叫做“邏輯理論家”的程序,是第一個(gè)能夠用符號(hào)邏輯進(jìn)行推理和證明定理的程序。這個(gè)程序被認(rèn)為是第一個(gè)真正意義上的人工智能程序,并為后來(lái)的符號(hào)主義學(xué)派奠定了基礎(chǔ)。
在上世紀(jì)中葉,人工智能已經(jīng)成為非常熱門的學(xué)術(shù)話題,很多科學(xué)家、數(shù)學(xué)家都參與其中。在這樣的背景下,1956年,在達(dá)特茅斯學(xué)院舉行了一次歷史性的會(huì)議,會(huì)議由麥卡錫、明斯基、羅切斯特和肖組織,許多后來(lái)成為人工智能領(lǐng)域領(lǐng)軍者的人物都參加了這次會(huì)議,如紐厄爾、西蒙、塞繆爾等。達(dá)特茅斯會(huì)議在當(dāng)時(shí)看來(lái)可謂波瀾不驚,但在這次會(huì)議上正式使用了“人工智能”(Artificial Intelligence,AI)這個(gè)術(shù)語(yǔ),并確定了將AI作為一個(gè)獨(dú)立學(xué)科的研究方向和目標(biāo)。
達(dá)特茅斯會(huì)議是人工智能史上一次重要事件。
達(dá)特茅斯會(huì)議之后,從1956年到1974年,人工智能領(lǐng)域取得了許多重大的突破和創(chuàng)新,也吸引了大量的資金和人才。
1957年,羅森布拉特提出了模擬人腦神經(jīng)網(wǎng)絡(luò)的感知機(jī)模型;1964年,約瑟夫·韋岑鮑姆開發(fā)了ELIZA程序;1965年,美國(guó)科學(xué)家愛德華?費(fèi)恩波姆等人成功研制出化學(xué)分析專家系統(tǒng)DENDRAL,這是第一套有效進(jìn)行工作的專家系統(tǒng);1968年,美國(guó)斯坦福國(guó)際咨詢研究所研發(fā)成功世界上第一臺(tái)智能機(jī)器人Shakey,它具備一定程度的人工智能,能夠自主進(jìn)行感知、環(huán)境建模、行為規(guī)劃并執(zhí)行任務(wù);1972年,斯坦福大學(xué)教授特里·溫諾格拉德開發(fā)了一個(gè)名為SHRDLU的程序,可以用自然語(yǔ)言理解和回答一個(gè)有關(guān)虛擬世界中物體和動(dòng)作的問題……
因?yàn)橥黄祁l頻,1956年到1974年被稱為“人工智能的黃金時(shí)代”,而在黃金時(shí)代中也暗藏危機(jī)。1966年,美國(guó)國(guó)防部資助了一項(xiàng)試圖利用計(jì)算機(jī)進(jìn)行自動(dòng)翻譯的研究項(xiàng)目,該項(xiàng)目的目標(biāo)是將俄語(yǔ)的科技文獻(xiàn)翻譯成英語(yǔ),以便美國(guó)獲取蘇聯(lián)的科技信息,項(xiàng)目由美國(guó)科學(xué)院的語(yǔ)言自動(dòng)處理咨詢委員會(huì)(ALPAC)進(jìn)行評(píng)估和監(jiān)督。
1956年到1974年被稱為“人工智能的黃金時(shí)代”
然而,該項(xiàng)目的結(jié)果并不令人滿意——機(jī)器翻譯的質(zhì)量低下、速度緩慢、成本高昂且無(wú)法處理語(yǔ)言的復(fù)雜性和多樣性。1966年11月,ALPAC公布了一份名為《語(yǔ)言與機(jī)器》的報(bào)告,全面否定了機(jī)器翻譯的可行性和前景,認(rèn)為“在近期或可以預(yù)見的未來(lái),開發(fā)出實(shí)用的機(jī)器翻譯系統(tǒng)是沒有指望的”。報(bào)告建議停止對(duì)機(jī)器翻譯項(xiàng)目的資金支持,轉(zhuǎn)而投入到詞典和語(yǔ)料庫(kù)的開發(fā)上。這個(gè)事件標(biāo)志著人工智能低谷期的到來(lái)。
1973年,英國(guó)政府委托數(shù)學(xué)家詹姆斯·萊特希爾對(duì)英國(guó)的人工智能研究進(jìn)行一項(xiàng)評(píng)估。詹姆斯·萊特希爾在評(píng)估報(bào)告中對(duì)人工智能的前景持悲觀態(tài)度,認(rèn)為人工智能研究者的承諾過(guò)于夸大,沒有實(shí)現(xiàn)預(yù)期的影響和效果。報(bào)告還將人工智能分為兩類:一類是基于數(shù)學(xué)和邏輯的人工智能,如自動(dòng)推理、定理證明等;另一類是基于模擬人類認(rèn)知過(guò)程的人工智能,如自然語(yǔ)言理解、圖像識(shí)別等。報(bào)告認(rèn)為,前者雖然有一定的價(jià)值,但難以應(yīng)用于實(shí)際問題;后者則是不切實(shí)際的幻想,無(wú)法實(shí)現(xiàn)。
萊特希爾報(bào)告的發(fā)布對(duì)英國(guó)的人工智能研究造成嚴(yán)重的打擊,導(dǎo)致政府和企業(yè)對(duì)人工智能的資助和支持大幅減少。報(bào)告也影響了其他國(guó)家對(duì)人工智能的態(tài)度和投入,加劇了人工智能領(lǐng)域的低谷期。
從1980年到1987年左右,人工智能受到日本政府的第五代計(jì)算機(jī)計(jì)劃的刺激,專家系統(tǒng)得到廣泛的應(yīng)用和贊譽(yù),知識(shí)表示和推理也取得進(jìn)展,同時(shí)聯(lián)結(jié)主義也得到重生,出現(xiàn)了反向傳播算法和神經(jīng)網(wǎng)絡(luò)等,由此進(jìn)入一段繁榮期。但由于日本第五代計(jì)算機(jī)項(xiàng)目未能達(dá)到預(yù)期目標(biāo)、神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)被發(fā)現(xiàn)難以克服的弱點(diǎn)、經(jīng)濟(jì)衰退等因素,從1987年起,人工智能開始進(jìn)入第二次低谷期。
日本第五代計(jì)算機(jī)項(xiàng)目在1982年啟動(dòng),旨在制造出能夠與人對(duì)話、翻譯語(yǔ)言、解釋圖像,并且能像人一樣推理的機(jī)器,但在1992年結(jié)束時(shí),只取得了有限的成果。神經(jīng)網(wǎng)絡(luò)在1986年被重新發(fā)現(xiàn)并引起了一股熱潮,但很快被發(fā)現(xiàn)存在過(guò)擬合、局部最優(yōu)等問題。專家系統(tǒng)在20世紀(jì)80年代初期也取得了一些商業(yè)成功,但后來(lái)被發(fā)現(xiàn)難以維護(hù)、擴(kuò)展和泛化。此外,20世紀(jì)80年代末期的經(jīng)濟(jì)衰退也影響了對(duì)人工智能的投資和需求。
這次低谷期一直持續(xù)到1993年。1993年后,人工智能發(fā)展進(jìn)入了平穩(wěn)期。從那時(shí)起到2010年這段時(shí)間,互聯(lián)網(wǎng)在全世界范圍內(nèi)普及開來(lái),全球進(jìn)入信息時(shí)代。
互聯(lián)網(wǎng)飛速發(fā)展的20年,計(jì)算機(jī)技術(shù)也一直沿著摩爾定律穩(wěn)步前進(jìn)。人工智能的發(fā)展雖然相對(duì)緩慢,沒有出現(xiàn)太多的突破性成果,但互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù)的發(fā)展也為后來(lái)的深度學(xué)習(xí)和大數(shù)據(jù)等技術(shù)的興起奠定了基礎(chǔ)。在這段時(shí)間里,深度學(xué)習(xí)、大數(shù)據(jù)、云計(jì)算技術(shù)都取得了相當(dāng)不錯(cuò)的成果,受其影響,人工智能在感知、交互、認(rèn)知等方面都有了重大的突破和進(jìn)展,從而又一次進(jìn)入了繁榮期。
人工智能第三次繁榮期的標(biāo)志性事件是,2011年IBM的超級(jí)計(jì)算機(jī)沃森(Watson)在美國(guó)電視節(jié)目《危險(xiǎn)邊緣》(Jeopardy!)上擊敗了兩位人類冠軍,展示了自然語(yǔ)言理解和問答系統(tǒng)的能力。緊接著,2012年,AlexNet在ImageNet圖像識(shí)別挑戰(zhàn)賽上大幅提高了準(zhǔn)確率,引發(fā)了深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的熱潮。而我們熟知的AlphaGo打敗李世石和柯潔,則緣起于2014年谷歌收購(gòu)DeepMind公司,后者開發(fā)了一種可以自主學(xué)習(xí)玩各種電子游戲的強(qiáng)化學(xué)習(xí)算法,這種算法催生了后來(lái)的AlphaGo,并在2016年和2017年兩戰(zhàn)“封神”。
在語(yǔ)音語(yǔ)義方面,2015年微軟和百度分別宣布他們的語(yǔ)音識(shí)別系統(tǒng)達(dá)到了人類水平;2017年,阿里巴巴和微軟分別宣布他們的機(jī)器翻譯系統(tǒng)在中英文互譯上達(dá)到了人類水平;2018年,OpenAI發(fā)布了一種可以自主生成任意文本的自然語(yǔ)言生成系統(tǒng)GPT;2019年,谷歌發(fā)布了一種可以玩《星際爭(zhēng)霸2》等復(fù)雜策略游戲的強(qiáng)化學(xué)習(xí)系統(tǒng)AlphaStar;2020年,OpenAI發(fā)布了GPT-3,一種可以根據(jù)任意輸入生成各種類型文本的自然語(yǔ)言生成系統(tǒng);2022年底,ChatGPT公開上線,一個(gè)人工智能的新時(shí)代到來(lái)了。
從2011年起,人工智能的發(fā)展進(jìn)入了蓬勃期,這個(gè)時(shí)期的主要技術(shù)包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)與大型語(yǔ)言模型等,正是這些技術(shù)催生了AlphaGo以及ChatGPT。我們要理解當(dāng)前的人工智能,就需要對(duì)這些技術(shù)有簡(jiǎn)單的了解。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種分支,它使用多層的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行表征學(xué)習(xí),也就是從數(shù)據(jù)中提取出有用的特征和概念,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的多層抽象。深度學(xué)習(xí)可以處理各種類型的數(shù)據(jù),如圖像、語(yǔ)音、文本、音頻等,并將其轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)可以理解和處理的數(shù)值向量。深度學(xué)習(xí)的優(yōu)勢(shì)在于它可以自動(dòng)地從數(shù)據(jù)中學(xué)習(xí)特征,而不需要人工地設(shè)計(jì)或選擇特征,這樣可以減少人為的偏差和錯(cuò)誤,并提高模型的泛化能力。
深度學(xué)習(xí)圖示
深度學(xué)習(xí)和大模型之間有著密切的聯(lián)系,因?yàn)榇竽P褪巧疃葘W(xué)習(xí)的一種發(fā)展方向,也是一種解決深度學(xué)習(xí)中存在的問題(如梯度消失、過(guò)擬合、泛化能力等)的方法。深度學(xué)習(xí)和大模型也受到神經(jīng)科學(xué)和認(rèn)知科學(xué)的啟發(fā),試圖模擬人類大腦中神經(jīng)元和信息處理的方式。
大模型是指使用大量參數(shù)的神經(jīng)網(wǎng)絡(luò),通常達(dá)到了百億甚至萬(wàn)億的規(guī)模。大模型可以利用更多的數(shù)據(jù)和計(jì)算資源來(lái)提高深度學(xué)習(xí)的性能,同時(shí)也具備自監(jiān)督學(xué)習(xí)的功能,可以減少數(shù)據(jù)標(biāo)注的成本和提高小樣本學(xué)習(xí)的能力。大模型也被稱為基礎(chǔ)模型或基石模型,因?yàn)樗鼈兛梢宰鳛橥ㄓ玫念A(yù)訓(xùn)練模型,再通過(guò)微調(diào)來(lái)適應(yīng)不同的下游任務(wù)。例如,在自然語(yǔ)言處理領(lǐng)域,GPT-3就是一個(gè)典型的大模型,它使用了1750億個(gè)參數(shù),并在45TB的文本數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,然后可以通過(guò)簡(jiǎn)單地改變輸入格式或添加少量標(biāo)簽數(shù)據(jù)來(lái)完成各種語(yǔ)言任務(wù),如文本生成、問答、摘要、翻譯等。GPT-4的參數(shù)更是達(dá)到了3.5萬(wàn)億,是GPT-3的20倍。
深度學(xué)習(xí)和大模型已經(jīng)在很多領(lǐng)域中取得了令人矚目的應(yīng)用和成果。比如在計(jì)算機(jī)視覺領(lǐng)域,深度學(xué)習(xí)和大模型可以實(shí)現(xiàn)高精度的圖像分類、目標(biāo)檢測(cè)、人臉識(shí)別、圖像生成、圖像風(fēng)格遷移等任務(wù);在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)和大模型可以實(shí)現(xiàn)高效準(zhǔn)確的語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音、語(yǔ)音合成、語(yǔ)音翻譯等任務(wù);在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)和大模型可以實(shí)現(xiàn)多樣化豐富的語(yǔ)言任務(wù),如文本理解、文本生成、問答、摘要、翻譯等。以上只是一些代表性的例子,實(shí)際上深度學(xué)習(xí)和大模型還有很多其他的應(yīng)用和成果,如音樂生成、藝術(shù)創(chuàng)作、醫(yī)療診斷、智能交通等等。
深度學(xué)習(xí)和大模型雖然已經(jīng)取得了很多令人驚嘆的成就,但是它們也面臨著一些機(jī)遇和挑戰(zhàn)。
一方面,深度學(xué)習(xí)和大模型有著巨大的潛力和前景。隨著數(shù)據(jù)量和計(jì)算資源的增加,深度學(xué)習(xí)和大模型可以不斷地提升自己的性能和能力,并拓展更多的應(yīng)用領(lǐng)域和場(chǎng)景。深度學(xué)習(xí)和大模型也可以與其他技術(shù)相結(jié)合,如強(qiáng)化學(xué)習(xí)、知識(shí)圖譜、聯(lián)邦學(xué)習(xí)等,形成更強(qiáng)大和更智能的系統(tǒng)和平臺(tái)。深度學(xué)習(xí)和大模型也可以為人類社會(huì)和科技進(jìn)步帶來(lái)巨大的價(jià)值和意義,如提高生產(chǎn)效率、改善生活質(zhì)量、促進(jìn)教育公平、保護(hù)環(huán)境資源等。
另一方面,深度學(xué)習(xí)和大模型也存在著一些問題和風(fēng)險(xiǎn)。比如,深度學(xué)習(xí)和大模型需要消耗大量的數(shù)據(jù)和計(jì)算資源,這會(huì)帶來(lái)高昂的成本和環(huán)境影響——據(jù)估計(jì),訓(xùn)練GPT-3所需的電力相當(dāng)于5000輛汽車一年的碳排放量。深度學(xué)習(xí)和大模型可能缺乏可解釋性和可信度,這會(huì)導(dǎo)致模型的不可靠和不可控,例如,由于數(shù)據(jù)中存在的偏見或噪聲,深度學(xué)習(xí)和大模型可能產(chǎn)生錯(cuò)誤或不道德的結(jié)果,如歧視、誤導(dǎo)、欺騙等。
當(dāng)然,這些只是技術(shù)的不足,都可以通過(guò)技術(shù)的手段糾正和彌補(bǔ),畢竟沒有任何技術(shù)是完美無(wú)缺的,更不用說(shuō)剛剛推出的新技術(shù)。無(wú)論有什么缺陷,我們必須正視——大模型孕育的讓人驚嘆的人工智能誕生了。目前,人工智能已經(jīng)在教育、數(shù)字創(chuàng)意、醫(yī)療、交通等領(lǐng)域展示出了強(qiáng)大的能力,更不用說(shuō)我們?nèi)粘_M(jìn)行的聊天、繪畫了。
可能還有很多人沒體驗(yàn)過(guò)ChatGPT(以及類似的AI應(yīng)用),會(huì)認(rèn)為這類生成式AI不過(guò)是根據(jù)用戶的文字進(jìn)行上下文搜索,本質(zhì)上還是以大數(shù)據(jù)和大模型為基礎(chǔ)的“猜字游戲”,并不具備邏輯思維能力,更沒有意識(shí)。這種看法也許沒錯(cuò),但ChatGPT的能力可能已經(jīng)超越很多人的想象了。
獵豹移動(dòng)CEO傅盛本來(lái)也是持有這種看法的人,后來(lái)他和ChatGPT的一次對(duì)話徹底改變了其看法。他告訴ChatGPT,他的狗名叫三萬(wàn),問它為什么會(huì)給自己的狗取這樣一個(gè)名字。在ChatGPT說(shuō)了一些給寵物取名可能的原因之后,傅盛補(bǔ)充,他的狗是收養(yǎng)的,因?yàn)楣钦圩鲞^(guò)手術(shù)。然后ChatGPT回答:你可能因?yàn)榻o狗做手術(shù)花了三萬(wàn)塊錢,為紀(jì)念這次手術(shù)給狗取了這個(gè)名字。傅盛非常驚訝,他在社交平臺(tái)上發(fā)文稱:“這不是內(nèi)容的重新整理,而是基于常識(shí)的推理!頭皮發(fā)麻啊,這種推理能力本來(lái)業(yè)界認(rèn)為幾乎不可實(shí)現(xiàn)!圖靈測(cè)試肯定是能通過(guò)了,關(guān)鍵這才剛剛開始……”
ChatGPT的出現(xiàn),開啟了人工智能的新時(shí)代。
是的,現(xiàn)在基于大模型的生成式人工智能已經(jīng)可以做到基于事實(shí)進(jìn)行合理的邏輯推理了,我們雖然不能稱其為“理解人類語(yǔ)言”,但在用戶的使用感受上來(lái)說(shuō),這是完全不同于過(guò)去“人工智障”的真正的人工智能。而對(duì)于過(guò)去我們一直使用的計(jì)算機(jī)應(yīng)用來(lái)說(shuō),它們甚至連人工智障都算不上。
同樣是計(jì)算機(jī)技術(shù),為什么我們不把普通的計(jì)算機(jī)應(yīng)用稱為人工智能?主要原因是,普通的計(jì)算機(jī)應(yīng)用并不具備像人類那樣思考的能力,而人工智能具備(或者說(shuō)需要具備)。如果要讓計(jì)算機(jī)像人類那樣思考,就必須讓其理解人類的大腦是如何工作的。因此,人工智能的發(fā)展離不開腦神經(jīng)和認(rèn)知神經(jīng)科學(xué)。
簡(jiǎn)單地說(shuō),人工智能是利用計(jì)算機(jī)和數(shù)學(xué)來(lái)模擬和實(shí)現(xiàn)人類或動(dòng)物的智能行為,比如視覺、語(yǔ)言、推理等;腦神經(jīng)科學(xué)是研究大腦的結(jié)構(gòu)、功能和機(jī)制,探索大腦如何處理信息和產(chǎn)生行為;認(rèn)知神經(jīng)科學(xué)是腦神經(jīng)科學(xué)的一個(gè)分支,它主要關(guān)注大腦如何支持認(rèn)知過(guò)程,比如注意力、記憶、情感等。這兩個(gè)領(lǐng)域之間有很多交叉和互動(dòng),可以說(shuō)是相互啟發(fā)、相互促進(jìn)的。一方面,人工智能可以借鑒大腦的原理和方法來(lái)設(shè)計(jì)更好的算法和系統(tǒng),比如深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)就是受到人類視覺系統(tǒng)的啟發(fā)。另一方面,人工智能也可以為腦神經(jīng)科學(xué)提供新的工具和思路來(lái)分析和模擬大腦的數(shù)據(jù)和過(guò)程,比如使用機(jī)器學(xué)習(xí)來(lái)識(shí)別大腦活動(dòng)的模式。
人工智能目前還不能完全模擬大腦的復(fù)雜性和靈活性,也不能解釋大腦的內(nèi)在邏輯和意義。腦神經(jīng)科學(xué)目前還不能完全揭示大腦的結(jié)構(gòu)和功能,也不能預(yù)測(cè)大腦的行為和結(jié)果。這些問題需要更多的研究和探索,也需要更多的合作和交流。也許將來(lái),我們將會(huì)研究清楚人類的大腦和認(rèn)知,創(chuàng)造出真正媲美人類大腦的計(jì)算機(jī)智能。
違法和不良信息舉報(bào)投訴電話:0377-62377728 舉報(bào)郵箱:fbypt@m.4729d.com
網(wǎng)絡(luò)警察提醒你 a>
中國(guó)互聯(lián)網(wǎng)舉報(bào)中心
網(wǎng)絡(luò)舉報(bào)APP下載
掃黃打非網(wǎng)舉報(bào)專區(qū)