當AlphaGo 落(là)下(xià)第(dì)一(yī)子開(kāi)始,无論勝負,这(zhè)款執行着诸多(duō)科学家(jiā)意(yì)志的(de)人(rén)工智能(néng)産品的(de)“本(běn)體(tǐ)”都很值得玩味。无論多(duō)麼(me)高(gāo)深的(de)科技,都由(yóu)硬(yìng)件(jiàn)打(dǎ)造而(ér)成(chéng),或(huò)许AlphaGo 的(de)本(běn)體(tǐ)也(yě)可(kě)以(yǐ)被(bèi)看(kàn)做是(shì)一(yī)種(zhǒng)新型棋具。
Alpha Go的(de)思(sī)路(lù)與(yǔ)此(cǐ)前(qián)的(de)思(sī)路(lù)有(yǒu)何不(bù)同(tóng)?
在(zài)AlphaGo之前(qián),Google也(yě)開(kāi)發(fà)了(le)利用(yòng)深度(dù)学習進(jìn)行簡單紅(hóng)白機(jī)遊戏对(duì)戰的(de)人(rén)工智能(néng)技術(shù)。Linkface聯合創始人(rén)石(dàn)建萍認为(wèi),深度(dù)学習技術(shù)验(yàn)證了(le)这(zhè)樣(yàng)大數據(jù)輸入(rù)直(zhí)接預测一(yī)个(gè)複雜問(wèn)題(tí)是(shì)可(kě)行的(de),之後(hòu)很多(duō)問(wèn)題(tí)的(de)解(jiě)決其实都是(shì)利用(yòng)了(le)这(zhè)个(gè)先(xiān)验(yàn),包(bāo)括圍棋技術(shù)。AlphaGo的(de)圍棋AI实際上(shàng)是(shì)在(zài)圍棋这(zhè)个(gè)特(tè)定(dìng)問(wèn)題(tí)上(shàng)用(yòng)深度(dù)学習的(de)思(sī)路(lù)建模,并通(tòng)过(guò)Google強(qiáng)大的(de)計(jì)算資源不(bù)斷進(jìn)行訓練。
石(dàn)建萍介紹道(dào),在(zài)IBM“深藍(lán)”时(shí)期(qī),人(rén)工智能(néng)实際上(shàng)還(huán)是(shì)人(rén)總(zǒng)結規律,用(yòng)算法实現(xiàn)規律,用(yòng)高(gāo)性(xìng)能(néng)計(jì)算硬(yìng)件(jiàn)来(lái)進(jìn)行計(jì)算的(de)时(shí)期(qī)。“深藍(lán)”在(zài)象(xiàng)棋上(shàng)的(de)算法,主(zhǔ)要(yào)依靠強(qiáng)大的(de)計(jì)算能(néng)力窮舉所(suǒ)有(yǒu)路(lù)數来(lái)選擇最(zuì)佳策略,再加上(shàng)对(duì)一(yī)些明(míng)顯選擇的(de)判斷来(lái)縮小窮舉範圍。而(ér)象(xiàng)棋棋盤較小,可(kě)能(néng)的(de)策略較少(shǎo),所(suǒ)以(yǐ)當时(shí)的(de)人(rén)工智能(néng)利用(yòng)这(zhè)種(zhǒng)暴力的(de)做法是(shì)可(kě)以(yǐ)戰勝人(rén)類(lèi)的(de)。但是(shì)面(miàn)对(duì)圍棋这(zhè)種(zhǒng)可(kě)能(néng)的(de)策略非(fēi)常多(duō)的(de)情(qíng)況,基于(yú)類(lèi)似窮舉方(fāng)案(àn)的(de)算法就(jiù)无能(néng)为(wèi)力了(le)。
打(dǎ)造AlphaGo需要(yào)怎樣(yàng)的(de)硬(yìng)件(jiàn)配置
早(zǎo)在(zài)20世紀90年(nián)代(dài),深度(dù)学習的(de)概念就(jiù)被(bèi)提(tí)出(chū),但是(shì)由(yóu)于(yú)計(jì)算硬(yìng)件(jiàn)平台(tái)的(de)限制,大家(jiā)沒(méi)有(yǒu)辦(bàn)法訓練足够深的(de)深度(dù)学習网(wǎng)絡。这(zhè)个(gè)驚为(wèi)天(tiān)人(rén)的(de)想(xiǎng)法也(yě)因(yīn)此(cǐ)被(bèi)雪(xuě)藏了(le)10多(duō)年(nián)。目前(qián)被(bèi)頂級公司和(hé)研究界使用(yòng)的(de)硬(yìng)件(jiàn)平台(tái)大致(zhì)分(fēn)为(wèi)三(sān)類(lèi),單機(jī)單卡(kǎ)或(huò)多(duō)卡(kǎ)GPU、GPU集群(qún)、CPU集群(qún)。使用(yòng)FPGA加速深度(dù)学習也(yě)是(shì)目前(qián)業界和(hé)研究界的(de)热(rè)門(mén)方(fāng)向(xiàng)。
硬(yìng)件(jiàn)配置和(hé)具體(tǐ)的(de)任务有(yǒu)關(guān)。例如(rú),CPU集群(qún)适合解(jiě)決稀疏鍊(liàn)接的(de)顯存无法容納的(de)大模型。如(rú)果(guǒ)有(yǒu)問(wèn)題(tí)需要(yào)这(zhè)樣(yàng)的(de)网(wǎng)絡,就(jiù)会(huì)对(duì)对(duì)應(yìng)的(de)硬(yìng)件(jiàn)平台(tái)有(yǒu)所(suǒ)需求。目前(qián)計(jì)算機(jī)視覺和(hé)機(jī)器学習的(de)大部(bù)分(fēn)應(yìng)用(yòng)都可(kě)以(yǐ)用(yòng)單機(jī)多(duō)卡(kǎ)GPU来(lái)得到(dào)業界頂尖的(de)成(chéng)績。
計(jì)算機(jī)視覺界四(sì)大天(tiān)王之一(yī)Yann Lecun在(zài)去(qù)年(nián)5月(yuè)的(de)采訪中(zhōng)提(tí)及(jí)“盡管(guǎn)普遍(biàn)猜测Google擁有(yǒu)GPU的(de)數量(liàng)在(zài)8000个(gè)左(zuǒ)右(yòu),但事(shì)实上(shàng)遠(yuǎn)遠(yuǎn)不(bù)止,而(ér)且随着图(tú)片(piàn)、視頻數據(jù)集的(de)不(bù)斷增长,GPU的(de)規模還(huán)在(zài)擴大。”
硬(yìng)件(jiàn)技術(shù)的(de)進(jìn)步是(shì)人(rén)工智能(néng)算法研發(fà)得以(yǐ)推進(jìn)的(de)基礎。SenseTime 异(yì)構并行計(jì)算總(zǒng)監刘文(wén)志表(biǎo)示,圍棋之類(lèi)運算需要(yào)使用(yòng)神經(jīng)网(wǎng)絡和(hé)蒙特(tè)卡(kǎ)羅辦(bàn)法来(lái)決定(dìng)下(xià)一(yī)步的(de)落(là)子,这(zhè)需要(yào)大量(liàng)的(de)求解(jiě)和(hé)搜索解(jiě)空間(jiān),GPU是(shì)神經(jīng)网(wǎng)絡的(de)很好(hǎo)的(de)加速器,而(ér)需要(yào)進(jìn)行大量(liàng)邏輯判斷的(de)蒙特(tè)卡(kǎ)羅方(fāng)法則更(gèng)适合CPU。從AlphaGo和(hé)“异(yì)構神機(jī)”的(de)相關(guān)報道(dào)来(lái)说(shuō),刘文(wén)志認为(wèi)它(tā)们(men)都使用(yòng)了(le)GPU+CPU 来(lái)搭建計(jì)算平台(tái)。
最(zuì)近(jìn)些年(nián)基于(yú)深度(dù)学習的(de)人(rén)工智能(néng),已經(jīng)完全(quán)摒棄了(le)之前(qián)基于(yú)規則的(de)方(fāng)案(àn),通(tòng)过(guò)給(gěi)定(dìng)的(de)輸入(rù)輸出(chū),新的(de)学習方(fāng)案(àn)可(kě)以(yǐ)自(zì)動(dòng)学習得到(dào)給(gěi)定(dìng)輸出(chū)需要(yào)經(jīng)过(guò)的(de)運算。在(zài)大量(liàng)訓練數據(jù)的(de)指導下(xià),性(xìng)能(néng)不(bù)斷提(tí)升(shēng)。AlphaGo 自(zì)我(wǒ)对(duì)弈的(de)訓練量(liàng)多(duō)大3000万(wàn)盤,每一(yī)盤均堪稱高(gāo)手(shǒu)对(duì)決。诸多(duō)人(rén)類(lèi)高(gāo)手(shǒu)窮其一(yī)生(shēng)都无法企及(jí)的(de)訓練量(liàng),AlphaGo在(zài)短(duǎn)短(duǎn)幾(jǐ)年(nián)的(de)时(shí)間(jiān)內(nèi)就(jiù)可(kě)以(yǐ)完成(chéng)。
當然,從目前(qián)的(de)狀況来(lái)说(shuō),限制普通(tòng)人(rén)體(tǐ)验(yàn)到(dào)AlphaGo这(zhè)類(lèi)人(rén)工智能(néng)的(de)瓶颈仍旧(jiù)是(shì)硬(yìng)件(jiàn)。資料顯示:“目前(qián)百(bǎi)万(wàn)級的(de)訓練數據(jù)借(jiè)助GPU一(yī)般都能(néng)在(zài)幾(jǐ)天(tiān)內(nèi)完成(chéng)訓練;实際使用(yòng)时(shí),利用(yòng)GPU也(yě)可(kě)以(yǐ)在(zài)幾(jǐ)十(shí)毫(háo)秒(miǎo)內(nèi)完成(chéng)預测”。对(duì)于(yú)普通(tòng)学生(shēng)来(lái)说(shuō),如(rú)果(guǒ)想(xiǎng)單槍匹(pǐ)马研究深度(dù)学習,單硬(yìng)件(jiàn)配置一(yī)項就(jiù)耗資不(bù)菲;对(duì)于(yú)移動(dòng)端来(lái)说(shuō),无論是(shì)存儲容量(liàng)還(huán)是(shì)計(jì)算能(néng)力,更(gèng)是(shì)无法同(tóng)台(tái)式機(jī)或(huò)服(fú)务器的(de)GPU比,深度(dù)学習幾(jǐ)乎无法在(zài)移動(dòng)端的(de)應(yìng)用(yòng)。对(duì)于(yú)普通(tòng)人(rén)来(lái)说(shuō),想(xiǎng)和(hé)真(zhēn)正(zhèng)的(de)人(rén)工智能(néng)高(gāo)手(shǒu)較量(liàng)一(yī)番(fān),仍需要(yào)等待一(yī)些时(shí)日(rì)。
如(rú)果(guǒ)说(shuō)圍棋爱(ài)好(hǎo)者(zhě)过(guò)分(fēn)追求棋具是(shì)舍本(běn)求末(mò),那(nà)似乎也(yě)只(zhī)有(yǒu)人(rén)工智能(néng)才能(néng)做到(dào)不(bù)甚關(guān)注这(zhè)些“藝術(shù)品”,“全(quán)情(qíng)投入(rù)”在(zài)棋局(jú)中(zhōng)。由(yóu)人(rén)類(lèi)壟斷对(duì)弈名局(jú)的(de)日(rì)子一(yī)去(qù)不(bù)複返,流傳千(qiān)年(nián)的(de)人(rén)類(lèi)智慧和(hé)情(qíng)感(gǎn)的(de)寄托被(bèi)古井无波(bō)的(de)程序所(suǒ)取(qǔ)代(dài),未来(lái)无論是(shì)谁面(miàn)对(duì)这(zhè)位新晉的(de)“大魔王”棋手(shǒu)之时(shí),定(dìng)会(huì)心(xīn)存芥蒂。
















