许多(duō)高(gāo)性(xìng)能(néng)計(jì)算用(yòng)例(例如(rú)深度(dù)学習)通(tòng)常依賴于(yú)浮點(diǎn)運算 - 这(zhè)是(shì)GPU非(fēi)常擅长的(de)。过(guò)去(qù),FPGA对(duì)浮點(diǎn)計(jì)算的(de)效率非(fēi)常低,因(yīn)为(wèi)浮點(diǎn)單元(yuán)必須從邏輯块(kuài)組裝(zhuāng),耗費大量(liàng)資源。
較新的(de)FPGA(如(rú)Arria 10和(hé)Stratix 10)在(zài)FPGA架構上(shàng)具有(yǒu)內(nèi)置浮點(diǎn)單元(yuán),使其在(zài)浮點(diǎn)計(jì)算方(fāng)面(miàn)更(gèng)加出(chū)色(sè)。浮點(diǎn)單元(yuán)的(de)增加是(shì)否使FPGA在(zài)能(néng)效方(fāng)面(miàn)对(duì)浮點(diǎn)計(jì)算很有(yǒu)意(yì)義?它(tā)们(men)比GPU更(gèng)节(jié)能(néng)吗?
讓我(wǒ)们(men)将最(zuì)先(xiān)進(jìn)的(de)GPU與(yǔ)最(zuì)先(xiān)進(jìn)的(de)FPGA進(jìn)行比較。目前(qián)最(zuì)快(kuài)的(de)專業GPU是(shì)Tesla V100,其理論最(zuì)大值为(wèi)15 TFLOPS(每秒(miǎo)Tera浮點(diǎn)運算,测量(liàng)浮點(diǎn)性(xìng)能(néng)的(de)标(biāo)準方(fāng)法),功耗約为(wèi)250瓦(wǎ)。現(xiàn)在(zài)最(zuì)好(hǎo)的(de)FPGA板之一(yī)是(shì)Nallatech 520C,它(tā)使用(yòng)Altera / Intel的(de)新Statix 10芯片(piàn)。該卡(kǎ)的(de)理論最(zuì)大值为(wèi)9.2 TFLOPS,功耗約为(wèi)225瓦(wǎ)。
如(rú)果(guǒ)我(wǒ)们(men)比較这(zhè)两(liǎng)个(gè)設備的(de)能(néng)效,那(nà)麼(me)GPU似乎更(gèng)节(jié)能(néng),理論上(shàng)达(dá)到(dào)56 GFLOP / W(每瓦(wǎ)Giga浮點(diǎn)運算,一(yī)種(zhǒng)测量(liàng)浮點(diǎn)性(xìng)能(néng)能(néng)效的(de)标(biāo)準方(fāng)法),而(ér)FPGA只(zhī)能(néng)达(dá)到(dào)40.9 GFLOP / W.因(yīn)此(cǐ),如(rú)果(guǒ)你現(xiàn)在(zài)要(yào)購買(mǎi)新的(de)浮點(diǎn)硬(yìng)件(jiàn),并且你需要(yào)一(yī)台(tái)主(zhǔ)機(jī),那(nà)麼(me)看(kàn)起来(lái)你的(de)GPU会(huì)更(gèng)好(hǎo),至(zhì)少(shǎo)在(zài)这(zhè)个(gè)粗(cū)略的(de)比較中(zhōng)。
然而(ér),差异(yì)很小,新的(de)FPGA卡(kǎ)(例如(rú)基于(yú)Stratix 10 FPGA的(de)即将推出(chū)的(de)卡(kǎ))很可(kě)能(néng)比浮點(diǎn)計(jì)算上(shàng)的(de)Volta更(gèng)节(jié)能(néng)。此(cǐ)外(wài),上(shàng)述比較是(shì)蘋果(guǒ)和(hé)橙子之間(jiān)的(de)意(yì)義,特(tè)斯拉V100是(shì)在(zài)12納米(mǐ)工藝生(shēng)産,而(ér)Stratix 10是(shì)在(zài)較旧(jiù)的(de)14納米(mǐ)工藝生(shēng)産。
虽然比較确实表(biǎo)明(míng)如(rú)果(guǒ)你現(xiàn)在(zài)想(xiǎng)要(yào)节(jié)能(néng)浮點(diǎn)計(jì)算最(zuì)好(hǎo)堅持(chí)使用(yòng)GPU,但它(tā)并沒(méi)有(yǒu)表(biǎo)明(míng)GPU对(duì)于(yú)浮點(diǎn)計(jì)算本(běn)身(shēn)就(jiù)更(gèng)具能(néng)量(liàng)效率。 GPU目前(qián)赢得了(le)浮點(diǎn)能(néng)效的(de)争奪戰,但这(zhè)可(kě)能(néng)会(huì)在(zài)不(bù)久的(de)将来(lái)發(fà)生(shēng)變(biàn)化(huà)。
FPGA的(de)能(néng)源标(biāo)签(qiān):取(qǔ)決于(yú)應(yìng)用(yòng)(图(tú)片(piàn)版權:歐盟)
如(rú)果(guǒ)不(bù)需要(yào)主(zhǔ)機(jī),則需要(yào)在(zài)高(gāo)端GPU與(yǔ)主(zhǔ)機(jī)和(hé)沒(méi)有(yǒu)主(zhǔ)機(jī)的(de)高(gāo)端FPGA之間(jiān)進(jìn)行比較。如(rú)果(guǒ)我(wǒ)们(men)使用(yòng)與(yǔ)上(shàng)述比較中(zhōng)相同(tóng)的(de)數字(zì),那(nà)麼(me)如(rú)果(guǒ)主(zhǔ)機(jī)占用(yòng)116.7瓦(wǎ)(在(zài)多(duō)GPU設置的(de)情(qíng)況下(xià)为(wèi)每GPU,則具有(yǒu)主(zhǔ)機(jī)的(de)GPU和(hé)沒(méi)有(yǒu)主(zhǔ)機(jī)的(de)FPGA)完全(quán)同(tóng)樣(yàng)节(jié)能(néng)。現(xiàn)代(dài)主(zhǔ)機(jī)消耗在(zài)50-250瓦(wǎ)範圍內(nèi),使FPGA更(gèng)具競争力。
概述和(hé)展(zhǎn)望
在(zài)某些領域,很難繞过(guò)FPGA。在(zài)军事(shì)應(yìng)用(yòng)中(zhōng),例如(rú)導弹制導系(xì)統,FPGA被(bèi)用(yòng)于(yú)低延遲。在(zài)射電(diàn)天(tiān)文(wén)應(yìng)用(yòng)中(zhōng),FPGA的(de)專用(yòng)輸入(rù)/輸出(chū)对(duì)于(yú)处理大量(liàng)數據(jù)至(zhì)關(guān)重(zhòng)要(yào)。在(zài)加密貨幣(bì)挖掘中(zhōng),FPGA的(de)固定(dìng)精度(dù)和(hé)邏輯運算的(de)能(néng)效可(kě)能(néng)是(shì)有(yǒu)利的(de)。
藝術(shù)家(jiā)对(duì)即将建造的(de)SKA射電(diàn)望遠(yuǎn)鏡(jìng)的(de)印(yìn)象(xiàng)(图(tú)片(piàn)来(lái)源:SKA組織/ Swinburne Astronomy Productions)
然而(ér),英特(tè)爾并沒(méi)有(yǒu)为(wèi)这(zhè)些有(yǒu)利可(kě)图(tú)的(de)市(shì)场在(zài)Altera上(shàng)花費167亿(yì)美元(yuán) - 他(tā)们(men)有(yǒu)更(gèng)大的(de)計(jì)劃(huà)。據(jù)我(wǒ)所(suǒ)知,他(tā)们(men)想(xiǎng)要(yào)滲透的(de)两(liǎng)个(gè)市(shì)场是(shì)高(gāo)性(xìng)能(néng)計(jì)算和(hé)雲(yún)計(jì)算(即在(zài)類(lèi)似亞马遜的(de)中(zhōng)心(xīn)使用(yòng))。
用(yòng)于(yú)高(gāo)性(xìng)能(néng)計(jì)算的(de)FPGA
就(jiù)个(gè)人(rén)而(ér)言,我(wǒ)認为(wèi)未来(lái)幾(jǐ)年(nián)FPGA不(bù)会(huì)在(zài)高(gāo)性(xìng)能(néng)計(jì)算市(shì)场上(shàng)大放(fàng)异(yì)彩。即使它(tā)们(men)的(de)能(néng)量(liàng)效率略高(gāo)于(yú)GPU,但FPGA的(de)软(ruǎn)件(jiàn)開(kāi)發(fà)仍然比GPU要(yào)困難得多(duō)。 HPC社區(qū)已經(jīng)習慣了(le)GPU - 讓人(rén)们(men)從GPU切(qiè)換到(dào)FPGA需要(yào)更(gèng)大的(de)好(hǎo)处。從长遠(yuǎn)来(lái)看(kàn),即超过(guò)5年(nián),可(kě)能(néng)会(huì)發(fà)現(xiàn)FPGA确实提(tí)供了(le)如(rú)此(cǐ)大的(de)优勢,这(zhè)正(zhèng)是(shì)英特(tè)爾似乎希望的(de)。
适用(yòng)于(yú)雲(yún)提(tí)供商的(de)FPGA
另(lìng)一(yī)个(gè)市(shì)场是(shì)雲(yún)提(tí)供商。英特(tè)爾設想(xiǎng)雲(yún)服(fú)务器具有(yǒu)FPGA或(huò)運行在(zài)CPU-FPGA混合體(tǐ)上(shàng)。这(zhè)个(gè)想(xiǎng)法是(shì)計(jì)算的(de)某些部(bù)分(fēn)可(kě)以(yǐ)卸载到(dào)FPGA和(hé)/或(huò)FPGA可(kě)以(yǐ)用(yòng)来(lái)定(dìng)制网(wǎng)絡拓撲。
毫(háo)无疑問(wèn),微软(ruǎn)與(yǔ)英特(tè)爾合作,已經(jīng)在(zài)其數據(jù)中(zhōng)心(xīn)中(zhōng)实現(xiàn)了(le)FPGA,并擁有(yǒu)一(yī)个(gè)擁有(yǒu)100,000个(gè)FPGA的(de)网(wǎng)絡。微软(ruǎn)在(zài)Bing搜索的(de)性(xìng)能(néng)方(fāng)面(miàn)表(biǎo)現(xiàn)出(chū)很大的(de)好(hǎo)处,現(xiàn)在(zài)这(zhè)些搜索部(bù)分(fēn)由(yóu)FPGA計(jì)算,并且具有(yǒu)靈活性(xìng)。亞马遜還(huán)在(zài)其流行的(de)EC2平台(tái)上(shàng)提(tí)供FPGA节(jié)點(diǎn)。这(zhè)種(zhǒng)趨勢是(shì)否会(huì)繼續下(xià)去(qù)還(huán)有(yǒu)待观察
明(míng)德揚科教致(zhì)力于(yú)为(wèi)廣大FPGAer提(tí)供一(yī)種(zhǒng)快(kuài)速入(rù)門(mén)的(de)FPGA培訓服(fú)务,設有(yǒu)以(yǐ)下(xià)班級:
詳情(qíng)請點(diǎn)擊查看(kàn)















