自(zì)Xilinx在(zài)1984年(nián)創造出(chū)FPGA以(yǐ)来(lái),这(zhè)種(zhǒng)可(kě)編程邏輯器件(jiàn)凭借(jiè)性(xìng)能(néng)、上(shàng)市(shì)时(shí)間(jiān)、成(chéng)本(běn)、稳定(dìng)性(xìng)和(hé)长期(qī)維護方(fāng)面(miàn)的(de)优勢,在(zài)通(tòng)信(xìn)、醫療、工控和(hé)安(ān)防等領域占有(yǒu)一(yī)席(xí)之地(dì),在(zài)过(guò)去(qù)幾(jǐ)年(nián)也(yě)有(yǒu)极(jí)高(gāo)的(de)增长率。而(ér)進(jìn)入(rù)了(le)最(zuì)近(jìn)两(liǎng)年(nián),由(yóu)于(yú)雲(yún)計(jì)算、高(gāo)性(xìng)能(néng)計(jì)算和(hé)人(rén)工智能(néng)的(de)繁荣,擁有(yǒu)先(xiān)天(tiān)优勢的(de)FPGA的(de)關(guān)注度(dù)更(gèng)是(shì)到(dào)达(dá)了(le)前(qián)所(suǒ)未有(yǒu)的(de)高(gāo)度(dù)。本(běn)文(wén)從基礎出(chū)發(fà)談及(jí)FPGA的(de)过(guò)去(qù)、現(xiàn)在(zài)與(yǔ)未来(lái)。
我(wǒ)们(men)知道(dào),相对(duì)于(yú)專業的(de)ASIC,FPGA有(yǒu)上(shàng)市(shì)时(shí)間(jiān)和(hé)成(chéng)本(běn)上(shàng)的(de)优勢。另(lìng)外(wài),在(zài)大多(duō)數情(qíng)況下(xià),FPGA執行某些功能(néng)較之CPU上(shàng)的(de)软(ruǎn)件(jiàn)操作更(gèng)高(gāo)效。这(zhè)就(jiù)是(shì)为(wèi)什麼(me)我(wǒ)们(men)認为(wèi)它(tā)不(bù)但会(huì)運用(yòng)在(zài)數據(jù)中(zhōng)心(xīn)的(de)服(fú)务器、交換器、存儲层的(de)各(gè)个(gè)角(jiǎo)落(là),并且具有(yǒu)加速整个(gè)工作流程的(de)功能(néng)。
然而(ér)我(wǒ)们(men)不(bù)能(néng)过(guò)分(fēn)乐(lè)观,尤其是(shì)在(zài)2015年(nián)12月(yuè),Intel以(yǐ)167亿(yì)美元(yuán)收(shōu)購了(le)FPGA生(shēng)産商Altera之後(hòu)。
在(zài)2014年(nián)年(nián)底,當时(shí)還(huán)处于(yú)独立的(de)Altera公司高(gāo)层盯上(shàng)了(le)基于(yú)CPU+FPGA的(de)數據(jù)中(zhōng)心(xīn)并行計(jì)算的(de)發(fà)展(zhǎn)前(qián)景——这(zhè)个(gè)當时(shí)價值大約10亿(yì)美元(yuán)的(de)市(shì)场。而(ér)并非(fēi)數據(jù)中(zhōng)心(xīn)里(lǐ)約2.5亿(yì)美元(yuán)的(de)CPU-GPU市(shì)场和(hé)直(zhí)接應(yìng)用(yòng)CPU处理器的(de)90亿(yì)美元(yuán)市(shì)场。
Altera做出(chū)这(zhè)个(gè)決定(dìng)的(de)原因(yīn)在(zài)于(yú)他(tā)们(men)認为(wèi)这(zhè)个(gè)組合較之另(lìng)外(wài)两(liǎng)个(gè)方(fāng)案(àn),有(yǒu)編程的(de)簡便性(xìng)和(hé)能(néng)效优勢。人(rén)们(men)对(duì)CPU非(fēi)常熟悉,并發(fà)現(xiàn)尋找(zhǎo)C程序員也(yě)不(bù)会(huì)太難。因(yīn)此(cǐ)对(duì)大部(bù)分(fēn)開(kāi)發(fà)者(zhě)来(lái)说(shuō),在(zài)執行運算任务的(de)时(shí)候,持(chí)續使用(yòng)这(zhè)種(zhǒng)方(fāng)案(àn)不(bù)需要(yào)冒太大的(de)风险,但是(shì)能(néng)源效率相对(duì)比較低,尤其是(shì)在(zài)密集的(de)計(jì)算和(hé)固有(yǒu)的(de)并行工作負载的(de)情(qíng)況底下(xià)。
至(zhì)于(yú)CPU+GPU的(de)方(fāng)案(àn),程序員并不(bù)是(shì)很熟悉,但是(shì)擁有(yǒu)很高(gāo)的(de)效率。
根(gēn)據(jù)Altera的(de)估計(jì),使用(yòng)OpenCL对(duì)混合CPU-FPGA系(xì)統進(jìn)行編程比使用(yòng)Nvidia的(de)CUDA环(huán)境对(duì)于(yú)程序員来(lái)说(shuō)更(gèng)容易(某些方(fāng)面(miàn)肯定(dìng)是(shì)有(yǒu)争議的(de)),但用(yòng)HDL来(lái)硬(yìng)編程FPGA是(shì)相當困難的(de),因(yīn)此(cǐ)需要(yào)OpenCL或(huò)者(zhě)通(tòng)过(guò)其他(tā)抽象(xiàng)层来(lái)将CPU中(zhōng)的(de)負载轉(zhuǎn)移到(dào)FPGA上(shàng)。
Intel收(shōu)購Altera改變(biàn)FPGA格局(jú)
这(zhè)个(gè)十(shí)亿(yì)美元(yuán)的(de)數據(jù)中(zhōng)心(xīn)市(shì)场被(bèi)Altera、Xilinx和(hé)其他(tā)FPGA供應(yìng)商瓜分(fēn)。在(zài)Intel于(yú)2015年(nián)6月(yuè)收(shōu)購了(le)Altera之後(hòu),这(zhè)个(gè)市(shì)场變(biàn)得更(gèng)加複雜。
在(zài)收(shōu)購之前(qián)的(de)2014年(nián),Altera的(de)19亿(yì)美元(yuán)收(shōu)入(rù)中(zhōng),有(yǒu)16%来(lái)自(zì)于(yú)與(yǔ)數據(jù)中(zhōng)心(xīn)相關(guān)的(de)計(jì)算、网(wǎng)絡和(hé)存儲業务,其總(zǒng)值达(dá)到(dào)3.04亿(yì)美元(yuán)。那(nà)些在(zài)这(zhè)个(gè)領域深耕十(shí)幾(jǐ)二(èr)十(shí)年(nián)的(de)通(tòng)信(xìn)和(hé)无線(xiàn)設備系(xì)統制造商想(xiǎng)要(yào)有(yǒu)更(gèng)高(gāo)的(de)能(néng)源效率,更(gèng)低的(de)成(chéng)本(běn)和(hé)更(gèng)高(gāo)的(de)擴展(zhǎn)性(xìng),这(zhè)些都是(shì)FPGA所(suǒ)擅长的(de)領域。另(lìng)外(wài)有(yǒu)一(yī)點(diǎn)需要(yào)提(tí)一(yī)下(xià),那(nà)就(jiù)是(shì)在(zài)執行这(zhè)些功能(néng)的(de)时(shí)候,使用(yòng)FPGA并不(bù)需要(yào)像使用(yòng)CPU那(nà)樣(yàng)需要(yào)操作系(xì)統和(hé)相應(yìng)的(de)软(ruǎn)件(jiàn)。这(zhè)部(bù)分(fēn)的(de)營收(shōu)占了(le)Altera營收(shōu)的(de)44%,總(zǒng)額为(wèi)8.35亿(yì)美元(yuán)。
Altera另(lìng)外(wài)的(de)22%收(shōu)入(rù),即4.18亿(yì)美元(yuán),来(lái)自(zì)工業控制、军事(shì)設備和(hé)汽車制造等領域。他(tā)们(men)面(miàn)对(duì)相同(tóng)的(de)困境,因(yīn)此(cǐ)選擇FPGA来(lái)处理他(tā)们(men)的(de)一(yī)些工作負载。
其实早(zǎo)在(zài)2014年(nián),英特(tè)爾看(kàn)中(zhōng)了(le)價值1150亿(yì)美元(yuán)的(de)各(gè)種(zhǒng)類(lèi)型的(de)芯片(piàn)潛在(zài)市(shì)场。當中(zhōng)可(kě)編輯邏輯設備(以(yǐ)FPGA为(wèi)主(zhǔ))約占4%,ASIC占18%,其餘为(wèi)ASSP的(de)大雜燴。
在(zài)可(kě)編輯邏輯設備的(de)領域中(zhōng),英特(tè)爾預估Altera占有(yǒu)48亿(yì)美元(yuán)市(shì)场中(zhōng)的(de)39%,Xilinx占有(yǒu)49%,剩下(xià)供應(yìng)商則占據(jù)剩下(xià)的(de)12%。
當时(shí)英特(tè)爾沒(méi)有(yǒu)收(shōu)購Altera的(de)原因(yīn)是(shì)因(yīn)为(wèi)FPGA業务的(de)增长速度(dù)幾(jǐ)乎與(yǔ)其數據(jù)中(zhōng)心(xīn)集团(tuán)(为(wèi)服(fú)务器,存儲和(hé)交換機(jī)制造商提(tí)供芯片(piàn),芯片(piàn)組和(hé)主(zhǔ)板)的(de)速度(dù)一(yī)樣(yàng)快(kuài)。
再者(zhě),英特(tè)爾沒(méi)有(yǒu)这(zhè)樣(yàng)做也(yě)是(shì)因(yīn)为(wèi)摩爾定(dìng)律逐漸緩慢(màn)下(xià)来(lái)的(de)脚步,給(gěi)FPGA带(dài)来(lái)了(le)日(rì)益增长的(de)競争威脅。
实際上(shàng),如(rú)果(guǒ)應(yìng)用(yòng)的(de)話(huà),在(zài)數據(jù)中(zhōng)心(xīn)里(lǐ)不(bù)止安(ān)裝(zhuāng)一(yī)个(gè)FPGA、GPU或(huò)DSP加速器,但不(bù)需要(yào)安(ān)裝(zhuāng)多(duō)个(gè)XeonCPU。由(yóu)于(yú)英特(tè)爾不(bù)能(néng)繼續为(wèi)Xeons提(tí)供更(gèng)多(duō)的(de)核心(xīn)和(hé)加速器,所(suǒ)以(yǐ)他(tā)们(men)得出(chū)了(le)将FPGA當做加速器的(de)結論。
除非(fēi)FPGA能(néng)在(zài)數據(jù)中(zhōng)心(xīn)創造5亿(yì)美元(yuán)的(de)收(shōu)益,或(huò)者(zhě)幾(jǐ)年(nián)後(hòu)創造10亿(yì)美元(yuán)或(huò)更(gèng)多(duō)的(de)收(shōu)入(rù)。不(bù)然英特(tè)爾宁願犧牲两(liǎng)至(zhì)三(sān)倍的(de)Xeon收(shōu)入(rù),也(yě)不(bù)会(huì)把Xeon的(de)收(shōu)入(rù)拱手(shǒu)相讓。
深度(dù)学習加持(chí),FPGA前(qián)景可(kě)人(rén)
根(gēn)據(jù)英特(tè)爾的(de)預测,他(tā)们(men)計(jì)劃(huà)從現(xiàn)在(zài)到(dào)2023年(nián)以(yǐ)接近(jìn)直(zhí)線(xiàn)增长率来(lái)提(tí)升(shēng)FPGA的(de)業务。对(duì)此(cǐ)我(wǒ)们(men)總(zǒng)是(shì)抱有(yǒu)怀疑的(de)态度(dù)。但FPGA業务随着时(shí)間(jiān)的(de)推移或(huò)多(duō)或(huò)少(shǎo)地(dì)在(zài)增长(比15年(nián)前(qián)增长約2.5倍)。
英特(tè)爾還(huán)預計(jì),FPGA的(de)營收(shōu)在(zài)2014年(nián)到(dào)2023年(nián)之間(jiān)将会(huì)再翻一(yī)倍。按照英特(tè)爾預测,從2014年(nián)到(dào)2023年(nián)間(jiān)其複合年(nián)增长率为(wèi)7%,其收(shōu)入(rù)應(yìng)該略低于(yú)預测的(de)89亿(yì)美元(yuán)。有(yǒu)趣的(de)是(shì),由(yóu)于(yú)英特(tè)爾的(de)預测并沒(méi)有(yǒu)把来(lái)自(zì)數據(jù)計(jì)算中(zhōng)心(xīn)(服(fú)务器,交換和(hé)网(wǎng)絡)的(de)FPGA收(shōu)入(rù)份額納入(rù)計(jì)劃(huà)中(zhōng),这(zhè)将会(huì)發(fà)生(shēng)很大變(biàn)化(huà)。讓我(wǒ)们(men)分(fēn)析一(yī)下(xià):
如(rú)果(guǒ)Altera和(hé)Xilinx的(de)市(shì)场份額沒(méi)有(yǒu)發(fà)生(shēng)改變(biàn),且假設Altera的(de)收(shōu)入(rù)在(zài)网(wǎng)絡,計(jì)算和(hé)存儲的(de)部(bù)分(fēn)保持(chí)不(bù)變(biàn),那(nà)麼(me)Altera这(zhè)一(yī)部(bù)分(fēn)的(de)業务收(shōu)入(rù)到(dào)2023年(nián)将会(huì)达(dá)到(dào)5.6亿(yì)美元(yuán)左(zuǒ)右(yòu)。我(wǒ)们(men)認为(wèi)Intel这(zhè)樣(yàng)的(de)數據(jù)低估了(le)數據(jù)中(zhōng)心(xīn)在(zài)提(tí)供更(gèng)有(yǒu)效和(hé)靈活計(jì)算所(suǒ)面(miàn)对(duì)的(de)壓力。不(bù)給(gěi)过(guò)我(wǒ)们(men)認为(wèi)FPGA的(de)前(qián)景遠(yuǎn)遠(yuǎn)优于(yú)这(zhè)个(gè)預测。也(yě)就(jiù)是(shì)说(shuō),许多(duō)FPGA技術(shù)的(de)支持(chí)者(zhě)一(yī)直(zhí)期(qī)待FPGA在(zài)數據(jù)中(zhōng)心(xīn)中(zhōng)獲得計(jì)算合法化(huà)的(de)那(nà)天(tiān)很快(kuài)到(dào)来(lái)。
諷刺的(de)是(shì),英特(tè)爾本(běn)身(shēn)作为(wèi)FPGA的(de)編程專家(jiā),硬(yìng)件(jiàn)描述語(yǔ)言的(de)使用(yòng)者(zhě),以(yǐ)及(jí)知名的(de)ASIC制造商,竟成(chéng)为(wèi)推動(dòng)FPGA成(chéng)为(wèi)加速器优先(xiān)選擇的(de)主(zhǔ)要(yào)參與(yǔ)者(zhě)。这(zhè)樣(yàng)的(de)加速器既能(néng)作为(wèi)独立的(de)離散(sàn)計(jì)算元(yuán)件(jiàn),又可(kě)以(yǐ)作为(wèi)混合CPU-FPGA器件(jiàn)。
这(zhè)也(yě)是(shì)为(wèi)什麼(me)從2016年(nián)以(yǐ)来(lái),我(wǒ)们(men)看(kàn)到(dào)所(suǒ)有(yǒu)關(guān)于(yú)Altera的(de)新聞都是(shì)昭示FPGA将会(huì)有(yǒu)的(de)大規模增的(de)增长。所(suǒ)以(yǐ)至(zhì)少(shǎo)在(zài)短(duǎn)期(qī),他(tā)们(men)除了(le)为(wèi)其他(tā)的(de)FPGA制造商作嫁衣(yī)裳,幾(jǐ)乎别无他(tā)法。
这(zhè)次(cì)收(shōu)購不(bù)僅是(shì)FPGA發(fà)展(zhǎn)的(de)里(lǐ)程碑,也(yě)是(shì)英特(tè)爾对(duì)FPGA巨大的(de)潛力的(de)承認。FPGA作为(wèi)未来(lái)強(qiáng)大的(de)計(jì)算加速器,不(bù)但影響主(zhǔ)要(yào)企業的(de)決策和(hé)市(shì)场趨勢,而(ér)且加速企業中(zhōng)的(de)工作負载,促進(jìn)超大規模數據(jù)中(zhōng)心(xīn)的(de)內(nèi)部(bù)搜索,以(yǐ)及(jí)提(tí)高(gāo)高(gāo)性(xìng)能(néng)計(jì)算模拟的(de)地(dì)位。
在(zài)跨越2017年(nián)之際,FPGA在(zài)應(yìng)用(yòng)程序中(zhōng)等級中(zhōng)新增了(le)機(jī)器学習和(hé)深度(dù)学習,这(zhè)給(gěi)FPGA産業敲下(xià)了(le)又一(yī)重(zhòng)錘。
为(wèi)什麼(me)大家(jiā)都青(qīng)睐FPGA
首先(xiān),編程FPGA的(de)软(ruǎn)件(jiàn)棧已經(jīng)演進(jìn)了(le),尤其是(shì)在(zài)Altera的(de)幫助下(xià),FPGA增加了(le)对(duì)OpenCL開(kāi)發(fà)环(huán)境的(de)支持(chí)。但不(bù)是(shì)每个(gè)人(rén)都是(shì)OpenCL的(de)狂热(rè)粉丝(sī)。
先(xiān)有(yǒu)Nvidia为(wèi)其TeslaGPU加速器創建了(le)自(zì)己的(de)CUDA并行編程环(huán)境。再有(yǒu)SRC計(jì)算機(jī)公司不(bù)但早(zǎo)在(zài)2002年(nián)就(jiù)为(wèi)國(guó)防和(hé)智能(néng)領域提(tí)供混合CPU-FPGA系(xì)統,到(dào)了(le)2016年(nián)年(nián)中(zhōng),進(jìn)一(yī)步将自(zì)己研發(fà)的(de)Carte編程环(huán)境進(jìn)入(rù)了(le)商業市(shì)场,这(zhè)个(gè)編程环(huán)境可(kě)以(yǐ)使C和(hé)Fortran程序自(zì)動(dòng)轉(zhuǎn)換为(wèi)FPGA的(de)硬(yìng)件(jiàn)描述語(yǔ)言(HDL)。
另(lìng)一(yī)个(gè)推動(dòng)FPGA被(bèi)采用(yòng)的(de)因(yīn)素是(shì)随着芯片(piàn)制造技術(shù)難以(yǐ)持(chí)續縮進(jìn),多(duō)核CPU性(xìng)能(néng)的(de)提(tí)高(gāo)越来(lái)越艱難。虽然CPU的(de)性(xìng)能(néng)獲得了(le)大跳躍,但主(zhǔ)要(yào)用(yòng)于(yú)擴展(zhǎn)CPU的(de)性(xìng)能(néng)吞吐量(liàng),而(ér)不(bù)是(shì)單个(gè)CPU內(nèi)核的(de)个(gè)體(tǐ)性(xìng)能(néng)。(我(wǒ)们(men)知道(dào)架構增強(qiáng)是(shì)有(yǒu)難度(dù)的(de))。但是(shì)FPGA和(hé)GPU加速器的(de)每瓦(wǎ)性(xìng)能(néng)都有(yǒu)了(le)令人(rén)信(xìn)服(fú)的(de)改進(jìn)。
根(gēn)據(jù)微软(ruǎn)的(de)運行测試,在(zài)執行深度(dù)学習算法的(de)时(shí)候,CPU-FPGA和(hé)CPU-GPU混合計(jì)算在(zài)的(de)每瓦(wǎ)性(xìng)能(néng)也(yě)不(bù)相伯仲。GPU在(zài)運行中(zhōng)更(gèng)热(rè)和(hé)有(yǒu)類(lèi)似的(de)每瓦(wǎ)性(xìng)能(néng)表(biǎo)現(xiàn),但是(shì)同(tóng)时(shí)他(tā)们(men)也(yě)带(dài)来(lái)了(le)更(gèng)強(qiáng)的(de)工作能(néng)力。
提(tí)高(gāo)了(le)每瓦(wǎ)性(xìng)能(néng)解(jiě)析了(le)为(wèi)什麼(me)世界上(shàng)最(zuì)強(qiáng)大的(de)超級計(jì)算機(jī)在(zài)20世紀90年(nián)代(dài)後(hòu)期(qī)轉(zhuǎn)移到(dào)并行集群(qún),并且解(jiě)析了(le)为(wèi)什麼(me)現(xiàn)在(zài)他(tā)们(men)轉(zhuǎn)向(xiàng)了(le)混合機(jī)器,而(ér)不(bù)是(shì)英特(tè)爾的(de)下(xià)一(yī)个(gè)以(yǐ)CPU-GPU为(wèi)混合主(zhǔ)力的(de)XeonPhi的(de)处理器“KnightsLanding(簡稱KNL)。
在(zài)AlteraFPGA協处理器和(hé)XeonPhi处理器KnightsLanding的(de)幫助下(xià),英特(tè)爾不(bù)但可(kě)以(yǐ)保持(chí)自(zì)己的(de)在(zài)高(gāo)端的(de)競争优勢。并且在(zài)與(yǔ)Nvidia、IBM和(hé)Mellanox組成(chéng)的(de)Openpower聯盟競争中(zhōng)繼續領先(xiān)。
英特(tè)爾堅信(xìn)超大規模計(jì)算,雲(yún)端和(hé)HPC市(shì)场的(de)工作負载会(huì)快(kuài)速成(chéng)长。为(wèi)促進(jìn)其計(jì)算業务繼續蓬勃發(fà)展(zhǎn)。这(zhè)情(qíng)況下(xià)只(zhī)能(néng)成(chéng)为(wèi)FPGA的(de)賣(mài)家(jiā),否則别人(rén)就(jiù)会(huì)搶去(qù)这(zhè)唯一(yī)的(de)出(chū)路(lù)。
但英特(tè)爾并不(bù)是(shì)这(zhè)樣(yàng)跟大家(jiā)说(shuō)。他(tā)们(men)说(shuō):“我(wǒ)们(men)不(bù)認为(wèi)这(zhè)是(shì)一(yī)種(zhǒng)防守戰或(huò)者(zhě)其他(tā),”英特(tè)爾的(de)CEOBrianKrzanich在(zài)Altera收(shōu)購消息後(hòu)的(de)新聞發(fà)布(bù)会(huì)上(shàng)说(shuō)。
“我(wǒ)们(men)認为(wèi)物(wù)聯网(wǎng)和(hé)數據(jù)中(zhōng)心(xīn)都是(shì)龐大的(de)。这(zhè)些也(yě)是(shì)我(wǒ)们(men)的(de)客戶想(xiǎng)要(yào)構建的(de)産品。我(wǒ)们(men)30%的(de)雲(yún)端工作負载将在(zài)这(zhè)些産品上(shàng),这(zhè)是(shì)基于(yú)我(wǒ)们(men)对(duì)如(rú)何看(kàn)待趨勢變(biàn)化(huà)以(yǐ)及(jí)市(shì)场發(fà)展(zhǎn)的(de)預测。
这(zhè)是(shì)用(yòng)来(lái)證明(míng)这(zhè)些工作負载能(néng)以(yǐ)一(yī)種(zhǒng)或(huò)另(lìng)一(yī)種(zhǒng)方(fāng)式轉(zhuǎn)移到(dào)矽中(zhōng)。我(wǒ)们(men)認为(wèi)最(zuì)好(hǎo)的(de)做法是(shì)使用(yòng)有(yǒu)業界最(zuì)佳性(xìng)能(néng)和(hé)成(chéng)本(běn)优勢的(de)Xeon处理器和(hé)FPGA組合。这(zhè)将給(gěi)工業領域带(dài)来(lái)更(gèng)好(hǎo)的(de)産品和(hé)性(xìng)能(néng)。而(ér)在(zài)IoT中(zhōng),这(zhè)将擴展(zhǎn)到(dào)潛在(zài)市(shì)场对(duì)抗ASIC和(hé)ASSP;而(ér)在(zài)數據(jù)中(zhōng)心(xīn)中(zhōng),則会(huì)将workload轉(zhuǎn)移到(dào)矽,推動(dòng)雲(yún)的(de)快(kuài)速增长。
Krzanich解(jiě)釋道(dào):“你可(kě)以(yǐ)把FPGA想(xiǎng)象(xiàng)成(chéng)一(yī)堆(duī)gate,且能(néng)够随时(shí)編程。根(gēn)據(jù)他(tā)们(men)的(de)想(xiǎng)法,其算法会(huì)随着时(shí)間(jiān)的(de)推移和(hé)学習變(biàn)得更(gèng)聰明(míng)。FPGA可(kě)以(yǐ)用(yòng)作多(duō)个(gè)領域的(de)加速器,可(kě)以(yǐ)在(zài)進(jìn)行加密的(de)同(tóng)时(shí)進(jìn)行面(miàn)部(bù)搜索,而(ér)且能(néng)在(zài)基本(běn)上(shàng)在(zài)微秒(miǎo)內(nèi)重(zhòng)新編程FPGA。这(zhè)比大規模的(de)單个(gè)定(dìng)制部(bù)件(jiàn)的(de)成(chéng)本(běn)低得多(duō)且具備更(gèng)高(gāo)的(de)靈活性(xìng)。”
英特(tè)爾看(kàn)到(dào)了(le)更(gèng)大的(de)機(jī)会(huì)
英特(tè)爾看(kàn)到(dào)了(le)比这(zhè)更(gèng)大的(de)機(jī)会(huì)。
Intel首席(xí)執行官BrianKrzanich在(zài)收(shōu)購完成(chéng)後(hòu)宣布(bù),到(dào)2020年(nián),将有(yǒu)高(gāo)达(dá)三(sān)分(fēn)之一(yī)的(de)雲(yún)端服(fú)务提(tí)供商使用(yòng)混合的(de)CPU-FPGA服(fú)务器节(jié)點(diǎn),这(zhè)是(shì)一(yī)个(gè)令人(rén)震驚的(de)消息。这(zhè)也(yě)給(gěi)從2014年(nián)底就(jiù)開(kāi)始瞄準的(de)數據(jù)中(zhōng)心(xīn)的(de)Altera带(dài)来(lái)大約10亿(yì)美元(yuán)的(de)FPGA的(de)機(jī)会(huì)。这(zhè)數目大概是(shì)Nvidia目前(qián)流行的(de)Tesla計(jì)算引擎營收(shōu)的(de)三(sān)倍。
在(zài)2014年(nián)初,英特(tè)爾展(zhǎn)示了(le)一(yī)个(gè)相同(tóng)封(fēng)裝(zhuāng)的(de)Xeon-FPGA芯片(piàn)原型,并且打(dǎ)算在(zài)2017年(nián)推出(chū)这(zhè)个(gè)芯片(piàn)。这(zhè)是(shì)基于(yú)當时(shí)數據(jù)中(zhōng)心(xīn)集团(tuán)GMDianeBryant提(tí)出(chū)的(de)一(yī)个(gè)带(dài)有(yǒu)FPGA電(diàn)路(lù)的(de)Xeon設想(xiǎng)不(bù)久之後(hòu)推出(chū)的(de)。
在(zài)宣布(bù)Altera交易的(de)電(diàn)話(huà)会(huì)議上(shàng),Krzanich沒(méi)有(yǒu)说(shuō)明(míng)退(tuì)出(chū)这(zhè)款Xeon-FPGA設備的(de)时(shí)間(jiān),但是(shì)他(tā)表(biǎo)示英特(tè)爾将創建一(yī)个(gè)面(miàn)向(xiàng)物(wù)聯网(wǎng)市(shì)场的(de)單die混合Atom-FPGA設備。英特(tè)爾正(zhèng)在(zài)考究在(zài)混合过(guò)渡階(jiē)段(duàn),是(shì)否需要(yào)为(wèi)Atom和(hé)AlteraFPGA做單一(yī)封(fēng)裝(zhuāng)混合。
在(zài)2016年(nián)的(de)初太平洋(yáng)頂峰(fēng)證券的(de)電(diàn)話(huà)会(huì)議中(zhōng),英特(tè)爾的(de)雲(yún)端基礎設施集团(tuán)總(zǒng)經(jīng)理JasonWaxman與(yǔ)研究分(fēn)析师(shī)讨論關(guān)于(yú)英特(tè)爾數據(jù)中(zhōng)心(xīn)業务时(shí)表(biǎo)示,FPGA已經(jīng)成(chéng)为(wèi)了(le)热(rè)門(mén)話(huà)題(tí)。
首先(xiān),虽然他(tā)沒(méi)有(yǒu)指名道(dào)姓哪家(jiā)廠(chǎng)商或(huò)者(zhě)任何設備的(de)規格,但是(shì)Waxman确定(dìng)英特(tè)爾已經(jīng)为(wèi)某些客戶提(tí)供了(le)Xeon加FPGA的(de)混合計(jì)算引擎樣(yàng)品。
在(zài)会(huì)議期(qī)間(jiān),Waxman更(gèng)是(shì)暢談了(le)驅動(dòng)英特(tè)爾收(shōu)購Altera和(hé)插足可(kě)編程計(jì)算設備的(de)原因(yīn)。英特(tè)爾顯然希望讓FPGA成(chéng)为(wèi)主(zhǔ)流,即使这(zhè)可(kě)能(néng)会(huì)在(zài)數據(jù)中(zhōng)心(xīn)中(zhōng)蠶食Xeon的(de)某些業务。(我(wǒ)们(men)認为(wèi),因(yīn)为(wèi)英特(tè)爾認为(wèi)这(zhè)種(zhǒng)自(zì)相残殺是(shì)不(bù)可(kě)避免的(de),控制它(tā)的(de)最(zuì)好(hǎo)方(fāng)法是(shì)使FPGA成(chéng)为(wèi)Xeon阵(zhèn)容的(de)一(yī)部(bù)分(fēn)。)
Waxman说(shuō):“我(wǒ)認为(wèi)这(zhè)項收(shōu)購可(kě)能(néng)涉及(jí)许多(duō)事(shì)情(qíng),而(ér)且其中(zhōng)一(yī)些已經(jīng)超越數據(jù)中(zhōng)心(xīn)集团(tuán)的(de)範圍。”
首先(xiān),一(yī)个(gè)潛在(zài)的(de)核心(xīn)業务往往是(shì)由(yóu)制造領先(xiān)优勢驅動(dòng)。在(zài)这(zhè)方(fāng)面(miàn)我(wǒ)们(men)能(néng)很好(hǎo)的(de)掌控,而(ér)且这(zhè)樣(yàng)做還(huán)有(yǒu)良好(hǎo)的(de)協同(tóng)作用(yòng)。
再者(zhě),還(huán)有(yǒu)物(wù)聯网(wǎng)“集团(tuán)”对(duì)此(cǐ)也(yě)有(yǒu)很強(qiáng)的(de)興趣。
據(jù)我(wǒ)们(men)所(suǒ)知,某些大規模工作負载的(de)擴展(zhǎn)(如(rú)機(jī)器学習,某些网(wǎng)絡功能(néng))吸引了(le)越来(lái)越多(duō)的(de)人(rén)關(guān)注。我(wǒ)们(men)才意(yì)識到(dào)我(wǒ)们(men)或(huò)者(zhě)可(kě)以(yǐ)在(zài)性(xìng)能(néng)方(fāng)面(miàn)取(qǔ)得一(yī)些突破,这(zhè)将是(shì)一(yī)个(gè)把FPGA從數據(jù)中(zhōng)心(xīn)應(yìng)用(yòng)程序中(zhōng)移植到(dào)更(gèng)多(duō)适合的(de)、廣泛發(fà)展(zhǎn)領域的(de)良好(hǎo)機(jī)会(huì)。
但是(shì)在(zài)數據(jù)中(zhōng)心(xīn)集团(tuán)里(lǐ)的(de)協作,FPGA不(bù)过(guò)是(shì)給(gěi)CPU做个(gè)伴,幫助解(jiě)決雲(yún)端服(fú)务提(tí)供商和(hé)其他(tā)類(lèi)型的(de)大規模應(yìng)用(yòng)程序的(de)問(wèn)題(tí)。
英特(tè)爾認为(wèi)对(duì)FPGA加速有(yǒu)优先(xiān)和(hé)大量(liàng)需求的(de)關(guān)鍵應(yìng)用(yòng)包(bāo)括機(jī)器学習,搜索引擎索引,加密和(hé)數據(jù)壓縮。正(zhèng)如(rú)Waxman指出(chū),这(zhè)些往往是(shì)很有(yǒu)針(zhēn)对(duì)性(xìng)的(de),且沒(méi)有(yǒu)統一(yī)的(de)使用(yòng)案(àn)例。这(zhè)就(jiù)是(shì)Krzanich斬釘截铁(tiě)说(shuō)三(sān)分(fēn)之一(yī)的(de)雲(yún)端服(fú)务提(tí)供商将在(zài)五(wǔ)年(nián)內(nèi)使用(yòng)FPGA加速的(de)依據(jù)。
跨越FPGA的(de)障礙
虽然每个(gè)人(rén)都抱怨編程FPGA有(yǒu)多(duō)難,但英特(tè)爾并不(bù)为(wèi)此(cǐ)退(tuì)縮。虽然沒(méi)有(yǒu)透露(lù)太多(duō)相關(guān)計(jì)劃(huà)的(de)情(qíng)況下(xià),Waxman提(tí)出(chū)了(le)一(yī)些方(fāng)法讓FPGA更(gèng)容易被(bèi)運用(yòng)和(hé)理解(jiě)。
Waxman说(shuō):“我(wǒ)们(men)所(suǒ)擁有(yǒu)的(de)是(shì)独一(yī)无二(èr)的(de),这(zhè)是(shì)其他(tā)人(rén)不(bù)能(néng)給(gěi)的(de)。那(nà)就(jiù)是(shì)我(wǒ)们(men)能(néng)够了(le)解(jiě)这(zhè)些工作負载和(hé)能(néng)够推動(dòng)加速的(de)能(néng)力。
“我(wǒ)们(men)看(kàn)到(dào)一(yī)条(tiáo)促進(jìn)機(jī)器学習,加速存儲加密,加速网(wǎng)絡功能(néng)的(de)捷徑”,Waxman強(qiáng)調。这(zhè)是(shì)基于(yú)我(wǒ)们(men)对(duì)这(zhè)些工作負载的(de)深入(rù)了(le)解(jiě),所(suǒ)以(yǐ)才讓我(wǒ)们(men)看(kàn)到(dào)了(le)这(zhè)樣(yàng)的(de)機(jī)会(huì)。
但現(xiàn)在(zài)FPGA還(huán)需要(yào)面(miàn)对(duì)一(yī)些困難,因(yīn)为(wèi)現(xiàn)在(zài)人(rén)们(men)是(shì)写RTL的(de)。我(wǒ)们(men)是(shì)一(yī)家(jiā)写RTL的(de)公司,所(suǒ)以(yǐ)我(wǒ)们(men)可(kě)以(yǐ)解(jiě)決这(zhè)个(gè)問(wèn)題(tí)。首先(xiān)我(wǒ)们(men)使它(tā)運作,然後(hòu)我(wǒ)们(men)可(kě)以(yǐ)降低進(jìn)入(rù)的(de)門(mén)檻。第(dì)三(sān)步是(shì)真(zhēn)正(zhèng)的(de)規模經(jīng)濟学,而(ér)这(zhè)全(quán)部(bù)是(shì)靠集成(chéng)和(hé)制造的(de)实力。
为(wèi)了(le)解(jiě)決这(zhè)些障礙,我(wǒ)们(men)提(tí)供了(le)一(yī)系(xì)列的(de)方(fāng)法。
X86+FPGA?
对(duì)于(yú)那(nà)些英特(tè)爾打(dǎ)算用(yòng)FPGA来(lái)代(dài)替Xeons的(de)猜测,Waxman表(biǎo)示这(zhè)是(shì)一(yī)派胡言。
Waxman表(biǎo)示,对(duì)于(yú)那(nà)些对(duì)高(gāo)速率和(hé)重(zhòng)複性(xìng)有(yǒu)強(qiáng)烈需求的(de)算法,具有(yǒu)先(xiān)天(tiān)优勢的(de)FPGA就(jiù)是(shì)其最(zuì)好(hǎo)的(de)選擇。而(ér)那(nà)些对(duì)延遲有(yǒu)极(jí)高(gāo)需求的(de)數據(jù)操作和(hé)轉(zhuǎn)換,FPGA也(yě)是(shì)候選人(rén)。
考慮到(dào)Altera已經(jīng)在(zài)一(yī)个(gè)SoC上(shàng)集成(chéng)了(le)ARM处理器和(hé)FPGA,这(zhè)很自(zì)然地(dì)会(huì)想(xiǎng)到(dào)英特(tè)爾会(huì)試图(tú)用(yòng)X86內(nèi)核全(quán)面(miàn)替換ARM內(nèi)核来(lái)做類(lèi)似的(de)設備。但它(tā)看(kàn)起来(lái)不(bù)像这(zhè)会(huì)發(fà)生(shēng)。
首先(xiān),在(zài)2016年(nián)第(dì)二(èr)季度(dù)英特(tè)爾财务聲明(míng)会(huì)上(shàng),Krzanich承諾,英特(tè)爾将加強(qiáng)对(duì)目前(qián)使用(yòng)Altera的(de)ARM-FPGA芯片(piàn)客戶的(de)支持(chí)。
Waxman進(jìn)一(yī)步澄清(qīng):“我(wǒ)们(men)的(de)观點(diǎn)是(shì)会(huì)以(yǐ)某種(zhǒng)形式把FPGA集成(chéng)到(dào)Xeon里(lǐ)。我(wǒ)们(men)已經(jīng)公開(kāi)宣布(bù)将会(huì)打(dǎ)造第(dì)一(yī)代(dài)使用(yòng)这(zhè)種(zhǒng)單一(yī)封(fēng)裝(zhuāng)的(de)設備,但是(shì)我(wǒ)们(men)将根(gēn)據(jù)進(jìn)展(zhǎn)情(qíng)況調整方(fāng)向(xiàng),甚至(zhì)可(kě)能(néng)会(huì)在(zài)同(tóng)一(yī)个(gè)die上(shàng)实現(xiàn)。我(wǒ)们(men)将根(gēn)據(jù)客戶的(de)反(fǎn)饋了(le)解(jiě)什麼(me)是(shì)正(zhèng)确的(de)組合。
順便说(shuō)一(yī)下(xià),我(wǒ)仍然期(qī)待看(kàn)到(dào)沒(méi)有(yǒu)集成(chéng)的(de)系(xì)統,保持(chí)他(tā)们(men)会(huì)做系(xì)統級的(de)協同(tóng)。我(wǒ)们(men)不(bù)会(huì)将Xeon與(yǔ)FPGA以(yǐ)多(duō)種(zhǒng)方(fāng)式組合集成(chéng),反(fǎn)之我(wǒ)们(men)会(huì)在(zài)市(shì)场上(shàng)找(zhǎo)到(dào)正(zhèng)确的(de)目标(biāo)和(hé)平衡。”
虽然Altera的(de)工具集利用(yòng)OpenCL編程模型獲得應(yìng)用(yòng)程序代(dài)碼,并将其轉(zhuǎn)換为(wèi)RTL(FPGA的(de)原生(shēng)語(yǔ)言),但是(shì)有(yǒu)趣的(de)是(shì),英特(tè)爾并不(bù)認为(wèi)FPGA在(zài)數據(jù)中(zhōng)心(xīn)的(de)未来(lái)成(chéng)功是(shì)基于(yú)OpenCL與(yǔ)RTL工具集成(chéng)的(de)改進(jìn)或(huò)更(gèng)廣泛地(dì)采用(yòng)OpenCL。
Waxman也(yě)強(qiáng)調地(dì)说(shuō):“这(zhè)并不(bù)是(shì)以(yǐ)OpenCL为(wèi)基礎的(de)。”虽然我(wǒ)们(men)确实把OpenCL看(kàn)作是(shì)進(jìn)一(yī)步擴大FPGA應(yìng)用(yòng)範圍的(de)一(yī)个(gè)途徑,但目前(qián)FPGA的(de)初始雲(yún)端部(bù)署(shǔ)可(kě)能(néng)由(yóu)更(gèng)具能(néng)力的(de)公司完成(chéng),但他(tā)们(men)并沒(méi)有(yǒu)要(yào)求我(wǒ)们(men)提(tí)供OpenCL。Waxman補充说(shuō)。
Waxman在(zài)不(bù)能(néng)“自(zì)由(yóu)”地(dì)談論的(de)情(qíng)況下(xià),暗(àn)示英特(tè)爾有(yǒu)計(jì)劃(huà)使FPGA更(gèng)容易編程。他(tā)表(biǎo)示Intel将会(huì)为(wèi)程序員提(tí)供RTL庫,方(fāng)便他(tā)们(men)調用(yòng)在(zài)FPGA上(shàng)部(bù)署(shǔ)的(de)例程,并推動(dòng)在(zài)其上(shàng)執行應(yìng)用(yòng)程序的(de)gate的(de)形成(chéng),来(lái)实現(xiàn)應(yìng)用(yòng)程序例程的(de)gate,而(ér)不(bù)是(shì)讓他(tā)们(men)自(zì)己創建例程。这(zhè)有(yǒu)一(yī)定(dìng)的(de)意(yì)義,與(yǔ)Convey(現(xiàn)在(zài)是(shì)美光(guāng)科技的(de)一(yī)个(gè)部(bù)門(mén))幾(jǐ)年(nián)前(qián)用(yòng)FPGA加速系(xì)統处理的(de)方(fāng)案(àn)一(yī)樣(yàng)。
Waxman说(shuō):“我(wǒ)認为(wèi)有(yǒu)一(yī)个(gè)連(lián)續的(de)加速。在(zài)一(yī)開(kāi)始,你可(kě)能(néng)不(bù)知道(dào)你正(zhèng)在(zài)試图(tú)加速什麼(me),只(zhī)是(shì)做了(le)一(yī)些嘗試,因(yīn)此(cǐ)在(zài)这(zhè)个(gè)階(jiē)段(duàn)加速,你想(xiǎng)要(yào)的(de)是(shì)一(yī)个(gè)更(gèng)通(tòng)用(yòng)的(de)目的(de)。當你開(kāi)始真(zhēn)正(zhèng)地(dì)想(xiǎng)要(yào)加速的(de)时(shí)候,你会(huì)想(xiǎng)要(yào)更(gèng)高(gāo)效的(de),更(gèng)低的(de)功耗和(hé)更(gèng)少(shǎo)的(de)空間(jiān),这(zhè)时(shí)你就(jiù)会(huì)把焦點(diǎn)移到(dào)FPGA上(shàng)。”
Waxman還(huán)引用(yòng)了(le)Microsoft在(zài)其“Catapult”系(xì)統上(shàng)使用(yòng)FPGA加速的(de)方(fāng)案(àn)来(lái)说(shuō)明(míng)。
該系(xì)統采用(yòng)其OpenCloudServer并添加FPGA夾层卡(kǎ)作为(wèi)加速器。我(wǒ)们(men)在(zài)3月(yuè)份研究了(le)这(zhè)个(gè)項目,将这(zhè)些加速器應(yìng)用(yòng)在(zài)Google上(shàng)執行相同(tóng)的(de)图(tú)像識别訓練算法,得出(chū)的(de)結果(guǒ)顯示,25瓦(wǎ)的(de)FPGA器件(jiàn)相对(duì)于(yú)使用(yòng)NvidiaTeslaK20GPU加速器(235瓦(wǎ)特(tè))的(de)服(fú)务器,提(tí)高(gāo)了(le)更(gèng)好(hǎo)的(de)性(xìng)能(néng)/瓦(wǎ)特(tè)。
正(zhèng)如(rú)我(wǒ)们(men)所(suǒ)说(shuō),我(wǒ)们(men)对(duì)于(yú)微软(ruǎn)和(hé)Google發(fà)布(bù)的(de)性(xìng)能(néng)數據(jù)毫(háo)无疑問(wèn)。但是(shì)对(duì)分(fēn)立的(de)GPU或(huò)FPGA執行應(yìng)用(yòng)性(xìng)能(néng)和(hé)对(duì)自(zì)身(shēn)的(de)热(rè)配置文(wén)件(jiàn)進(jìn)行测量(liàng)都是(shì)不(bù)公平的(de)。你必須在(zài)服(fú)务器节(jié)點(diǎn)級别上(shàng)看(kàn)到(dào)这(zhè)一(yī)點(diǎn)。
如(rú)果(guǒ)意(yì)識到(dào)这(zhè)點(diǎn),得到(dào)FPGA輔助的(de)Microsoft服(fú)务器在(zài)系(xì)統級只(zhī)稍稍領先(xiān)于(yú)用(yòng)TeslaK20s的(de)Google服(fú)务器。(这(zhè)些只(zhī)是(shì)我(wǒ)们(men)基于(yú)每秒(miǎo)每瓦(wǎ)特(tè)图(tú)像处理性(xìng)能(néng)的(de)估計(jì))。在(zài)这(zhè)个(gè)对(duì)比中(zhōng),Microsoft應(yìng)該不(bù)考慮成(chéng)本(běn)。而(ér)且坦白说(shuō),不(bù)同(tóng)于(yú)什麼(me)都配備的(de)TeslaGPU,微软(ruǎn)開(kāi)放(fàng)雲(yún)端服(fú)务器并沒(méi)有(yǒu)使用(yòng)Juice或(huò)Cooling。真(zhēn)正(zhèng)的(de)評测怎麼(me)都会(huì)使用(yòng)GPU夾层卡(kǎ),同(tóng)时(shí)還(huán)需要(yào)考慮热(rè)量(liàng),性(xìng)能(néng)和(hé)價格等因(yīn)素。
但是(shì)Waxman讨論的(de)重(zhòng)點(diǎn)仍然是(shì)那(nà)个(gè)。“在(zài)某个(gè)时(shí)候,你真(zhēn)的(de)很想(xiǎng)要(yào)那(nà)个(gè)能(néng)給(gěi)你驚喜,并且能(néng)做到(dào)更(gèng)低功耗的(de)方(fāng)案(àn)。而(ér)这(zhè)就(jiù)是(shì)我(wǒ)们(men)的(de)FPGA方(fāng)案(àn)所(suǒ)擅长的(de)方(fāng)面(miàn)。”
雲(yún)端業务
最(zuì)後(hòu)要(yào)考慮的(de)是(shì)英特(tè)爾的(de)雲(yún)端業务。这(zhè)些客戶現(xiàn)在(zài)占據(jù)了(le)他(tā)们(men)數據(jù)中(zhōng)心(xīn)集团(tuán)收(shōu)入(rù)的(de)25%。
整體(tǐ)来(lái)看(kàn),他(tā)们(men)的(de)購買(mǎi)量(liàng)每年(nián)增长約25%。預計(jì)從2016年(nián)開(kāi)始,未来(lái)幾(jǐ)年(nián)整體(tǐ)數據(jù)中(zhōng)心(xīn)集团(tuán)業务都将增长15%。讓我(wǒ)们(men)做一(yī)些計(jì)算。
如(rú)果(guǒ)英特(tè)爾的(de)計(jì)劃(huà)如(rú)期(qī)实施,他(tā)的(de)數據(jù)中(zhōng)心(xīn)集团(tuán)2016年(nián)收(shōu)益将会(huì)达(dá)到(dào)166亿(yì)美元(yuán)。雲(yún)端服(fú)务提(tí)供商(其中(zhōng)包(bāo)括在(zài)TheNextPlatform上(shàng)使用(yòng)我(wǒ)们(men)的(de)語(yǔ)言的(de)雲(yún)端構建者(zhě)和(hé)超大規模計(jì)算者(zhě))占大約41亿(yì)美元(yuán),其餘歸屬于(yú)英特(tè)爾數據(jù)中(zhōng)心(xīn),銷售數據(jù)大約为(wèi)125亿(yì)美元(yuán)。因(yīn)此(cǐ),英特(tè)爾數據(jù)中(zhōng)心(xīn)的(de)業务增长在(zài)12%左(zuǒ)右(yòu)(除雲(yún)端外(wài)),是(shì)雲(yún)端速率的(de)一(yī)半。英特(tè)爾需要(yào)以(yǐ)任何方(fāng)式来(lái)滿足雲(yún)端的(de)增长和(hé)明(míng)顯的(de)FPGA需求,即使它(tā)只(zhī)占用(yòng)Xeon容量(liàng)的(de)一(yī)點(diǎn)點(diǎn)。对(duì)于(yú)英特(tè)爾来(lái)说(shuō)是(shì)这(zhè)个(gè)的(de)選擇比讓GPU加速持(chí)續增长的(de)方(fāng)案(àn)要(yào)好(hǎo)。
編程方(fāng)面(miàn)可(kě)能(néng)是(shì)阻礙FPGA被(bèi)廣泛采用(yòng)的(de)一(yī)个(gè)主(zhǔ)因(yīn)(不(bù)像其他(tā)加速器,具有(yǒu)豐富的(de)開(kāi)發(fà)生(shēng)态系(xì)統,如(rú)NvidiaGPU的(de)CUDA)。这(zhè)就(jiù)驅動(dòng)程序員去(qù)基于(yú)C語(yǔ)言去(qù)做擴展(zhǎn)設計(jì),或(huò)使用(yòng)OpenCL,而(ér)不(bù)是(shì)用(yòng)过(guò)去(qù)困擾FPGA開(kāi)發(fà)的(de)低級模型。但即使在(zài)應(yìng)用(yòng)的(de)过(guò)程中(zhōng)有(yǒu)这(zhè)麼(me)多(duō)里(lǐ)程碑,FPGA仍然不(bù)被(bèi)主(zhǔ)流青(qīng)睐。我(wǒ)们(men)将会(huì)探索解(jiě)決編程問(wèn)題(tí)的(de)方(fāng)法和(hé)機(jī)会(huì)。
虽然我(wǒ)们(men)已經(jīng)與(yǔ)这(zhè)个(gè)相对(duì)較小的(de)生(shēng)态系(xì)統中(zhōng)的(de)许多(duō)供應(yìng)商(包(bāo)括Altera和(hé)Xilinx,两(liǎng)个(gè)主(zhǔ)要(yào)供應(yìng)商)進(jìn)行了(le)交流,但按照FPGA长期(qī)研究員RussellTessier所(suǒ)说(shuō),FPGA在(zài)更(gèng)廣闊的(de)市(shì)场上(shàng)大展(zhǎn)拳脚的(de)日(rì)子還(huán)在(zài)前(qián)面(miàn),新的(de)發(fà)展(zhǎn)意(yì)味着更(gèng)廣泛的(de)采用(yòng)。
他(tā)在(zài)马薩诸塞大学(他(tā)還(huán)在(zài)Altera工作,并且MentorGraphics收(shōu)購的(de)虛拟機(jī)工程的(de)創始人(rén))研究了(le)FPGA二(èr)十(shí)多(duō)年(nián),他(tā)認为(wèi)FPGA從科学項目到(dào)企業應(yìng)用(yòng)的(de)形勢正(zhèng)式緩變(biàn)化(huà)。他(tā)認为(wèi)其中(zhōng)的(de)關(guān)鍵是(shì)来(lái)自(zì)于(yú)設計(jì)工具的(de)改進(jìn),設計(jì)人(rén)員不(bù)斷提(tí)高(gāo)他(tā)们(men)設計(jì)高(gāo)水(shuǐ)平。除此(cǐ)與(yǔ)外(wài),工具vendor可(kě)以(yǐ)更(gèng)好(hǎo)地(dì)引導芯片(piàn)發(fà)展(zhǎn)。他(tā)補充说(shuō),設備內(nèi)的(de)大量(liàng)邏輯量(liàng)意(yì)味着用(yòng)戶能(néng)够实現(xiàn)更(gèng)多(duō)的(de)功能(néng),这(zhè)使得FPGA对(duì)更(gèng)多(duō)領域更(gèng)廣泛的(de)吸引力。
Tessier说(shuō):“在(zài)过(guò)去(qù)幾(jǐ)年(nián)里(lǐ),FPGA的(de)一(yī)个(gè)明(míng)顯趨勢就(jiù)是(shì)这(zhè)些設備更(gèng)容易“程序化(huà)”。
Xilinx目前(qián)鼓勵使用(yòng)其Vivado産品的(de)时(shí)候,用(yòng)C語(yǔ)言進(jìn)行設計(jì)。Altera還(huán)有(yǒu)一(yī)个(gè)已經(jīng)開(kāi)發(fà)的(de)OpenCL环(huán)境。關(guān)鍵是(shì)两(liǎng)家(jiā)公司都在(zài)試图(tú)創建一(yī)个(gè)环(huán)境,讓用(yòng)戶可(kě)以(yǐ)使用(yòng)更(gèng)熟悉的(de)編程(如(rú)C和(hé)OpenCL),而(ér)不(bù)必是(shì)使用(yòng)RTL設計(jì)專家(jiā)所(suǒ)擅长的(de)Verilog或(huò)VHDL。虽然在(zài)过(guò)去(qù)幾(jǐ)年(nián)里(lǐ)取(qǔ)得不(bù)錯的(de)成(chéng)績,但这(zhè)仍然处于(yú)推進(jìn)的(de)階(jiē)段(duàn),不(bù)过(guò)这(zhè)将有(yǒu)助于(yú)把更(gèng)多(duō)的(de)事(shì)情(qíng)地(dì)移入(rù)主(zhǔ)流。
其中(zhōng)一(yī)个(gè)对(duì)FPGA真(zhēn)正(zhèng)有(yǒu)利的(de)因(yīn)素就(jiù)是(shì)如(rú)果(guǒ)将其和(hé)芯片(piàn)搭配使用(yòng),建立一(yī)个(gè)快(kuài)速的(de)內(nèi)部(bù)互聯,它(tā)能(néng)解(jiě)決memory和(hé)數據(jù)移動(dòng)中(zhōng)的(de)限制。这(zhè)種(zhǒng)优勢就(jiù)是(shì)吸引Intel收(shōu)購Altera的(de)主(zhǔ)要(yào)誘因(yīn)。另(lìng)外(wài),如(rú)果(guǒ)像英特(tè)爾和(hé)IBM这(zhè)樣(yàng)的(de)大公司能(néng)够積极(jí)推動(dòng)FPGA的(de)软(ruǎn)件(jiàn)生(shēng)态系(xì)統的(de)建設,其應(yìng)用(yòng)市(shì)场将会(huì)迅速擴张(zhāng)。FPGA的(de)主(zhǔ)流化(huà)(至(zhì)少(shǎo)現(xiàn)在(zài)沒(méi)有(yǒu)GPU那(nà)麼(me)重(zhòng)要(yào),)可(kě)能(néng)会(huì)更(gèng)快(kuài)地(dì)出(chū)現(xiàn)。
Tessier解(jiě)釋:“标(biāo)準核心(xīn)处理器集成(chéng)的(de)增加肯定(dìng)是(shì)關(guān)鍵所(suǒ)在(zài)。过(guò)去(qù)的(de)障礙是(shì)語(yǔ)言和(hé)工具,随着这(zhè)些障礙越来(lái)越少(shǎo),为(wèi)芯片(piàn)供應(yìng)商新的(de)合作機(jī)会(huì)打(dǎ)開(kāi)了(le)一(yī)扇(shàn)門(mén)。由(yóu)于(yú)这(zhè)些和(hé)其他(tā)“主(zhǔ)流化(huà)”趨勢出(chū)現(xiàn),不(bù)斷做出(chū)的(de)改變(biàn)的(de)FPGA的(de)應(yìng)用(yòng)領域将繼續增长。例如(rú),金(jīn)融服(fú)务商店(diàn)是(shì)第(dì)一(yī)个(gè)使用(yòng)FPGA進(jìn)行财务趨勢和(hé)股票(piào)選擇分(fēn)析的(de)用(yòng)戶,但使用(yòng)案(àn)例正(zhèng)在(zài)擴大。現(xiàn)在(zài)有(yǒu)更(gèng)強(qiáng)的(de)設備可(kě)以(yǐ)解(jiě)決更(gèng)大的(de)問(wèn)題(tí)。
更(gèng)廣泛的(de)應(yìng)用(yòng)領域
除此(cǐ)之外(wài),FPGA通(tòng)过(guò)的(de)其他(tā)新領域發(fà)現(xiàn)新用(yòng)途,包(bāo)括DNA测序,安(ān)全(quán)性(xìng),加密和(hé)一(yī)些關(guān)鍵的(de)機(jī)器学習任务。
當然,我(wǒ)们(men)希望FPGA變(biàn)得強(qiáng)大,并“進(jìn)入(rù)”世界上(shàng)最(zuì)大的(de)雲(yún)端和(hé)超大規模數據(jù)中(zhōng)心(xīn),Xilnix數據(jù)中(zhōng)心(xīn)部(bù)門(mén)副總(zǒng)裁HamantDhulla对(duì)此(cǐ)表(biǎo)示強(qiáng)烈赞同(tóng)。他(tā)在(zài)2016年(nián)初,他(tā)告訴TheNextPlatform,“异(yì)構計(jì)算已經(jīng)不(bù)再是(shì)一(yī)種(zhǒng)趨勢,而(ér)是(shì)現(xiàn)实”,也(yě)就(jiù)是(shì)在(zài)那(nà)个(gè)时(shí)候,微软(ruǎn)推出(chū)了(le)使用(yòng)FPGA的(de)Catapult案(àn)例(現(xiàn)在(zài)就(jiù)很多(duō)或(huò)以(yǐ)後(hòu)会(huì)很多(duō)),英特(tè)爾收(shōu)購了(le)Altera以(yǐ)及(jí)看(kàn)到(dào)了(le)更(gèng)多(duō)FPGA将廣泛應(yìng)用(yòng)在(zài)數據(jù)中(zhōng)心(xīn)的(de)聲明(míng)。
從機(jī)器学習,高(gāo)性(xìng)能(néng)計(jì)算,數據(jù)分(fēn)析等領域,FPGA在(zài)更(gèng)多(duō)樣(yàng)化(huà)的(de)應(yìng)用(yòng)領域中(zhōng)嶄露(lù)头(tóu)角(jiǎo)。这(zhè)些都與(yǔ)FPGA上(shàng)嵌入(rù)了(le)越来(lái)越多(duō)可(kě)用(yòng)的(de)on-chip存儲器有(yǒu)關(guān),这(zhè)些都是(shì)FPGA制造商和(hé)潛在(zài)終(zhōng)端用(yòng)戶所(suǒ)期(qī)待的(de)。Dhulla表(biǎo)示,市(shì)场潛力足够大,讓Xilinx能(néng)够調整其業务的(de)方(fāng)式。过(guò)去(qù)幾(jǐ)年(nián),存儲和(hé)网(wǎng)絡主(zhǔ)導了(le)FPGA用(yòng)戶群(qún)。但未来(lái)五(wǔ)年(nián)內(nèi),計(jì)算端的(de)需求将遠(yuǎn)遠(yuǎn)超过(guò)存儲和(hé)网(wǎng)絡,并都将沿着稳定(dìng)的(de)增长線(xiàn)繼續發(fà)展(zhǎn)。
在(zài)FPGA其他(tā)的(de)热(rè)門(mén)領域(包(bāo)括機(jī)器学習),它(tā)们(men)的(de)更(gèng)像是(shì)一(yī)个(gè)带(dài)有(yǒu)GPU的(de)“協作”加速器。毫(háo)无疑問(wèn),对(duì)于(yú)许多(duō)機(jī)器学習工作負载的(de)訓練部(bù)分(fēn),GPU是(shì)主(zhǔ)要(yào)的(de)。因(yīn)此(cǐ)为(wèi)这(zhè)里(lǐ)需要(yào)很多(duō)計(jì)算能(néng)力,就(jiù)像HPC一(yī)樣(yàng),其中(zhōng)powerenvelopetradeoff值得的(de)。但是(shì)这(zhè)些客戶購買(mǎi)了(le)數十(shí)或(huò)數百(bǎi)个(gè)GPU,而(ér)不(bù)是(shì)數十(shí)万(wàn)个(gè),龐大的(de)加速器數目正(zhèng)使用(yòng)在(zài)機(jī)器学習pipeline的(de)推理部(bù)分(fēn),这(zhè)就(jiù)是(shì)市(shì)场所(suǒ)在(zài)。
正(zhèng)如(rú)我(wǒ)们(men)指出(chū)的(de),Nvidia正(zhèng)在(zài)使用(yòng)两(liǎng)个(gè)独立的(de)GPU(用(yòng)M4来(lái)訓練,更(gèng)低功耗的(de)M4插入(rù)来(lái)削減服(fú)务器)来(lái)抵消这(zhè)一(yī)點(diǎn),但Dhulla認为(wèi)FPGA仍然能(néng)够通(tòng)过(guò)采用(yòng)PCIe方(fāng)法降低功耗,也(yě)可(kě)以(yǐ)嵌入(rù)超大規模數據(jù)中(zhōng)心(xīn)。
他(tā)们(men)的(de)SDAccel編程环(huán)境通(tòng)过(guò)提(tí)供对(duì)C,C++和(hé)OpenCL的(de)高(gāo)級接口(kǒu),使其更(gèng)实用(yòng),但是(shì)推動(dòng)超大規模和(hé)HPC采用(yòng)的(de)真(zhēn)正(zhèng)途徑是(shì)通(tòng)过(guò)最(zuì)終(zhōng)用(yòng)戶示例。
當涉及(jí)到(dào)这(zhè)些早(zǎo)期(qī)的(de)用(yòng)戶,就(jiù)像为(wèi)下(xià)一(yī)代(dài)的(de)FPGA的(de)應(yìng)用(yòng)搭建了(le)舞(wǔ)台(tái),Dhulla指向(xiàng)像EdicoGenome这(zhè)樣(yàng)的(de)公司。Xilinx目前(qián)還(huán)與(yǔ)其他(tā)領域的(de)客戶合作,包(bāo)括石(dàn)油和(hé)天(tiān)然气(qì)和(hé)金(jīn)融方(fāng)面(miàn)的(de)曆史計(jì)算方(fāng)面(miàn)。早(zǎo)期(qī)客戶将Xilinx的(de)FPGA應(yìng)用(yòng)在(zài)機(jī)器学習,图(tú)像識别和(hé)分(fēn)析以(yǐ)及(jí)安(ān)全(quán)性(xìng)方(fāng)面(miàn),这(zhè)可(kě)以(yǐ)看(kàn)作他(tā)们(men)計(jì)算加速業务發(fà)展(zhǎn)的(de)第(dì)一(yī)步。
盡管(guǎn)双(shuāng)精度(dù)性(xìng)能(néng)和(hé)總(zǒng)體(tǐ)價格不(bù)佳,FPGA的(de)真(zhēn)正(zhèng)的(de)大規模應(yìng)用(yòng)機(jī)会(huì)在(zài)于(yú)雲(yún)端。因(yīn)为(wèi)FPGA可(kě)以(yǐ)提(tí)供GPU所(suǒ)不(bù)能(néng)提(tí)供的(de)优勢。如(rú)果(guǒ)FPGA供應(yìng)商能(néng)够说(shuō)服(fú)其最(zuì)終(zhōng)用(yòng)戶,他(tā)们(men)的(de)加速器可(kě)以(yǐ)提(tí)供相當大的(de)性(xìng)能(néng)提(tí)升(shēng)(在(zài)某些情(qíng)況下(xià)他(tā)们(men)会(huì)这(zhè)樣(yàng)做)給(gěi)關(guān)鍵的(de)工作負载。提(tí)供一(yī)个(gè)通(tòng)过(guò)带(dài)有(yǒu)其他(tā)加速器(例如(rú)CUDA)的(de)complexity-wise的(de)編程环(huán)境推進(jìn)OpenCL開(kāi)發(fà),通(tòng)过(guò)在(zài)雲(yún)端中(zhōng)提(tí)供FPGA来(lái)解(jiě)決價格問(wèn)題(tí)。这(zhè)可(kě)能(néng)是(shì)一(yī)个(gè)新的(de)希望。
當然,这(zhè)種(zhǒng)希望来(lái)源于(yú)将FPGA部(bù)署(shǔ)到(dào)有(yǒu)超密集服(fú)务器雲(yún)端架構內(nèi),而(ér)不(bù)是(shì)在(zài)單機(jī)的(de)銷售上(shàng)。这(zhè)種(zhǒng)模式已經(jīng)在(zài)FPGA的(de)金(jīn)融服(fú)务中(zhōng)發(fà)生(shēng)。
正(zhèng)如(rú)他(tā)们(men)GPU加速器“夥伴”圍繞深度(dù)学習進(jìn)行拉動(dòng),以(yǐ)便迅速得到(dào)更(gèng)多(duō)的(de)用(yòng)戶,FPGA設備在(zài)探索一(yī)个(gè)通(tòng)过(guò)解(jiě)決神經(jīng)网(wǎng)絡和(hé)深度(dù)学習的(de)問(wèn)題(tí)的(de)方(fāng)式找(zhǎo)尋入(rù)侵市(shì)场的(de)真(zhēn)正(zhèng)的(de)機(jī)会(huì)。
新的(de)應(yìng)用(yòng)程序主(zhǔ)機(jī)意(yì)味着新的(de)市(shì)场,随着雲(yún)端應(yìng)用(yòng)的(de)推廣消除了(le)一(yī)些管(guǎn)理開(kāi)銷,它(tā)可(kě)能(néng)意(yì)味着更(gèng)廣泛的(de)采用(yòng)。FPGA供應(yìng)商努力推動(dòng)它(tā)在(zài)一(yī)些關(guān)鍵的(de)機(jī)器学習,神經(jīng)网(wǎng)絡和(hé)搜索方(fāng)面(miàn)的(de)應(yìng)用(yòng)。FPGA在(zài)诸如(rú)自(zì)然語(yǔ)言处理,醫学成(chéng)像,深度(dù)數據(jù)檢测等領域中(zhōng)的(de)超大規模上(shàng)下(xià)文(wén)中(zhōng)變(biàn)得越来(lái)越普遍(biàn)。
在(zài)过(guò)去(qù)一(yī)年(nián)里(lǐ),FPGA的(de)多(duō)種(zhǒng)應(yìng)用(yòng)得到(dào)曝光(guāng),特(tè)别是(shì)在(zài)深度(dù)学習和(hé)神經(jīng)网(wǎng)絡,以(yǐ)及(jí)图(tú)像識别和(hé)自(zì)然語(yǔ)言处理等領域。例如(rú),微软(ruǎn)使用(yòng)FPGA在(zài)1,632个(gè)节(jié)點(diǎn)上(shàng)提(tí)供2倍的(de)搜索服(fú)务,并采用(yòng)創新的(de)高(gāo)吞吐量(liàng)网(wǎng)絡来(lái)支持(chí)AlteraFPGA驅動(dòng)的(de)工作。中(zhōng)國(guó)的(de)搜索引擎巨头(tóu)百(bǎi)度(dù)(也(yě)是(shì)许多(duō)深度(dù)学習和(hé)神經(jīng)网(wǎng)絡任务GPU用(yòng)戶)正(zhèng)在(zài)用(yòng)FPGA執行存儲控制,其每天(tiān)的(de)數據(jù)吞吐量(liàng)在(zài)100TB到(dào)1PB之間(jiān)。
使用(yòng)FPGA的(de)大規模數據(jù)中(zhōng)心(xīn)和(hé)其他(tā)領域的(de)應(yìng)用(yòng)正(zhèng)在(zài)吸引人(rén)们(men)对(duì)FPGA的(de)單精度(dù)浮點(diǎn)性(xìng)能(néng)的(de)更(gèng)多(duō)關(guān)注。
虽然一(yī)些案(àn)例使用(yòng)(包(bāo)括百(bǎi)度(dù)示例),将GPU作为(wèi)計(jì)算加速器和(hé)FPGA用(yòng)在(zài)存儲端,但Altera,Xilnix,Nallatech和(hé)IBM的(de)研究人(rén)員在(zài)OpenPower聯盟展(zhǎn)示了(le)FPGA在(zài)雲(yún)端深度(dù)学習的(de)光(guāng)明(míng)前(qián)景。















