Hlbšie učenie s FPGA

Gomdra Khenpo Tsultrim Tenzin - Esenciálne učenie tibetského budhizmu (Apríl 2019).

Anonim

Hlbšie učenie s FPGA


Tu je dôvod, prečo FPGA robia obraty napriek skutočnosti, že GPU sú de facto štandardom pre implementáciu algoritmov hlbokého učenia.

V hlbokom učení sa grafické spracovacie jednotky alebo GPU stali výpočtovou architektúrou, ktorú si zvolili pre svoju bezkonkurenčnú rýchlosť. Takže prečo by inžinieri prejsť na FPGA pre implementáciu algoritmov hlbokého učenia, keď GPU robia takú úžasnú prácu a oni sa na ňom stále lepšie "" src = "// www.allaboutcircuits.com/uploads/articles/Image_1_-_FPGA_cluster.jpg" />

Klastre FPGA môžu vykompenzovať rýchlosť a výkon podobný GPU.

Spoločnosti ako Microsoft a čínsky vyhľadávací gigant Baidu najskôr upozornili na používanie FPGA v hlbokých vzdelávacích aplikáciách pred pár rokmi. Preložili hlboké algoritmy učenia na FPGA a tvrdili, že FPGA ponúkajú výrazné zlepšenie rýchlosti pri zlomku spotreby energie v porovnaní s GPU.

Spoločnosť Microsoft, ktorá prevádzkuje veľké dátové centrá pre svoj vyhľadávač Bing a iné operácie s vysokým výkonom (HPC) ako cloud Azure, mala problémy s nasadením GPU ako jediného výpočtového zdroja. GPU sú rýchle a to je kľúčový atribút v hlbokom učebnom svete, ktorý je ťažký pre algoritmy. Inžinieri spoločnosti Microsoft však chcú urýchliť algoritmy hlbokého učenia bez výrazného zvýšenia spotreby energie.

Potom sa vyskytol tento problém nízkeho dopytu v danom čase, ktorý zanechal veľa kapacity GPU nepoužívaných. Takže Microsoft sa rozhodol používať lacnejšie FPGA - Altera Startix 5-in operácie, ako je spracovanie Bing algoritmy vyhľadávania. Výpočtový gigant zaznamenal zvýšenie celkového výkonu o faktor 2x, keď počíta náklady na servery a spotrebu energie.

Príležitosti a výzvy

Teraz použite Altera Arria 10 FPGA, ktoré spoločnosť Microsoft využíva v koncepčnej koncepcii neurónovej siete (CNN). Spracováva 233 obrázkov za sekundu, pričom spotrebuje 25 wattov. Na druhej strane GPU Tesla K40 od ​​spoločnosti NVIDIA spracováva 500 až 824 obrázkov za sekundu, zatiaľ čo kreslí 235 wattov.

Nakoniec môžu byť nasadené tri FPGA, aby sa dosiahol procesorový výkon, ktorý je ekvivalentný grafickému procesoru NVIDIA a zníži spotrebu energie o takmer 30 percent. To robí FPGA dôveryhodnou alternatívou pre ťažké výpočtové aplikácie v hlbokej vzdelávacej sfére.

FPGA budú tiež pravdepodobnou voľbou pre vstavané systémy, pretože sú výpočtovo náročné a podporujú aplikácie v reálnom čase. Ďalej existuje väčšia rozmanitosť funkcií, ktoré môžu FPGA vykonávať, zatiaľ čo môžu rýchlo nakonfigurovať počet vrstiev a rozmerov v sieti.

TeraDeep využíva FPGA na ponúkanie dávkového spracovania na prispôsobenie rýchlosti GPU. Obrázok je s láskavým dovolením TeraDeep.

Xilinx, spoločnosť Altera na trhu s FPGA, investovala do spoločnosti TeraDeep, ktorá zrýchľuje algoritmy hlbšieho učenia pomocou Xilinx FPGA. TeraDeep je výkopom z výskumného projektu na Purdue University, ktorý sa snažil získať viacvrstvové CNN na spracovanie obrazu a podobné úlohy, ako rozpoznávanie reči.

Avšak, zatiaľ čo FPGA vyhrávajú reflektor ako hlboký učebný urýchľovač s obálkou s nízkym výkonom, kľúčovým úskokom je obtiažnosť programovania FPGA. Na rozdiel od GPU, ktoré pracujú so softvérom, inžinieri musia konvertovať softvérový algoritmus na hardvérový blok pred jeho mapovaním na FPGA.

Hlboké vzdelávanie súvisiace s vývojom aplikácií pre FPGA je stále v počiatočných fázach a veľké firmy ako Microsoft pravdepodobne budú používať GPU pre výcvikové modely pri prenose ich na FPGA pre nahrávanie produkcie. Medzitým FPGA s najväčšou pravdepodobnosťou budú pokračovať vo zvyšovaní výkonnosti a efektívnosti.

Tretia a posledná časť seriálu o hlbokom vzdelávaní sa bude týkať toho, kde sa DSP stali na tomto rýchlo sa rozvíjajúcom trhu.