Labas svečias

Prisijungti / Registruotis

Welcome,{$name}!

/ Atsijungti
lietuvių
EnglishDeutschItaliaFrançais한국의русскийSvenskaNederlandespañolPortuguêspolski繁体中文SuomiGaeilgeSlovenskáSlovenijaČeštinaMelayuMagyarországHrvatskaDanskromânescIndonesiaΕλλάδαБългарски езикGalegolietuviųMaoriRepublika e ShqipërisëالعربيةአማርኛAzərbaycanEesti VabariikEuskeraБеларусьLëtzebuergeschAyitiAfrikaansBosnaíslenskaCambodiaမြန်မာМонголулсМакедонскиmalaɡasʲພາສາລາວKurdîსაქართველოIsiXhosaفارسیisiZuluPilipinoසිංහලTürk diliTiếng ViệtहिंदीТоҷикӣاردوภาษาไทยO'zbekKongeriketবাংলা ভাষারChicheŵaSamoaSesothoCрпскиKiswahiliУкраїнаनेपालीעִבְרִיתپښتوКыргыз тилиҚазақшаCatalàCorsaLatviešuHausaગુજરાતીಕನ್ನಡkannaḍaमराठी
Namai > Dienoraštis > What Is an NPU and How Does It Work in AI Devices?

What Is an NPU and How Does It Work in AI Devices?

Neuroniniai apdorojimo įrenginiai (NPU) yra specializuoti procesoriai, skirti pagreitinti dirbtinio intelekto ir neuroninio tinklo darbo krūvį dideliu greičiu ir mažu energijos suvartojimu.Skirtingai nei CPU ir GPU, NPU daugiausia dėmesio skiria AI specifinėms operacijoms, tokioms kaip matricos dauginimas, konvoliucija, tenzorių apdorojimas, vaizdo atpažinimas, balso apdorojimas ir realaus laiko išvados.Šiame straipsnyje paaiškinama, kaip veikia NPU, jų vidinė architektūra, vaidmuo išmaniuosiuose telefonuose ir kraštiniuose įrenginiuose, kaip jie lyginami su procesoriais ir GPU, jų praktinis pritaikymas ir ateities tendencijos, formuojančios naujos kartos intelektualųjį skaičiavimą.

Katalogas

1. Kas yra NPU?
2. NPU pagrindinė architektūra ir apdorojimo moduliai
3. NPU išmaniuosiuose telefonuose ir mobiliajame AI
4. NPU vs GPU vs CPU: pagrindiniai AI apdorojimo skirtumai
5. Šiuolaikinės kompiuterijos specializuoti apdorojimo įrenginiai
6. NPU ateities tendencijos
7. Išvada

What Is an NPU and How Does It Work in AI Devices?

Kas yra NPU?

Neuroninis procesorius (NPU) yra specializuotas procesorius, skirtas dirbtinio intelekto užduotims atlikti efektyviau nei bendrosios paskirties procesorius.Jo pagrindinis vaidmuo yra paspartinti neuroninio tinklo operacijas, naudojamas tokiose funkcijose kaip vaizdo atpažinimas, balso apdorojimas, objektų aptikimas ir realaus laiko AI išvados.Unlike a CPU, which is built to manage many different computing tasks, an NPU is focused on AI-related calculations.Jis optimizuotas apdoroti didelius duomenų kiekius vienu metu, todėl tinka darbo krūviams, kuriems reikia greito modelio atpažinimo ir sprendimų priėmimo.Šiuolaikiniuose įrenginiuose NPU padeda dirbtinio intelekto funkcijoms veikti tiesiogiai vietinėje aparatinėje įrangoje, o ne visiškai priklausyti nuo debesies serverių.Tai leidžia išmaniesiems telefonams, išmaniesiems fotoaparatams, robotams, transporto priemonėms ir kraštiniams įrenginiams reaguoti greičiau ir naudojant mažiau energijos.Dėl šios priežasties NPU tapo svarbia šiuolaikinių išmaniųjų sistemų dalimi.

Pagrindinė NPU architektūra ir apdorojimo moduliai

NPU yra sukurtas iš kelių specializuotų aparatinės įrangos modulių, kurie veikia kartu, kad greitai ir efektyviai apdorotų neuroninio tinklo darbo krūvius.Vietoj to, kad kiekviena operacija būtų siunčiama per vieną bendrosios paskirties procesorių, darbo krūvis yra padalintas į tam skirtus aparatinės įrangos blokus, kurie nuolat lygiagrečiai apdoroja duomenis.Ši struktūra pagerina AI išvadų greitį, sumažina nereikalingą duomenų judėjimą, sumažina energijos sąnaudas ir padeda išlaikyti efektyvų atminties naudojimą.

Apdorojant dirbtinį intelektą, duomenys procesoriaus viduje perduodami keliais etapais.Įvesties duomenys pirmiausia patenka į skaičiavimo konvejerį, kuriame atliekamos didelės apimties matematinės operacijos.Tada tarpiniai rezultatai pereina per aktyvinimo apdorojimą, tenzoriaus pagreitį, su vaizdu susijusias operacijas ir atminties optimizavimo aparatinę įrangą, prieš sukuriant galutinę išvestį.Kadangi šie moduliai veikia kartu suderinta seka, NPU gali išlaikyti aukštą pralaidumą net ir naudodamas didelius neuroninių tinklų modelius.

Pagrindiniai skaičiavimo ir aktyvinimo moduliai

Pagrindinis skaičiavimo variklis NPU viduje yra dauginimo kaupimo (MAC) blokas.Dauguma neuroninio tinklo darbo krūvių pakartotinai daugina ir sudeda labai didelius duomenų rinkinius, todėl ši aparatinė įranga apdoroja didžiąją dalį AI skaičiavimo atlikdama išvadas.When input data enters a neural network, values are multiplied by stored weight values and then added together to generate new outputs.Šis procesas nuolat kartojasi daugelyje neuroninio tinklo sluoksnių.

Šiuolaikiniuose NPU dažnai yra šimtai ar tūkstančiai vienu metu veikiančių MAC įrenginių.Užuot skaičiuojusi vieną operaciją vienu metu, aparatinė įranga paskirsto darbo krūvius daugeliu lygiagrečių vykdymo kelių.Didelės AI duomenų partijos kartu juda per procesorių, labai pagerindamos išvadų greitį ir išlaikant mažą delsą.Pavyzdžiui, vaizdo atpažinimo sistemose MAC įrenginiai pakartotinai nuskaito pikselių grupes ir derina filtrų reikšmes, kad aptiktų kraštus, tekstūras, formas ir raštus.In language models, the same hardware performs large-scale vector and matrix operations to process tokens and relationships between words.

Atlikus šiuos matematinius skaičiavimus, rezultatai perkeliami į aktyvinimo funkcijos modulį.Neuroniniai tinklai priklauso nuo netiesinių aktyvinimo funkcijų, kad apdorotų sudėtingus duomenų ryšius.Be aktyvinimo apdorojimo tinklas atliktų tik paprastus tiesinius skaičiavimus ir negalėtų efektyviai atlikti pažangių AI užduočių.

Šis modulis vykdo tokias funkcijas kaip ReLU, Sigmoid ir Tanh tiesiogiai aparatinėje įrangoje.Gaunamos reikšmės greitai transformuojamos pagal pasirinktą aktyvinimo taisyklę.Pavyzdžiui, ReLU pašalina neigiamas reikšmes, išsaugant teigiamus išėjimus, o tai padeda tinklui sutelkti dėmesį į stipresnius funkcijų signalus darant išvadas.Kadangi aktyvinimo apdorojimas kartojasi kiekviename neuroninio tinklo lygmenyje, speciali greitinimo aparatinė įranga padeda sumažinti vėlavimą ir neleidžia perkrauti pagrindinių skaičiavimo įrenginių.

Tenzoriniai ir erdvinių duomenų apdorojimo moduliai

NPU taip pat yra specializuota aparatinė įranga, skirta tenzorinėms operacijoms ir erdvinių duomenų apdorojimui.Beveik kiekvienas modernus AI modelis remiasi tenzoriais, kurie yra daugiamatės duomenų struktūros, naudojamos informacijai tvarkyti pagal matmenis, tokius kaip plotis, aukštis, kanalai, funkcijų sluoksniai ir paketai.Išvados metu dideli tenzorinių duomenų kiekiai nuolat juda tarp neuroninio tinklo sluoksnių.

Tenzorio pagreitinimo įrenginys šias tenzorines struktūras apdoroja tiesiogiai aparatinėje įrangoje.Tokios operacijos kaip tenzorių dauginimas, pertvarkymas, transformavimas ir kaupimas atliekamos daug greičiau nei bendrosios paskirties procesoriuose.Šis specialus pagreitis tampa ypač svarbus transformatorių architektūrose, kompiuterinio vaizdo sistemose, didelių kalbų modeliuose ir realaus laiko AI programose, kurioms reikalingas labai didelis pralaidumas.

Be tensorinio apdorojimo, NPU taip pat yra modulių, skirtų 2D ir erdvinių duomenų operacijoms, paprastai naudojamoms vaizdų ir vaizdo įrašų apkrovoms.Prieš pradedant gilesnę AI analizę, kompiuterinės regos sistemos nuolat keičia, pertvarko, filtruoja ir perkelia didelius pikselių duomenų kiekius.Šių užduočių atlikimas atskirai padidina efektyvumą ir sumažina spaudimą pagrindiniam skaičiavimo varikliui.

Apdorojant vaizdą, aparatinė įranga valdo tokias operacijas kaip diskretizavimo mažinimas, funkcijų žemėlapio judėjimas, vaizdo kopijavimas, dydžio keitimas, apkarpymas ir erdvinių duomenų perdavimas.Pavyzdžiui, fotoaparatu užfiksuoto didelės raiškos vaizdo įrašo dydis gali būti pakeistas ir pertvarkytas prieš patenkant į neuroninio tinklo dujotiekį.Tai sumažina skaičiavimo apkrovą ir išsaugo svarbią vaizdinę informaciją, reikalingą objektų aptikimui ir scenos analizei.

Atminties optimizavimo ir duomenų suspaudimo moduliai

Šiuolaikiniams AI modeliams reikia daug atminties, kad būtų galima saugoti neuroninio tinklo svorius, tenzorius ir tarpinius duomenis.Nuolat perkeliant šią informaciją iš atminties į kompiuterinę įrangą, padidėja pralaidumo naudojimas, delsa ir energijos suvartojimas.Siekiant sumažinti šias pridėtines išlaidas, NPU turi tam skirtus duomenų suspaudimo ir išskleidimo modulius.

Prieš išsaugant duomenis atmintyje, pasikartojantys modeliai ir svorio reikšmės suglaudinami į mažesnius formatus.Vykdymo metu suglaudinta informacija greitai atkuriama ir siunčiama tiesiai į skaičiavimo vamzdyną.Tai sumažina atminties srautą ir leidžia daugiau AI duomenų likti didelės spartos vietinėje atmintyje arčiau procesoriaus.

Pažangūs glaudinimo metodai dažnai gali kelis kartus sumažinti modelio dydį, išlaikant beveik tą patį išvadų tikslumą.Tai tampa ypač svarbu išmaniuosiuose telefonuose, įterptosiose sistemose, išmaniuosiuose fotoaparatuose, nešiojamoje elektronikoje ir kituose DI įrenginiuose, kuriuose atminties talpa ir energijos vartojimo efektyvumas yra riboti.

Neural Processing Unit Architecture and Coordinated Processing Pipeline

Kaip šie moduliai veikia kartu

NPU veikimas nepriklauso nuo vieno aparatūros bloko.Jo efektyvumas atsiranda dėl to, kaip visi apdorojimo moduliai veikia kartu kaip suderintas dujotiekis.

Įprastas AI darbo krūvis prasideda nuo didelio masto matematinio skaičiavimo MAC vienetuose.Tada tarpiniai rezultatai perduodami aktyvinimo procesui, kad neuroniniame tinkle būtų įdiegtas netiesinis elgesys.Tenzorinio pagreitinimo aparatinė įranga nuolat tvarko ir apdoroja daugiamačius duomenis visame dujotiekyje, o erdvinio apdorojimo moduliai valdo su vaizdu ir vaizdo įrašu susijusias operacijas.Tuo pačiu metu glaudinimo aparatinė įranga sumažina atminties perdavimo fone išlaidas.

Kadangi šios operacijos vienu metu vykdomos tam skirtuose aparatūros keliuose, NPU gali apdoroti didelius AI darbo krūvius su dideliu pralaidumu, mažesne delsa ir daug geresniu energijos vartojimo efektyvumu nei tradiciniai procesoriai.

NPU išmaniuosiuose telefonuose ir mobiliajame AI

Šiuolaikiniai išmanieji telefonai kas sekundę atlieka daugybę operacijų.Telefonas gali atrakinti naudojant veido atpažinimą, atidaryti fotoaparatą, apdoroti nuotraukas, išversti kalbą ir beveik akimirksniu paleisti programas su dirbtiniu intelektu.Kad būtų palaikomas toks našumo lygis plonuose mobiliuosiuose įrenginiuose, kurių akumuliatoriaus talpa yra ribota, išmanieji telefonai remiasi labai integruota System-on-Chip (SoC) architektūra.

SoC viduje veikia keli procesoriai, o kiekvienas procesorius yra optimizuotas skirtingam darbo krūviui.CPU valdo sistemos valdymą, programas ir bendras skaičiavimo užduotis.GPU tvarko grafikos atvaizdavimą, žaidimus ir vaizdo apdorojimą.NPU (Neural Processing Unit) daugiausia dėmesio skiria AI skaičiavimui.

Užuot nukreipę neuroninio tinklo darbo krūvius per centrinį procesorių arba GPU, išmanieji telefonai daugelį AI užduočių nukreipia į NPU, kur aparatinė įranga yra optimizuota greitam lygiagrečiam AI apdorojimui.Šis atskyrimas pagerina efektyvumą, nes kiekvienas procesorius apdoroja tokio tipo darbo krūvį, kuriam jis buvo skirtas.Dėl to išmanieji telefonai gali atlikti pažangias AI operacijas su greitesniu atsako laiku, mažesne delsa ir geresniu energijos vartojimo efektyvumu.

Kaip NPU pakeitė išmaniojo telefono AI

Kol mobilieji NPU tapo įprasti, daugelis išmaniųjų telefonų AI funkcijų labai priklausė nuo debesų kompiuterijos.Norint atlikti tokias užduotis kaip balso atpažinimas, kalbos vertimas, vaizdo patobulinimas ir intelektualūs asistentai, dažnai reikėdavo duomenis įkelti į nuotolinius serverius, kad būtų galima apdoroti, prieš grąžinant rezultatus į įrenginį.Dėl to atsirado vėlavimų, padidėjo tinklo srautas ir kilo susirūpinimas dėl privatumo.

Pristačius specialius mobiliuosius NPU, ši darbo eiga labai pasikeitė.AI modeliai dabar gali veikti tiesiogiai pačiame išmaniajame telefone, todėl daugelis operacijų gali būti vykdomos vietoje realiuoju laiku, o ne visiškai priklausytų nuo išorinių serverių.

Šis pakeitimas suteikė keletą pagrindinių privalumų:

• Mažesnė delsa, nes duomenims nebereikia nuolatinio debesies ryšio

• Greitesnis dirbtinio intelekto atsako laikas atliekant operacijas realiuoju laiku

• Geresnė privatumo apsauga, nes neskelbtini duomenys gali likti įrenginyje

• Mažesnis energijos suvartojimas dėl specialiai AI darbo krūviams optimizuotos aparatinės įrangos

• Stabilesnis AI veikimas net esant silpnam arba nepasiekiamam interneto ryšiui

Kai mobilieji NPU tapo galingesni, išmanieji telefonai pradėjo nuolat naudoti pažangias dirbtinio intelekto funkcijas fone be pastebimų delsų naudojant kasdien.

Kaip išmanieji telefonai naudoja NPU realiose operacijose

AI fotografija ir vaizdo apdorojimas

Vienas iš labiausiai matomų mobiliųjų NPU naudojimo būdų yra AI fotografija.Šiuolaikinės išmaniųjų telefonų kameros nebepasikliauja tik vaizdo jutikliais ir tradiciniais vaizdo apdorojimo algoritmais.Dirbtinio intelekto modeliai dabar nuolat analizuoja vaizdo duomenis, kol kamera veikia.

Atsidarius fotoaparato programėlei, išmanusis telefonas iškart pradeda apdoroti gaunamą vaizdo srautą kadras po kadro.NPU realiu laiku analizuoja apšvietimo sąlygas, objektų ribas, veido detales, spalvas, tekstūras ir judesių modelius.Remdamasi šia analize, sistema sureguliuoja ekspoziciją, baltos spalvos balansą, HDR nustatymus, ryškumą ir kontrastą beveik akimirksniu prieš užfiksuojant vaizdą.

Fotografuojant prasto apšvietimo sąlygomis, NPU sujungia kelis vaizdo kadrus, kad pagerintų ryškumą ir sumažintų vaizdo triukšmą.Fotografuojant portretus procesorius atskiria priekinio plano objektus nuo fono sričių ir tiksliau pritaiko gylio efektus aplink kraštus, tokius kaip plaukai, akiniai ir drabužių kontūrai.

Scenos atpažinimas taip pat labai priklauso nuo NPU.Procesorius palygina vaizdų modelius su išmokytais dirbtinio intelekto modeliais, kad nustatytų aplinkas, tokias kaip maistas, peizažai, augintiniai, dokumentai, saulėlydžiai ar nakties scenos.Kai atpažįstama, fotoaparatas automatiškai pakoreguoja nustatymus, kad optimizuotų vaizdo kokybę.

Kadangi šie skaičiavimai atliekami tiesiogiai išmaniajame telefone, dirbtinio intelekto fotografavimas atrodo beveik akimirksniu, net jei fone nuolat atliekami dideli neuroninio tinklo skaičiavimai.

Balso atpažinimo ir AI padėjėjai

Balso asistentai ir su kalba susijusios funkcijos taip pat labai priklauso nuo vietinio AI pagreičio.Kai vartotojas kalba su išmaniuoju telefonu, mikrofonas užfiksuoja neapdorotus garso signalus, kuriuos reikia išvalyti, atskirti ir paversti atpažįstamais kalbos raštais.

NPU nuolat apdoroja garso srautą identifikuodamas fonemas, filtruodamas foninį triukšmą ir suderindamas garso modelius su kalbos atpažinimo modeliais.Vietinis AI apdorojimas leidžia beveik akimirksniu aptikti pažadinimo žodžius ir įprastas balso komandas, nuolat neperduodant garso įrašų į debesies serverius.

Tai pagerina reagavimą į tokias užduotis kaip:

• Balso komandos

• Kalbos transkripcija realiuoju laiku

• Kalbos vertimas

• AI asistento sąveika

• AI skambučio patobulinimas

• Triukšmo slopinimas vaizdo skambučių metu

Kadangi didžioji dalis apdorojimo vyksta tiesiai įrenginyje, balso sąveika išlieka sklandesnė net ir nestabiliomis tinklo sąlygomis.

AI žaidimai ir sistemos optimizavimas realiuoju laiku

Šiuolaikiniai išmanieji telefonai taip pat naudoja NPU žaidimų optimizavimui ir išmaniesiems sistemų valdymui.Žaidimo metu AI modeliai stebi kadrų atvaizdavimo poreikį, darbo krūvio elgseną, šilumines sąlygas, jutiklinio įvesties modelius ir akumuliatoriaus naudojimą realiuoju laiku.

Sistema gali dinamiškai reguliuoti GPU darbo krūvius, optimizuoti galios paskirstymą, stabilizuoti kadrų dažnį ir sumažinti perkaitimą ilgų žaidimų seansų metu.Kai kurie išmanieji telefonai taip pat naudoja dirbtinio intelekto didinimo ir judesio numatymo metodus, kad pagerintų vaizdo sklandumą ir išlaikytų mažesnes energijos sąnaudas.

Už žaidimų ribų NPU padeda optimizuoti fonines programas, akumuliatoriaus valdymą, nuspėjamą naudotojo sąveiką ir užduočių planavimą pagal įrenginio naudojimo modelius.

Mobiliųjų NPU raida

Mobiliųjų NPU plėtra sparčiai paspartėjo, nes išmaniųjų telefonų AI darbo krūviai tapo pažangesni ir reikalaujantys daug skaičiavimų.

Laikotarpis
Mobiliojo NPU kūrimas
2017 m. – ankstyvieji komerciniai mobilieji NPU
„Huawei“ pristatė vieną pirmųjų komercinių išmaniųjų telefonų NPU per Kirin 970 procesorių.Tai žymėjo didelį poslinkį link didelio masto įrenginio AI pagreitis vartotojų išmaniuosiuose telefonuose.Vietoj to AI užduotims atlikti daugiausia pasikliaujama procesoriais ir GPU, dabar įtraukiami išmanieji telefonai skirta AI aparatūra tiesiogiai SoC architektūroje.
2018 m. – Įrenginio AI išplėtimas
„Apple“ pristatė neuroninį variklį A12 Bionic viduje lustas, tobulinamas AI apdorojimas veido atpažinimui, skaičiavimas fotografija ir išmaniosios mobiliosios funkcijos.Įrenginio AI tapo pagrindine daugiausia dėmesio skiriama pavyzdinių išmaniųjų telefonų kūrimui.
2019–2020 m. – visos pramonės AI integracija
Pagrindiniai lustų gamintojai, įskaitant „Qualcomm“, „Samsung“ ir „MediaTek“ pradėjo integruoti specialius AI greitintuvus į pavyzdinius mobiliuosius įrenginius procesoriai.AI našumas pradėjo tapti pagrindiniu konkurencijos veiksniu išmaniųjų telefonų techninės įrangos dizainas.
2021–2023 m. – AI apdorojimas tampa pagrindiniu etalonu
Išmaniųjų telefonų gamintojai vis dažniau lygino NPU našumas kartu su CPU ir GPU našumu.NPU tapo pagrindiniais kompiuterinė fotografija, balso AI, vaizdo patobulinimas, akumuliatoriaus optimizavimas, ir išmaniosios sistemos ypatybės.
2024–2025 – dideli AI modeliai, veikiantys išmaniuosiuose telefonuose
Šiuolaikiniai mobilieji NPU įgijo pakankamai apdorojimo galios palaiko didesnius AI modelius tiesiai išmaniuosiuose telefonuose ir kraštutiniuose įrenginiuose.Daugiau AI darbo krūviai dabar gali būti vykdomi vietoje, labai nepriklausant nuo debesies infrastruktūrą, gerinant atsaką ir privatumą.

Dabartinių pagrindinių mobiliųjų NPU palyginimas

Šiuolaikiniai pavyzdiniai išmaniųjų telefonų procesoriai dabar apima labai pažangias NPU architektūras, optimizuotas realaus laiko AI išvadai, dideliu pralaidumu ir geresniu energijos vartojimo efektyvumu.

Mobilus procesorius
NPU savybės
Apple A17 Pro
Apima 26 branduolių neuronų variklį, sukurtą greitam AI apdorojimas įrenginyje.Architektūra pagerina AI fotografiją, balsą atpažinimas ir realiuoju laiku veikiančios išmaniosios sistemos funkcijos visuose „Apple“ įrenginiuose.
Qualcomm Snapdragon 8 Gen 3
Naudojamas atnaujintas šešiakampis AI procesorius, optimizuotas generatyvinis AI, neuronų tinklo pagreitis, pažangus vaizdo apdorojimas ir efektyvus mobiliojo AI darbo krūvis.
„MediaTek Dimensity 9300“.
Apima šeštosios kartos APU (AI Processing Unit) su esminiai AI išvadų greičio ir realaus laiko AI apdorojimo patobulinimai galimybė išmaniesiems telefonams ir krašto įrenginiams.
Samsung Exynos 2400
Turi naujos kartos mobilųjį NPU, orientuotą į greitesnį Įrenginyje esantis AI apdorojimas kompiuterinei fotografijai, intelektuali sistema operacijas ir pažangias mobiliąsias AI programas.

NPU vs GPU vs CPU: pagrindiniai AI apdorojimo skirtumai

CPU, GPU, and NPU Architecture Comparison

Tiek GPU, tiek NPU yra skirti dideliems duomenų kiekiams apdoroti lygiagrečiai, tačiau jie buvo sukurti labai skirtingiems tikslams.GPU iš pradžių buvo sukurtas grafikos atvaizdavimui, o NPU buvo sukurtas specialiai neuroninio tinklo skaičiavimui ir AI išvadoms daryti. Dėl šių projektavimo tikslų skirtumų du procesoriai DI darbo krūvius apdoroja labai skirtingai.GPU gali efektyviai paleisti AI modelius, ypač didelės apimties mokymo sistemose, tačiau jie vis tiek pasižymi dideliu grafikos procesoriaus sudėtingumu.NPU supaprastina daugelį šių operacijų, nes beveik visas dėmesys skiriamas su AI susijusiam skaičiavimui.

Funkcija
CPU (Centrinis procesorius)
GPU (grafikos apdorojimo įrenginys)
NPU (Neuronų apdorojimo blokas)
Pagrindinis tikslas
Bendrosios paskirties kompiuterija ir sistemų valdymas
Lygiagretus grafika ir didelio našumo skaičiavimas
AI išvada ir neuroninio tinklo pagreitis
Pirminis darbo krūvis
Veikiantis sistemos, programos, daugiafunkcinis darbas
Grafika atvaizdavimas, dirbtinio intelekto mokymas, mokslinis skaičiavimas
AI apdorojimas, tenzorinės operacijos, gilaus mokymosi išvada
Apdorojimo stilius
Eilės tvarka apdorojimas
Masyvi paralelė apdorojimas
AI optimizuotas lygiagretus apdorojimas
Pagrindinis dizainas
Nedaug galingų ir lanksčios šerdys
Tūkstančiai lygiagrečios vykdymo šerdys
Specializuotas AI pagreičio vienetai
AI našumas
Vidutinis
Aukštas
Labai aukštas AI išvada
Matrica Daugybos greitis
Ribotas
Greitai
Labai optimizuotas
Tenzoras Apdorojimas
Programinės įrangos pagrindu
Palaikoma per GPU pagreitį
Dedikuotas tenzorius pagreitinimo aparatūra
Energijos efektyvumas
Žemesnis AI darbo krūviai
Nuo vidutinio iki didelio energijos suvartojimas
Didelė galia efektyvus
Šilumos generavimas
Vidutinis
Aukštas po sunkiu darbo krūviai
Žemesnis AI metu išvada
Atminties juostos plotis Naudojimas
Vidutinis
Labai aukštas
Optimizuotas ir sumažintas
AI delsa Užduotys
Aukščiau
Vidutinis
Labai žemas
Realaus laiko AI Galimybė
Ribotas
Gerai
Puikiai
Geriausia AI Treniruotės
Ne idealus
Puikiai
Palyginti ribotai į GPU
Geriausia AI Išvada
Pagrindiniai darbo krūviai
Didelio našumo išvada
Optimizuotas realaus laiko išvada
Dažnas Programos
kompiuteriai, serveriai, operacinės sistemos
Žaidimai, AI mokymai, atvaizdavimas, simuliacijos
Išmanieji telefonai, krašto AI, robotika, išmaniosios kameros
Priklausomybė nuo Debesis AI
Aukščiau
Vidutinis
Žemesnis dėl vietinis AI pagreitis
Baterija Mobiliųjų įrenginių efektyvumas
Žemesnis
Vidutinis
Aukštas
Tipiški įrenginiai
Kompiuteriai, nešiojamieji kompiuteriai, serveriai
Žaidimų kompiuteriai, AI serveriai, darbo vietos
Išmanieji telefonai, IoT įrenginiai, AI aparatinė įranga
Kaina ir Sudėtingumas
Bendrosios paskirties architektūra
Sudėtingas didelio našumo architektūra
Specializuotas Į AI orientuota architektūra
Pagrindinis privalumas
Lankstumas ir sistemos valdymas
Didelio masto lygiagretus skaičiavimas
Greitai ir efektyvus vietinis AI apdorojimas

Specializuoti apdorojimo įrenginiai šiuolaikinėje kompiuterijoje

Be NPU, šiuolaikinės skaičiavimo sistemos naudoja daug skirtingų tipų procesorių, nes jokia architektūra negali efektyviai apdoroti kiekvieno darbo krūvio.Kai kurie procesoriai daugiausia dėmesio skiria sistemos valdymui, kai kurie specializuojasi grafikos atvaizdavime, o kiti yra optimizuoti dirbtinio intelekto pagreitinimui, tinklų kūrimui, moksliniam skaičiavimui ar įterptajam valdymui.

Šiuolaikiniuose išmaniuosiuose telefonuose, serveriuose, pramoninėse sistemose, robotikos platformose, transporto priemonėse ir DI įrenginiuose keli apdorojimo įrenginiai dažnai veikia kartu vienu metu.Kiekvienas procesorius apdoroja tokio tipo darbo krūvį, kuriam jis buvo specialiai sukurtas, pagerindamas našumą, energijos vartojimo efektyvumą ir reagavimą realiuoju laiku šiuolaikinėse skaičiavimo aplinkose.

CPU: centrinis procesorius

Centrinis procesorius (Central Processing Unit) yra pagrindinis daugumos kompiuterinių sistemų valdiklis.Jis valdo operacines sistemas, programas, atminties koordinavimą, užduočių planavimą ir ryšį tarp aparatūros komponentų.

CPU yra labai lankstūs ir gali patikimai susidoroti su daugybe skirtingų darbo krūvių, todėl jie yra būtini kompiuteriuose, išmaniuosiuose telefonuose, serveriuose ir įterptosiose sistemose.Tačiau jie yra mažiau veiksmingi didelio masto lygiagrečiam AI darbo krūviui, palyginti su labiau specializuotais procesoriais.

GPU: grafikos apdorojimo blokas

GPU (Graphics Processing Unit) yra optimizuotas didelio masto lygiagrečiam apdorojimui.Architektūroje yra daug vykdymo branduolių, galinčių vienu metu atlikti tūkstančius operacijų.

Iš pradžių GPU buvo sukurti grafikos atvaizdavimui, tačiau dabar jie plačiai naudojami dirbtinio intelekto mokymui, moksliniam modeliavimui, vaizdo apdorojimui ir didelio našumo skaičiavimui dėl stiprių lygiagretaus skaičiavimo galimybių.

TPU: Tensor Processing Unit

TPU (Tensor Processing Unit) yra optimizuotas tenzoriais pagrįstiems AI darbo krūviams ir didelio masto giliam mokymosi pagreitinimui.Šie procesoriai daugiausia skirti debesų AI infrastruktūrai ir duomenų centrų mašininio mokymosi aplinkoms.

TPU yra labai veiksmingi:

• Giluminio mokymosi mokymas

• Dideli AI modeliai

• Tenzorių skaičiavimas

• Cloud AI paslaugos

• Didelio našumo AI pagreitis

FPGA: perkonfigūruojamas aparatūros apdorojimas

FPGA (Field-Programmable Gate Array) naudoja programuojamus loginius blokus, kuriuos galima konfigūruoti konkrečioms užduotims po pagaminimo.Skirtingai nuo fiksuotų procesorių architektūrų, FPGA leidžia pritaikyti pačią aparatinės įrangos funkciją.

FPGA plačiai naudojami:

• Ryšių sistemos

• Automobilių elektronika

• Pramoninė automatika

• Oro erdvės sistemos

• Kraštų skaičiavimas

• Medicinos prietaisai

DPU: duomenų apdorojimo padalinys

DPU (duomenų apdorojimo vienetas) yra optimizuotas į duomenis orientuotam darbo krūviui debesų infrastruktūroje ir tinklo sistemose.DPU padeda sumažinti procesoriaus darbo krūvį pagreitindami duomenų judėjimą, saugojimo operacijas, šifravimą ir tinklo srauto valdymą.

Šie procesoriai dažniausiai naudojami:

• Duomenų centrai

• Debesų kompiuterija

• Didelės spartos tinklų kūrimas

• Saugojimo pagreitis

• Serverio infrastruktūra

VPU: vizijos apdorojimo blokas

VPU (Vision Processing Unit) specializuojasi kompiuterinio matymo ir vaizdų DI apdorojime.VPU pagreitina darbo krūvius, tokius kaip veido atpažinimas, objektų aptikimas, judesio sekimas ir vaizdo analizė.

VPU dažniausiai randami:

• Išmaniosios kameros

• Stebėjimo sistemos

• Robotika

• Autonominės transporto priemonės

• AR/VR sistemos

• Edge AI matymo įrenginiai

IPU: Intelligence Processing Unit

IPU (Intelligence Processing Unit) sukurtas labai lygiagrečiam AI ir mašininio mokymosi darbo krūviui.Architektūra orientuota į duomenų srauto efektyvumo gerinimą didelio masto neuroninio tinklo vykdymo metu.

IPU naudojami:

• Mašininio mokymosi pagreitis

• Rašto atpažinimas

• AI išvada

• Lygiagretusis tenzorinis apdorojimas

• Pažangūs AI tyrimai

BPU: smegenų apdorojimo blokas

BPU (Brain Processing Unit) yra optimizuotas įterptoms AI ir krašto žvalgybos sistemoms.Šie procesoriai sutelkia dėmesį į greitą vietinį AI išvadą ir mažesnį energijos suvartojimą.

BPU dažniausiai naudojami:

• Išmaniosios jutimo sistemos

• Robotika

• Edge AI aparatinė įranga

• Judesio aptikimo sistemos

• Autonominės platformos

HPU: Holografinis apdorojimo įrenginys

HPU (Holographic Processing Unit) yra skirtas holografiniam skaičiavimui, mišriai realybei ir erdvinės analizės sistemoms.

HPU pagalbos procesas:

• Aplinkos kartografavimas

• Judesio sekimas

• Jutiklio suliejimas

• Realaus laiko erdvinė sąveika

• AR/VR aplinkos

MPU ir MCU: integruotas valdymo apdorojimas

MPU (Microprocessor Units) ir MCU (Microcontroller Units) plačiai naudojami įterptosiose sistemose ir mažos galios elektronikoje.

MPU dažniausiai naudojami įterptosiose skaičiavimo sistemose, kurioms reikalingas operacinės sistemos lygio valdymas, o MCU integruoja procesoriaus branduolius, atmintį ir įvesties/išvesties valdymą į kompaktišką lustą, kad būtų galima atlikti tam skirtas mažos galios užduotis.

Šie procesoriai dažniausiai randami:

• IoT įrenginiai

• Pramoniniai valdikliai

• Automobilių elektronika

• Buitinė technika

• Nešiojamos įterptosios sistemos

APU: pagreitintas apdorojimo blokas

APU (Accelerated Processing Unit) sujungia CPU ir GPU funkcijas viename procesoriaus pakete.Ši integracija pagerina energijos vartojimo efektyvumą, sumažina aparatinės įrangos dydį ir leidžia kompiuteriams bei grafikos darbo krūviams efektyviau dalytis sistemos ištekliais.

APU dažniausiai naudojami:

• Nešiojamieji kompiuteriai

• Mini kompiuteriai

• Pradinio lygio žaidimų sistemos

• Multimedijos įrenginiai

• Nešiojamos skaičiavimo platformos

Kodėl šiuolaikinėse sistemose naudojami keli specializuoti procesoriai

Šiuolaikinės skaičiavimo sistemos retai remiasi vieno procesoriaus architektūra.Vietoj to, įrenginiai sujungia kelis specializuotus procesorius, nes skirtingiems darbo krūviams reikalingi skirtingi apdorojimo metodai.

Pavyzdžiui, šiuolaikinė sistema gali naudoti:

• CPU sistemos valdymui

• GPU grafikai ir lygiagrečiam skaičiavimui

• NPU AI išvadoms

• VPU kompiuteriniam matymui

• DPU tinklams ir duomenų judėjimui

• MCU įterptoms valdymo užduotims atlikti

Paskirstydamos darbo krūvius tam skirtai aparatūrai, modernios sistemos pasiekia geresnį našumą, mažesnį delsą, didesnį energijos vartojimo efektyvumą ir efektyvesnį apdorojimą realiuoju laiku AI, grafikos, tinklų ir įterptosiose skaičiavimo aplinkose.

Išvada

NPU tampa būtini šiuolaikiniame skaičiavime, nes jie leidžia dirbtinio intelekto užduotis vykdyti vietoje, greitai ir efektyviai, labai nepriklausant nuo debesų apdorojimo.Jų optimizuota architektūra sumažina delsą, energijos naudojimą, atminties judėjimą ir šilumos generavimą, todėl jie yra vertingi išmaniuosiuose telefonuose, robotikoje, sveikatos priežiūros įrenginiuose, pramoninėje automatikoje, išmaniuosiuose namuose, autonominėse sistemose ir DI platformose.Dirbtinio intelekto modeliams tampant didesniems ir sudėtingesniems, būsimi NPU toliau tobulės dėl išmanesnės architektūros, žemo tikslumo skaičiavimo, apdorojimo atmintyje, vietinio didelio modelio palaikymo, pažangaus puslaidininkių dizaino ir stipresnių AI saugos funkcijų.






Dažnai užduodami klausimai [DUK]

1. Kodėl NPU yra efektyvesni nei centriniai procesoriai neuroninio tinklo darbo krūviams?

NPU yra efektyvesni, nes jų aparatinė įranga yra sukurta specialiai dirbtinio intelekto skaičiavimui, o ne bendrosios paskirties apdorojimui.CPU nuosekliai atlieka daugybę skirtingų sistemos užduočių, o NPU daugiausia dėmesio skiria tenzorinėms operacijoms, matricos daugybai, konvoliucijai ir lygiagrečiam neuroninio tinklo apdorojimui.Tai leidžia NPU greičiau atlikti AI išvadas, naudojant mažiau energijos ir generuojant mažiau šilumos.

2. Kaip lygiagretus apdorojimas pagerina NPU našumą atliekant AI išvadą?

NPU padalija AI darbo krūvį į daugybę mažesnių operacijų, kurios vienu metu vykdomos keliuose skaičiavimo įrenginiuose.Užuot laukę, kol baigsis viena instrukcija, prieš pradėdami kitą, dideli neuroninio tinklo duomenų kiekiai per procesorių juda lygiagrečiai.Tai žymiai pagerina pralaidumą ir sumažina delsą atliekant darbo krūvius, tokius kaip vaizdo atpažinimas, kalbos apdorojimas ir objektų aptikimas realiuoju laiku.

3. Kodėl mažo tikslumo skaičiavimas yra svarbus šiuolaikiniuose NPU?

Daugeliui dirbtinio intelekto modelių nereikia itin didelio skaitinio tikslumo, kad būtų gauti tikslūs rezultatai.NPU naudoja tokius formatus kaip INT8 ir FP16, kad sumažintų atminties naudojimą ir skaičiavimo išlaidas.Mažesnio tikslumo apdorojimas leidžia atlikti daugiau operacijų per trumpesnį laiką, tuo pačiu pagerinant energijos vartojimo efektyvumą ir išlaikant gerą AI išvadų našumą.

4. Kaip NPU sumažina atminties perdavimo kliūtis, palyginti su GPU?

NPU atmintį ir skaičiavimo aparatūrą sujungia arčiau procesoriaus architektūros viduje.Užuot pakartotinai perkėlus didelius tenzorinių duomenų kiekius tarp išorinės atminties ir apdorojimo branduolių, daugelis tarpinių operacijų lieka šalia vykdymo vienetų.Tai sutrumpina duomenų perdavimo kelius, sumažina pralaidumo naudojimą, sumažina delsą ir pagerina bendrą energijos vartojimo efektyvumą.

5. Kodėl NPU tampa naudingi išmaniuosiuose telefonuose ir DI įrenginiuose?

Šiuolaikiniams įrenginiams reikalingas greitas vietinis AI apdorojimas su mažu energijos suvartojimu ir minimalia delsa.NPU leidžia išmaniesiems telefonams ir krašto sistemoms atlikti dirbtinio intelekto užduotis, tokias kaip veido atpažinimas, AI fotografavimas, balso sąveika ir objektų aptikimas tiesiogiai įrenginyje, labai nepriklausant nuo debesies serverių.Tai pagerina reagavimą, privatumą ir baterijos efektyvumą.

6. Kaip MAC įrenginiai prisideda prie NPU pagreitinimo?

Multiply-Accumulate (MAC) įrenginiai tvarko kartojamas daugybos ir sudėjimo operacijas, naudojamas neuroniniuose tinkluose.Šiuolaikiniuose NPU yra šimtai ar tūkstančiai vienu metu veikiančių MAC įrenginių, todėl didelius AI darbo krūvius galima apdoroti daug greičiau nei naudojant tradicinius nuoseklius procesorius.

7. Kodėl šiuolaikinės AI sistemos naudoja ir GPU, ir NPU, o ne pasikliauja vienu procesoriaus tipu?

GPU ir NPU yra optimizuoti skirtingiems darbo krūviams.GPU puikiai tinka didelio masto AI mokymui, grafikos atvaizdavimui ir didelio našumo lygiagrečiam skaičiavimui, o NPU yra optimizuoti mažos galios AI išvadoms ir realaus laiko vietiniam apdorojimui.Abiejų procesorių naudojimas leidžia sistemoms suderinti lankstumą, našumą ir energijos vartojimo efektyvumą.

8. Kaip NPU pagerina realaus laiko AI apdorojimą robotikoje ir autonominėse sistemose?

Robotika ir autonominės sistemos nuolat apdoroja kameros įvestį, aplinkos žemėlapių sudarymą, jutiklių duomenis ir judesio analizę.NPU pagreitina šiuos darbo krūvius lokaliai su maža delsa, todėl sistemos gali greitai reaguoti navigacijos, kliūčių aptikimo, pėsčiųjų atpažinimo ir sprendimų priėmimo realiuoju laiku metu.

9. Kodėl įrenginyje esantis AI tampa vis svarbesnis NPU plėtrai ateityje?

Įrenginyje esantis AI sumažina priklausomybę nuo debesų kompiuterijos, leisdamas AI modelius paleisti tiesiogiai vietinėje aparatinėje įrangoje.Tai pagerina privatumą, sumažina tinklo pralaidumo naudojimą ir leidžia greičiau reaguoti realiuoju laiku.Tikimasi, kad būsimi NPU palaikys didesnius vietinius AI modelius, multimodalinį AI apdorojimą ir pažangius generuojamus AI darbo krūvius tiesiogiai vartotojų ir pramoniniuose įrenginiuose.

10. Kaip būsimos NPU architektūros galėtų pakeisti AI aparatinės įrangos efektyvumą?

Ateityje NPU greičiausiai naudos išmanesnį darbo krūvio paskirstymą, retą skaičiavimą, apdorojimą atmintyje, mikroschemų architektūrą ir adaptyvų tikslumo valdymą, kad padidintų efektyvumą.Šiomis technologijomis siekiama sumažinti nereikalingą skaičiavimą, sumažinti energijos sąnaudas ir padidinti pralaidumą, kartu palaikant didesnius ir pažangesnius AI modelius pažangiuose įrenginiuose, robotikoje, pramoninėse sistemose ir pažangiosios buitinės elektronikos srityse.

Susijęs tinklaraštis