
Neuroninis procesorius (NPU) yra specializuotas procesorius, skirtas dirbtinio intelekto užduotims atlikti efektyviau nei bendrosios paskirties procesorius.Jo pagrindinis vaidmuo yra paspartinti neuroninio tinklo operacijas, naudojamas tokiose funkcijose kaip vaizdo atpažinimas, balso apdorojimas, objektų aptikimas ir realaus laiko AI išvados.Unlike a CPU, which is built to manage many different computing tasks, an NPU is focused on AI-related calculations.Jis optimizuotas apdoroti didelius duomenų kiekius vienu metu, todėl tinka darbo krūviams, kuriems reikia greito modelio atpažinimo ir sprendimų priėmimo.Šiuolaikiniuose įrenginiuose NPU padeda dirbtinio intelekto funkcijoms veikti tiesiogiai vietinėje aparatinėje įrangoje, o ne visiškai priklausyti nuo debesies serverių.Tai leidžia išmaniesiems telefonams, išmaniesiems fotoaparatams, robotams, transporto priemonėms ir kraštiniams įrenginiams reaguoti greičiau ir naudojant mažiau energijos.Dėl šios priežasties NPU tapo svarbia šiuolaikinių išmaniųjų sistemų dalimi.
NPU yra sukurtas iš kelių specializuotų aparatinės įrangos modulių, kurie veikia kartu, kad greitai ir efektyviai apdorotų neuroninio tinklo darbo krūvius.Vietoj to, kad kiekviena operacija būtų siunčiama per vieną bendrosios paskirties procesorių, darbo krūvis yra padalintas į tam skirtus aparatinės įrangos blokus, kurie nuolat lygiagrečiai apdoroja duomenis.Ši struktūra pagerina AI išvadų greitį, sumažina nereikalingą duomenų judėjimą, sumažina energijos sąnaudas ir padeda išlaikyti efektyvų atminties naudojimą.
Apdorojant dirbtinį intelektą, duomenys procesoriaus viduje perduodami keliais etapais.Įvesties duomenys pirmiausia patenka į skaičiavimo konvejerį, kuriame atliekamos didelės apimties matematinės operacijos.Tada tarpiniai rezultatai pereina per aktyvinimo apdorojimą, tenzoriaus pagreitį, su vaizdu susijusias operacijas ir atminties optimizavimo aparatinę įrangą, prieš sukuriant galutinę išvestį.Kadangi šie moduliai veikia kartu suderinta seka, NPU gali išlaikyti aukštą pralaidumą net ir naudodamas didelius neuroninių tinklų modelius.
Pagrindinis skaičiavimo variklis NPU viduje yra dauginimo kaupimo (MAC) blokas.Dauguma neuroninio tinklo darbo krūvių pakartotinai daugina ir sudeda labai didelius duomenų rinkinius, todėl ši aparatinė įranga apdoroja didžiąją dalį AI skaičiavimo atlikdama išvadas.When input data enters a neural network, values are multiplied by stored weight values and then added together to generate new outputs.Šis procesas nuolat kartojasi daugelyje neuroninio tinklo sluoksnių.
Šiuolaikiniuose NPU dažnai yra šimtai ar tūkstančiai vienu metu veikiančių MAC įrenginių.Užuot skaičiuojusi vieną operaciją vienu metu, aparatinė įranga paskirsto darbo krūvius daugeliu lygiagrečių vykdymo kelių.Didelės AI duomenų partijos kartu juda per procesorių, labai pagerindamos išvadų greitį ir išlaikant mažą delsą.Pavyzdžiui, vaizdo atpažinimo sistemose MAC įrenginiai pakartotinai nuskaito pikselių grupes ir derina filtrų reikšmes, kad aptiktų kraštus, tekstūras, formas ir raštus.In language models, the same hardware performs large-scale vector and matrix operations to process tokens and relationships between words.
Atlikus šiuos matematinius skaičiavimus, rezultatai perkeliami į aktyvinimo funkcijos modulį.Neuroniniai tinklai priklauso nuo netiesinių aktyvinimo funkcijų, kad apdorotų sudėtingus duomenų ryšius.Be aktyvinimo apdorojimo tinklas atliktų tik paprastus tiesinius skaičiavimus ir negalėtų efektyviai atlikti pažangių AI užduočių.
Šis modulis vykdo tokias funkcijas kaip ReLU, Sigmoid ir Tanh tiesiogiai aparatinėje įrangoje.Gaunamos reikšmės greitai transformuojamos pagal pasirinktą aktyvinimo taisyklę.Pavyzdžiui, ReLU pašalina neigiamas reikšmes, išsaugant teigiamus išėjimus, o tai padeda tinklui sutelkti dėmesį į stipresnius funkcijų signalus darant išvadas.Kadangi aktyvinimo apdorojimas kartojasi kiekviename neuroninio tinklo lygmenyje, speciali greitinimo aparatinė įranga padeda sumažinti vėlavimą ir neleidžia perkrauti pagrindinių skaičiavimo įrenginių.
NPU taip pat yra specializuota aparatinė įranga, skirta tenzorinėms operacijoms ir erdvinių duomenų apdorojimui.Beveik kiekvienas modernus AI modelis remiasi tenzoriais, kurie yra daugiamatės duomenų struktūros, naudojamos informacijai tvarkyti pagal matmenis, tokius kaip plotis, aukštis, kanalai, funkcijų sluoksniai ir paketai.Išvados metu dideli tenzorinių duomenų kiekiai nuolat juda tarp neuroninio tinklo sluoksnių.
Tenzorio pagreitinimo įrenginys šias tenzorines struktūras apdoroja tiesiogiai aparatinėje įrangoje.Tokios operacijos kaip tenzorių dauginimas, pertvarkymas, transformavimas ir kaupimas atliekamos daug greičiau nei bendrosios paskirties procesoriuose.Šis specialus pagreitis tampa ypač svarbus transformatorių architektūrose, kompiuterinio vaizdo sistemose, didelių kalbų modeliuose ir realaus laiko AI programose, kurioms reikalingas labai didelis pralaidumas.
Be tensorinio apdorojimo, NPU taip pat yra modulių, skirtų 2D ir erdvinių duomenų operacijoms, paprastai naudojamoms vaizdų ir vaizdo įrašų apkrovoms.Prieš pradedant gilesnę AI analizę, kompiuterinės regos sistemos nuolat keičia, pertvarko, filtruoja ir perkelia didelius pikselių duomenų kiekius.Šių užduočių atlikimas atskirai padidina efektyvumą ir sumažina spaudimą pagrindiniam skaičiavimo varikliui.
Apdorojant vaizdą, aparatinė įranga valdo tokias operacijas kaip diskretizavimo mažinimas, funkcijų žemėlapio judėjimas, vaizdo kopijavimas, dydžio keitimas, apkarpymas ir erdvinių duomenų perdavimas.Pavyzdžiui, fotoaparatu užfiksuoto didelės raiškos vaizdo įrašo dydis gali būti pakeistas ir pertvarkytas prieš patenkant į neuroninio tinklo dujotiekį.Tai sumažina skaičiavimo apkrovą ir išsaugo svarbią vaizdinę informaciją, reikalingą objektų aptikimui ir scenos analizei.
Šiuolaikiniams AI modeliams reikia daug atminties, kad būtų galima saugoti neuroninio tinklo svorius, tenzorius ir tarpinius duomenis.Nuolat perkeliant šią informaciją iš atminties į kompiuterinę įrangą, padidėja pralaidumo naudojimas, delsa ir energijos suvartojimas.Siekiant sumažinti šias pridėtines išlaidas, NPU turi tam skirtus duomenų suspaudimo ir išskleidimo modulius.
Prieš išsaugant duomenis atmintyje, pasikartojantys modeliai ir svorio reikšmės suglaudinami į mažesnius formatus.Vykdymo metu suglaudinta informacija greitai atkuriama ir siunčiama tiesiai į skaičiavimo vamzdyną.Tai sumažina atminties srautą ir leidžia daugiau AI duomenų likti didelės spartos vietinėje atmintyje arčiau procesoriaus.
Pažangūs glaudinimo metodai dažnai gali kelis kartus sumažinti modelio dydį, išlaikant beveik tą patį išvadų tikslumą.Tai tampa ypač svarbu išmaniuosiuose telefonuose, įterptosiose sistemose, išmaniuosiuose fotoaparatuose, nešiojamoje elektronikoje ir kituose DI įrenginiuose, kuriuose atminties talpa ir energijos vartojimo efektyvumas yra riboti.

NPU veikimas nepriklauso nuo vieno aparatūros bloko.Jo efektyvumas atsiranda dėl to, kaip visi apdorojimo moduliai veikia kartu kaip suderintas dujotiekis.
Įprastas AI darbo krūvis prasideda nuo didelio masto matematinio skaičiavimo MAC vienetuose.Tada tarpiniai rezultatai perduodami aktyvinimo procesui, kad neuroniniame tinkle būtų įdiegtas netiesinis elgesys.Tenzorinio pagreitinimo aparatinė įranga nuolat tvarko ir apdoroja daugiamačius duomenis visame dujotiekyje, o erdvinio apdorojimo moduliai valdo su vaizdu ir vaizdo įrašu susijusias operacijas.Tuo pačiu metu glaudinimo aparatinė įranga sumažina atminties perdavimo fone išlaidas.
Kadangi šios operacijos vienu metu vykdomos tam skirtuose aparatūros keliuose, NPU gali apdoroti didelius AI darbo krūvius su dideliu pralaidumu, mažesne delsa ir daug geresniu energijos vartojimo efektyvumu nei tradiciniai procesoriai.
Šiuolaikiniai išmanieji telefonai kas sekundę atlieka daugybę operacijų.Telefonas gali atrakinti naudojant veido atpažinimą, atidaryti fotoaparatą, apdoroti nuotraukas, išversti kalbą ir beveik akimirksniu paleisti programas su dirbtiniu intelektu.Kad būtų palaikomas toks našumo lygis plonuose mobiliuosiuose įrenginiuose, kurių akumuliatoriaus talpa yra ribota, išmanieji telefonai remiasi labai integruota System-on-Chip (SoC) architektūra.
SoC viduje veikia keli procesoriai, o kiekvienas procesorius yra optimizuotas skirtingam darbo krūviui.CPU valdo sistemos valdymą, programas ir bendras skaičiavimo užduotis.GPU tvarko grafikos atvaizdavimą, žaidimus ir vaizdo apdorojimą.NPU (Neural Processing Unit) daugiausia dėmesio skiria AI skaičiavimui.
Užuot nukreipę neuroninio tinklo darbo krūvius per centrinį procesorių arba GPU, išmanieji telefonai daugelį AI užduočių nukreipia į NPU, kur aparatinė įranga yra optimizuota greitam lygiagrečiam AI apdorojimui.Šis atskyrimas pagerina efektyvumą, nes kiekvienas procesorius apdoroja tokio tipo darbo krūvį, kuriam jis buvo skirtas.Dėl to išmanieji telefonai gali atlikti pažangias AI operacijas su greitesniu atsako laiku, mažesne delsa ir geresniu energijos vartojimo efektyvumu.
Kol mobilieji NPU tapo įprasti, daugelis išmaniųjų telefonų AI funkcijų labai priklausė nuo debesų kompiuterijos.Norint atlikti tokias užduotis kaip balso atpažinimas, kalbos vertimas, vaizdo patobulinimas ir intelektualūs asistentai, dažnai reikėdavo duomenis įkelti į nuotolinius serverius, kad būtų galima apdoroti, prieš grąžinant rezultatus į įrenginį.Dėl to atsirado vėlavimų, padidėjo tinklo srautas ir kilo susirūpinimas dėl privatumo.
Pristačius specialius mobiliuosius NPU, ši darbo eiga labai pasikeitė.AI modeliai dabar gali veikti tiesiogiai pačiame išmaniajame telefone, todėl daugelis operacijų gali būti vykdomos vietoje realiuoju laiku, o ne visiškai priklausytų nuo išorinių serverių.
Šis pakeitimas suteikė keletą pagrindinių privalumų:
• Mažesnė delsa, nes duomenims nebereikia nuolatinio debesies ryšio
• Greitesnis dirbtinio intelekto atsako laikas atliekant operacijas realiuoju laiku
• Geresnė privatumo apsauga, nes neskelbtini duomenys gali likti įrenginyje
• Mažesnis energijos suvartojimas dėl specialiai AI darbo krūviams optimizuotos aparatinės įrangos
• Stabilesnis AI veikimas net esant silpnam arba nepasiekiamam interneto ryšiui
Kai mobilieji NPU tapo galingesni, išmanieji telefonai pradėjo nuolat naudoti pažangias dirbtinio intelekto funkcijas fone be pastebimų delsų naudojant kasdien.
Vienas iš labiausiai matomų mobiliųjų NPU naudojimo būdų yra AI fotografija.Šiuolaikinės išmaniųjų telefonų kameros nebepasikliauja tik vaizdo jutikliais ir tradiciniais vaizdo apdorojimo algoritmais.Dirbtinio intelekto modeliai dabar nuolat analizuoja vaizdo duomenis, kol kamera veikia.
Atsidarius fotoaparato programėlei, išmanusis telefonas iškart pradeda apdoroti gaunamą vaizdo srautą kadras po kadro.NPU realiu laiku analizuoja apšvietimo sąlygas, objektų ribas, veido detales, spalvas, tekstūras ir judesių modelius.Remdamasi šia analize, sistema sureguliuoja ekspoziciją, baltos spalvos balansą, HDR nustatymus, ryškumą ir kontrastą beveik akimirksniu prieš užfiksuojant vaizdą.
Fotografuojant prasto apšvietimo sąlygomis, NPU sujungia kelis vaizdo kadrus, kad pagerintų ryškumą ir sumažintų vaizdo triukšmą.Fotografuojant portretus procesorius atskiria priekinio plano objektus nuo fono sričių ir tiksliau pritaiko gylio efektus aplink kraštus, tokius kaip plaukai, akiniai ir drabužių kontūrai.
Scenos atpažinimas taip pat labai priklauso nuo NPU.Procesorius palygina vaizdų modelius su išmokytais dirbtinio intelekto modeliais, kad nustatytų aplinkas, tokias kaip maistas, peizažai, augintiniai, dokumentai, saulėlydžiai ar nakties scenos.Kai atpažįstama, fotoaparatas automatiškai pakoreguoja nustatymus, kad optimizuotų vaizdo kokybę.
Kadangi šie skaičiavimai atliekami tiesiogiai išmaniajame telefone, dirbtinio intelekto fotografavimas atrodo beveik akimirksniu, net jei fone nuolat atliekami dideli neuroninio tinklo skaičiavimai.
Balso asistentai ir su kalba susijusios funkcijos taip pat labai priklauso nuo vietinio AI pagreičio.Kai vartotojas kalba su išmaniuoju telefonu, mikrofonas užfiksuoja neapdorotus garso signalus, kuriuos reikia išvalyti, atskirti ir paversti atpažįstamais kalbos raštais.
NPU nuolat apdoroja garso srautą identifikuodamas fonemas, filtruodamas foninį triukšmą ir suderindamas garso modelius su kalbos atpažinimo modeliais.Vietinis AI apdorojimas leidžia beveik akimirksniu aptikti pažadinimo žodžius ir įprastas balso komandas, nuolat neperduodant garso įrašų į debesies serverius.
Tai pagerina reagavimą į tokias užduotis kaip:
• Balso komandos
• Kalbos transkripcija realiuoju laiku
• Kalbos vertimas
• AI asistento sąveika
• AI skambučio patobulinimas
• Triukšmo slopinimas vaizdo skambučių metu
Kadangi didžioji dalis apdorojimo vyksta tiesiai įrenginyje, balso sąveika išlieka sklandesnė net ir nestabiliomis tinklo sąlygomis.
Šiuolaikiniai išmanieji telefonai taip pat naudoja NPU žaidimų optimizavimui ir išmaniesiems sistemų valdymui.Žaidimo metu AI modeliai stebi kadrų atvaizdavimo poreikį, darbo krūvio elgseną, šilumines sąlygas, jutiklinio įvesties modelius ir akumuliatoriaus naudojimą realiuoju laiku.
Sistema gali dinamiškai reguliuoti GPU darbo krūvius, optimizuoti galios paskirstymą, stabilizuoti kadrų dažnį ir sumažinti perkaitimą ilgų žaidimų seansų metu.Kai kurie išmanieji telefonai taip pat naudoja dirbtinio intelekto didinimo ir judesio numatymo metodus, kad pagerintų vaizdo sklandumą ir išlaikytų mažesnes energijos sąnaudas.
Už žaidimų ribų NPU padeda optimizuoti fonines programas, akumuliatoriaus valdymą, nuspėjamą naudotojo sąveiką ir užduočių planavimą pagal įrenginio naudojimo modelius.
Mobiliųjų NPU plėtra sparčiai paspartėjo, nes išmaniųjų telefonų AI darbo krūviai tapo pažangesni ir reikalaujantys daug skaičiavimų.
|
Laikotarpis |
Mobiliojo NPU kūrimas |
|
2017 m. – ankstyvieji komerciniai mobilieji NPU |
„Huawei“ pristatė vieną pirmųjų komercinių išmaniųjų telefonų
NPU per Kirin 970 procesorių.Tai žymėjo didelį poslinkį link
didelio masto įrenginio AI pagreitis vartotojų išmaniuosiuose telefonuose.Vietoj to
AI užduotims atlikti daugiausia pasikliaujama procesoriais ir GPU, dabar įtraukiami išmanieji telefonai
skirta AI aparatūra tiesiogiai SoC architektūroje. |
|
2018 m. – Įrenginio AI išplėtimas |
„Apple“ pristatė neuroninį variklį A12 Bionic viduje
lustas, tobulinamas AI apdorojimas veido atpažinimui, skaičiavimas
fotografija ir išmaniosios mobiliosios funkcijos.Įrenginio AI tapo pagrindine
daugiausia dėmesio skiriama pavyzdinių išmaniųjų telefonų kūrimui. |
|
2019–2020 m. – visos pramonės AI integracija |
Pagrindiniai lustų gamintojai, įskaitant „Qualcomm“, „Samsung“ ir
„MediaTek“ pradėjo integruoti specialius AI greitintuvus į pavyzdinius mobiliuosius įrenginius
procesoriai.AI našumas pradėjo tapti pagrindiniu konkurencijos veiksniu
išmaniųjų telefonų techninės įrangos dizainas. |
|
2021–2023 m. – AI apdorojimas tampa pagrindiniu etalonu |
Išmaniųjų telefonų gamintojai vis dažniau lygino NPU
našumas kartu su CPU ir GPU našumu.NPU tapo pagrindiniais
kompiuterinė fotografija, balso AI, vaizdo patobulinimas, akumuliatoriaus optimizavimas,
ir išmaniosios sistemos ypatybės. |
|
2024–2025 – dideli AI modeliai, veikiantys išmaniuosiuose telefonuose |
Šiuolaikiniai mobilieji NPU įgijo pakankamai apdorojimo galios
palaiko didesnius AI modelius tiesiai išmaniuosiuose telefonuose ir kraštutiniuose įrenginiuose.Daugiau AI
darbo krūviai dabar gali būti vykdomi vietoje, labai nepriklausant nuo debesies
infrastruktūrą, gerinant atsaką ir privatumą. |
Šiuolaikiniai pavyzdiniai išmaniųjų telefonų procesoriai dabar apima labai pažangias NPU architektūras, optimizuotas realaus laiko AI išvadai, dideliu pralaidumu ir geresniu energijos vartojimo efektyvumu.
|
Mobilus procesorius |
NPU savybės |
|
Apple A17 Pro |
Apima 26 branduolių neuronų variklį, sukurtą greitam
AI apdorojimas įrenginyje.Architektūra pagerina AI fotografiją, balsą
atpažinimas ir realiuoju laiku veikiančios išmaniosios sistemos funkcijos visuose „Apple“ įrenginiuose. |
|
Qualcomm Snapdragon 8 Gen 3 |
Naudojamas atnaujintas šešiakampis AI procesorius, optimizuotas
generatyvinis AI, neuronų tinklo pagreitis, pažangus vaizdo apdorojimas ir
efektyvus mobiliojo AI darbo krūvis. |
|
„MediaTek Dimensity 9300“. |
Apima šeštosios kartos APU (AI Processing Unit) su
esminiai AI išvadų greičio ir realaus laiko AI apdorojimo patobulinimai
galimybė išmaniesiems telefonams ir krašto įrenginiams. |
|
Samsung Exynos 2400 |
Turi naujos kartos mobilųjį NPU, orientuotą į greitesnį
Įrenginyje esantis AI apdorojimas kompiuterinei fotografijai, intelektuali sistema
operacijas ir pažangias mobiliąsias AI programas. |

Tiek GPU, tiek NPU yra skirti dideliems duomenų kiekiams apdoroti lygiagrečiai, tačiau jie buvo sukurti labai skirtingiems tikslams.GPU iš pradžių buvo sukurtas grafikos atvaizdavimui, o NPU buvo sukurtas specialiai neuroninio tinklo skaičiavimui ir AI išvadoms daryti. Dėl šių projektavimo tikslų skirtumų du procesoriai DI darbo krūvius apdoroja labai skirtingai.GPU gali efektyviai paleisti AI modelius, ypač didelės apimties mokymo sistemose, tačiau jie vis tiek pasižymi dideliu grafikos procesoriaus sudėtingumu.NPU supaprastina daugelį šių operacijų, nes beveik visas dėmesys skiriamas su AI susijusiam skaičiavimui.
|
Funkcija |
CPU
(Centrinis procesorius) |
GPU
(grafikos apdorojimo įrenginys) |
NPU
(Neuronų apdorojimo blokas) |
|
Pagrindinis tikslas |
Bendrosios paskirties
kompiuterija ir sistemų valdymas |
Lygiagretus
grafika ir didelio našumo skaičiavimas |
AI išvada ir
neuroninio tinklo pagreitis |
|
Pirminis darbo krūvis |
Veikiantis
sistemos, programos, daugiafunkcinis darbas |
Grafika
atvaizdavimas, dirbtinio intelekto mokymas, mokslinis skaičiavimas |
AI apdorojimas,
tenzorinės operacijos, gilaus mokymosi išvada |
|
Apdorojimo stilius |
Eilės tvarka
apdorojimas |
Masyvi paralelė
apdorojimas |
AI optimizuotas
lygiagretus apdorojimas |
|
Pagrindinis dizainas |
Nedaug galingų ir
lanksčios šerdys |
Tūkstančiai
lygiagrečios vykdymo šerdys |
Specializuotas AI
pagreičio vienetai |
|
AI našumas |
Vidutinis |
Aukštas |
Labai aukštas AI
išvada |
|
Matrica
Daugybos greitis |
Ribotas |
Greitai |
Labai optimizuotas |
|
Tenzoras
Apdorojimas |
Programinės įrangos pagrindu |
Palaikoma
per GPU pagreitį |
Dedikuotas tenzorius
pagreitinimo aparatūra |
|
Energijos efektyvumas |
Žemesnis AI
darbo krūviai |
Nuo vidutinio iki didelio
energijos suvartojimas |
Didelė galia
efektyvus |
|
Šilumos generavimas |
Vidutinis |
Aukštas po sunkiu
darbo krūviai |
Žemesnis AI metu
išvada |
|
Atminties juostos plotis
Naudojimas |
Vidutinis |
Labai aukštas |
Optimizuotas ir
sumažintas |
|
AI delsa
Užduotys |
Aukščiau |
Vidutinis |
Labai žemas |
|
Realaus laiko AI
Galimybė |
Ribotas |
Gerai |
Puikiai |
|
Geriausia AI
Treniruotės |
Ne idealus |
Puikiai |
Palyginti ribotai
į GPU |
|
Geriausia AI
Išvada |
Pagrindiniai darbo krūviai |
Didelio našumo
išvada |
Optimizuotas
realaus laiko išvada |
|
Dažnas
Programos |
kompiuteriai, serveriai,
operacinės sistemos |
Žaidimai, AI
mokymai, atvaizdavimas, simuliacijos |
Išmanieji telefonai,
krašto AI, robotika, išmaniosios kameros |
|
Priklausomybė nuo
Debesis AI |
Aukščiau |
Vidutinis |
Žemesnis dėl
vietinis AI pagreitis |
|
Baterija
Mobiliųjų įrenginių efektyvumas |
Žemesnis |
Vidutinis |
Aukštas |
|
Tipiški įrenginiai |
Kompiuteriai,
nešiojamieji kompiuteriai, serveriai |
Žaidimų kompiuteriai, AI
serveriai, darbo vietos |
Išmanieji telefonai, IoT
įrenginiai, AI aparatinė įranga |
|
Kaina ir
Sudėtingumas |
Bendrosios paskirties
architektūra |
Sudėtingas
didelio našumo architektūra |
Specializuotas
Į AI orientuota architektūra |
|
Pagrindinis privalumas |
Lankstumas ir
sistemos valdymas |
Didelio masto
lygiagretus skaičiavimas |
Greitai ir
efektyvus vietinis AI apdorojimas |
Be NPU, šiuolaikinės skaičiavimo sistemos naudoja daug skirtingų tipų procesorių, nes jokia architektūra negali efektyviai apdoroti kiekvieno darbo krūvio.Kai kurie procesoriai daugiausia dėmesio skiria sistemos valdymui, kai kurie specializuojasi grafikos atvaizdavime, o kiti yra optimizuoti dirbtinio intelekto pagreitinimui, tinklų kūrimui, moksliniam skaičiavimui ar įterptajam valdymui.
Šiuolaikiniuose išmaniuosiuose telefonuose, serveriuose, pramoninėse sistemose, robotikos platformose, transporto priemonėse ir DI įrenginiuose keli apdorojimo įrenginiai dažnai veikia kartu vienu metu.Kiekvienas procesorius apdoroja tokio tipo darbo krūvį, kuriam jis buvo specialiai sukurtas, pagerindamas našumą, energijos vartojimo efektyvumą ir reagavimą realiuoju laiku šiuolaikinėse skaičiavimo aplinkose.
Centrinis procesorius (Central Processing Unit) yra pagrindinis daugumos kompiuterinių sistemų valdiklis.Jis valdo operacines sistemas, programas, atminties koordinavimą, užduočių planavimą ir ryšį tarp aparatūros komponentų.
CPU yra labai lankstūs ir gali patikimai susidoroti su daugybe skirtingų darbo krūvių, todėl jie yra būtini kompiuteriuose, išmaniuosiuose telefonuose, serveriuose ir įterptosiose sistemose.Tačiau jie yra mažiau veiksmingi didelio masto lygiagrečiam AI darbo krūviui, palyginti su labiau specializuotais procesoriais.
GPU (Graphics Processing Unit) yra optimizuotas didelio masto lygiagrečiam apdorojimui.Architektūroje yra daug vykdymo branduolių, galinčių vienu metu atlikti tūkstančius operacijų.
Iš pradžių GPU buvo sukurti grafikos atvaizdavimui, tačiau dabar jie plačiai naudojami dirbtinio intelekto mokymui, moksliniam modeliavimui, vaizdo apdorojimui ir didelio našumo skaičiavimui dėl stiprių lygiagretaus skaičiavimo galimybių.
TPU (Tensor Processing Unit) yra optimizuotas tenzoriais pagrįstiems AI darbo krūviams ir didelio masto giliam mokymosi pagreitinimui.Šie procesoriai daugiausia skirti debesų AI infrastruktūrai ir duomenų centrų mašininio mokymosi aplinkoms.
TPU yra labai veiksmingi:
• Giluminio mokymosi mokymas
• Dideli AI modeliai
• Tenzorių skaičiavimas
• Cloud AI paslaugos
• Didelio našumo AI pagreitis
FPGA (Field-Programmable Gate Array) naudoja programuojamus loginius blokus, kuriuos galima konfigūruoti konkrečioms užduotims po pagaminimo.Skirtingai nuo fiksuotų procesorių architektūrų, FPGA leidžia pritaikyti pačią aparatinės įrangos funkciją.
FPGA plačiai naudojami:
• Ryšių sistemos
• Automobilių elektronika
• Pramoninė automatika
• Oro erdvės sistemos
• Kraštų skaičiavimas
• Medicinos prietaisai
DPU (duomenų apdorojimo vienetas) yra optimizuotas į duomenis orientuotam darbo krūviui debesų infrastruktūroje ir tinklo sistemose.DPU padeda sumažinti procesoriaus darbo krūvį pagreitindami duomenų judėjimą, saugojimo operacijas, šifravimą ir tinklo srauto valdymą.
Šie procesoriai dažniausiai naudojami:
• Duomenų centrai
• Debesų kompiuterija
• Didelės spartos tinklų kūrimas
• Saugojimo pagreitis
• Serverio infrastruktūra
VPU (Vision Processing Unit) specializuojasi kompiuterinio matymo ir vaizdų DI apdorojime.VPU pagreitina darbo krūvius, tokius kaip veido atpažinimas, objektų aptikimas, judesio sekimas ir vaizdo analizė.
VPU dažniausiai randami:
• Išmaniosios kameros
• Stebėjimo sistemos
• Robotika
• Autonominės transporto priemonės
• AR/VR sistemos
• Edge AI matymo įrenginiai
IPU (Intelligence Processing Unit) sukurtas labai lygiagrečiam AI ir mašininio mokymosi darbo krūviui.Architektūra orientuota į duomenų srauto efektyvumo gerinimą didelio masto neuroninio tinklo vykdymo metu.
IPU naudojami:
• Mašininio mokymosi pagreitis
• Rašto atpažinimas
• AI išvada
• Lygiagretusis tenzorinis apdorojimas
• Pažangūs AI tyrimai
BPU (Brain Processing Unit) yra optimizuotas įterptoms AI ir krašto žvalgybos sistemoms.Šie procesoriai sutelkia dėmesį į greitą vietinį AI išvadą ir mažesnį energijos suvartojimą.
BPU dažniausiai naudojami:
• Išmaniosios jutimo sistemos
• Robotika
• Edge AI aparatinė įranga
• Judesio aptikimo sistemos
• Autonominės platformos
HPU (Holographic Processing Unit) yra skirtas holografiniam skaičiavimui, mišriai realybei ir erdvinės analizės sistemoms.
HPU pagalbos procesas:
• Aplinkos kartografavimas
• Judesio sekimas
• Jutiklio suliejimas
• Realaus laiko erdvinė sąveika
• AR/VR aplinkos
MPU (Microprocessor Units) ir MCU (Microcontroller Units) plačiai naudojami įterptosiose sistemose ir mažos galios elektronikoje.
MPU dažniausiai naudojami įterptosiose skaičiavimo sistemose, kurioms reikalingas operacinės sistemos lygio valdymas, o MCU integruoja procesoriaus branduolius, atmintį ir įvesties/išvesties valdymą į kompaktišką lustą, kad būtų galima atlikti tam skirtas mažos galios užduotis.
Šie procesoriai dažniausiai randami:
• IoT įrenginiai
• Pramoniniai valdikliai
• Automobilių elektronika
• Buitinė technika
• Nešiojamos įterptosios sistemos
APU (Accelerated Processing Unit) sujungia CPU ir GPU funkcijas viename procesoriaus pakete.Ši integracija pagerina energijos vartojimo efektyvumą, sumažina aparatinės įrangos dydį ir leidžia kompiuteriams bei grafikos darbo krūviams efektyviau dalytis sistemos ištekliais.
APU dažniausiai naudojami:
• Nešiojamieji kompiuteriai
• Mini kompiuteriai
• Pradinio lygio žaidimų sistemos
• Multimedijos įrenginiai
• Nešiojamos skaičiavimo platformos
Šiuolaikinės skaičiavimo sistemos retai remiasi vieno procesoriaus architektūra.Vietoj to, įrenginiai sujungia kelis specializuotus procesorius, nes skirtingiems darbo krūviams reikalingi skirtingi apdorojimo metodai.
Pavyzdžiui, šiuolaikinė sistema gali naudoti:
• CPU sistemos valdymui
• GPU grafikai ir lygiagrečiam skaičiavimui
• NPU AI išvadoms
• VPU kompiuteriniam matymui
• DPU tinklams ir duomenų judėjimui
• MCU įterptoms valdymo užduotims atlikti
Paskirstydamos darbo krūvius tam skirtai aparatūrai, modernios sistemos pasiekia geresnį našumą, mažesnį delsą, didesnį energijos vartojimo efektyvumą ir efektyvesnį apdorojimą realiuoju laiku AI, grafikos, tinklų ir įterptosiose skaičiavimo aplinkose.
NPU tampa būtini šiuolaikiniame skaičiavime, nes jie leidžia dirbtinio intelekto užduotis vykdyti vietoje, greitai ir efektyviai, labai nepriklausant nuo debesų apdorojimo.Jų optimizuota architektūra sumažina delsą, energijos naudojimą, atminties judėjimą ir šilumos generavimą, todėl jie yra vertingi išmaniuosiuose telefonuose, robotikoje, sveikatos priežiūros įrenginiuose, pramoninėje automatikoje, išmaniuosiuose namuose, autonominėse sistemose ir DI platformose.Dirbtinio intelekto modeliams tampant didesniems ir sudėtingesniems, būsimi NPU toliau tobulės dėl išmanesnės architektūros, žemo tikslumo skaičiavimo, apdorojimo atmintyje, vietinio didelio modelio palaikymo, pažangaus puslaidininkių dizaino ir stipresnių AI saugos funkcijų.
NPU yra efektyvesni, nes jų aparatinė įranga yra sukurta specialiai dirbtinio intelekto skaičiavimui, o ne bendrosios paskirties apdorojimui.CPU nuosekliai atlieka daugybę skirtingų sistemos užduočių, o NPU daugiausia dėmesio skiria tenzorinėms operacijoms, matricos daugybai, konvoliucijai ir lygiagrečiam neuroninio tinklo apdorojimui.Tai leidžia NPU greičiau atlikti AI išvadas, naudojant mažiau energijos ir generuojant mažiau šilumos.
NPU padalija AI darbo krūvį į daugybę mažesnių operacijų, kurios vienu metu vykdomos keliuose skaičiavimo įrenginiuose.Užuot laukę, kol baigsis viena instrukcija, prieš pradėdami kitą, dideli neuroninio tinklo duomenų kiekiai per procesorių juda lygiagrečiai.Tai žymiai pagerina pralaidumą ir sumažina delsą atliekant darbo krūvius, tokius kaip vaizdo atpažinimas, kalbos apdorojimas ir objektų aptikimas realiuoju laiku.
Daugeliui dirbtinio intelekto modelių nereikia itin didelio skaitinio tikslumo, kad būtų gauti tikslūs rezultatai.NPU naudoja tokius formatus kaip INT8 ir FP16, kad sumažintų atminties naudojimą ir skaičiavimo išlaidas.Mažesnio tikslumo apdorojimas leidžia atlikti daugiau operacijų per trumpesnį laiką, tuo pačiu pagerinant energijos vartojimo efektyvumą ir išlaikant gerą AI išvadų našumą.
NPU atmintį ir skaičiavimo aparatūrą sujungia arčiau procesoriaus architektūros viduje.Užuot pakartotinai perkėlus didelius tenzorinių duomenų kiekius tarp išorinės atminties ir apdorojimo branduolių, daugelis tarpinių operacijų lieka šalia vykdymo vienetų.Tai sutrumpina duomenų perdavimo kelius, sumažina pralaidumo naudojimą, sumažina delsą ir pagerina bendrą energijos vartojimo efektyvumą.
Šiuolaikiniams įrenginiams reikalingas greitas vietinis AI apdorojimas su mažu energijos suvartojimu ir minimalia delsa.NPU leidžia išmaniesiems telefonams ir krašto sistemoms atlikti dirbtinio intelekto užduotis, tokias kaip veido atpažinimas, AI fotografavimas, balso sąveika ir objektų aptikimas tiesiogiai įrenginyje, labai nepriklausant nuo debesies serverių.Tai pagerina reagavimą, privatumą ir baterijos efektyvumą.
Multiply-Accumulate (MAC) įrenginiai tvarko kartojamas daugybos ir sudėjimo operacijas, naudojamas neuroniniuose tinkluose.Šiuolaikiniuose NPU yra šimtai ar tūkstančiai vienu metu veikiančių MAC įrenginių, todėl didelius AI darbo krūvius galima apdoroti daug greičiau nei naudojant tradicinius nuoseklius procesorius.
GPU ir NPU yra optimizuoti skirtingiems darbo krūviams.GPU puikiai tinka didelio masto AI mokymui, grafikos atvaizdavimui ir didelio našumo lygiagrečiam skaičiavimui, o NPU yra optimizuoti mažos galios AI išvadoms ir realaus laiko vietiniam apdorojimui.Abiejų procesorių naudojimas leidžia sistemoms suderinti lankstumą, našumą ir energijos vartojimo efektyvumą.
Robotika ir autonominės sistemos nuolat apdoroja kameros įvestį, aplinkos žemėlapių sudarymą, jutiklių duomenis ir judesio analizę.NPU pagreitina šiuos darbo krūvius lokaliai su maža delsa, todėl sistemos gali greitai reaguoti navigacijos, kliūčių aptikimo, pėsčiųjų atpažinimo ir sprendimų priėmimo realiuoju laiku metu.
Įrenginyje esantis AI sumažina priklausomybę nuo debesų kompiuterijos, leisdamas AI modelius paleisti tiesiogiai vietinėje aparatinėje įrangoje.Tai pagerina privatumą, sumažina tinklo pralaidumo naudojimą ir leidžia greičiau reaguoti realiuoju laiku.Tikimasi, kad būsimi NPU palaikys didesnius vietinius AI modelius, multimodalinį AI apdorojimą ir pažangius generuojamus AI darbo krūvius tiesiogiai vartotojų ir pramoniniuose įrenginiuose.
Ateityje NPU greičiausiai naudos išmanesnį darbo krūvio paskirstymą, retą skaičiavimą, apdorojimą atmintyje, mikroschemų architektūrą ir adaptyvų tikslumo valdymą, kad padidintų efektyvumą.Šiomis technologijomis siekiama sumažinti nereikalingą skaičiavimą, sumažinti energijos sąnaudas ir padidinti pralaidumą, kartu palaikant didesnius ir pažangesnius AI modelius pažangiuose įrenginiuose, robotikoje, pramoninėse sistemose ir pažangiosios buitinės elektronikos srityse.
2024/07/29
2024/08/28
2024/10/6
2024/07/4
2024/04/22
2024/07/15
2023/12/28
2024/11/15
2025/09/20
2024/07/10









