Po dvejų metų 100% įmonių kompiuterių pirkimų sudarys dirbtinio intelekto kompiuteriai – Computerworld

Šešiasdešimt šeši procentai įmonių visame pasaulyje teigė, kad per ateinančius 18 mėnesių investuos į genAI, rodo IDC tyrimai. Tarp organizacijų, kurios 2024 m. didins IT išlaidas, skirtas genAI, infrastruktūra sudarys 46 % visų išlaidų.
Problema: pagrindinė aparatūros dalis, reikalinga norint nustatyti, kad AI infrastruktūros trūksta. Nors GPU yra labai paklausūs, kad galėtų paleisti didžiausius didelių kalbų modelius (LLM) už genAI, rinkai vis dar reikia didelio našumo atminties lustų dirbtinio intelekto programoms. Rinka yra įtempta abiem – kol kas.
GPU, naudojami mokymo ir išvadų užduotims atlikti LLM, gali sunaudoti daug procesoriaus ciklų ir būti brangu. Mažesni, labiau į pramonę ar verslą orientuoti modeliai dažnai gali duoti geresnių rezultatų, pritaikytų verslo poreikiams, ir jie gali naudoti įprastus x86 procesorius su NPU.
„Nors daug dėmesio skiriama didelio našumo GPU naudojimui naujiems AI darbo krūviams, pagrindiniai hiperskaleriai (AWS, Google, Meta ir Microsoft) investuoja į savo lustų, optimizuotų dirbtiniam intelektui, kūrimą“, – sakė Priestley.
Pasak Priestley, lustų kūrimas yra brangus, tačiau naudojant pagal užsakymą sukurtus lustus galima pagerinti veiklos efektyvumą, sumažinti AI pagrįstų paslaugų teikimo vartotojams sąnaudas ir sumažinti vartotojų sąnaudas prieigai prie naujų dirbtinio intelekto programų.
„Kadangi rinka pereina nuo kūrimo prie diegimo, tikimės, kad ši tendencija tęsis“, – sakė Priestley.