
Ki hitte volna, hogy valaha is eljön ez a nap? Az elmúlt évtizedekben az informatika világában az NVIDIA és az Intel neve rendre versenytársakként csengett, gyakran éles piaci küzdelmek főszereplőiként. Éppen ezért, az a friss hír, miszerint az NVIDIA egy öt milliárd dolláros stratégiai befektetéssel, mintegy 4,9%-os részesedést szerzett az Intelben, igencsak felkavarta az állóvizet. Ez a lépés messze túlmutat egy egyszerű pénzügyi tranzakción; sokkal inkább egy komplex, előre mutató együttműködés kezdetét jelzi, amely mindkét vállalat számára létfontosságú lehet.
A háttérben valójában az NVIDIA jelenlegi gyártási kényszere áll. Bár a tajvani TSMC kifogástalan minőséget és élvonalbeli technológiát kínál, a zöld óriás számára óriási fejtörést okoz a gyártási kapacitás diverzifikációja. A rendkívül keresett, nagy teljesítményű AI gyorsítók iránti elképesztő igény miatt minden gyártósor aranyat ér. Ezek a csúcstermékek továbbra is a TSMC-nél készülnek, ez nem is kérdés. De mi van a kisebb, ám mégis jelentős volumenű termékekkel, mint például a népszerű játékosoknak szánt grafikus vezérlők? Ezek gyártása a TSMC-nél gyakorlatilag leköti azt a kapacitást, amit amúgy AI-gyorsítókra fordíthatnának. Ezért már régóta pletykálták, hogy az NVIDIA alternatívákat keres, és úgy tűnik, az Intel – a Samsung mellett – most az első számú jelöltté lépett elő, elsődlegesen a jövőbeli 14A gyártási node-jával.
A befektetésen túl, ami igazán izgalmassá teszi a helyzetet, azok a már hónapokkal ezelőtt, valószínűleg még Pat Gelsinger korábbi vezérigazgató idejében elindított közös fejlesztési projektek. Az egyik ilyen egy egészen elképesztő koncepció: az Intel tervezne egyedi x86-os szerverprocesszorokat az NVIDIA számára. De nem akármilyeneket! Ezek a CPU-k kiemelt célja az NVLink támogatása lenne, és alapvető dizájnjuknál fogva tökéletesen illeszkednének az NVIDIA aktuális generációs AI gyorsítóihoz. Elképzelhető, hogy az NVIDIA saját fejlesztésű ARM alapú szerverprocesszorai, bár ígéretesek, nem hozták el a várt áttörést bizonyos kulcsterületeken. Ezenfelül egy másik fejlesztés a klienspiacra fókuszál: az Intel egy x86-os SoC dizájnon dolgozna, amelybe az NVIDIA egy GPU chipletet, afféle integrált grafikus vezérlőt (IGP) tervezne.
És itt jön a képbe egy rendkívül fontos, ám sokak által mégis alábecsült paraméter: a Time To First Token (TTFT). Az AI-munkaterhelések, különösen a népszerű chatszolgáltatások esetében, ahol pillanatok alatt kell válaszokat generálni, a host CPU teljesítménye legalább annyira kritikus, mint a grafikus gyorsítóké. A TTFT lényegében azt méri, mennyi idő telik el a kérdés beérkezésétől az első válaszelem megjelenéséig.
Gondoljunk csak bele: ha egy AI chatszolgáltatás lassan „gondolkodik”, az nemcsak felhasználói élmény szempontjából frusztráló, de a szerver kihasználtságát is drámaian rontja. Ha a gyorsítók tétlenül várnak a lassú CPU-ra, az azt jelenti, hogy kevesebb ügyfelet tud kiszolgálni egyetlen szerver, ami végül skálázási rémálommá válhat. A késleltetés halmozódik, és a rendszer teljesítménye megreked.
Jelenleg az adatközpontok többségét úgy optimalizálják, hogy a TTFT maximum egy másodperc körül legyen. Ez azonban már egy olyan érték, ami hosszú távon sem a skálázás, sem a kihasználtság szempontjából nem ideális, nem is beszélve a felhasználók türelmét próbára tevő várakozásról. Az NVIDIA számára tehát létfontosságú, hogy olyan szerverplatform álljon rendelkezésre, amely kiemelkedő TTFT-t produkál, miközben továbbra is biztosítja az NVLink kompatibilitást.
Bár az NVIDIA saját ARM-alapú megoldásaival próbálkozik, és más ARM-os alternatívák is léteznek, a jelenlegi generációk még nem igazán jeleskednek ezen a téren. Érdekes módon, éppen az x86 architektúrán belül létezik már egy olyan piaci szereplő, amely ezt a kihívást megugrotta: az AMD legújabb EPYC processzorai stabilan 300 ms alatti TTFT-vel dolgoznak. Ez az a szint, ami már lehetővé teszi a valóban zökkenőmentes, élő interakciókat. A szolgáltatók is ezt a határt célozzák, hiszen egy ilyen reszponzív élmény kulcsfontosságú az ügyfelek megtartásához és az adatközpontok optimalizált működéséhez.
Ezen információk tükrében, nem is annyira meglepő, hogy az NVIDIA azt fontolgatja: az optimálishoz közeli TTFT-t talán hamarabb elhozza egy jövőbeli Intel CPU, mint a saját ARM dizájnjaik. Ha az AMD már most képes erre az x86 architektúrával, akkor az Intel is eljuthat ide. Ez a felismerés komoly fejtörést okozhat az ARM jövőbeli szerveres törekvéseinek. Az NVIDIA szempontjából azonban ez kevésbé lényeges. Hiszen ők nem vették meg az ARM-ot, így végső soron számukra az a fontos, hogy a host CPU a lehető legjobb teljesítményt nyújtsa, és természetesen támogassa az NVLink technológiát, függetlenül attól, hogy melyik cég vagy architektúra biztosítja azt.