Intel en SambaNova verbeteren AI voor Agentic met Xeon 6

Onze nieuwsberichten zijn gebaseerd op de laatste actualiteiten en persberichten.
Esther
Door Esther

Het officiële persbericht

SambaNova heeft de volgende fase van de samenwerking met Intel aangekondigd: een heterogene hardwareoplossing die GPU’s combineert voor prefill, Intel Xeon 6-processors als host- en “actie"-CPU’s, en SambaNova RDU’s voor decodering. Deze oplossing levert hoogwaardige inferentie voor de meest veeleisende Agentic AI-toepassingen. Het ontwerp zal in de tweede helft van 2026 beschikbaar komen voor bedrijven, cloudproviders en soevereine AI-programma’s die codeeragenten en andere agentische workloads op grote schaal willen uitvoeren.

“Agentic AI wordt steeds vaker in productie genomen - en het succespatroon dat we zien, is GPU’s om de taak te starten, Intel Xeon 6 om deze uit te voeren en SambaNova RDU’s om deze snel af te ronden", aldus Rodrigo Liang, CEO en medeoprichter van SambaNova Systems. “Samen met Intel bieden we klanten een blauwdruk die ze kunnen implementeren in bestaande, luchtgekoelde datacenters, met brede x86-ondersteuning voor de codeeragenten en tools die ze vandaag de dag al gebruiken."

“Het software-ecosysteem voor datacenters is gebouwd op x86 en draait op Xeon-processors. Dit biedt een volwassen, bewezen basis waarop ontwikkelaars, bedrijven en cloudproviders op grote schaal kunnen vertrouwen", aldus Kevork Kechichian, Executive Vice President en General Manager van de Data Center Group (DCG) bij Intel Corporation. “Toekomstige workloads vereisen een heterogene mix van rekenkracht, en deze samenwerking met SambaNova levert een kostenefficiënte, krachtige inferentiearchitectuur op die is ontworpen om te voldoen aan de behoeften van klanten op grote schaal, aangedreven door Xeon 6."

Agentische AI ​​wordt steeds gangbaarder

Agentische AI ​​is van demo’s naar implementaties gegaan. Coderende agents compileren en voeren nu code uit, roepen tools en API’s aan, raadplegen databases en coördineren workflows voor snelle inferentie van grote modellen met lage latentie. Daarbij komen de beperkingen van GPU-only stacks aan het licht: GPU’s verzorgen de prefill, maar CPU’s en dedicated inferentie-acceleratoren bepalen nu hoe snel en efficiënt de workloads van agents in de praktijk worden uitgevoerd, geschaald en geoptimaliseerd in productie.

“We zien de code-output van AI-agents exponentieel groeien en daardoor ziet Daytona de behoefte aan steeds meer sandboxes om deze code uit te voeren en te compileren, die draait op CPU’s zoals Intel’s Xeon", aldus Ivan Burazin, CEO van Daytona, een bedrijf dat veilige code-infrastructuur voor agentische AI ​​levert.

“Inferentie in productieomgevingen evolueert naar heterogene hardware - geen enkel chiptype is optimaal voor elke fase van een agentworkflow. Wat het Intel- en SambaNova-plan zo bijzonder maakt, is de combinatie van herconfigureerbare RDU’s voor snelle decodering met Intel Xeon CPU’s voor de uitvoering van agenttools. Dit levert premium prestaties op met minder chips en volledige compatibiliteit met het software-ecosysteem waarop bedrijven al draaien," aldus Banghua Zhu, medeoprichter en CTO van RadixArk.

Waarom Intel Xeon 6 en SambaNova RDU’s?

De gezamenlijk ontwikkelde architectuur is gebaseerd op Intel Xeon 6-processors en SambaNova RDU’s. De SN50 RDU is ontworpen om de tokenomics van inferentie te veranderen en levert decodering met hoge doorvoer en lage latentie voor grote taalmodellen, terwijl de Xeon 6 zorgt voor de geheugenbandbreedte, PCIe-lanedichtheid en on-die accelerators.

Uit metingen van SambaNova blijkt dat de Xeon 6 meer dan 50% snellere LLVM-compilatietijden levert in vergelijking met Arm-gebaseerde server-CPU’s, en tot 70% snellere prestaties van vectordatabases in vergelijking met beschikbare x86-gebaseerde concurrenten. Dit versnelt de volledige workflow van codeeragenten, waardoor ontwikkelaars aanzienlijk sneller van idee naar productiegereed agent kunnen overstappen.

“Wanneer duizenden codeeragenten tegelijkertijd toolaanroepen, ophaalverzoeken, codecompilaties en versleutelde berichten tussen agenten genereren, is de CPU geen achtergrondcomponent, maar de uitvoerende en actielaag van het systeem", aldus Harry Ault, CRO van SambaNova. “De combinatie van Xeon 6 met SambaNova RDU’s biedt bedrijven en soevereine AI-operators implementaties die sneller, kostenefficiënter en specifiek ontworpen zijn voor de agentische workloads die momenteel in productie draaien."

In dit nieuwe ontwerp:
  • GPU’s verwerken de zeer parallelle prefill-fase, waarbij lange prompts efficiënt worden omgezet in key-value caches.
  • SambaNova RDU’s werken samen met Xeon 6 als de speciale inferentie-infrastructuur voor decodering met hoge doorvoer en lage latentie, zodat, zodra de CPU’s het werk hebben voorbereid, tokens snel en efficiënt worden gegenereerd.
  • Xeon 6 is de host-CPU en het systeemcontrolepaneel, verantwoordelijk voor de coördinatie van agentische taken, de verdeling van de werklast, de uitvoering van tools en API’s, en Het systeemgedrag wordt beheerd, terwijl het tevens fungeert als de actie-CPU die code compileert en uitvoert en de resultaten valideert.
De volgende fase van AI versnellen

Deze aankondiging markeert een duidelijke stap van partnerschap naar grootschalige commerciële implementatie, wat vertrouwen in de technologie uitstraalt en een sterke, concurrerende oplossing biedt voor bedrijven, dienstverleners en wereldwijde cloudplatformen.

Bronnen: TechPowerUp, Intel, SambaNova

Delen op