La Chine accélère face à Nvidia avec une nouvelle puce Alibaba annoncée trois fois plus rapide

La Chine accélère face à Nvidia avec une nouvelle puce Alibaba annoncée trois fois plus rapide

Alibaba a présenté un nouveau système serveur, le Panjiu AL128, qui regroupe 128 accélérateurs dans un seul rack, en même temps qu’une nouvelle puce IA destinée aux usages d’inférence.

L’annonce a été faite lors de l’Alibaba Cloud Summit, avec un objectif clair, fournir une base matérielle conçue pour les agents capables d’exécuter des tâches longues et multi-étapes, au-delà du simple chatbot. Le contexte est celui d’une montée en puissance des alternatives locales en Chine, sur fond de restrictions américaines sur les puces avancées. Alibaba met en avant une progression nette, sa nouvelle puce, conçue par sa filiale T-Head, est annoncée comme trois fois plus performante que la génération précédente. De quoi attirer les entreprises qui veulent déployer des agents en production, sans dépendre d’un fournisseur étranger unique.

Alibaba lance le Panjiu AL128, rack de 128 accélérateurs

Le Panjiu AL128 est présenté comme un système prêt entreprise qui assemble 128 accélérateurs dans un seul rack. Ce choix d’intégration vise un besoin concret, augmenter la capacité de calcul et surtout la communication entre puces, quand on passe d’un modèle isolé à des flottes d’agents qui tournent en continu. Dans les entreprises, ces agents doivent enchaîner des actions, lire des bases documentaires, appeler des outils, puis coordonner des résultats.

Alibaba indique que la plateforme est disponible immédiatement pour des clients domestiques, via Bailian, sa plateforme de modèles et de services IA sur Alibaba Cloud en Chine. Dit autrement, tu n’es pas face à une démo de labo, mais à un produit positionné pour des déploiements réels, avec les contraintes habituelles, supervision, disponibilité, et montée en charge. C’est aussi un signal commercial, Alibaba veut capter le budget IA des grands comptes.

A lire aussi :  Le cortège de Donald Trump à Pékin intrigue avec deux SUV noirs mystérieux au toit anormalement haut

Cette approche rack complet colle à l’évolution des charges de travail. Les agents consomment plus de mémoire, maintiennent du contexte plus longtemps et échangent davantage de données entre composants. Résultat, la performance ne se joue pas uniquement sur la puissance brute d’une puce, mais sur l’ensemble, interconnexions, latence, stabilité, et capacité à tenir des sessions longues. Sur ce terrain, l’architecture système devient un argument aussi important que le silicium.

T-Head annonce Zhenwu M890, puce 3 fois plus rapide

La nouvelle puce, développée par T-Head, est annoncée comme trois fois plus performante que la Zhenwu 810E. Alibaba la positionne sur l’inférence, c’est-à-dire le moment où un modèle déjà entraîné est déployé pour produire des réponses, exécuter des étapes, et piloter des outils. C’est un point clé, beaucoup d’entreprises ne veulent plus seulement entraîner, elles veulent faire tourner des agents à grande échelle, tous les jours.

Le discours technique insiste sur les besoins propres aux agents, mémoire plus importante, communications rapides, coordination en temps réel entre plusieurs composants. Dans un scénario concret, un agent de support client peut résumer un dossier, vérifier une commande, déclencher une procédure, puis rédiger une réponse, sans tout refaire à chaque étape. Ce type de boucle augmente la pression sur la bande passante interne et la gestion du contexte, ce que la puce prétend mieux absorber.

A lire aussi :  ChatGPT veut analyser vos dépenses, abonnements et paiements grâce à une connexion directe aux banques

Alibaba s’appuie aussi sur un historique industriel. T-Head dit avoir expédié plus de 560 000 unités Zhenwu au total, avec plus de 400 clients externes répartis dans 20 secteurs, dont l’automobile et les services financiers. Ce volume ne garantit pas que la nouvelle génération dominera le marché, mais il montre une capacité de livraison et un réseau de déploiement. La nuance, c’est que les promesses de performance restent dépendantes des logiciels, des frameworks et des cas d’usage réels.

La Chine finance des alternatives, Huawei et MetaX avancent

Le lancement d’Alibaba s’inscrit dans une dynamique nationale, réduire la dépendance aux puces étrangères, notamment dans un contexte de restrictions d’exportation américaines sur les composants les plus avancés. Pékin soutient cette trajectoire via des investissements, dont un fonds IA annoncé à 8,4 milliards de dollars, soit environ 7,7 milliards d’euros au taux indicatif de 1 $ = 0,92. L’idée est simple, sécuriser l’accès à la puissance de calcul.

Dans cette course, Huawei occupe une place centrale avec ses puces Ascend. Des analystes cités dans la presse spécialisée estiment que certains systèmes Ascend peuvent dépasser, sur certaines mesures, des configurations haut de gamme récentes de Nvidia, mais avec une consommation énergétique plus élevée. Et c’est là que le débat devient concret, si tu gagnes en souveraineté mais que ta facture électrique grimpe, l’équation économique peut se tendre pour des data centers déjà sous pression.

A lire aussi :  Google dévoile Gemini 3.5 Flash, une IA capable d'agir de manière autonome

D’autres acteurs émergent. La startup de Shanghai MetaX a lancé une puce présentée comme une alternative à la Nvidia H20, en s’appuyant sur une technologie plus ancienne et une approche deux puces combinées pour pousser les performances. Le compromis mentionné, plus de mémoire mais plus de consommation, illustre les arbitrages du moment. L’évolution reste incertaine, car la compétitivité se jouera autant sur l’écosystème logiciel et l’accès à la production de masse que sur les annonces produit.

À retenir

  • Alibaba présente le serveur Panjiu AL128, un rack intégrant 128 accélérateurs.
  • La nouvelle puce Zhenwu de T-Head est annoncée trois fois plus rapide que la 810E.
  • Les agents IA poussent les besoins en mémoire, communication inter-puces et disponibilité continue.
  • La Chine soutient l’écosystème via un fonds IA de 8,4 milliards de dollars (≈ 7,7 milliards d’euros).
  • Huawei et MetaX avancent aussi, avec des compromis notables sur la consommation énergétique.

Laisser un commentaire