Baidu accélère dans l’IA avec Ernie 4.5 et X1

Le moteur de recherche chinois Baidu diversifie son arsenal technologique avec deux nouveaux modèles d’IA, pensés pour des usages multimodaux et à coût réduit.
Tl;dr
- Baidu lance deux nouveaux modèles d’IA : Ernie 4.5 et Ernie X1, dotés de capacités multimodales.
- Ernie X1 rivalise avec DeepSeek R1 à moitié prix, tandis qu’Ernie 4.5 se distingue par sa compréhension des émotions, des mèmes et du second degré.
- Baidu prévoit de renforcer encore sa gamme avec le lancement d’Ernie 5 d’ici la fin de l’année.
Deux nouveaux modèles pour affirmer la stratégie IA de Baidu
Baidu, l’un des leaders de la recherche en ligne en Chine, vient d’annoncer la sortie de deux nouveaux modèles d’intelligence artificielle : Ernie 4.5 et Ernie X1. Ernie 4.5 constitue la dernière évolution de son modèle de base lancé il y a deux ans. De son côté, Ernie X1 est un modèle spécialisé dans le raisonnement avancé. Ces lancements illustrent la volonté de Baidu de s’imposer sur le marché mondial de l’intelligence artificielle, en particulier face à la concurrence américaine et chinoise. Baidu met en avant la sophistication de ses nouvelles IA pour attirer entreprises et développeurs.
Des performances solides et un positionnement tarifaire agressif
Selon l’agence Reuters, Baidu affirme qu’Ernie X1 affiche des performances comparables à celles du modèle DeepSeek R1, tout en étant proposé à un coût deux fois inférieur. Cet argument tarifaire pourrait constituer un atout décisif pour convaincre de nouveaux utilisateurs, dans un marché où le rapport qualité-prix devient un critère essentiel. Quant à Ernie 4.5, Baidu insiste sur ses capacités d’interprétation émotionnelle, revendiquant une « haute intelligence émotionnelle » qui lui permet de comprendre les mèmes et le second degré. Ces caractéristiques visent à répondre aux besoins d’une utilisation plus naturelle et intuitive des IA.
Des modèles multimodaux pour couvrir tous les formats
Ernie 4.5 et Ernie X1 sont tous deux dotés de capacités multimodales. Cela signifie qu’ils peuvent traiter non seulement du texte, mais également des images, des vidéos et du contenu audio. Ce type de fonctionnalités ouvre la voie à des applications variées dans des secteurs comme l’éducation, le divertissement ou encore le service client. En s’appuyant sur cette polyvalence, Baidu espère rattraper son retard face aux géants internationaux, en particulier OpenAI, qui domine actuellement le marché avec ChatGPT et ses versions avancées. La multimodalité devient aujourd’hui un standard attendu pour les modèles de nouvelle génération.
Une stratégie d’avenir avec Ernie 5 en ligne de mire
Malgré ses efforts, Baidu a jusqu’à présent rencontré des difficultés à imposer ses modèles sur le marché mondial, avec une adoption qui reste limitée. Toutefois, la société ne compte pas s’arrêter là. CNBC rapporte que Baidu prévoit de lancer Ernie 5 d’ici la fin de l’année, en promettant des améliorations significatives sur les capacités multimodales. Ce futur modèle pourrait marquer une étape importante dans la course à l’intelligence artificielle, dans un contexte de compétition accrue entre la Chine et les États-Unis. Baidu entend bien jouer un rôle majeur dans cette nouvelle ère technologique.