Actualité : Précommande Galaxy S26 : une fenêtre de remises rare avant le 10 mars

9 mars 2026 à 14:45

Un trio de modèles, trois manières de faire baisser la noteLa campagne de précommande repose sur une mécanique simple : un prix d’entrée déjà réduit, puis un remboursement après achat, auquel s’ajoute un bonus reprise. Cette combinaison évite les calculs compliqués et permet de visualiser assez vite l’économie potentielle. Les tarifs affichés sont ca...

Ce n’est pas une lune, c’est une publicité.

Actualités des internautes libres

Par : Corentin BURTIN

9 mars 2026 à 14:36

La publicité envahit désormais des lieux que l’on juge autrefois préservés et neutres, et la Lune n’y échappe plus. Le projet de plaquer des messages ...

Lire plus

« Tolérance zéro » : France Travail va fouiller dans vos relevés téléphoniques pour lutter contre la fraude

Presse-Citron

Par : Mathilde Rochefort

9 mars 2026 à 14:34

Le gouvernement passe à la vitesse supérieure pour protéger les comptes de la Sécurité sociale. Un nouveau projet de loi, qui a été débattu février à l’Assemblée nationale, prévoit des mesures de surveillance inédites, allant jusqu’à l’analyse des relevés téléphoniques et la biométrie. Objectif : traquer les fraudeurs partout où ils se cachent, en France comme à l'étranger.

« More agents is all you need »… ou pas : une esquisse de lois d’échelle pour l’IA agentique

Silicon

Par : Clément Bohic

9 mars 2026 à 14:34

« More agents is all you need. »

En octobre 2024, le labo IA de Tencent avait publié un article ainsi intitulé. Il y présentait une méthode permettant d’accroître la performance d’un LLM en augmentant le nombre d’agents instanciés.

La technique, dite « forêt d’agents », est simple dans son principe : envoyer une requête à plusieurs agents (instances d’un LLM) et les faire voter à la majorité sur les outputs.

forêt agents — Un « agent LLM » peut aussi bien être un LLM seul qu’un groupe d’agents.

Google Research y fait référence dans un autre article… qui en prend partiellement le contrepied. Il y propose des principes de mise à l’échelle des systèmes agentiques.

3 familles de LLM, 4 benchmarks, 5 architectures

Ces principes découlent de l’analyse de 180 configurations. En l’occurrence, 5 architectures agentiques appliquées à 3 familles de modèles et testées sur 4 benchmarks.

Les architectures en question :

Mono-agent
Agents indépendants (aucune communication entre eux)
Centralisé (plusieurs agents, chacun communiquant avec un orchestrateur)
Décentralisé (communication entre pairs)
Hybride (orchestrateur + P2P limité)

L’orchestrateur détermine la manière dont sont agrégés les outputs des agents et s’il a le droit de passer outre. Il gère aussi la mémoire.

Ces architectures ont été appliquées à des modèles d’Anthropic (Claude Sonnet 3.7, 4.0 et 4.5), de Google (Gemini 2.0 Flash, 2.5 Flash et 2.5 Pro) et d’OpenAI (GPT-5, 5 mini et 5 nano).

Les benchmarks étaient les suivants :

Finance Agent (2025 ; analyse financière sur dépôts SEC)
BrowseComp-Plus (2025 ; « recherche approfondie » sur le web)
Plancraft (2024 ; planification en environnement Minecraft)
WorkBench (2024 ; exécution de tâches en environnement de bureau)

Les tests se sont faits à paramètres fixes (outils, prompts, budgets de calcul). En sont ressorties 8 métriques, le taux de réussite étant la principale.

À partir de ces métriques, ainsi que de trois autres indicateurs (propriétés des tâches, nombre d’agents, capacités de modèles de base), Google Research a élaboré un modèle prédictif. Son rôle : identifier l’architecture optimale pour une tâche donnée.

Ce n’est pas (vraiment) le nombre qui compte

Là semble effectivement résider le véritable enjeu. Si on en croit les résultats communiqués, ce n’est pas tant le nombre d’agents qui importe que l’adéquation entre la tâche et l’architecture agentique.

La complexité des tâches joue moins que la capacité à les décomposer. Les résultats sur Finance Agent et Plancraft en témoignent.

Fait d’informations statiques et structurées, Finance Agent se prête à une division du travail. Toutes les architectures multi-agents apportent effectivement un gain important par rapport au mono-agent.

Plancraft est, au contraire, intrinsèquement séquentiel (chaque action modifie potentiellement l’environnement). Le multi-agent y est systématiquement moins efficace que le mono-agent. Diviser le travail implique que chaque agent synchronise l’état du système. Dans un tel environnement dynamique, cela impacte significativement le budget de calcul disponible. Les agents compressent alors d’autant plus les informations qu’ils (se) transmettent, au risque de perdre de l’information.

résultats — Les taux en rouge et en vert s’entendent par rapport au résultat en mono-agent. Les boîtes représentent l’intervalle des taux de réussite ; les diamants, la performance moyenne.

Sur WorkBench, la différence est plus marginale. Idem sur BrowserComp-Plus, où l’approche décentralisée, adaptée à l’exploration parallèle de pages web (espaces de recherche à forte entropie), affiche le meilleur score de précision.

Google perçoit un modèle généralisable

La surcharge liée à la coordination des agents pèse démesurément sur les tâches qui impliquent beaucoup d’outils. L’étude ne révèle pas, en revanche, de corrélation entre l’augmentation de cette surcharge et celle de la complexité des tâches. À performance équivalente, le multi-agent consomme bien plus de tokens que le mono-agent (+ 58 % en mode « indépendant », + 263 % en décentralisé, + 285 % en centralisé, + 515 % en hybride.

Dès qu’un agent seul dépasse les 45 % de taux de réussite, en ajouter a des effets négatifs. Quant à la redondance des tâches (en confier une à plusieurs agents), elle n’a, à l’échelle, qu’un bénéfice marginal.

La présence ou l’absence de points de validation engendre une grande différence dans l’amplification des erreurs. En centralisé, elles sont multipliées par 4,4 par rapport au mono-agent ; en décentralisé, par 7,8 ; en hybride, par 5,1 ; en indépendant, par 17,2.

Les architectures centralisée et décentralisée tendent à réduire le taux moyen d’erreurs par rapport au mono-agent. Notamment pour ce qui est de l’omission de contexte. Et, dans une moindre mesure, les contradictions de logique. C’est n’est pas toujours le cas pour les architectures hybrides, avec lesquels ce taux s’accroît même parfois. En particulier sur les dérives numériques (découlant d’arrondis ou de mauvaises conversions en cascade).

La hiérarchie des architectures est relativement stable entre domaines. Google Research y voit la preuve que son modèle est généralisable. Sur labase de ses expérimentations, il affirme qu’à budget constant, au-delà de 3 ou 4 agents, la qualité de raisonnement de chacun se dégrade.

Illustration principale générée par IA

The post « More agents is all you need »… ou pas : une esquisse de lois d’échelle pour l’IA agentique appeared first on Silicon.fr.

Comment inverser le texte dans Microsoft Word ?

Actualités des internautes libres

Par : Corentin BURTIN

9 mars 2026 à 14:26

Manipuler l’orientation d’un texte peut sembler réservé aux graphistes, pourtant c’est accessible depuis Microsoft Word pour des usages pratiques. Cet article pratique montre des méthodes ...

Lire plus

Derniers codes Darkdivers – Mars 2026 (Actifs et Fonctionnels)

Moyens I/O

Par : Moyens Staff

9 mars 2026 à 14:24

Vous retournez à l’écran de spawn et la boutique vous fixe : ces Points donnent l’impression d’une poignée de main secrète que tout le monde connaît déjà. J’ai vu des équipes échanger des murmures frénétiques dans le chat pendant qu’un seul code transformait le grind de la nuit en victoire ; la liste des codes […]

Le post Derniers codes Darkdivers – Mars 2026 (Actifs et Fonctionnels) est apparu en premier sur Moyens I/O.

Actualité : Windows 11 : machine arrière pour Microsoft avec des paramètres rapides vraiment personnalisables

Les Numériques

Par : Antoine Roche

9 mars 2026 à 14:21

L'un des (nombreux) reproches faits à Windows 11 depuis son lancement est le manque de personnalisation de son interface, souvent très figée. Surtout quand l'on compare certains éléments déjà présents dans de précédentes versions de l'OS de Microsoft, assurément plus rigides depuis Windows 11. Mais il y a quelques semainesla firme a promis de corrige...

Galaxy S26 Ultra vs iPhone 17 Pro : le verdict de DxOMark sur le duel photo

BlogNT : Le Blog des Nouvelles Technologies dédié au Web, aux nouvelles technologies et au développement Web

Par : Yohann Poiron

9 mars 2026 à 14:20

Les premiers retours « pré-score » de DxOMark sur le Galaxy S26 Ultra dessinent un tableau nuancé : Samsung progresse là où on l’attendait (basse lumière, portraits plus propres), mais l’iPhone 17 Pro resterait légèrement devant sur deux nerfs de la guerre : la constance en conditions difficiles et la découpe des portraits. Galaxy S26 Ultra : Ce que Samsung a vraiment changé […]

L’article Galaxy S26 Ultra vs iPhone 17 Pro : le verdict de DxOMark sur le duel photo est apparu en premier sur BlogNT : le Blog des Nouvelles Technologies.

Telegram : éviter les arnaques, conseils inspirés de Google Safe Browsing

Actualités des internautes libres

Par : Matthieu CHARRIER

9 mars 2026 à 14:19

Telegram reste une plateforme majeure de messagerie, attirant des centaines de millions d’utilisateurs anonymes et fidèles. Malheureusement, l’essor a favorisé la multiplication des arnaques sophistiquées ...

Lire plus

Windows 11 ouvre les vannes pour les widgets tiers

Actualités des internautes libres

Par : Matthieu CHARRIER

9 mars 2026 à 14:18

Windows 11 ouvre une nouvelle ère pour les modules d’information en permettant l’arrivée de widgets tiers sur le bureau. Cette évolution promet une intégration plus ...

Lire plus

Actualité : Bon plan – L'aspirateur robot Roborock Saros 10 "5 étoiles" à 899,00 € (-35%)

Les Numériques

Par : Rick

9 mars 2026 à 14:14

Le Roborock Saros 10 promet de nettoyer là où ses prédécesseurs rechignaient en abaissant son LiDAR ou en se propulsant sur ses roues. Cet aspirateur-robot promet même de le faire mieux que quiconque.Points fortsApp claire et fluide. LiDAR rétractable. Retrait automatique de la serpillière. Navigation intelligente. Évite la plupart des obstacles et d...

Une arme inconnue serait à l’origine du syndrome de La Havane : des détails classifiés fuitent sur un dispositif à micro-ondes miniaturisé russe

Presse-Citron

Par : Mathilde Rochefort

9 mars 2026 à 14:12

Pendant des années, le gouvernement américain a balayé les témoignages de centaines d'agents, diplomates et militaires victimes de mystérieux troubles neurologiques. Une vaste enquête révèle que Washington possède désormais l'arme qui aurait causé leurs blessures.

Free offre Canal+ pendant un an à certains de ses abonnés. Êtes-vous concernés ?

Le Journal du Geek

Par : Julie Hay

9 mars 2026 à 14:10

Free renouvelle son offre exceptionnelle et propose gratuitement Canal+ la chaine à certains de ses abonnés. Êtes-vous concernés ? Comment l'activer ?

Où trouver le carburant le moins cher ? Les meilleures applications mobiles gratuites

Numerama.com

Par : Nathalie Jourand

9 mars 2026 à 14:03

Les automobilistes qui roulent encore en thermique doivent faire face à de nombreux postes de dépense pour leur véhicule, et l’un des plus importants est évidemment le carburant. Alors quand il faut faire le plein, toute économie est bonne à prendre. Pour vous aider à trouver le carburant le moins cher, voici une sélection d’applications gratuites pour comparer les prix des stations-service.

Face aux coûts de l’électrique, Porsche envisage de fusionner le Taycan et la Panamera

Presse-Citron

Par : Camille Coirault

9 mars 2026 à 14:02

Un plan de sauvetage aventureux, certes, mais Porsche cultive le goût du risque depuis que le Boxster a sauvé la baraque dans les années 90, prouvant que Stuttgart sait manoeuvrer quand le vent tourne dans le mauvais sens.

Avez-vous remarqué le message caché du MacBook Neo ? Il se dévoile à qui sait regarder

Be Geek

Par : Jordan Servan

9 mars 2026 à 14:00

Avez-vous remarqué le message caché du MacBook Neo ? Il se dévoile à qui sait regarder

Le nouveau MacBook Neo intrigue les passionnés de technologie : un message dissimulé s’y cacherait, perceptible seulement pour les plus observateurs. Cette énigme, subtilement intégrée au design, suscite déjà la curiosité des utilisateurs attentifs.

Jujutsu Kaisen : Y aura-t-il un autre manga après Modulo ?

Moyens I/O

Par : Moyens Staff

9 mars 2026 à 14:00

Je me souviens avoir tourné la dernière page et avoir senti la pièce se faire plus silencieuse. La courte note de l’éditeur a atterri sur la page et a attiré l’attention comme un fil lâche. On pouvait presque entendre les fans poser la même question à voix haute : quelle est la suite ? Avertissement […]

Le post Jujutsu Kaisen : Y aura-t-il un autre manga après Modulo ? est apparu en premier sur Moyens I/O.

On a testé l’iPhone 17e : l’autonomie et le stockage sont ses points forts

Numerama.com

Par : Nicolas Lellouche

9 mars 2026 à 14:00

Plus puissant que son prédécesseur et enfin compatible avec le large écosystème d'accessoires MagSafe, l’iPhone 17e est le meilleur rapport qualité-prix de la gamme pour la majorité des consommateurs. Les autres, plus exigeants en photo ou sur l'écran par exemple, feraient sans doute mieux de se tourner vers l'iPhone 17.

Actualité : Bitdefender Premium Security : VPN illimité et Scam Copilot à seulement 55 € (-50 %)

Les Numériques

Par : L'équipe Promo

9 mars 2026 à 14:00

Bitdefender Premium Security constitue l’offre la plus complète de l’éditeur. Cette suite ne se limite pas à un simple antivirus. Pour faire face à la majorité des menaces en ligne, elle intègre un ensemble de fonctionnalités de sécurité, dont un antivirus, un VPN, des outils de détection des arnaques et une protection contre les fraudes sur internet...

Les États-Unis surpris par les drones iraniens : comment l’Ukraine vient à leur secours

Numerama.com

Par : Julien Lausson

9 mars 2026 à 13:59

drone iran

Les rôles s'inversent au Moyen-Orient. Pris de court par les essaims de drones iraniens, les États-Unis et leurs alliés sollicitent l'expertise unique de l'Ukraine. Kiev pourrait en proposer plusieurs milliers par mois, mais pas « gratuitement ».

Vue lecture

3 familles de LLM, 4 benchmarks, 5 architectures

Ce n’est pas (vraiment) le nombre qui compte

Google perçoit un modèle généralisable