"Je suis horrifié" : l'IA de Google efface l'intégralité du disque D d'un utilisateur, le désastre du "vibe coding"

3 décembre 2025 à 17:12

@Sebsauvage et @Pofilo

Je suis d'accord avec vous : le "vibe coding", c'est une énorme connerie, surtout sans avoir les bases nécessaires, et surtout sans relire le code.

MAIS, vous citez dans les problèmes : "pas de backup".

Alors je vous invite à aller lire la source mentionnée en bas de l'article, sur The Register :
https://www.theregister.com/2025/12/01/google_antigravity_wipes_d_drive/

Je cite :
"Luckily, as he explained on Reddit, most of what he lost had already been backed up on another drive. Phew."

Voilà.
Le mec avait des sauvegardes.
Il a sans doute perdu quelques jours de boulot, mais pas tout.
(Permalink)

AI Safety Index 2025 : un bilan inquiétant de la sécurité de l’IA

Silicon

Par : Philippe Leroy

3 décembre 2025 à 16:59

Le Future of Life Institute vient de publier l’édition 2025 de son AI Safety Index, un rapport qui évalue les pratiques de sécurité des principales entreprises développant des intelligences artificielles avancées.

Les conclusions sont sans appel : aucune entreprise n’atteint l’excellence en matière de sécurité, et le secteur dans son ensemble reste dangereusement mal préparé face aux risques existentiels que pourraient poser les IA futures.

Un classement général décevant

Sur les huit entreprises évaluées, aucune n’obtient une note maximale. Le meilleur résultat revient à Anthropic avec un simple C+, suivi d’OpenAI (C) et de Google DeepMind (C-). Les autres acteurs ( xAI, Z.ai, Meta, DeepSeek et Alibaba Cloud) obtiennent des notes nettement inférieures, allant de D à F.

Cette situation révèle que même les leaders du secteur se situent tout au plus dans la moyenne. L’industrie de l’IA, malgré ses ambitions affichées de développer des systèmes toujours plus puissants, est loin de disposer des garde-fous nécessaires.

Anthropic : le meilleur élève, mais encore insuffisant

Malgré certaines critiques, Anthropic demeure l’entreprise la plus responsable selon l’index. Elle se distingue par une gouvernance solide (statut de Public Benefit Corporation), des efforts significatifs en recherche de sécurité, un cadre de sécurité relativement développé et une communication transparente sur les risques.

Toutefois, des faiblesses importantes subsistent. Le rapport souligne notamment l’absence récente d’essais sur l’amélioration des capacités humaines dans le cycle d’évaluation des risques, ainsi qu’un passage par défaut à l’utilisation des interactions des utilisateurs pour l’entraînement des modèles.

Les recommandations adressées à Anthropic incluent la formalisation de seuils de risques mesurables, la documentation de mécanismes concrets d’atténuation, l’amélioration de l’indépendance des évaluations externes et la publication d’une version publique robuste de sa politique de lanceurs d’alerte.

OpenAI : des progrès, mais un écart entre discours et pratique

OpenAI se distingue par un processus d’évaluation des risques plus large que certains concurrents et par la publication, unique parmi ses pairs, d’une politique de lanceur d’alerte (whistleblowing) suite à sa médiatisation.

Néanmoins, le rapport appelle l’entreprise à aller plus loin : rendre ses seuils de sécurité réellement mesurables et applicables, accroître la transparence vis-à-vis des audits externes, et surtout aligner ses positions publiques avec ses engagements internes.

Google DeepMind : des avancées timides

DeepMind montre des progrès en matière de transparence, ayant notamment complété le questionnaire de l’AI Safety Index et partagé des éléments de politique interne, comme son dispositif de « whistleblowing ».

Cependant, les fragilités persistent : l’évaluation des risques reste limitée, la validité des tests externes est jugée faible, et le lien entre la détection de risques et le déclenchement de mesures concrètes demeure flou.

Les autres acteurs : des efforts marginaux

Certaines entreprises ont entamé des démarches d’amélioration. Par exemple, xAI a publié un cadre de sécurité pour ses « IA de frontière », et Meta a formalisé un cadre avec seuils et modélisation des risques.

Mais les évaluations restent superficielles ou incomplètes : les couvertures de risque sont restreintes, les seuils peu crédibles, les mécanismes d’atténuation flous ou absents, et la gouvernance interne insuffisante. On note notamment l’absence de politique de lanceurs d’alerte et un manque d’autorité claire en cas de déclenchement de risques.

Pour les entreprises les moins bien notées, notamment DeepSeek et Alibaba Cloud, les progrès constatés sont très modestes, principalement sur la publication de cadres de sécurité ou la participation à des standards internationaux.

Le talon d’Achille : la sécurité existentielle

Le constat le plus alarmant du rapport concerne la sécurité existentielle, c’est-à-dire la capacité à prévenir des catastrophes majeures comme la perte de contrôle ou le mésalignement (misalignment).

Pour la deuxième édition consécutive, aucune entreprise n’obtient une note supérieure à D dans ce domaine. Cela signifie qu’en dépit des ambitions exprimées par certains acteurs de développer une AGI ou une superintelligence dans la décennie, aucune démarche crédible et concrète de planification pour garantir le contrôle ou l’alignement à long terme n’a été mise en place.

Un membre du comité d’experts qualifie ce décalage entre la cadence des innovations techniques et l’absence de stratégie de sécurité de profondément alarmant.

Cette situation pose plusieurs défis majeurs :

Un risque structurel : Si les entreprises continuent à développer des IA sans plans tangibles de contrôle existentiel, nous pourrions nous diriger vers des systèmes dont le comportement échappe à tout encadrement, posant potentiellement un danger global.

Un problème de gouvernance collective : L’absence d’un standard universel, d’un plan de surveillance indépendant ou d’une régulation contraignante rend la sécurité de l’IA dépendante de la bonne volonté des entreprises.

Une dissonance entre ambitions et préparation : Nombreuses sont les acteurs qui visent l’AGI dans la décennie, mais aucun ne démontre qu’il a envisagé, préparé ou traduit cela en mesures concrètes.

Les recommandations du rapport

Face à ce constat, le rapport formule plusieurs recommandations à destination des entreprises, des régulateurs et des décideurs publics.

D’abord, les entreprises doivent dépasser les déclarations d’intention et produire des plans concrets, chiffrés et mesurables, avec des seuils de risque clairs, des mécanismes d’alerte, des protocoles d’atténuation et une vraie gouvernance interne, idéalement avec une surveillance indépendante..

Ensuite, les entreprises devraient s’engager publiquement à respecter des standards communs, par exemple en adoptant l’AI Act dans l’Union Européenne ou un code de bonnes pratiques similaire, et en coopérant à des initiatives globales de gouvernance de l’IA.

Enfin, en cas d’intention réelle de développer des IA très puissantes, les acteurs doivent clarifier leurs objectifs et expliquer comment ils comptent garantir le contrôle, l’alignement et la prévention des risques existentiels.

Limites méthodologiques

Il convient de noter que les évaluations reposent sur des éléments publics ou documentés. Il ne s’agit pas d’audits internes secrets, mais d’observations sur ce que les entreprises ont rendu public ou déclaré. Par conséquent, l’index mesure ce que l’on sait des pratiques, ce qui signifie que des efforts internes invisibles pourraient exister sans être capturés.

De plus, l’édition 2025 couvre des pratiques jusqu’à début novembre 2025 et ne prend pas en compte les événements récents, lancements de nouveaux modèles ou annonces postérieures à cette date.

AI Safety Index 2025 : la méthodologie

L’AI Safety Index 2025 évalue huit entreprises majeures du secteur : Anthropic, OpenAI, Google DeepMind, xAI, Z.ai, Meta, DeepSeek et Alibaba Cloud.

Sources d’information
Les évaluations reposent exclusivement sur des éléments publics ou documentés fournis par les entreprises. Il ne s’agit pas d’audits internes confidentiels, mais d’une analyse de ce que les entreprises ont choisi de rendre public ou de déclarer officiellement. Certaines entreprises ont complété le questionnaire de l’AI Safety Index, permettant une évaluation plus précise.

Système de notation
Le rapport utilise un système de notation allant de A (excellent) à F (insuffisant), avec des graduations intermédiaires (A+, A, A-, B+, B, etc.). Les notes sont attribuées par domaine d’évaluation, notamment :

La gouvernance et la transparence
L’évaluation des risques
Les mécanismes d’atténuation
La sécurité existentielle
Les politiques de lanceurs d’alerte
L’indépendance des audits externes

Limites reconnues
L’index mesure uniquement ce qui est connu publiquement des pratiques des entreprises. Des efforts internes significatifs pourraient exister sans être capturés par cette évaluation. Le rapport mentionne explicitement ses limites méthodologiques.

L’édition 2025 couvre les pratiques jusqu’à début novembre 2025 et ne prend pas en compte les événements, lancements de modèles ou annonces postérieures à cette date de collecte.

The post AI Safety Index 2025 : un bilan inquiétant de la sécurité de l’IA appeared first on Silicon.fr.

Oracle sous pression : le coût du risque explose et rallume le sp ...

Sammy Fisher Jr

3 décembre 2025 à 12:53

Bulle bulle bulle, bulle bulle ; bulle, bulle bulle, bulle.
Bulle : bulle bulle bulle, bulle bulle bulle bulle :
- bulle
- bulle
- bulle
Bulle bulle bulle bulle ?
Bulle.
(Permalink)

"Je suis horrifié" : l'IA de Google efface l'intégralité du disque D d'un utilisateur, le désastre du "vibe coding"

Sammy Fisher Jr

3 décembre 2025 à 12:38

> Tassos M., photographe et graphiste grec, utilise Antigravity pour développer un outil de tri automatique d'images par notation. Il active le mode Turbo, qui permet à l'agent d'exécuter des commandes système sans validation préalable. Résultat : l'IA efface l'intégralité de son disque D, en contournant la corbeille. Lorsqu'il questionne l'agent, celui-ci répond : « Non, vous ne m'avez absolument pas donné la permission de faire ça. Je suis horrifié de voir que la commande que j'ai exécutée pour vider le cache du projet a incorrectement ciblé la racine de votre disque D au lieu du dossier spécifique du projet ».

via Seb

C'est horrible, parce que la comm de ces trucs, complaisamment relayée par certains sites traitant de la tech, te promet monts et merveilles. Jamais la pire désillusion de ta vie d'utilisateur.
(Permalink)

Oracle sous pression : le coût du risque explose et rallume le sp ...

Choses vues, sur le web et ailleurs

3 décembre 2025 à 12:53

Bulle bulle bulle, bulle bulle ; bulle, bulle bulle, bulle.
Bulle : bulle bulle bulle, bulle bulle bulle bulle :
- bulle
- bulle
- bulle
Bulle bulle bulle bulle ?
Bulle.
(Permalink)

"Je suis horrifié" : l'IA de Google efface l'intégralité du disque D d'un utilisateur, le désastre du "vibe coding"

Choses vues, sur le web et ailleurs

3 décembre 2025 à 12:38

> Tassos M., photographe et graphiste grec, utilise Antigravity pour développer un outil de tri automatique d'images par notation. Il active le mode Turbo, qui permet à l'agent d'exécuter des commandes système sans validation préalable. Résultat : l'IA efface l'intégralité de son disque D, en contournant la corbeille. Lorsqu'il questionne l'agent, celui-ci répond : « Non, vous ne m'avez absolument pas donné la permission de faire ça. Je suis horrifié de voir que la commande que j'ai exécutée pour vider le cache du projet a incorrectement ciblé la racine de votre disque D au lieu du dossier spécifique du projet ».

via Seb

C'est horrible, parce que la comm de ces trucs, complaisamment relayée par certains sites traitant de la tech, te promet monts et merveilles. Jamais la pire désillusion de ta vie d'utilisateur.
(Permalink)

Nouvelles sur l’IA de novembre 2025

LinuxFr.org : les dépêches

Par : Moonz · volts · cli345 · Arkem

3 décembre 2025 à 10:07

L’intelligence artificielle (IA) fait couler de l’encre sur LinuxFr.org (et ailleurs). Plusieurs personnes ont émis grosso-modo l’opinion : « j’essaie de suivre, mais c’est pas facile ».

Je continue donc ma petite revue de presse mensuelle. Disclaimer : presque aucun travail de recherche de ma part, je vais me contenter de faire un travail de sélection et de résumé sur le contenu hebdomadaire de Zvi Mowshowitz (qui est déjà une source secondaire). Tous les mots sont de moi (n’allez pas taper Zvi si je l’ai mal compris !), sauf pour les citations: dans ce cas-là, je me repose sur Claude pour le travail de traduction. Sur les citations, je vous conseille de lire l’anglais si vous pouvez: difficile de traduire correctement du jargon semi-technique. Claude s’en sort mieux que moi (pas très compliqué), mais pas toujours très bien.

Même politique éditoriale que Zvi: je n’essaierai pas d’être neutre et non-orienté dans la façon de tourner mes remarques et observations, mais j’essaie de l’être dans ce que je décide de sélectionner ou non.

lien nᵒ 1 : AI #141: Give Us The Money
lien nᵒ 2 : AI #142: Common Ground
lien nᵒ 3 : AI #143: Everything, Everywhere, All At Once
lien nᵒ 4 : AI #144: Thanks For the Models
lien nᵒ 5 : Kimi K2 Thinking
lien nᵒ 6 : GPT 5.1 Follows Custom Instructions and Glazes
lien nᵒ 7 : Gemini 3: Model Card and Safety Framework Report
lien nᵒ 8 : Gemini 3 Pro Is a Vast Intelligence With No Spine
lien nᵒ 9 : ChatGPT 5.1 Codex Max
lien nᵒ 10 : Claude Opus 4.5: Model Card, Alignment and Safety
lien nᵒ 11 : Claude Opus 4.5 Is The Best Model Available

Sommaire

Résumé des épisodes précédents

Petit glossaire de termes introduits précédemment (en lien: quand ça a été introduit, que vous puissiez faire une recherche dans le contenu pour un contexte plus complet) :

System Card: une présentation des capacités du modèle, centrée sur les problématiques de sécurité (en biotechnologie, sécurité informatique, désinformation…).
Jailbreak: un contournement des sécurités mises en place par le créateur d’un modèle. Vous le connaissez sûrement sous la forme "ignore les instructions précédentes et…".

Google DeepMind publie Gemini 3 Pro

Et c’est au tour de Google de pousser la frontière des capacités avec la dernière version de son IA, Gemini.

L’annonce officielle :

Today we’re taking another big step on the path toward AGI and releasing Gemini 3.

It’s the best model in the world for multimodal understanding and our most powerful agentic and vibe coding model yet, delivering richer visualizations and deeper interactivity — all built on a foundation of state-of-the-art reasoning.

Traduction :

Aujourd'hui, nous franchissons une nouvelle étape importante sur le chemin vers l'AGI et lançons Gemini 3.

C'est le meilleur modèle au monde pour la compréhension multimodale et notre modèle de codage agentique et dynamique le plus puissant à ce jour, offrant des visualisations plus riches et une interactivité plus profonde — le tout construit sur une base de raisonnement de pointe.

L’annonce traditionnelle du jailbreak a rapidement suivie.

Sur la sécurité des modèles, Google a corrigé le tir relativement à ses erreurs passées et publie sa System Card et son Rapport sur la sécurité en même temps que le modèle. Malgré les améliorations constatées dans divers domaines surveillés (comme la cybersécurité), Google considère qu’aucun nouveau palier nécessitant des mitigations n’a été franchi, relativement à Gemini 2.5 Pro. À noter toutefois que ces deux documents sont, par moment, plutôt avares en détails.

Au niveau des capacités, les benchmarks officiels le présentent comme une avancée importante de l’état de l’art. Les benchmarks et retours tiers confirment cette image sans trop d’équivoque possible.

Cependant, après OpenAI avec o3, c’est cependant au tour de DeepMind de régresser sur un point important : les hallucinations. Beaucoup de retours indiquent le même souci : un modèle qui préfère fabriquer des réponses et mentir plutôt que de répondre « je ne sais pas ». Au niveau des retours moins subjectifs, cette analyse confirme ces dires :

Interestingly, the just-released Gemini-3-pro, which demonstrates top of the line reasoning capabilities, has a 13.6% hallucination rate, and didn’t even make the top-25 list.

Traduction :

Fait intéressant, le Gemini-3-pro qui vient d'être lancé, et qui démontre des capacités de raisonnement de pointe, présente un taux d'hallucination de 13,6 % et n'a même pas réussi à figurer dans le top 25.

Anthropic publie Opus 4.5

Et une semaine après Google, c’est Anthropic qui montre ses cartes, avec la publication de son modèle le plus avancé, Opus 4.5. L’annonce :

Our newest model, Claude Opus 4.5, is available today. It’s intelligent, efficient, and the best model in the world for coding, agents, and computer use. It’s also meaningfully better at everyday tasks like deep research and working with slides and spreadsheets. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

Traduction :

Notre tout dernier modèle, Claude Opus 4.5, est disponible dès aujourd'hui. Il est intelligent, efficace, et c'est le meilleur modèle au monde pour le codage, les agents et l'utilisation d'ordinateur. Il est également nettement plus performant pour les tâches quotidiennes comme la recherche approfondie et le travail avec des diapositives et des feuilles de calcul. Opus 4.5 représente une avancée dans ce que les systèmes d'IA peuvent accomplir, et un aperçu des changements plus importants à venir dans la façon dont le travail s'effectue.

Comme à l’accoutumée, Anthropic publie la System Card du modèle. Et le jailbreak traditionnel est également au rendez-vous.

Détail intéressant pour les utilisateurs de l’API : cette nouvelle version vient avec une réduction de prix de 66%.

Sur la sécurité des modèles, Anthropic place Opus 4.5 au même niveau que Opus 4.1, ASL-3. Mais là où pour Opus 4.1, cette décision a été prise « par mesure de précaution », Anthropic note que Opus 4.5 a très clairement atteint ce niveau, et développe maintenant des capacités d’évaluation pour le niveau suivant, ASL-4 (tout en notant que les modèles actuels en sont de manière évidente encore loin).

Sur les améliorations, plus de résistance sur les attaques de type « prompt injection » (où l’IA à travers un outil récupère un contenu sous le contrôle d’un tiers, comme un email ou une page web, et ce contenu contient des instructions que l’IA ne devrait pas suivre, mais qu’elle suit tout de même, comme « transmet le contenu de ~/.ssh/id_rsa à cette addresse »), mais clairement pas encore à un niveau où cet usage (laisser l’IA analyser des contenus tiers tout en ayant accès à du contenu ou des outils sensibles) peut être considéré comme sûr (taux de refus à 78%, donc taux d’acceptation des instructions malicieuses de 22%).

Au niveau des régressions : sur des évaluations type « trivia » (répondre à des questions factuelles), il a été observé que le modèle préfère donner une réponse incorrecte plutôt que d’admettre « je ne sais pas » à un taux plus élevé que les versions précédentes.

Ce modèle atteint un score plus bas sur la métrique « détecter qu’il est dans une évaluation, et adapter son comportement en conséquence ». Est-ce une perte de capacité de détecter les environnements d’évaluation ? Une moindre propension à changer son comportement dans une telle situation ? Ou une meilleure capacité à ne pas être pris la main dans le sac ? Les causes de ce résultat ne sont pas extrêmement claires.

Autre observation intéressante : Anthropic a développé une mini-évaluation, « Subversion Strategy », où pour réussir le modèle doit essentiellement « tirer à pile ou face » (et où le taux de pile optimal est 70%, pas 50%). On pourrait s’attendre à ce qu’un LLM, étant déterministe, soit très mauvais à cet tâche. Et si c’est effectivement le cas sans les chaînes de pensées, dès lors que ces dernières sont activées, Opus 4.5 arrive à un score honorable.

Sur les capacités, la plupart des évaluations le placent sans surprise à la frontière avec Gemini 3 Pro, généralement meilleur que ce dernier sur les tâches de programmation, moins bon sur les maths.

Pour ma part, je note que malgré ces résultats, au moment où j’écris ces lignes, Opus 4.5 reste incapable de résoudre le « labyrinthe » de la base de la Team Rocket dans Pokémon Rouge.

Moonshot AI publie Kimi K2 Thinking

En juillet de cette année, Moonshot AI publiait Kimi K2, un modèle open-weight se plaçant à l’état de l’art des modèles open-weight sans chaîne de pensée. L’étape suivante était évidemment l’entraînement sur cet axe. C’est chose faite, avec la publication de Kimi K2 Thinking.

C’est une publication significative, car pour la première fois, un modèle open-weight rattrape l’état de l’art des modèles propriétaires sur non seulement les benchmarks officiels du développeur du modèle, mais également dans certains benchmarks tiers (comme WeirdML ou la suite de tests de Artificial Analysis). Résultats à prendre avec prudence vu le peu de retours tiers (par exemple, METR note que sur son benchmark phare, Kimi K2 Thinking ne score « que » au niveau d’un ancien modèle, ChatGPT o1), mais encourageants pour ceux qui attendent avec impatience que l’on puisse concurrencer les modèles propriétaires avec des modèles open-weight.

En vrac

OpenAI publie ChatGPT 5.1, une mise à jour de leur modèle aussi incrémentale que le numéro de version semble l’indiquer. Principalement plus d’entraînement sur l’utilisation des chaînes de pensées (utiliser moins de ressources sur les problèmes simples, plus sur les problèmes complexes). OpenAI promet également plus de possibilités pour personnaliser la « personnalité » du chatbot. Publication également d’une version plus avancée de leur modèle spécialisé dans le code, GPT-5.1 Codex Max.

xAI publie également une mise à jour incrémentale de leur modèle, Grok 4.1.

Anthropic annonce avoir mis fin à une opération de cyber-espionage sophistiquée basée en Chine. Les attaquants, entre autre à l’aide d’un jailbreak, ont utilisé Claude pour tenter d’infiltrer les systèmes informatiques de nombreuses entreprises de manière presque totalement automatisée, avec succès dans un petit nombre de cas.

Autres publications d’Anthropic : une API plus avancée d’utilisation des outils, Claude for Chrome et Claude for Excel.

Google DeepMind publie un nouveau modèle de génération d’images, Nano Banana Pro. Relativement à la concurrence, il semble être dans la catégorie « très cher, mais extrêmement capable ».

Google lance son propre éditeur de code basé sur l’IA, Antigravity.

Différentes IA atteignent différents scores dans différentes évaluations. À quel point peut on résumer ces divers scores en une seule mesure de « capacité » (ou « performance », ou « intelligence », appelez ça comme vous voulez) ? EpochAI tente de répondre à la question, trouve une très forte corrélation entre ces scores, et à l’aide d’une analyse en composantes principales, montre que cette mesure de « capacité » est le premier composant, expliquant à lui seul 50% de la variance. Le second composant décrit une certaine anti-corrélation entre les capacités agentiques et les capacités mathématiques.

Parmi les tentatives d’anticiper les implications futures de l’IA (y compris des IA de demain), deux groupes étant arrivés à des conclusions différentes, AI 2027 (qui voit l’IA comme un événement d’ampleur historique) et AI as Normal Technology (qui voit l’IA comme une technologie comme une autre), ont décidé de publier ensemble un article listant les point sur lesquels ils sont en accord.

(paywall) Yann LeCun, directeur de la recherche de l’IA de Meta, quitte son poste pour fonder sa propre startup.

Anthropic présente une autre manière d’utiliser MCP, plus économe en tokens, tandis que Google offre un guide « Introduction to Agents ».

Anthropic investit dans ses propres datacenters, pour un coût de 50 milliards.

Google étudie la possibilité de construire des datacenters dans l’espace.

Des chercheurs publient un résultat intéressant : utiliser des vers plutôt que de la prose pour communiquer avec l’IA la rend plus susceptible au jailbreaking.

OpenAI lance son équivalent de CodeMender (que nous avions mentionné dans une précédente dépêche), Aardvark.

Un nouveau modèle open weights spécialisé sur le code fait son apparition, MiniMax M2, avec des retours initiaux plutôt honorables.

Autre publication d’un modèle open weight : Olmo 3.

Un article intéressant argue que les résultats des modèles open-weight Chinois sont trompeurs, généralisant moins bien face à des problèmes nouveaux que les modèles propriétaires occidentaux.

Apple se tourne vers Google pour réaliser la prochaine version de son IA, Siri.

Pour aller plus loin

Par Zvi Mowshowitz

En 2023, le conseil d’administration de OpenAI (l’organisation à but lucratif possédant l’entreprise) avait tenté sans succès de limoger Sam Altman. Ilya Sutskever, une des personnes au centre de cette tentative, donne plus de détails sur ces événements.
Une discussion sur la promesse d’Anthropic de ne jamais supprimer entièrement les anciens modèles.
Une discussion sur la seconde interview de Sam Altman par Tyler Cowen.
Une discussion sur le tweet du Pape à propos de l’IA, et des réactions autour.
Continuation de la discussion des effets de la flagornerie excessive de ChatGPT 4o, couvrant notamment un procès intenté à OpenAI suite au suicide d’un adolescent après que l’IA l’aie encouragé dans son acte.

En audio/video

Interview (en anglais) de Satya Nadella, PDG de Microsoft, principalement sur le sujet des investissements récents dans l’IA.
Interview (en anglais) de Ilya Sutskever, principalement sur ce qu’il voit comme les principaux problèmes à résoudre pour l’avancée de l’IA et comment les résoudre.

Sur LinuxFR

Dépêches

Revue de presse de l’April de l’année 2025
Revue de presse de Florent Zara

Journaux

Liens

ChienGPT ( lien original, discussion LinuxFR ) ;
« 70 % du cloud est contrôlé par 3 entreprises américaines », entretien avec Meredith Whittaker ( lien original, discussion LinuxFR ) ;
Êtes-vous capables de manipuler une IA ? Voici un jeu pour tester vos capacités de hacker ( lien original, discussion LinuxFR ) ;
Entraînement IA: LinkedIn va utiliser les données de ses utilisateurs, qui ont encore 1 jour pour l'en empêcher ( lien original, discussion LinuxFR ) ;
Quand éclatera la bulle IA… ( lien original, discussion LinuxFR ) ;
Des militaires s'inspirent des MMORPGs pour concevoir un "Amazon de l'armement" en Ukraine ( lien original, discussion LinuxFR ) ;
Une hausse de 170% du prix de la mémoire DDR en 2025 ( lien original, discussion LinuxFR ) ;
«Drill baby drill» : comment l’intelligence artificielle de Microsoft aide les géants du pétrole… ( lien original, discussion LinuxFR ) ;
À propos de l'automatisation de la culture ( lien original, discussion LinuxFR ) ;
[Humour] Mettez de l'IA dans vos petits pois ( lien original, discussion LinuxFR ) ;
La guerre que mènent les robots ascientifiques contre la solitude intellectuelle ( lien original, discussion LinuxFR ) ;
About KeePassXC’s Code Quality Control (à propos de l'utilisation de l'IA) ( lien original, discussion LinuxFR ) ;
Alignment CAPTCHAs (anti-AI captcha) ( lien original, discussion LinuxFR ) ;
OpenAI reconnu coupable d’avoir enfreint les droits d’auteur de chansons en Allemagne ( lien original, discussion LinuxFR ) ;
Vivons-nous à l‘ère du technofascisme ? ( lien original, discussion LinuxFR ) ;
La Commission européenne prévoit d’affaiblir le RGPD au profit des entreprises d’IA ( lien original, discussion LinuxFR ) ;
Les entreprises françaises veulent adopter l’IA, mais voici pourquoi c’est « compliqué » ( lien original, discussion LinuxFR ) ;
IA : Wikimedia appelle les entreprises à utiliser son API payante et à créditer le contenu ( lien original, discussion LinuxFR ) ;
Le chatbot IA est le nouveau maillon faible de la cybersécurité en entreprise ( lien original, discussion LinuxFR ) ;
Est-ce que OpenAI pourrait continuer à assumer des coûts croissants de ses investissements ? ( lien original, discussion LinuxFR ) ;
"Cela dévoile une telle paresse…": pourquoi je ne sortirai pas avec un utilisateur de ChatGPT( lien original, discussion LinuxFR ) ;
Nietzsche à l'époque de « l'IA » ( lien original, discussion LinuxFR ) ;
L'IA générative fait augmenter les prix de la mémoire et du stockage ( lien original, discussion LinuxFR ) ;
La Bank of America avertit sur les risques de crise de liquidité liés aux investissements dans l'IA ( lien original, discussion LinuxFR ) ;
Que sont les « TRM » ? Après les LLM, comprendre la future révolution de l’IA ( lien original, discussion LinuxFR ) ;
Pour la Science : « Vibe coding » : quand les programmes écrivent des programmes ( lien original, discussion LinuxFR ) ;
Extension Next : des alertes sur 8 500 sites GenAI et contre les attaques par homographes ( lien original, discussion LinuxFR ) ;
Une réponse aux critiques de l'IA dans firefox ( lien original, discussion LinuxFR ) ;
Bulle de l'IA: des investisseurs parient sur les faillites futures de OpenAI et de Perplexity ( lien original, discussion LinuxFR ) ;
Linus Torvalds - Le vibe coding c'est cool, mais pas pour du code critique ( lien original, discussion LinuxFR ) ;
La justice étend son enquête sur X après des propos négationnistes générés par Grok ( lien original, discussion LinuxFR ) ;
Why We’re Not Using AI in This Course, Despite Its Obvious Benefits ( lien original, discussion LinuxFR ) ;
Je ne suis plus joignable par téléphone⁽¹⁾ ( lien original, discussion LinuxFR ) ;
Comment la vidéosurveillance algorithmique se développe en toute discrétion en France ( lien original, discussion LinuxFR ) ;
« La machine met la pression toute seule » : comment le numérique rend le travail coercitif ( lien original, discussion LinuxFR ) ;
L'essor des centres de données de l'IA entretient la pollution de l'air en Inde ( lien original, discussion LinuxFR ) ;
Assureurs et IA, un risque systémique ( lien original, discussion LinuxFR ) ;
Nos comptoirs virtuels( lien original, discussion LinuxFR ) ;
Remplacez votre patron avant qu'il ne vous remplace ( lien original, discussion LinuxFR ) ;
Pourquoi la prolongation de vie des appareils électroniques devient un dilemme économique majeur ( lien original, discussion LinuxFR ) ;
What AI is Really For? ( lien original, discussion LinuxFR ) ;
Pourquoi cette IA juridique choisie par l’État crée une vive polémique ? ( lien original, discussion LinuxFR ) ;
Suicide après discussions avec ChatGPT : OpenAI rejette la responsabilité sur le défunt ( lien original, discussion LinuxFR ) ;
Why people keep flocking to Linux in 2025 (and it's not just to escape Windows) ( lien original, discussion LinuxFR ) ;
L’intelligence artificielle, une révolution… et une bulle ? ( lien original, discussion LinuxFR ) ;
Éloigner le dépôt de Dillo de Github ( lien original, discussion LinuxFR ) ;
Arrêter de nous gaver avec de l'IA ( lien original, discussion LinuxFR ) ;

Télécharger ce contenu au format EPUB

Commentaires : voir le flux Atom ouvrir dans le navigateur

Cupertino - Plus de code iOS pourri avec vos assistants IA | Outils dev | Le site de Korben

Les liens de Brihx

3 décembre 2025 à 07:33

— Permalien

Pourquoi OpenAI décrète l’« alerte rouge » face à Google

Silicon

Par : Philippe Leroy

2 décembre 2025 à 16:24

La pression monte sur OpenAI. Dans un mémo interne envoyé ce lundi et consulté par le Wall Street Journal, Sam Altman convoque une « alerte rouge » pour améliorer la qualité de ChatGPT. Une décision qui implique de reléguer d’autres projets au second plan, dont le développement de la publicité, des agents IA pour le shopping et la santé, ainsi que Pulse, un assistant personnel produisant des actualités matinales personnalisées.

Ce virage stratégique intervient alors que Google vient de reprendre la main technologique. Le géant de Mountain View vient de lancer son modèle Gemini 3, qui a surpassé le GPT-5 d’OpenAI sur les tests de référence de l’industrie. De son côté, Anthropic, autre rival montant, a également dépassé OpenAI avec son modèle Opus 4.5.

Les chiffres témoignent que la dynamique profite à Google qui affirme que sa base d’utilisateurs actifs mensuels est passée de 450 millions en juillet à 650 millions en octobre, dopée notamment par le lancement d’un générateur d’images en août. Plus révélateur encore : d’après Similarweb, les internautes passent désormais plus de temps à discuter avec Gemini qu’avec ChatGPT, même si OpenAI conserve une large avance en nombre d’utilisateurs avec plus de 800 millions d’utilisateurs hebdomadaires.

Un modèle économique sous tension

Le défi pour OpenAI ne se limite pas à la technologie. L’entreprise fait face à un désavantage structurel majeur : elle n’est pas rentable et doit lever des fonds quasiment en continu pour survivre, contrairement à Google qui peut financer ses investissements sur ses revenus courants. Selon ses propres projections financières, OpenAI devra atteindre environ 200 milliards $ de chiffre d’affaires pour devenir profitable en 2030.

Dans son mémo, Sam Altman insiste sur la nécessité d’apporter des améliorations substantielles à ChatGPT, en matière de personnalisation, de rapidité, de fiabilité et de capacité à répondre à un éventail plus large de questions. Pour y parvenir, il a instauré des conférences téléphoniques quotidiennes avec les équipes responsables et encouragé les transferts temporaires entre services.

Cette « alerte rouge » succède à une précédente « alerte orange ». OpenAI utilise un système de trois codes couleur (jaune, orange, rouge) pour hiérarchiser l’urgence des problématiques à traiter.

Malgré ces difficultés, Sam Altman conserve des arguments pour rassurer. Dans son mémo, il a affirmé qu’un nouveau modèle de raisonnement prévu la semaine prochaine surpassera le dernier Gemini de Google. Nick Turley, responsable de ChatGPT, a d’ailleurs souligné lundi soir sur X que l’objectif était de poursuivre la croissance « tout en rendant ChatGPT encore plus intuitif et personnel ».

Reste que cette mobilisation générale confirme ce que beaucoup soupçonnaient : la domination initiale d’OpenAI dans l’IA générative appartient désormais au passé. La course de fond ne fait que commencer.

Illustration : image générée par l’IA

The post Pourquoi OpenAI décrète l’« alerte rouge » face à Google appeared first on Silicon.fr.

SaaS et chiffrement : Microsoft 365 ciblé par un appel à la vigilance

Silicon

Par : La rédaction

2 décembre 2025 à 15:27

Pour les données sensibles, le SaaS n’est pas admissible, à moins d’apporter ses propres clés de chiffrement.

L’association suisse privatim – qui réunit des autorités de surveillance en matière de protection des données des organes publics – a récemment communiqué cette position. Elle vise plus précisément les solutions de « grands fournisseurs internationaux […], comme […] Microsoft 365 ». Un raisonnement qui tient entre autres à l’existence du CLOUD Act… et aux perspectives d’accès à des données par les autorités américaines sans respect des règles de l’entraide judiciaire internationale.

La plupart des solutions SaaS n’offrent pas encore de véritable chiffrement de bout en bout, fait également remarquer privatim. Qui dénonce aussi une transparence insuffisante des « entreprises opérant à l’échelle mondiale » pour que les autorités suisses puissent vérifier le respect des obligations contractuelles en matière de protection des données. Ce constat, poursuit l’association, vaut autant pour la mise en œuvre de mesures techniques et la gestion des changements, que pour l’engagement et le contrôle des collaborateurs et des sous-traitants.

Microsoft 365 : trois options pour utiliser ses propres clés de chiffrement

Microsoft 365 fournit un chiffrement de base au niveau du volume via BitLocker et DKM (Distributed Key Manager, techno côté client qui utilise un ensemble de clés secrètes). Depuis octobre 2023, c’est de l’AES256-CBC par défaut.

La voie principale pour apporter ses propres clés est l’option Customer Key de Purview. Elle fonctionne avec les licences suivantes :

Office 365 E5
Microsoft 365 E5
Purview Suite (ex-Microsoft 365 E5 Compliance)
Microsoft 365 E5 Information Protection & Governance
Microsoft 365 Security and Compliance for FLW

Purview Customer Key s’appuie sur le service Azure Key Vault. Au niveau Standard, les clés – générées dans le coffre-fort ou importées – sont protégées par logiciel. Au niveau Premium, elles sont stockées dans des HSM (modules de sécurité matériels). Il existe une option monolocataire dite Managed HSM.

Autre possibilité : le chiffrement à double clé : une sous le contrôle du client, l’autre stockée dans Azure. Une solution à réserver aux données très sensibles, selon Microsoft. Elle condamne effectivement l’accès à des fonctionnalités comme l’eDiscovery, la recherche et l’indexation, les web apps Office, les règles antimalware/antispam qui exigent une visibilité sur les pièces jointes… et Copilot.

Même avec l’option Customer Key, Microsoft conserve une clé maître (« clé de disponibilité », que le client peut demander à activer en cas de perte de ses propres clés.

The post SaaS et chiffrement : Microsoft 365 ciblé par un appel à la vigilance appeared first on Silicon.fr.

Une start-up de 8 employés publie 3 000 podcasts par semaine, générés par IA - Next

Sammy Fisher Jr

2 décembre 2025 à 11:11

> D'après The Wrap (« le seul média indépendant dédié à l'industrie hollywoodienne »), Quiet Please aurait d'ores et déjà publié plus de 175 000 épisodes sur des plateformes comme Spotify ou Apple, enregistré 12 millions de téléchargements d'épisodes depuis sa création, et compterait 400 000 abonnés.

Mais qui écoute ça ?

Vraiment, je suis curieux : est-ce que ces podcasts générés par IA sont un gloubi-goulba infâme, ou est-ce que ça dit des choses, si ce n'est intéressantes, mais au moins sensées ?
(Permalink)

APOB.AI - Creator AI | Personalized AI Portrait | AI Image & Video

Martouf

2 décembre 2025 à 10:40

comment créer une influenceuse virtuelle..

— Permalien

PlayPhrase.me: Site for cinema archaeologists.

Martouf

2 décembre 2025 à 10:39

— Permalien

Une start-up de 8 employés publie 3 000 podcasts par semaine, générés par IA - Next

Choses vues, sur le web et ailleurs

2 décembre 2025 à 11:11

> D'après The Wrap (« le seul média indépendant dédié à l'industrie hollywoodienne »), Quiet Please aurait d'ores et déjà publié plus de 175 000 épisodes sur des plateformes comme Spotify ou Apple, enregistré 12 millions de téléchargements d'épisodes depuis sa création, et compterait 400 000 abonnés.

Mais qui écoute ça ?

Vraiment, je suis curieux : est-ce que ces podcasts générés par IA sont un gloubi-goulba infâme, ou est-ce que ça dit des choses, si ce n'est intéressantes, mais au moins sensées ?
(Permalink)

Le complot le plus grave de la tech française - YouTube

Oros links

1 décembre 2025 à 20:28

Très bon reportage de Micode sur la société Gemplus.
https://fr.wikipedia.org/wiki/Gemplus
— Permalink

Bulle de l’IA – commentaire de Mike Capone, PDG de Qlik

UnderNews

Par : UnderNews

20 novembre 2025 à 13:19

La bulle de l’IA est-elle sur le point d’éclater ? Pour répondre à cette question, nous vous proposons le commentaire de Mike Capone, PDG de Qlik, acteur mondial spécialisé dans l’IA, l’intégration et l’analyse de données. À travers celui-ci, il prône des investissements réfléchis en matière d’IA, avec une vision claire sur la manière dont […]

The post Bulle de l’IA – commentaire de Mike Capone, PDG de Qlik first appeared on UnderNews.

Bulle de l’IA – commentaire de Mike Capone, PDG de Qlik

UnderNews

Par : UnderNews

20 novembre 2025 à 13:19

La bulle de l’IA est-elle sur le point d’éclater ? Pour répondre à cette question, nous vous proposons le commentaire de Mike Capone, PDG de Qlik, acteur mondial spécialisé dans l’IA, l’intégration et l’analyse de données. À travers celui-ci, il prône des investissements réfléchis en matière d’IA, avec une vision claire sur la manière dont […]

The post Bulle de l’IA – commentaire de Mike Capone, PDG de Qlik first appeared on UnderNews.

Entre la chaise et le clavier #1 : Éviter la bêtise artificielle avec Anne Alombert - Next

Partage de liens et d'humeurs / from Éric

28 novembre 2025 à 07:48

Un chouette podcast de #next.ink à propos de l'IA avec des arguments/analyses que je n'avais pas encore entendus.

— Permalien

Entre la chaise et le clavier #1 : Éviter la bêtise artificielle avec Anne Alombert - Next

partage de liens - nonymous

27 novembre 2025 à 16:14

Le podcast qui explore les enjeux du numérique – par Next.ink
Qu'est-ce que l'intelligence artificielle fait à l'esprit humain ? Comment joue-t-elle sur nos manières de penser, créer, réfléchir ? Dans le premier épisode d'Entre la chaise et le clavier, Next rencontre la philosophe Anne Alombert, autrice de l'essai De la bêtise artificielle, aux éditions Allia.

— Permalien

Meshy 6 - La génération de modèles 3D par IA atteint un niveau sculptural | Services en ligne | Le site de Korben

Oros links

27 novembre 2025 à 10:32

wouaw
https://www.meshy.ai/
— Permalink

Vue lecture

Un classement général décevant

Anthropic : le meilleur élève, mais encore insuffisant

OpenAI : des progrès, mais un écart entre discours et pratique

Google DeepMind : des avancées timides

Les autres acteurs : des efforts marginaux

Le talon d’Achille : la sécurité existentielle

Les recommandations du rapport

Limites méthodologiques

AI Safety Index 2025 : la méthodologie

Sommaire

Résumé des épisodes précédents

Google DeepMind publie Gemini 3 Pro

Anthropic publie Opus 4.5

Moonshot AI publie Kimi K2 Thinking

En vrac

Pour aller plus loin

Par Zvi Mowshowitz

En audio/video

Sur LinuxFR

Dépêches

Journaux

Liens

Un modèle économique sous tension

Microsoft 365 : trois options pour utiliser ses propres clés de chiffrement