Vue normale

Reçu aujourd’hui — 28 janvier 2026

La NASA va envoyer des « avatars biologiques » d’astronautes autour de la Lune avec Artemis II

28 janvier 2026 à 08:02
Astronaute (2)

Lors de la mission Artemis II, les quatre astronautes du programme ne seront pas seuls à bord de la capsule Orion : ils seront accompagnés de leurs propres « avatars biologiques ». Une expérience frôlant de près la science-fiction conçue pour assurer l'avenir de la conquête spatiale.

Reçu hier — 27 janvier 2026

GPT-2 comprend les protéines sans jamais les avoir apprises

Par :Korben
27 janvier 2026 à 09:48

Des chercheurs viennent de trouver un truc complètement dingue. Un modèle de langage entraîné UNIQUEMENT sur de l'anglais, du texte humain basique quoi, est capable de comprendre la biologie moléculaire sans jamais avoir vu une seule séquence de protéines durant son entraînement.

En gros, GPT-2 qui fait de la paraphrase d'ordinaire est, sans le savoir, un expert en détection d' homologie protéique . Je vous jure que c'est vrai !!

Liang Wang, chercheur à l'Université de Wuhan (les pangolins, tout ça tout ça, loool), a publié une étude sur bioRxiv qui remet en question pas mal de certitudes. L'idée, c'est que la "grammaire" du langage humain et celle du vivant partagent une structure profonde commune. Du coup, un modèle qui apprend à distinguer des phrases qui ont le même sens mais avec des mots dans un ordre différent... développe aussi la capacité de reconnaitre les protéines qui sont de la même "famille".

Perso, ça me retourne le cerveau parce qu'à la base, on parle "juste" d'un petit GPT-2 de 124 millions de paramètres, entraîné sur le dataset PAWS (des paires de phrases anglaises adverses), qui atteint 84% de précision sur la détection d'homologie protéique. Sans jamais avoir vu d'acides aminés ! C'est comme si votre chat, après avoir appris le français, se mettait soudainement à comprendre le chinois.

Et ça devient encore plus fou quand on scale. Les gros modèles comme Qwen-3 atteignent quasiment 100% de précision sur les benchmarks standards, mais le plus impressionnant, c'est leur performance dans la "zone crépusculaire" de l'évolution, là où les séquences protéiques ont moins de 25% d'identité entre elles. Dans ce régime où même les outils spécialisés comme ESM-2 peinent à maintenir leurs performances, les LLM généralistes maintiennent 75% de précision.

Ils raisonnent là où les autres mémorisent !

D'ailleurs, si vous aimez l'actu IA et biologie, vous avez peut-être déjà lu mes articles sur Evo 2 ou SimpleFold d'Apple . Ces outils-là sont entraînés sur des montagnes de données biologiques alors que dans le cas que je vous expose ici, c'est l'inverse. C'est un LLM tout ce qu'il y a de plus classique qui n'a pas BESOIN de ces données spécifiques pour comprendre la structure du vivant (enfin, ça doit encore être bien validé par d'autres équipes mais on verra bien).

Alors vous vous en doutez, curieux, les chercheurs ont analysé ce qui se passe dans la tête du modèle. Certaines " têtes d'attention " du transformer deviennent des détecteurs universels de différences. La même tête qui repère une inversion sujet-objet dans une phrase anglaise va spontanément repérer les mutations d'acides aminés dans une protéine. Et voilà comment la syntaxe du langage humain et la syntaxe de la vie se retrouvent projetées sur le même "manifold" c'est à dire dans la même "surface" géométrique dans l'espace latent du modèle.

Et quand on demande aux gros modèles d'expliquer leur raisonnement via Chain-of-Thought (enchainement de pensées comme ce que propose ChatGPT 5.2 en mode thinking par exemple), ils font du "mental folding". C'est à dire qu'ils imaginent la structure 3D des protéines à partir de la séquence 1D. Le modèle identifie explicitement des motifs structurels comme " Hélice-Coude-Hélice " versus " Tonneau TIM " pour déterminer si deux protéines sont apparentées. Et tout ça sans jamais avoir reçu de coordonnées 3D en entrée.

Pour formaliser tout ça, l'équipe a donc créé BioPAWS, un benchmark qui évalue la capacité des modèles à transférer leur compréhension syntaxique du langage vers l'ADN, l'ARN et les protéines. Le dataset est dispo sur Hugging Face pour ceux qui veulent jouer avec.

Bref, si la grammaire humaine et la grammaire biologique sont vraiment des manifestations d'une même structure universelle, ça change pas mal de choses sur comment on pourrait faire de la découverte scientifique à moindre coût. Plus besoin de datasets monstrueux pour chaque domaine, les patterns abstraits sont peut-être déjà là, encodés dans le langage qu'on utilise tous les jours.

Source

Reçu — 23 janvier 2026

Ricine : l’un des poisons les plus mortels du monde a désormais son antidote, développé par un laboratoire français

23 janvier 2026 à 17:02
Antidote

C’est une première mondiale qui nous vient tout droit de Lyon : le laboratoire Fabentech a reçu l’autorisation de mise sur le marché pour le Ricimed, le premier antidote capable de neutraliser la ricine.

Avant les arbres, la Terre abritait une forme de vie géante qui semble venue d’un autre monde

Bien avant que les arbres ne façonnent les paysages terrestres, d’étranges structures dominaient déjà la surface de la planète. Découverts au XIXᵉ siècle, leurs fossiles intriguent toujours les scientifiques. Et si ces colosses préhistoriques ne ressemblaient à rien de ce que la biologie connaît...

Reçu — 22 janvier 2026

Ces régions où l’on vit beaucoup plus longtemps existent bien : voici lesquelles sont vraiment des « zones bleues »

Et si vivre jusqu’à 100 ans en pleine forme n’était pas un hasard, mais le fruit d’un mode de vie précis ? Des îles grecques aux montagnes sardes, certaines régions du monde affichent une longévité hors normes qui fascine scientifiques et curieux depuis plus de vingt ans. Mythe enjolivé ou...

Votre peau qui s’illumine quand votre corps combat une infection ? Des chercheurs y sont parvenus

Pour beaucoup, la prise de sang reste un passage obligé redouté. Une recherche japonaise récente propose une autre manière d’envisager le suivi de certains déséquilibres biologiques, sans prélèvement ni capteur.

Reçu — 14 novembre 2025
❌