Même si notre Univers comporte une infinité de trous noirs, certains sortent du lot car ils se comportent comme si nos modèles théoriques n'existaient pas. C'est le cas de IGR J17091-3624, dont la luminosité augmente et diminue de façon régulière : un casse-tête astrophysique.
Nous autres, Homo sapiens, sommes les survivants d'un buisson foisonnant d'espèces oubliées. Australopithecus deyiremeda, découverte en 2015, était l'une d'entre elles et elle vivait à la même époque que la célèbre Lucy. Le trône de notre ancêtre unique vacille !
La startup américaine Figure AI vient de franchir une étape majeure dans l’histoire de la robotique humanoïde. Avec son nouveau modèle d’intelligence artificielle Helix 02, l’entreprise parvient à unifier locomotion, manipulation et équilibre au sein d’un même système neuronal, ouvrant ainsi la voie à des robots capables d’évoluer …
L’intelligence artificielle continue de transformer la recherche scientifique, et l’astronomie en offre une nouvelle démonstration spectaculaire. Deux chercheurs de l’Agence spatiale européenne (ESA) ont ainsi mis au point un outil basé sur un réseau neuronal capable d’explorer automatiquement des volumes massifs d’images spatiales. En moins de trois jours, …
Lors de la mission Artemis II, les quatre astronautes du programme ne seront pas seuls à bord de la capsule Orion : ils seront accompagnés de leurs propres « avatars biologiques ». Une expérience frôlant de près la science-fiction conçue pour assurer l'avenir de la conquête spatiale.
Les télescopes spatiaux, tels que le vénérable Hubble et le JWST, génèrent d’immenses quantités de données. Les scientifiques ont donc recours à l’IA pour faire le tri et déceler des…
Nvidia vient de présenter sa nouvelle intelligence artificielle capable d’établir des prévisions météorologiques. Baptisée Earth-2, celle-ci serait encore plus performante que son équivalent chez Google, GenCast. De nos jours, l’intelligence…
SpaceX se prépare à franchir une nouvelle étape dans son programme spatial avec le premier vol d’essai de Starship V3, désormais programmé pour la mi-mars. L’annonce a été faite par Elon Musk sur X, alors que l’entreprise accélère le développement de sa fusée la plus ambitieuse à ce …
Alors que plusieurs régions des États-Unis viennent d’être frappées par une tempête hivernale difficile à anticiper, Nvidia dévoile une nouvelle génération de modèles météorologiques basés sur l’intelligence artificielle. Regroupées sous la bannière Earth-2, ces solutions promettent des prévisions plus rapides, plus précises et accessibles à un plus grand …
La Russie reviendrait-elle dans la course technologique mondiale ? Rosatom, l’agence nucléaire russe, affirme en tout cas avoir mis au point un moteur spatial d’un nouveau genre, capable de propulser un vaisseau vers Mars en seulement un à deux mois. Une avancée technologique majeure qui, si elle se …
Après plusieurs années, nous avons la confirmation que notre Univers n’est pas une simulation. En effet, les résultats d’une étude du Dr Mir Faizal et d’autres chercheurs ont permis de conclure que notre réalité n’a pas pu être créée par un algorithme. Découverte !
Lors du Forum économique mondial de Davos, Elon Musk a une nouvelle fois créé la surprise en affirmant que Tesla commercialiserait son robot humanoïde Optimus dès l’an prochain. Une annonce ambitieuse, fidèle au style du patron de la firme américaine, alors même que peu d’éléments concrets permettent aujourd’hui …
Une équipe internationale d’astronomes vient de franchir une étape majeure dans l’étude de la matière noire en observant son comportement lors d’une collision spectaculaire entre deux amas de galaxies lointains. Cette observation rare apporte de nouveaux éléments pour comprendre cette composante invisible de l’Univers, qui façonne pourtant la …
Le télescope spatial James Webb vient de livrer l’une de ses images les plus spectaculaires à ce jour, soit un gros plan inédit de la nébuleuse de l’Hélice, surnommée l’Œil de Dieu pour sa forme particulière. Cette observation exceptionnelle offre un aperçu fascinant du destin qui attend notre …
Comme (trop) souvent, une femme aux contributions scientifiques importantes ne sera connue du grand public qu’à l’heure de sa mort : la mathématicienne américaine Gladys West est décédée à l’âge de 95 ans. Très peu connue donc, cette dernière a pourtant joué un rôle décisif dans le développement …
Les États-Unis enregistrent des avancées significatives dans la survie au cancer depuis cinquante ans, selon le rapport annuel de l’American Cancer Society. Pour la première fois, 70% des patients atteints de cancer survivent au moins cinq ans après leur diagnostic, contre seulement 49% au milieu des années 1970. Cette amélioration spectaculaire témoigne des progrès réalisés ... Lire plus
Des chercheurs britanniques proposent d’adopter une unité de mesure standardisée pour évaluer la puissance du cannabis, à l’image des verres d’alcool utilisés pour quantifier la consommation éthylique. Développée par l’Université de Bath, cette approche vise à aider les usagers à maîtriser leur consommation tout en identifiant les personnes présentant un risque accru de développer un ... Lire plus
Chaque jour, des millions de personnes saisissent leur gobelet de café à emporter sans imaginer qu’il pourrait libérer des milliers de fragments microscopiques dans leur boisson. Pourtant, une nouvelle étude révèle que les contenants en plastique ou dotés d’un revêtement plastique fin dispersent massivement des microplastiques lorsqu’ils entrent en contact avec des liquides chauds. Avec ... Lire plus
Vieillir sans voir sa mémoire décliner reste l’un des grands défis de la recherche en neurosciences. Pourtant, certaines personnes âgées déjouent les statistiques. Passé un certain âge, leurs capacités cognitives rivalisent avec celles d’adultes bien plus jeunes. Une vaste étude scientifique vient d’apporter un éclairage nouveau sur ce phénomène rare. Elle révèle que ces individus, ... Lire plus
Il y a des combats comme cela auxquels pas grand monde ne pense et qui pourtant sont très importants. Je parle évidemment de la lutte contre le chaos du texte non structuré. Si vous avez déjà essayé d'extraire des données propres d'un tas de PDF (après OCR), de rapports ou de notes griffonnées, vous voyez de quoi je parle : c'est l'enfer ! (oui j'aime me faire du mal en tentant des regex impossibles).
Heureusement, Google a lâché début janvier 2026 une petite pépite en open source (même si c'est pas un produit "officiel") qui s'appelle
LangExtract
. C'est une bibliothèque Python qui utilise la puissance des LLM pour transformer vos documents textuels en données JSON bien rangées.
Exemple d'extraction sur le texte de Roméo et Juliette (
Source
)
Ce qui fait que LangExtract sort du lot par rapport à d'autres outils comme
Sparrow
, c'est surtout son système de Source Grounding. En gros, chaque info extraite est directement liée à sa position exacte dans le texte source. Ça facilite énormément la vérification et la traçabilité puisque vous pouvez voir visuellement d'où vient la donnée grâce à un système de surlignage automatique.
Sous le capot, l'outil est optimisé pour les documents à rallonge (le fameux problème de l'aiguille dans une botte de foin). Il utilise des stratégies de découpage de texte et de passes multiples pour améliorer le rappel et s'assurer que le maximum d'infos soit capturé.
La visualisation interactive permet de valider les données en un clin d'œil (
Source
)
Et cerise sur le gâteau, il permet de générer un fichier HTML interactif pour visualiser les milliers d'entités extraites dans leur contexte original. À la cool !
Côté installation, c'est hyper fastoche :
pip install langextract
Pour faire le job, vous avez le choix des armes : les modèles cloud de Google (Gemini 2.5 Flash/Pro), ceux d'OpenAI (via pip install langextract[openai]), ou carrément du local avec
Ollama
. Pas besoin de passer des heures à fine-tuner un modèle, il suffit de fournir quelques exemples structurés via le paramètre examples et hop, c'est parti mon kiki.
Voici à quoi ça ressemble sous le capot pour lancer une machine à extraire :
import langextract as lx
# 1. On définit les règles du jeu
prompt = "Extraire les noms de personnages et leurs émotions."
# 2. On donne un exemple (few-shot) pour guider le modèle
examples = [
lx.data.ExampleData(
text="ROMEO. But soft! What light...",
extractions=[lx.data.Extraction(extraction_class="character", extraction_text="ROMEO", attributes={"emotion": "wonder"})]
)
]
# 3. On lance l'extraction (nécessite une clé API ou Ollama)
results = lx.extract(
text_or_documents="votre_texte_brut_ici",
prompt_description=prompt,
examples=examples,
model_id="gemini-2.5-flash"
)
# 4. On sauvegarde et on génère la visualisation HTML
lx.io.save_annotated_documents(results, output_name="results.jsonl")
html_content = lx.visualize("results.jsonl")
with open("view.html", "w") as f:
f.write(html_content)
Honnêtement, je ne sais pas si ça va remplacer
les solutions industrielles de RPA
, mais pour un dev qui veut structurer du texte sans se prendre la tête, c'est vraiment impressionnant. Que vous fassiez du
Grist
ou de l'analyse de données pure, cet outil mérite clairement que vous y jetiez un œil !