Vue normale
Google Search: le hack « num=100 » pour afficher 100 résultats disparaît
Google Search dispose de nombreux paramètres cachés permettant d’adapter les résultats de recherche. Parmi eux, le fameux paramètre &num=100, qui permettait d’afficher 100 résultats sur une seule page, semble en passe de disparaître. 100 résultats sur une page : un hack bien connu des pros du SEO En ajoutant &num=100 à la fin de l’URL d’une recherche, […]
L’article Google Search: le hack « num=100 » pour afficher 100 résultats disparaît est apparu en premier sur BlogNT : le Blog des Nouvelles Technologies.
SimpleFold - Un labo de biologie moléculaire qui tourne sur un simple Macbook Pro
Apple vient de sortir un truc énorme et je pense que personne n’a encore capté cette folie. Leur équipe de recherche en machine learning a publié SimpleFold , un modèle d’IA pour prédire la structure des protéines. Jusque-là, rien de révolutionnaire me direz-vous car AlphaFold de Google fait déjà ça très bien, sauf que… SimpleFold, lui, tourne sur votre MacBook Pro !
Maintenant, je vais vous expliquer pourquoi c’est complètement dingue. D’après l’article de recherche d’Apple , SimpleFold atteint 95% des performances d’AlphaFold2 tout en étant infiniment plus léger. En effet, AlphaFold nécessite des supercalculateurs avec des GPU à 20 000 balles pièce alors SimpleFold, lui tourne tranquille sur un MacBook Pro M2 avec 64GB de RAM.
Pour réaliser cet exploit, au lieu d’utiliser les modules super complexes d’AlphaFold comme la méthode du triangle attention ou les MSA ( Multiple Sequence Alignments ), SimpleFold utilise une technique appelée “flow-matching” avec des transformers basiques. Pour rappel, flow matching ça permet de générer des données (souvent des images ou du texte), à partir de bruit aléatoire…
Ils ont donc échangé le moteur de Formule 1 utilisé par des outil comme Alphafold par un moteur de Twingo bien générique et arrivent à atteindre la même vitesse.
Les chercheurs d’Apple ont pour cela entraîné 6 versions différentes de SimpleFold, de 100 millions à 3 milliards de paramètres. Et même la plus petite version (100M) atteint 90% des performances d’ ESMFold sur les benchmarks CAMEO22.
Et c’est super cool parce que prédire la structure d’une protéine, c’est pas juste un truc de geek pour s’amuser. C’est LA base pour créer de nouveaux médicaments, comprendre des maladies, développer des vaccins… Jusqu’à présent, seuls les gros labos avec des budgets de malade pouvaient se permettre de faire ça, c’est pourquoi SimpleFold change complètement la donne en rendant cette technologie accessible à n’importe quel chercheur avec un MacBook.
Un chercheur indépendant peut maintenant découvrir de nouvelles molécules depuis son canapé… Chapeau Apple pour démocratiser cette partie de la recherche scientifique !
Le plus drôle dans tout ça, c’est qu’Apple a entraîné SimpleFold sur 8,6 millions de structures protéiques, ce qui en fait donc le plus gros modèle de folding jamais créé, avec 3 milliards de paramètres pour la version complète. Maintenant pour l’installer, c’est super simple. Le repo GitHub montre que vous aurez juste besoin de Python 3.10 et que ça supporte PyTorch ou MLX (le framework d’Apple pour les puces Silicon).
Et voilà, en 5 minutes, vous avez un labo de biologie moléculaire totalement open source sur votre machine !
Yuyang Wang et son équipe ont donc prouvé que pour prédire les structures protéiques, pas besoin de réinventer la roue. Des transformers classiques avec du flow-matching, et ça marche ! Imaginez des lycéens qui découvrent de nouvelles molécules pour leur TPE, des startups biotech qui se lancent depuis un garage (littéralement), des pays en développement qui peuvent enfin faire de la recherche de pointe sans investir des millions dans l’infra…
Apple vient de casser un petit peu le monopole de la big pharma sur la recherche moléculaire.
C’est top non ?
Va-t-on trouver le tombeau de Cléopâtre ? National Geographic filme une nouvelle piste prometteuse

À la recherche du tombeau de Cléopâtre, l’archéologue Kathleen Martínez a découvert un port englouti depuis des siècles. National Geographic a suivi son parcours de plus de 20 ans, sur les traces de la souveraine captivante.
-
- Cette technologie potentiellement révolutionnaire pourrait réduire la température de nos cartes graphique de 65%
Cette technologie potentiellement révolutionnaire pourrait réduire la température de nos cartes graphique de 65%
Chaque matin, WhatsApp s’anime avec les dernières nouvelles tech. Rejoignez notre canal Frandroid pour ne rien manquer !
L’Europe déploie son deuxième ordinateur quantique
L’Union européenne a inauguré en République tchèque son deuxième ordinateur quantique. Baptisé VLQ, ce nouveau venu marque une étape clé dans la stratégie européenne, qui vise, à terme, la mise en place d'une constellation de six ordinateurs quantiques sur le continent.
Google face à la fronde, ses résumés IA accusés d’asphyxier la presse et de propager des erreurs
Absents en France, les résumés IA (AI Overviews) de Google sont mal perçus en Allemagne par la presse et les éditeurs. Ceux-ci ont décidé de déposer une plainte contre cette fonctionnalité, en mobilisant la récente réglementation européenne du DSA sur les services numériques.
Google transforme son navigateur en un véritable assistant IA grâce à Gemini
Google a annoncé le 18 septembre 2025 l'arrivée de Gemini, son intelligence artificielle maison, directement dans le navigateur Chrome. Pour l’instant, la nouveauté n'est disponible que pour les utilisateurs situés aux États-Unis, en anglais, sur Mac et Windows.
-
- Une IA qui détecte les sous-marins avec 95% de précision | Intelligence artificielle | Le site de Korben
Des agents IA de recherche peuvent tricher, alerte fiable
Des agents IA connectés biaisent des benchmarks via une contamination à la recherche, d'où l'intérêt de journaux de navigation et de listes de domaines bloqués.
Cet article Des agents IA de recherche peuvent tricher, alerte fiable est apparu en premier sur Linformatique.org.
Frequently Asked Questions about Indexing
Sans PubMed, il est possible de savoir si une référence a été indexée par un humain ou une machine.
Pour cela, il faut consulter le XML de la référence à l’aide des APIs pour trouver l’attribut « IndexingMethod ». Par exemple avec le PMID 40794811 : https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&retmode=xml&id=40794811
L’absence de cet attribut ou une valeur « Manual » indique une indexation manuelle. Une valeur « Curated » indique une indexation initiale automatisée, qui a ensuite été contrôlée/vérifiée par un humain. Une valeur « Automated » indique une indexation automatique sans vérification par un humain.
(Informations fournies par Jérôme)
— Permalien
-
- OpenAI confronté à une faille majeure exposant des milliers de conversations privées sur les moteurs de recherche
OpenAI confronté à une faille majeure exposant des milliers de conversations privées sur les moteurs de recherche
Une défaillance technique majeure transforme l’assistant conversationnel le plus populaire au monde en source involontaire de fuites massives. Des milliers d’échanges supposés privés entre utilisateurs et ChatGPT se retrouvent indexés par Google suite à un dysfonctionnement de la fonction de partage. L’incident révèle des demandes particulièrement compromettantes, allant de stratégies commerciales déloyales à des informations personnelles ... Lire plus
L'article OpenAI confronté à une faille majeure exposant des milliers de conversations privées sur les moteurs de recherche est apparu en premier sur Fredzone.-
- La promesse inattendue du lithium caché dans le cerveau pour guérir de la maladie d'Alzheimer - Numerama
La promesse inattendue du lithium caché dans le cerveau pour guérir de la maladie d'Alzheimer - Numerama
vid{264b93c4a3a4d80dafcc27fd6e4ad7f6302c34d253cd12a3fd161a5e78c50555}
— Permalink
OpenCitations - Search
Outil de recherche d'articles citant ou étant cité par une publication
Utile pour la phase de citation chasing d'une revue systématique moyennant de passer par l'API pour réaliser plusieurs requêtes, car l'interface de recherche semble limitée à la recherche d'une seule publication à la fois
Les données (publiées sous licence CC0) peuvent également être téléchargées pour travailler en local : https://download.opencitations.net/
"OpenCitations is managed by the Research Centre for Open Scholarly Metadata, an independent research centre within the University of Bologna." -- https://opencitations.net
— Permalien
Citation Gecko
Outil de recherche d'articles citant ou étant cité par un set de publications
Utile pour la phase de citation chasing d'une revue systématique
— Permalien
-
- Des chercheurs chinois viennent de simuler un cerveau de singe sur un ordinateur | Insolite | Le site de Korben
Sortie de Datafari 6.2, moteur de recherche open source pour entreprise avec de l'IA
Nous (NdM: France Labs qui porte datafari.com) sommes fiers de vous annoncer la mise à disposition de Datafari 6.2
Pour faire court, la grosse nouveauté vient de l’intégration simplifiée des outils tiers d’IA générative. Ces travaux ont été en partis financés par le projet Européen NGI Search Neural Datafari, qui a permi du coup également d'ajouter la recherche vectorielle bout en bout au projet Apache Solr.
Pour rappel, Datafari est une solution de recherche pour entreprise. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles.
Et désormais grâce à l’IA, de « discuter » avec ses connaissances. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre aussi de chercher des documents mais aussi d’utiliser une IA générative pour les questionner.
Pour cette dépêche, on se concentre sur la version libre et open source (mais il y a aussi d’autres nouveautés sur la version entreprise propriétaire).
- lien nᵒ 1 : Page de téléchargement
- lien nᵒ 2 : Accéder au code source
- lien nᵒ 3 : Le forum de discussion
- lien nᵒ 4 : La documentation
- lien nᵒ 5 : Le site officiel
- lien nᵒ 6 : Image Docker
- lien nᵒ 7 : La précédente dépêche sur Datafari
Notre dernière dépêche datant de… Datafari 5.3, voici Les nouveautés et changements principaux par rapport à cette dernière:
- Ajout d’un module RAG (Retrieval Augmented Generation)
- Passage à Solr 9.8 avec recherche vectorielle
- Ajout d’un module d’appel de LLM à l’indexation
- Gestion automatique du chunking des documents indexés
- Création d’un module autonome d’analytics au lieu de Zeppelin pour optimiser les ressources
- Création d’un regex connector à l’indexation
- Refonte technique de l’interface graphique, en React
- Passage à la V2 des API REST de Datafari
- Prototype d’agent autonome pour héberger en local un modèle d’IA
- Du bugfix de partout
Comment démarrer ?
Pour voir à quoi ça ressemble, nous avons téléversé une courte vidéo de démonstration. Pour démarrer tout de suite, le mieux est d’aller lire le quick start guide. Nous mettons gratuitement à disposition notre documentation Datafari sur Confluence, qui couvre les usages, l’administration et le développement. Attention, les modules d’IA que nous avons développés, nécessitent la disponibilité d’un serveur exposant un modèle d’IA compatible. De base, Datafari n’héberge pas localement une IA. Le plus simple pour débuter est de le connecter par exemple à openAI pour se faire la main, et ensuite de passer à des modèles locaux hébergés par vos soins ou par des partenaires.
Pour rappel, voici les principales fonctionnalités de Datafari en tant que moteur de recherche :
Que peut‐on faire avec Datafari ?
Datafari est un moteur de recherche pour entreprise enrichi à l’IA : membres de la famille des outils de gestion des connaissances, les solutions de recherche fédèrent les connaissances en analysant et indexant tous les documents d’une organisation, aussi bien leur contenu que leurs métadonnées. Pour cela, le moteur de recherche doit être multi‐sources, multi‐formats, et gérer la sécurité. En outre, il faut permettre l’administration de l’outil.
Dans la version libre, on peut, côté admin :
- Administrer les connecteurs aux sources de données vers de nombreuses sources (nous utilisons Apache ManifoldCF avec tous ses connecteurs) dont Sharepoint, Confluence, Alfresco et les partages de fichiers ;
- Gérer l’algorithme de pertinence qui classe les documents pour leur affichage suite à une requête ;
- Activer les modules de recherche vectorielle et de RAG
- Mettre en avant des documents pour des requêtes identifiées ;
- Créer des utilisateurs et leur assigner des rôles ;
- Voir des statistiques d’usage de l’outil ;
- Créer l’équivalent de Google AdWords (appelés promoliens) ;
- Gérer des synonymes ;
- Plein d’autres choses accessibles depuis la documentation Confluence.
Côté utilisateur, on peut :
- Chercher de façon simple ou avancée ;
- Prévisualiser les résultats ;
- « Discuter » avec ses documents via le module RAG
- Bénéficier de la correction orthographique et de l’auto‐complétion ;
- Choisir et utiliser des facettes pour filtrer les résultats ;
- Mettre des résultats dans un panier de favoris ;
- Créer des alertes par courriel quand des documents modifiés ou nouveaux correspondent à une requête.
Et ensuite ?
Pour le reste de 2025, nous allons continuer à ajouter des fonctionnalités se basant sur les IA génératives pour multiplier les possibilités.
Des commentaires ?
Nous sommes en permanence à l’écoute des commentaires et suggestions pour faire avancer le produit, alors profitez-en, que ce soit d’un point de vue technique ou fonctionnel, ça nous intéresse. Ha et si vous êtes déjà un utilisateur, n’hésitez pas à en parler sur le web !
Commentaires : voir le flux Atom ouvrir dans le navigateur
Researchers overturn landmark study on the replicability of psychological science
According to two Harvard professors and their collaborators, a 2015 landmark study showing that more than half of all psychology studies cannot be replicated is actually wrong.
— Permalink