Battlefield Redsec est enfin là, servant de compagnon tant attendu au Battle Royale récemment lancé Battlefield 6. Cette entrée gratuite promet de livrer la guerre à grande échelle palpitante pour laquelle la franchise est célébrée. Le jeu devrait coïncider avec la mise à jour de la Saison 1 pour BF6, prévue pour le 28 octobre […]
Mise à jour : 28 octobre 2025 Nous avons ajouté de nouveaux codes ! Alors que vous vous plongiez dans les complexités du régime Keto, je me délectais d’un seau de KFC, grâce à Fat Training. Ce n’est pas une question de perdre du poids ; c’est une tournure délicieuse où vous prenez du poids […]
Au musée des Arts et métiers à Paris, l’exposition Flops ?! présente une multitude d’objets ratés ou décevants, inventions high-tech ou produits de grande consommation. Les raisons de ces échecs sont très variables.
"Bien que les animaux sauvages se livrent à des migrations remarquables, le mouvement de biomasse des humains dépasse probablement celui de toute la vie sauvage terrestre", écrivent les auteurs de cette nouvelle étude.
Le chlorure de vinyle monomère (CVM) est un gaz présent dans les canalisations d'eau potable en PVC installées dans les années 1970, classé cancérogène "certain" depuis 1987.
Devant le siège d’un service archéologique allemand, une vitrine a été déposée en pleine nuit. À l’intérieur : des os humains, des fragments de tissus anciens, et une énigme vieille de plus d’un millénaire. Les autorités cherchent encore à comprendre qui a pu laisser un tel vestige, et...
Bonne nouvelle pour les amateurs de football virtuel : EA Sports FC 26 sur PS5 passe de 79,99 € à 66,64 € sur Rakuten, soit une réduction de 16 %. Une belle opportunité de s’offrir la dernière mouture du jeu de sport signé Bandai Namco Entertainment à un prix plus accessible, juste à temps pour...
Un escadron de l’U.S. Air Force a partagé des images spectaculaires de l’œil de l’ouragan Melissa, actuellement classé en catégorie 5. Ce cyclone, parmi les plus puissants jamais observés dans les Caraïbes, menace directement la Jamaïque, où vents extrêmes et pluies torrentielles sont redoutés.
Pour entretenir votre intérieur plus facilement, le choix du matériel fait toute la différence. En ce moment, Cdiscount propose le Rowenta X-Clean 4 à un prix particulièrement attractif, une bonne occasion de s’équiper d’un aspirateur laveur performant sans dépasser son budget.
Une nouvelle fuite révèle le calendrier de lancement pour les prochains produits du constructeur chinois Huawei. En pleine reconquête de sa clientèle en dehors de la Chine, la firme pourrait améliorer la caméra de son photophone, avec un lancement au printemps.
« Pour le goût personnel de Wesley, prendre la mer était suffisant, c'était tout ce qu'il voulait, et au diable les émeutes, les cuites, le mariage et tout le bazar . » Jack Kerouac (1922-1969) écrit à 20 ans un roman dont la trame est simple : le charme de Wesley, jeune marin solitaire et taciturne (...)
/ États-Unis, Histoire, Littérature, Personnalités, Culture - 2022/09
After pioneering haptic gloves for virtual reality, Tokyo-based startup Diver-X is taking aim at one of the most familiar computer tools: the mouse. Its new Melt Mouse, launching on Kickstarter under the company’s Melt Interface brand, combines a precision mouse, a trackpad, and a customizable shortcut keypad into one minimalist aluminum device.I had a hands-on session with the Melt Mouse prototype during a briefing with co-founder and CTO Kei Asano, […]
At CEATEC 2024, JVCKENWOOD introduced a prototype of an AI-powered wireless earbud with a built-in camera, designed to combine audio, visual input, and AI processing in a single wearable device. The concept allowed users to interact hands-free with an AI assistant based on what the built-in camera captured, without needing to use a smartphone.At CEATEC 2025, the company presented an updated prototype featuring a revised design and two new demonstrations […]
Xiaomi has officially begun the global rollout of HyperOS 3, which is based on Android 16. The company announced the update on the social platform X, confirming that the Xiaomi 15T series would be the first to receive it. Between November and December, additional Xiaomi, Redmi, and POCO devices will follow.According to the release schedule, the Xiaomi 15 and 15 Ultra will receive the update in November, alongside the Redmi […]
La plupart des documents sont conçus pour être lus par des humains. Partant, ils peuvent être analysés de façon plus approfondie par des modèles de vision que par des modèles de langage.
Le projet Colette repose sur ce postulat. Cofinancé par Airbus, le CNES et la société toulousaine Jolibrain, il a produit un logiciel open source de déploiement de LLM avec une brique de RAG visuel (tous les documents sont transformés et analysés sous forme d’images).
Colette s’appuie sur une architecture qui a ses racines à CentraleSupélec : ColPali. Présentée début 2025, elle met à profit un VLM entraîné pour indexer des documents purement à partir de leurs caractéristiques visuelles.
ColPali se retrouve aussi, entre autres, chez Morphik. Cette start-up Y Combinator a focalisé son offre sur le RAG. Elle a amélioré les performances en exploitant la méthode MUVERA – qui permet de contourner l’approche multivectorielle de ColPali – et la base de données vectorielle Turbopuffer.
DeepSeek-OCR : la modalité image comme moyen de compression
DeepSeek étudie également cet aspect. Il y a récemment consacré un article scientifique, sous un angle particulier : la modalité vision comme moyen de compresser l’information textuelle.
Ses travaux se matérialisent avec l’architecture DeepSeek-OCR. En son centre, DeepEncoder, qui encode les documents sous forme « tokens image ». Il exploite un modèle SAM (segmentation avec attention locale par fenêtre) et un modèle CLIP (attention globale). Avec, entre les deux, un module de convolutionnel de sous-échantillonnage.
DeepEncoder compte environ 380 millions de paramètres (80 pour le SAM, 300 pour le CLIP). Il gère deux modes d’entrée. D’un côté, la résolution native (4 modes : Tiny et Small, où les images sont directement redimensionnées ; Base et Large, où on utilise du padding pour préserver le ratio d’origine). De l’autre, la résolution dynamique (combinaison de deux résolutions natives ; Gundam, par exemple, associe du 640 x 640 en attention locale et du 1024 x 1024 en attention globale).
Le décodage est dévolu à un modèle DeepSeek MoE 3B à 570 millions de paramètres actifs (6 experts actifs sur 64 + 2 experts partagés).
On a d’abord entraîné DeepEncoder, puis DeepSeek-OCR dans son ensemble, à partir de deux jeux de données. L’un comprenant des PDF dans une centaine de langues avec éventuellement des images intégrées. L’autre axé sur des éléments spécifiques : graphes, formules chimiques, figures géométriques planes…
La perspective d’un mécanisme d’oubli graduel
DeepSeek-OCR a notamment été mis à l’épreuve sur un sous-ensemble du benchmarkFox. En l’occurrence, des documents en anglais comprenant de 600 à 1300 tokens texte. C’est de là que DeepSeek tire les principaux indicateurs de performance qu’il annonce en introduction de son article.
Avec un rapport de compression de 9-10x (1 token image pour 9 ou 10 tokens texte), le décodeur avoisine 97 % de précision OCR. Au-delà, les performances baissent (90 % à 10-12x, 60 % à 20x). DeepSeek y voit deux raisons. D’une part, le rapport entre la longueur des documents et la complexité de leur disposition. De l’autre, le fait qu’aux résolutions les plus basses (Tiny et Small), les textes longs deviennent « flous ».
Le premier élément peut être résolu par un rendu sur une page à disposition unique, estime DeepSeek. Le second peut être mis à profit pour reproduire une forme de mécanisme d’oubli : l’historique « froid » serait converti en images qui seraient ensuite progressivement compressées.
L’approche est, globalement, d’autant plus intéressante qu’elle n’occasionne pas de surcharge (les systèmes multimodaux exigent intrinsèquement un encodeur de vision).
Des diapos aux journaux, la nécessité de plusieurs modes d’encodage
En « conditions réelles » (OmniDocBench), DeepSeek retient que :
Le mode Small (100 tokens) produit de meilleurs résultats que GOT-OCR2.0 avec 2,5 fois moins de tokens.
Le mode Large (400 tokens) est au niveau des modèles OCR à l’état de l’art.
Avec moins de 800 tokens, la méthode Gundam s’en sort mieux que MinerU2.0 avec environ 7000 tokens.
Certaines catégories de documents nécessitent peu de tokens pour un résultat satisfaisant. Les diapositives, par exemple (64 tokens suffisent). Pour les livres et les rapports, 100 tokens est l’idéal. Avec les journaux (4000 à 5000 tokens), le mode Gundam, voire Gundam-master, est nécessaire.
DeepSeek annonce que son architecture est capable de générer 33 millions de pages de données par jour en utilisant 20 nœuds de 8 GPU A100-40G.
Microsoft et OpenAI viennent de conclure un accord majeur dans l’histoire de leur collaboration initiée en 2019 permettant à au créateur de ChatGPT d’adopter le statut de Public Benefit Corporation (PBC), soit une société à but lucratif encadrée par une mission d’intérêt public.
Dans cette nouvelle configuration, Microsoft détiendra une participation d’environ 27 % dans OpenAI Group PBC, valorisée à 135 milliards $, selon les informations fournies par les deux entreprises.
Le nouvel accord prolonge et redéfinit les droits de propriété intellectuelle (PI) entre les deux entreprises. Microsoft conserve son statut de partenaire exclusif pour les modèles de pointe développés par OpenAI, ainsi que l’exclusivité d’hébergement sur la plateforme Azure, jusqu’à la reconnaissance formelle d’une intelligence artificielle générale (AGI).
Restructuration et participation de Microsoft
La déclaration d’atteinte de l’AGI par OpenAI devra désormais être vérifiée par un panel d’experts indépendants. Les droits de Microsoft sur les modèles et produits d’OpenAI sont étendus jusqu’en 2032, contre 2030 précédemment, et continueront de s’appliquer même si l’AGI est validée avant cette date. Ces droits incluent les modèles post-AGI, sous réserve de garde-fous de sécurité.
Les droits de Microsoft sur la recherche (méthodes de développement internes et données confidentielles) expireront à la date de validation de l’AGI ou en 2030, selon la première de ces échéances. Ces droits ne couvrent pas l’architecture des modèles, les poids, le code d’inférence, le code de fine-tuning ni les infrastructures matérielles et logicielles de centres de données.
L’accord ouvre la voie à une coopération plus flexible. OpenAI pourra désormais développer certains produits avec des partenaires tiers. Les produits d’API issus de ces collaborations resteront exclusifs à Azure, tandis que les produits non liés à des API pourront être hébergés sur d’autres clouds.
Microsoft pourra également poursuivre de manière indépendante ses recherches vers l’AGI, seul ou avec d’autres partenaires. Si l’entreprise utilise la propriété intellectuelle d’OpenAI pour ce développement avant la reconnaissance formelle de l’AGI, elle devra respecter des limites de capacité de calcul prédéfinies.
Enfin, l’accord prévoit qu’OpenAI achètera pour 250 milliards $ de services Azure supplémentaires. En contrepartie, Microsoft renonce à son droit de premier refus pour fournir les services de calcul de l’entreprise.
Le partage de revenus entre les deux sociétés demeure en vigueur jusqu’à la validation de l’AGI, avec des paiements étalés sur une période plus longue. OpenAI est désormais autorisée à fournir des services API à des clients du gouvernement américain, y compris pour des usages liés à la sécurité nationale, sans exclusivité d’hébergement.
L’entreprise pourra également publier des modèles « Open Weight » répondant à des critères de sécurité et de capacité déterminés.
La saison 3 de la production politique de Netflix squatte toujours le top 10 de la plateforme, plusieurs jours après sa sortie, le 18 octobre 2025. Pour patienter jusqu'à la saison 4 de La Diplomate, déjà très attendue, voici 4 séries similaires à découvrir en streaming.
Dans un rapport publié le 23 octobre 2025, la société de services réseaux Infoblox met en lumière la face cachée du navigateur Universe Browser. L'outil, téléchargé des millions de fois, promettait à ses utilisateurs un respect de leur vie privée et la possibilité de contourner la censure dans les pays où les jeux d'argent en ligne sont interdits.
Octobre 2025 a été un mois animé sur le terrain nucléaire. La France vient à ce propos d'annoncer la mise en service opérationnel d'un nouveau missile nucléaire pour ses sous-marins. Et la nouvelle génération de ce missile est dès à présent en chantier.