Depuis le 24 juin, Google déploie dans Gmail son intelligence artificielle Gemini, qui est capable de résumer des mails, d'organiser des messages et de générer un brouillon. Seul bémol, sa disponibilité en Europe est encore limitée.
Selon un rapport de l’organisme NewsGuard, la désinformation russe est parvenue à infiltrer les meilleures IA génératives. Leurs chatbots peuvent répéter avec conviction les faux narratifs du Kremlin.
La bataille de l'IA générative est une bataille de mises à jour et de choix des benchmarks pour mettre en valeur les chatbots. En juin, la startup Anthropic a présenté Claude 3.5 Sonnet. Selon elle, elle surpasse le tout nouveau modèle GPT-4o d'OpenAI.
Selon un rapport de l’organisme NewsGuard, la désinformation russe est parvenue à infiltrer les meilleures IA génératives. Leurs chatbots peuvent répéter avec conviction les faux narratifs du Kremlin.
Ilya Sutskever, co-fondateur et ex-scientifique en chef d'OpenAI, lance Safe Surperintelligence Inc (SSI). Son objectif est de revenir à la mission originelle du créateur de ChatGPT, à savoir fabriquer une intelligence artificielle puissante et fiable.
Grâce à un modèle de diffusion capable de fonctionner localement, Snap dit pouvoir générer des filtres de réalité augmentée avec une simple phrase. Le réseau social pourrait être le premier à atteindre ce fantasme technologique.
Portées par l’intelligence artificielle, une excellente qualité photo/vidéo et un bouche-à-oreille efficace, les Meta Ray-Ban sont les premières lunettes connectées populaires. L’entreprise de Mark Zuckerberg va se restructurer pour mieux les mettre en avant.
La première bêta développeur d’iOS 18 ne permet pas encore d’essayer le nouveau Siri, qui sera accompagné des fonctions Apple Intelligence à la rentrée. Pourtant, son code est déjà présent.
Pendant 40 minutes, Numerama a pu découvrir Apple Intelligence en avant-première sur un iPhone sous iOS 18, un iPad sous iPadOS 18 et un MacBook Air sous macOS Sequoia. Dans cet article, voici les réponses à toutes vos questions.
OpenAI, la célèbre entreprise à l’origine de ChatGPT, vient de franchir une étape importante dans le déploiement de son outil d’intelligence artificielle. En effet, la société a signé un partenariat sans précédent avec PwC ( le géant du conseil et de l’audit) qui va permettre à 100 000 de ses employés d’accéder à la version entreprise ... Lire plus
Des chercheurs de l’Université du Michigan ont mis au point une technique absolument dingue qui permet de générer des spectrogrammes ayant l’allure d’images capables de produire des sons qui leur correspondent lorsqu’ils sont écoutés. Ils appellent cela des « images qui sonnent ».
Leur approche est simple et fonctionne sans entraînement spécifique. Elle s’appuie sur des modèles de diffusion text-to-image et text-to-spectrogram pré-entraînés, opérant dans un espace latent partagé. Durant le processus de génération, les deux modèles « débruitent » des latents partagés de manière simultanée, guidés par deux textes décrivant l’image et le son désirés.
Le résultat est bluffant ! Ça donne des spectrogrammes qui, vus comme des images, ressemblent à un château avec des tours, et écoutés comme des sons, font entendre des cloches. Ou des tigres dont les rayures cachent les motifs sonores de leurs rugissements.
Pour évaluer leur bidouille, les chercheurs ont utilisé des métriques quantitatives comme CLIP et CLAP, ainsi que des études de perception humaine. Leur méthode dépasse les approches alternatives et génère des échantillons qui collent finement aux prompts textuels dans les deux modalités. Ils montrent aussi que coloriser les spectrogrammes donne des images plus agréables à l’œil, tout en préservant l’audio.
Cette prouesse révèle qu’il existe une intersection entre la distribution des images et celle des spectrogrammes audio et en dépit de leurs différences, ils partagent des caractéristiques bas niveau comme les contours, les courbes et les coins. Cela permet de composer de façon inattendue des éléments visuels ET acoustiques, comme une ligne qui marque à la fois l’attaque d’un son de cloche et le contour d’un clocher.
Les auteurs y voient une avancée pour la génération multimodale par composition et une nouvelle forme d’expression artistique audio-visuelle. Une sorte de stéganographie qui cacherait des images dans une piste son, dévoilées uniquement lorsqu’elles sont transformées en spectrogramme.
Pour recréer cette méthode chez vous, il « suffit » d’aller sur le Github du projet et de suivre les instructions techniques.
Google a annoncé mercredi dernier une série de mises à jour majeures de son moteur de recherche ainsi que de ses publicités, qui intègrent l’intelligence artificielle générative. Ces changements visent en réalité à rendre les résultats de recherche plus pertinents et les annonces plus efficaces. Mais cela, tout en offrant de nouvelles fonctionnalités aux utilisateurs ... Lire plus
TikTok vient d’annoncer son intention de se tourner vers l’intelligence artificielle générative pour révolutionner son modèle publicitaire. Alors que la plateforme continue de gagner en popularité avec plus d’un milliard d’utilisateurs actifs chaque mois, elle cherche désormais à tirer parti des dernières avancées technologiques. Le but est d’offrir aux annonceurs des outils toujours plus performants ... Lire plus