Google Gemini crée de la musique à partir de vos photos : Lyria 3 bientôt disponible
Google repousse les limites de la créativité au sein de l' application Gemini , en intégrant la création musicale directement dans l'espace dédié à la création d'images et de vidéos . Avec le nouveau modèle Lyria 3 , l'objectif est de transformer une simple requête textuelle ou une photo en un morceau de musique complet en quelques secondes seulement . L'entreprise affirme vouloir ajouter une façon supplémentaire d'exprimer des émotions , des souvenirs et des moments du quotidien , sans compétences musicales et avec un contrôle plus précis sur le style , le chant et le tempo de la chanson. Plus précisément, Lyria 3 est le nouveau modèle de génération musicale développé par Google DeepMind et intégré en version bêta à l' application Gemini . Par rapport aux versions précédentes de la famille Lyria, il vise à créer des morceaux plus complexes , avec un rendu audio plus réaliste et une gestion plus fine des éléments musicaux. Le modèle fonctionne directement à partir de contenu textuel ou multimédia et crée des pistes d'environ 30 secondes .Chaque chanson est accompagnée d'une pochette personnalisée , générée par le système Nano Banana , vous offrant ainsi un contenu prêt à partager.Lyria 3 est né d'un parcours qui a débuté en 2023 avec les premières expériences de musique générative , notamment des projets tels que Music AI Sandbox , développé en collaboration avec le monde de la musique pour gérer plus consciemment des questions telles que le droit d'auteur et les droits .
La principale nouveauté de Lyria 3 dans l' application Gemini réside dans la création de chansons à partir d'une idée simple. Plus besoin de fournir des paroles toutes faites : le modèle génère automatiquement les couplets en fonction de vos indications.Les utilisateurs du service peuvent choisir différents aspects du résultat, comme le genre , le style , la présence de voix ou uniquement de parties instrumentales , et même le tempo du morceau. L'objectif est d'offrir une plus grande liberté créative tout en garantissant une expérience ultra- rapide .La génération suit deux modes principaux :
-Texte à enregistrer : vous décrivez le type de chanson que vous souhaitez, en indiquant peut-être une ambiance , un souvenir ou une référence culturelle, et Gemini produit un morceau cohérent avec cette atmosphère, avec des paroles originales ou simplement instrumental .
-De la photo ou de la vidéo à la chanson : Téléchargez une photo ou une vidéo et Gemini utilise ce contenu comme source d’inspiration pour créer une chanson dont les paroles et la musique correspondent au contexte des images.
Chaque émission dure environ 30 secondes , un choix qui vise un partage rapide et la création de petits fragments sonores, plutôt que des compositions longues ou particulièrement structurées.Les morceaux générés sont accompagnés d'une pochette créée automatiquement par Nano Banana , vous disposez donc d'un pack audio + image qui peut être immédiatement partagé via un lien ou téléchargé, notamment sur les réseaux sociaux et par messagerie.Lyria 3 est non seulement disponible dans l' application Gemini , mais aussi dans l' écosystème YouTube grâce à la fonctionnalité Dream Track . Cette intégration, déjà proposée aux États-Unis et bientôt déployée dans d'autres pays pour les créateurs de Shorts , vise à améliorer la qualité des bandes originales de courts métrages .Avec Dream Track, les créateurs peuvent générer de courtes lignes chantées ou des pistes d'accompagnement à utiliser pour leurs Shorts , avec un niveau de personnalisation plus élevé qu'avec les pistes préexistantes de la bibliothèque.
En matière de transparence , Google ajoute le filigrane SynthID à tous les morceaux créés dans l'application Gemini , un filigrane numérique imperceptible qui permet d'identifier le contenu généré avec l'IA de Google .De nouvelles fonctionnalités de vérification font également leur apparition dans l'application Gemini : vous pouvez télécharger un fichier audio , ainsi que des images et des vidéos , et demander s'ils ont été créés avec l'IA de Google. Gemini vérifie la présence de SynthID et utilise ses capacités d'analyse pour renvoyer une réponse argumentée. Ces outils visent à clarifier la distinction entre contenu original et contenu généré, à un moment où la reconnaissance des œuvres créées avec l'IA est un enjeu central pour les utilisateurs , les créateurs et les détenteurs de droits .
Google souligne que la génération musicale de Lyria 3 privilégie l'expression originale et non l'imitation d' artistes existants . Lorsqu'un utilisateur saisit le nom d'un artiste , Gemini l'interprète comme une source d'inspiration générale pour le style ou l'ambiance, et non comme une demande de copie conforme. Pour renforcer cette approche, le système utilise des filtres qui comparent le contenu généré avec le contenu existant, réduisant ainsi le risque de chevauchement important. Vous conservez toutefois la possibilité de signaler les morceaux susceptibles d'enfreindre vos droits ou ceux d'autrui. Votre utilisation des services est régie par les conditions d'utilisation de Google et la politique relative aux utilisations interdites de l'IA générative , qui incluent une interdiction de porter atteinte aux droits de propriété intellectuelle et à la vie privée des tiers . L'entreprise tente ainsi de concilier expérimentation créative et protection des sujets impliqués.
Concernant la disponibilité, Lyria 3 sera disponible sur l' application Gemini pour tous les utilisateurs de 18 ans et plus , en plusieurs langues : anglais , allemand , espagnol , français , hindi , japonais , coréen et portugais . Google prévoit d'étendre la qualité et la couverture à d'autres langues ultérieurement . Le déploiement débutera sur ordinateur et atteindra l' application mobile dans les jours suivants. Les abonnés Google AI Plus , Pro et Ultra bénéficieront de limites d'utilisation supérieures à celles des comptes gratuits. En attendant, vous pouvez écouter quelques extraits dans la vidéo officielle de Lyria 3, disponible via le lien ci-dessous.
TD6FPndjhoE (Lire la suite)