banner

Blog

Dec 20, 2023

Pratique avec l'IA de Google

L'IA peut-elle travailler à rebours à partir d'une description textuelle pour générer une chanson cohérente ? C'est le principe de MusicLM, l'outil de création musicale basé sur l'IA que Google a lancé hier lors du lancement de sa conférence I/O.

MusicLM, qui a été formé sur des centaines de milliers d'heures d'audio pour apprendre à créer de nouvelles musiques dans une gamme de styles, est disponible en avant-première via l'application AI Test Kitchen de Google. Je m'amuse avec ça depuis environ un jour, tout comme quelques-uns de mes collègues.

Le verdict? Disons simplement que MusicLM ne vient pas pour les emplois de musiciens de si tôt.

L'utilisation de MusicLM dans Test Kitchen est assez simple. Une fois que vous êtes approuvé pour l'accès, vous êtes accueilli par une zone de texte dans laquelle vous pouvez entrer une description de la chanson - aussi détaillée que vous le souhaitez - et demander au système de générer deux versions de la chanson. Les deux peuvent être téléchargés pour une écoute hors ligne, mais Google vous encourage à "pouce en l'air" l'une des pistes pour aider à améliorer les performances de l'IA.

Crédits image :Google

Lorsque j'ai couvert MusicLM pour la première fois en janvier, avant sa sortie, j'ai écrit que les chansons du système ressemblaient à quelque chose comme un artiste humain pourrait composer - mais pas nécessairement aussi musicalement inventives ou cohérentes. Maintenant, je ne peux pas dire que je maintiens entièrement ces mots, car il semble clair qu'il y avait une sérieuse sélection de cerises en cours avec des échantillons du début de l'année.

La plupart des chansons que j'ai générées avec MusicLM sonnent au mieux passable - et au pire comme un enfant de quatre ans lâché sur un DAW. Je suis principalement resté fidèle à l'EDM, essayant de produire quelque chose avec une structure et une mélodie perceptible (plus agréable, idéalement). Mais peu importe à quel point c'est décent, même bon ! — le début des chansons de MusicLM sonne, il arrive un moment où elles s'effondrent d'une manière très évidente, musicalement déplaisante.

Par exemple, prenez cet échantillon, généré à l'aide de l'invite "Chanson EDM dans un style léger, optimiste et aéré, bon pour la danse". Cela commence de manière prometteuse, avec une ligne de base époustouflante et des éléments d'un single classique de Daft Punk. Mais vers le milieu de la piste, ça dévie bien sûr - pratiquement un autre genre.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3

Voici un solo de piano à partir d'une invite plus simple - "musique de piano romantique et émotionnelle". Les pièces, vous le remarquerez, sonnent bien et bien — exceptionnelles même, du moins en termes de travail des doigts. Mais alors c'est comme si le pianiste devenait possédé par la manie. Un méli-mélo de notes plus tard, et la chanson prend une direction radicalement différente, comme si elle venait d'une nouvelle partition - bien que dans la lignée de l'original.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3

J'ai essayé la main de MusicLM sur les chiptunes pour le plaisir, pensant que l'IA pourrait avoir plus de facilité avec des chansons d'une construction plus basique. Pas de dé. Le résultat (ci-dessous), bien que accrocheur par endroits, s'est terminé de manière aussi aléatoire que les autres échantillons.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3

Du côté positif, MusicLM, dans l'ensemble, fait un bien meilleur travail que Jukebox, la tentative d'OpenAI il y a plusieurs années de créer un générateur de musique AI. Contrairement à MusicLM, étant donné un genre, un artiste et un extrait de paroles, Jukebox pouvait générer une musique relativement cohérente avec des voix, mais les chansons produites par Jukebox manquaient d'éléments musicaux typiques comme des refrains qui se répétaient et contenaient souvent des paroles absurdes. Les chansons produites par MusicLM contiennent également moins d'artefacts et se sentent généralement comme un pas en avant en ce qui concerne la fidélité.

L'utilité de MusicLM est d'ailleurs un peu limitée, grâce à des limitations artificielles du côté de l'incitation. Il ne générera pas de musique mettant en vedette des artistes ou des voix, pas même dans le style de musiciens particuliers. Essayez de taper une invite comme "dans le sens de Barry Manilow" et vous n'obtiendrez qu'un message d'erreur.

Crédits image :Google

La raison est probablement légale. La musique Deepfaked repose sur un terrain juridique trouble, après tout, certains acteurs de l'industrie de la musique affirmant que les générateurs de musique AI comme MusicLM violent le droit d'auteur sur la musique. Il ne faudra peut-être pas longtemps avant qu'il y ait une certaine clarté sur la question – plusieurs poursuites en cours devant les tribunaux auront probablement une incidence sur l'IA génératrice de musique, dont une concernant les droits des artistes dont le travail est utilisé pour former des systèmes d'IA à leur insu ou sans leur consentement. Le temps nous le dira.

Crédits image : Crédits image :
PARTAGER