AI-tool kennzeichnet ein Lied, das genre und liefert Erkenntnisse über die Wahrnehmung von Musik

Die Debatte kann endlich zur Ruhe setzen: Lil-Nas-X-s-record-Einstellung, Diagramm-topping-hit „Old Town Road“ ist in der Tat Land. Es ist aber auch ein wenig rock ’n‘ roll. Und wenn Sie analysieren die Texte und Akkorde zusammen, es ist straight-up pop.

Zumindest das ist nach einer künstlichen Intelligenz-tool, entwickelt von USC computer science PhD student Timothy Greer. Greer ‚ s Methode automatisch prognostiziert Musik-genres, indem Sie analysieren, wie Texte und Akkorde miteinander interagieren durch den gesamten song.

Die Methode klassifiziert „Old Town Road“ als Land nach den Texten; rock nach der Akkorde (basierend auf einem Nine Inch Nails-Musik-Probe); und pop nach den Akkorden und Texten kombiniert.

Das Papier mit dem Titel „Gemeinsame Vektor-Repräsentationen der Wörter und die Akkorde in der Musik für Genre-Einordnung“ wird vorgestellt, bei dem Sprache, Musik und Geist 2019-Konferenz Sept.14.

Eine Sehr Menschliche Erfahrung

„Old Town Road ist ein interessanter song,“, sagte Greer, ein lebenslanges Musiker, derzeit spielt Saxophon und keyboard in einer LA-band (Musikrichtung: Indie-rock).

„Die Texte sind durchdrungen von der country-genre, aber die Akkorde und die Instrumentierung klingen nicht wie das Land überhaupt. Der Algorithmus verdeutlicht die Komplexität der Musik, sowohl in Bezug darauf, wie die Musik aufgebaut ist und wie er wahrgenommen wird, in anderen Worten, wie Menschen es verarbeiten.“

Diese Bemühungen in der Musik-Forschung — rechnerisch zu verstehen, die Geschichten, die wir erzählen und wie Menschen erleben und von ihm beeinflusst werden-ist ein Teil eines größeren research program in Computational Media Intelligence an der USC Signal Analysis and Interpretation Laboratory (SAIL) (SEGEL).

„Musik, die Konstruktion und Wahrnehmung sind miteinander verwandt, aber Sie sind nicht ein und dasselbe,“ sagte Greer ‚ s supervisor und Papier co-Autor Shrikanth Narayanan.

Narayanan, SEGEL-Direktor und Niki und Max Nikias Stuhl und Professor of Electrical and Computer Engineering, hat zuvor analysiert vocal Muster der Beatboxer und Opernsänger mit MRI-scans, vorhergesagt Gewalt ratings mit Film-Drehbüchern und entwickelt Technologie, die mithilfe der Stimme zu beurteilen, Lautsprecher Emotionen. Er sagte, er ist aufgeregt über diese neue Forschung, denn es ist eine neue Art der Analyse von Musik rechnerisch und konnte zeigen, unerwartete Muster.

„Wir haben immer gesagt, es gibt keine hart-set-Regel für den menschlichen Erfahrungen von Musik“, sagte Narayanan, ein klassischer Musik Enthusiasten spielt das Indische saiteninstrument veena und die Violine. „KI und des maschinellen Lernens können eine Linse aus dem Blick auf diese sehr menschliche Erfahrung.“

Einen Neuen Sound

„Old Town Road“, die mittlerweile an der Spitze der charts für 18 Wochen, wurde bekannt für seine genre-Mischung charakteristisch ist. Als eines der heiß diskutierten Themen in der pop-Welt in diesem Sommer, jeder scheint eine andere Meinung-ist es country, pop, rock? Oder etwas vollkommen anderes?

Im April 2019, der song wurde entfernt, in den Billboard Hot Country chart-denn es habe „nicht genug umarmen Elemente der heutigen country-Musik-chart-in der jeweils geltenden Fassung,“ nach einem Billboard-Anweisung.

Greer legte der song und der test mit drei Modellen, die er entwickelt hatte, um vorherzusagen, genre: mit nur Akkord-Einbettungen, nur lyric Einbettungen und mit Akkord-und-Lyrik Einbettungen kombiniert. Er trainiert das system, das auf ein dataset mit 190,165 musikalische Segmente von 5,304 pop-songs mit Texten und entsprechenden Akkorde.

Während die meisten genre-Prognose-tools, ein Lied, das gesamte audio-Datei, was bedeutet, dass das abrufen und die Verarbeitung eine qualitativ hochwertige Aufnahme, Greer ‚ s Methode klassifizieren genre mit nur Akkorde und lyrics, die in der Regel online verfügbar mit einer schnellen Google-Suche.

„Dieses zusammenspiel von Akkordfolgen und lyrische Sequenzen gibt uns einen besseren Einblick in, wie wir wahrnehmen-genre als entweder allein, obwohl sich beide Modalitäten enthält nützliche Informationen allein, wie gut“, sagte Greer.

Die Studie liefert ein besseres Verständnis dafür, wie wir wahrgenommen und Musik verarbeiten, insbesondere die Unterschiede in der menschlichen Musik-Wahrnehmung-und-Kategorisierung-von Musik-Genres, je nach „looking glass“ verwendet.

Anwendungen umfassen, wie Musik vermarktet wird, verbraucht und getaggt; Neuropsychologie und die Mechanismen des menschlichen Denkens; und affective computing-Systeme, die Auswirkungen der menschlichen Emotionen.