Musik-Generator:
Über die Entwicklung von ANT POP MACHINE

Roman Gilad beschäftigt sich seit vielen Jahren mit kreativer künstlicher Intelligenz und gründete vor sieben Jahren den Musik-Service ANT POP MACHINE. Heute kämpft er als CEO um das Überleben in der Nische, denn die großen Musikvermarkter haben mächtig nachgelegt. Frustriert, aber leidenschaftlich erscheint er bei unserem Treffen in seiner Wahlheimat Berlin und spricht offen über fehlgeleiteten Perfektionismus und unfaire Herausforderungen.  

(Lies auch unseren Test zum ANT POP MACHINE-Update)


Roman, vor sieben Jahren hast du ANT POP MACHINE gestartet. Hast du eine Ahnung, wie viele Musikstücke der Service seither generiert hat?
Das wissen wir sogar ziemlich genau. Du könntest aber auch selbst den Service fragen. Er ist da sehr auskunftsfreudig.

Tatsächlich? Und was wäre die Antwort?
Moment… Gerade wird das 252.908.734ste Musikstück gespielt.

Eine beeindruckende Zahl. Da können doch die Unterschiede zwischen den einzelnen Stücken oft nur winzig sein. Wie sorgt ihr bei dieser Überfülle noch für so etwas wie echte Abwechslung?
Wiederholung ist in der Musik kein Verbrechen… ganz im Gegenteil, sie ist ein wichtiger Bestandteil. Mein Vater hat früher als DJ gearbeitet, DeepHouse, Techno, Dubstep, so das Zeug eben. Er hatte eine riesige Plattensammlung. Wenn mein Opa dann zu Besuch kam, gab es regelmäßig Streit. Er baute sich vor dieser wirklich großen Regelwand auf und behauptete dann genüsslich, dass exakt eine Platte gereicht hätte, da sowieso immer das Gleiche darauf zu hören ist. Mein Vater ist wahnsinnig geworden und hat nie aufgehört ihm die Details näherzubringen. Aber es war hoffnungslos, mein Opa blieb bei seiner Meinung.

Du meinst: Beide hatten Recht?
Genau. Langweilig oder aufregend, das wird letztlich beim Musik hören entschieden. Aber um auf deine Frage zurückzukommen: Natürlich wird es bei dieser immensen Anzahl Musikstücke geben, die sich ähneln, aber das ist keine Unfähigkeit des Systems. Mal davon abgesehen, dass niemand 250.000.000 Musikstücke hört, sondern höchstens ein paar Hundert, möchten Menschen Musik, die sich in bestimmten Parametern wiederholt, weil ihnen eben genau diese Musik gefällt. Unser Service erkennt diese individuellen Eigenheiten und kann darauf reagieren. Da gibt es Hörerinnen oder Hörer die wollen lieber sehr gleichklingende Musik, während andere immer wieder überrascht werden wollen. Darauf können wir uns einstellen.

Ok, dann lass mich die Frage nochmal anders stellen. Menschliche Musikschaffende können in ihrem Leben vielleicht ein paar Hundert Stücke komponieren, aber die tragen dann auch eine sehr individuelle Handschrift. Wie kann bei diesem immensen musikalischen Output noch irgendetwas Außergewöhnliches herauskommen?
Duke Ashford sagte mal, jeder Song ist ein Hit, du musst nur die richtigen Hörer finden.

… und er meinte das ironisch!
Erwischt! Aber dieses Zitat passt so gut zu dem, was wir machen, da muss ich es einfach bringen.

ANT POP MACHINE produziert also Hits am laufenden Band?
Im besten Fall… aber persönliche Hits und das ist ein großer Unterschied.
Meiner Meinung nach ist das Konzept des Hits im Sinne eines breiten Erfolgs weitgehend hinfällig. Natürlich gibt es immer noch menschliche Stars, die mit  entsprechendem Aufwand vermarktet werden und dadurch die erforderliche Aufmerksamkeit auf sich ziehen. Diese Art der Kulturproduktion ist ein altehrwürdiges Investitionsfeld, aber nicht das was wir machen. Und der Trend der letzten Jahre ist eindeutig. Auch die großen Stars sind in Wahrheit immer kleiner geworden und das Interesse der Hörerschaft verteilt sich immer weiter in Nischen. Es ist also gar nicht mehr so einfach einen großen Hit zu landen.

Und ihr liefert jetzt die Hits für die Nische?
Nicht für die Nische… individuell für jede Hörerin und jeden Hörer. Das ist unser erklärtes Ziel. Persönliche Hits. Die riesige Zahl vom Anfang sollte nicht davon ablenken, dass jedes Stück individuell und in Echtzeit erzeugt wird. Du hörst keine Konserve, sondern Musik, die zuvor noch nie jemand gehört hat und nach Dir auch niemand mehr hören wird, es sei denn du machst sie zum Favoriten oder übergibst sie der Community. Das ist wie eine persönliche Band, die Dich überall hin begleitet und Musik so spielt wie du sie hören willst.

Die Zeit der Stars und großen Hits ist also vorbei?
Jein, Menschen brauchen Stars als Projektionsfläche, aber es wird nicht einfacher. Du siehst ja wie sich die Musikindustrie windet und ihr Wohl vor allem darin sieht, andere zu verklagen.

Ich denke, du sprichst damit die Lizenzproblematik an.
Ja, und die hat sich wirklich zu einem gruseligem Thema entwickelt. Jemand schrieb vor kurzem: Das jüngste Gericht ist da und es kümmert sich um Lizenzrecht. Ich habe wirklich großen Respekt vor dem geistigen Eigentum anderer, aber was gerade passiert ist einfach absurd.

Kannst du ein Beispiel geben?
Leider einige. Aber vorweg ist mir was anderes wichtig. Wir haben uns schon vor dem Start unseres Services Gedanken zu diesem Thema gemacht, obwohl uns alle gesagt haben, dass wir uns nicht mit so einem Jura-Nerd-Kram aufhalten sollen. Aber unsere Beschäftigung mit dem Thema hat uns dazu gebracht, von Anfang an absolut konsequent auf jede Art von automatisierter Analyse urheberrechtlich geschützten musikalischen Materials zu verzichten und stattdessen die KI von Grund auf zu trainieren. Fähige und sehr musikalische Menschen haben ihr das Komponieren und Musizieren beigebracht und die Kompositionen werden auch heute noch mit Hilfe des Community-Feedbacks optimiert. Wir haben also nach vielen Jahren harter Arbeit ein System mit hervorragenden musikalischen Fähigkeiten geschaffen, dass einfach gute Musik machen kann ohne jemals ein anderes rechtlich geschütztes Musikwerk gehört zu haben.

Ihr habt euch also alle Mühe gegeben, den Problemen aus dem Weg zu gehen, aber es hat nichts gebracht. Warum nicht?
Weil wir uns in einer rechtlich undefinierten Situation befinden. Natürlich können wir nicht ausschließen, dass von den 250.000.000 Stücken auch mal eine Melodie klingt wie die eines rechtlich geschützten Stücks. Der Raum der Möglichkeiten ist zwar groß, aber doch nicht unbegrenzt. Leider gibt es inzwischen eine ganze Armee von Anwälten, die automatisiert Musikstücke mit unserem Service generiert und mit einer Datenbank von rechtlich geschützten Mustern ihrer Mandanten abgleicht. Leider finden sie gelegentlich mehr oder weniger übereinstimmende Parts und dann erhalten wir Klageschriften mit absurden Schadensersatzforderungen.

Du klingst verbittert?
Nein, bin ich nicht. Ich bin wütend, weil ich uns im Recht sehe, aber es keine belastbare Rechtsprechung und keine klaren Regeln gibt. Und das wird von einer starken Lobby gegen uns ausgenutzt. Aus diesem Grund haben wir uns mit einigen Firmen zur Interessenvertretung CUMU zusammengeschlossen, um nachdrücklich international verbindliche Standards für durch künstlerische Intelligenz erzeugte Musik einzufordern.

Hat euch denn diese ganze Unruhe und Unsicherheit bei der Weiterentwicklung von ANT POP MACHINE demotiviert? Immerhin habt ihr jetzt ein umfangreiches Update fertig gestellt.
Im Gegenteil. Unser Team war schon lange nicht mehr so motiviert wie im letzten Jahr. Jeder der bei uns arbeitet liebt die Firma und ganz besonders unser musikalisches Herzstück. Das ist nicht einfach nur ein großer Computer, das ist etwas mit Persönlichkeit zu dem jeder von uns eine ganz persönliche Bindung aufgebaut hat. Wer das jetzt kaputtmachen möchte, muss mit unserem Widerstand rechnen. Und der erste wichtige Schritt war es zu zeigen, dass wir noch da sind und weitermachen.

ANT POP MACHINE

Warum nicht ANT MUSIC MACHINE?

Einige haben erwartet, dass ihr mit diesem Update noch einen größeren Schritt macht und euren Service in ANT MUSIC MACHINE umbenennt und damit auch eine Erweiterung eures musikalischen Portfolios einläutet. Warum habt ihr das nicht gemacht?
Die Frage höre ich oft in letzter Zeit und es gibt darauf eine einfache Antwort. Wir lieben Pop über alles und deshalb ist die Beschränkung für uns eine natürliche Grenze. Außerdem sind wir ein kleines Team und können nicht alles machen. Für uns stand nie in Frage, ob wir mehr Breite oder mehr Qualität wollen. Solange wir den Eindruck haben, dass wir das Pop-Genre in all seinen Facetten nicht voll im Griff haben, werden wir kein anderes Musikgenre aufnehmen.

Als Außenstehende kann ich nur erahnen, was am Aufbau einer kreativen KI so aufwendig ist. Was macht ihr den ganzen Tag bei ANT POP?
Es sind unterschiedliche Ebenen, die für ein gelungenes Musikerlebnis verantwortlich sind und wir haben bei diesem Update auf allen Ebenen deutliche Verbesserungen erreicht. Nicht alles hat unmittelbar mit kreativer Intelligenz zu tun, aber letztlich laufen die Dinge dort natürlich zusammen.

Nenn doch mal ein Beispiel?
Stell Dir die unterschiedlichen Bereiche einer Musikproduktion vor. Jemand muss das Stück komponieren und arrangieren. Dann spielen Musiker die Komposition ein und abschließend wird abgemischt. Das ist jetzt sehr grob, aber jeder dieser Schritte bietet viel Potential für künstlerische Intelligenz. Doch bevor die vernünftig arbeiten kann, müssen kreative Möglichkeiten für sie geschaffen werden. Ich gebe Dir ein Beispiel: Das Physical Modelling von Musikinstrumenten gibt es schon sehr lange, also den Versuch die physikalischen Eigenschaften von Musikinstrumenten möglichst genau mathematisch nachzubilden. Da geht es dann nicht nur um den grundsätzlichen Klang des Instruments, sondern auch darum wie das Instrument gespielt wird. Dieses Zusammenspiel zwischen Instrument und Spieltechnik ist enorm wichtig für ein realistisches Klangbild. Der Ansatz war länger in einer Sackgasse, da die Berechnungen sehr ressourcen-intensiv waren ohne deutlich besser als andere Ansätze wie Sampling zu sein… Und es gab noch ein Problem. Es war für Musiker schwierig die Vielfalt der spielerischen Möglichkeiten wirklich abzurufen. Kein Eingabeinstrument war so sensible, dass es die komplizierten Wechselwirkungen zwischen Instrument und Spielweise intuitiv erfassen und an den Computer weitergeben konnte. In den letzten zehn Jahren hat sich das dramatisch verändert, denn jetzt ist nicht mehr nur das Instrument virtuell, sondern auch der Musiker.

Wenn du einem virtuellen Blues-Musiker unterschiedliche virtuelle Gitarren in die Hand drückst, verändert sich auch seine Spielweise – ist es das was du meinst?
Blues ist zwar nicht meine Musik, aber im Prinzip genau so. Konzertgitarre, Banjo, Resonatorgitarre – das Instrument wird Rückwirkungen auf die Spielweise oder sagen wir besser die Interpretation des Stücks durch den virtuellen Bluesmusiker haben. Es geht um sehr feine Nuancen, aber dadurch entsteht musikalische Glaubwürdigkeit. Instrumente müssen nicht immer perfekt klingen, aber authentisch und das hat eben auch etwas mit der Spielweise zu tun. Mit diesem Update stellen wir den virtuellen Musikern von ANT POP MACHINE fast 250 neue Instrumente zur Verfügung. Das gleiche haben wir auch mit der Studiotechnik gemacht und jetzt noch mal erheblich nachgelegt und verfeinert. Ein virtueller Musikproduzent kann jetzt aus einem wirklich sehr umfangreichen Katalog ein individuelles Studioszenario zusammenstellen, um ein bestimmtes Ergebnis zu erreichen. Ihm sind dabei Zeitgeist, Genre-relevantes Equipment, Mixertricks und vieles mehr sehr genau bekannt… er ist ein Vollprofi.

Letztlich habt ihr also kreative Intelligenzen fürs Komponieren, Spielen und Mischen?
Tatsächlich hat unsere Entwicklung so unterteilt angefangen – grob gesprochen. Das war zweckmäßig, da wir Teams auf die Teilbereiche ansetzen konnten. Außerdem ist es auch für uns einfacher von einzelnen Einheiten zu sprechen, die Komponieren, Instrumente spielen oder einen guten Mix machen. Am Ende ist aber alles eine zusammenhängende kreative Intelligenz – eben die ANT POP MACHINE. Und die muss möglichst kompakt arbeiten, sonst hätten wir keine Chance irgendetwas in Echtzeit zu produzieren oder Nutzerwünsche in Sekundenbruchteilen umzusetzen.

Da stimme ich Dir zu, die Echtzeitveränderungen funktionieren erstaunlich gut. Allerdings gab es diese Funktion ja schon länger. Was war denn die größte Herausforderung dieses Updates?
Die größte Herausforderung?… Die größte Herausforderung ist es einer nicht menschlichen kreativen Intelligenz zu erklären, was Menschen unter guter Pop-Musik verstehen. Wenn so eine kreative Intelligenz in einer Minute einige tausend Stücke ausliefert, die alle wie ein akustischer Amoklauf klingen, wie sagst du ihr das? Also wir haben uns sehr viel damit beschäftigt, die Grenzen des Pop-Genres noch mal klarer zu definieren. Das ist keineswegs trivial und erst recht nicht unstrittig. Es sind unsere Genre-Grenzen, wenn du so willst. Aber dieser Schritt war sehr wichtig, um der kreativen Intelligenz innerhalb dieser Grenzen mehr Spielraum zu geben. Das ist eine wichtige Grundlage für die Weiterentwicklung der nächsten Jahre… Stilsicherheit mit Abwechslung und Überraschung auszubalancieren.

Deine Antwort überrascht mich. Ich hätte gedacht, dass die neue Gesangsfunktion die größte Herausforderung war. Schließlich ist sie das vermarktete Hauptfeature eures Updates.
Tja … ein schwieriges Thema. Die Generierung von Gesang ist tatsächlich eine absolute Herausforderung.

Die ihr nicht gut gemeistert habt, wenn man der Kritik und eurer Community Glauben schenkt.
Die wir nicht meistern konnten, weil wir die Herausforderung nicht wirklich angenommen haben…  Es ist ja kaum zu überhören, dass die Ergebnisse bestenfalls mittelmäßig sind, also was soll ich um den heißen Brei herumreden. Wir hatten einen Entwicklungsplan über 18 Monate für dieses Update und das Thema ‚Gesang‘ tauchte nicht darin auf. Wir haben es schlichtweg nicht kommen sehen, dass  plötzlich alle Welt mit dem Gesangsfeature auf den Markt drängen wird. Aber so ist es gekommen und wir mussten darauf reagieren. Wir haben jetzt eine gute Basis auf der wir mit Hochdruck aufbauen werden. Es wird also schon bald ein Update geben, dass deutlich besser ist. Das gilt für die Texte, aber natürlich auch die Gesangstimmen und ihre muskalisch-emotionale Interpretation der Texte.

Aber warum habt ihr die Funktion dann überhaupt freigeschaltet, wenn ihr selbst nicht zufrieden seid?
Ich rede mich hier gerade um Kopf und Kragen, aber auch ich als CEO kann nicht immer alles alleine entscheiden. Für die Vermarktung war es zwingend, dass Feature anzubieten, sonst hätte alle Welt gefragt, ob ANT POP MACHINE den Trend verschlafen hat. Ich bin ehrlich… wahrscheinlich waren wir zu selbstverliebt mit unserem extrem hohen Anspruch an die Qualität der Musik. Wir machen das, weil wir ANT POP MACHINE lieben. Aber es geht natürlich auch ums Geld verdienen, also werden wir jetzt alles daran setzen, auch dieses Feature in der Qualität anzubieten wie alles andere bei ANT POP MACHINE auch… Das ist ein Versprechen an unsere Community.

Das sind ehrlich Worte. Aber eine letzte Frage noch: Du hast mal gesagt, eure lebendige Community ersetzt die fehlenden menschlichen Musiker. Habt ihr ein schlechtes Gewissen, weil ihr menschliche Musiker überflüssig macht.
Oh, das ist keine letzte Frage. Das ist ein ganzer Themenabend, den du da gerade ansprichst. Ich kann darauf nicht kurz antworten. Vielleicht nur so viel. Ich bin selbst Musiker. Das persönliche Erlebnis mit anderen Musikern zusammenzuspielen, wird keine künstlerische Intelligenz ersetzen können. Aus diesem Grund fördern wir auch verschiedenste musikalische Projekte, damit in Zukunft nicht weniger, sondern mehr Menschen Musik machen.

Wir sollten dazu wirklich mal einen Themenabend organisieren. Also dann… eine wirklich allerletzte Frage: Warum ANT?
Das ist ein Akronym. Es gibt nur zwei Menschen auf der Welt, die wissen wofür das steht und wir haben uns geschworen es für uns zu behalten. Also sorry, mehr kann ich Dir dazu nicht sagen.

Schade, das muss ich wohl akzeptieren. Roman, danke für deine Zeit.

Markus van Well