AI/ neuronale Netzwerke für Effekte, Mixing

engineer · 16.03.24

Und zum Dritten

Angewendet auf die Musik heißt das nun: Man muss die Prinzipien der Mischingenieure und Komponisten auf die Maschine bringen, sie per Zufall komponieren lassen und dann eine Gruppe von Personen die Bewertung durchführen lassen. Dann kann sich die KI optimieren und ihre Gleichungen anpassen, so wie ein Musiker lernt, was ankommt und was nicht und entsprechend handelt. Momentan ist es so, dass die "Arbeitsmusiker" das komponieren, was bei der Plattengesellschaft ankommt. Diese Aufgabe kann eine KI locker erledigen! Sehr locker sogar. Das Gleiche gilt für das, was ein typisches Master MIX Ergebnis ist. Da gehe ich schon mit. Aber ist das Intelligenz ? Dann kann ich auch Zufallsmusik einreichen und warten, was angenommen wird.

Gerade bei der Komposition sehen wir ja, dass es eben die Musiker mit Anspruch sind, die NICHT mainstream komponieren, weil sie echte Kreativität und Kunst über den Kommerz stellen. Natürlich kann auch eine KI angewiesen werden, konträr zum main stream zu bauen. Sie kommt aber von selber nicht auf die Idee. Man muss es ihr sagen und sie so programmieren, dass sie es kann. Sie muss den main stream erkennen und dann etwas mit genug Abstand davon produzieren.

Welche KI könnte z.B. so komponieren, wie Ligeti? Oder wie Stockhausen? Nur eine, die mit dessen Musik gefüttert wurde und dann probiert den Stil nachzustellen. Aber einen neuen Stil erfinden kann sie nicht. Ligeti und Stockhausen haben neue Stile erfunden und eine Niesche geschaffen. Eine Software kann nur, wozu sie programmiert wurde.

Wenn sie dazu programmiert wurde, Standardmusik zu machen, was ja gamcht wird! - dann tu sie das eben. Ende. Das ist keine Kreativität.

Man könnte höchstens einen Fall annehmen, dass der Programmierer einen dummen Fehler macht und sich daraus etwas entwickelt, was bei manchen Menschen gut ankommt, was dazu führt, dass es sich ausbreitet und dann manifestiert. Ich will nicht ausschließen, dass es das mal gibt, aber die Chancen dafür sind gering. Gleichwohl seien zwei Beispiele genannt:

1) Hier findet sich ein Synthesizer-Song von mir, der entstanden ist, weil ich einen Pointer in meinem FPGA-Synthesizer falsch herum programmiert hatte. Der RAM-Speicher drehte in die falsche Richtung (Beim FPGA-Design passiert es infolge der ->Delay-FFs, die die Rechenpfade ausgleichen, recht rasch, dass man sich verzählt.)

So schön können Rechenfehler sein

www.mikrocontroller.net

2) Gleich unten drunter sind Bilder, die anzeigen, wie Fehler in digitalen Rechnungen aussehen können. Es sind die Abweichungen von echter Real- und Int-Berechnung. Das sieht bisweilen sehr gut aus und bildet Muster. Daraus habe ich später auch dedizierte Bildgeneratoren gebaut. Es ist aber keine Intelligenz, sondern ein Unfall der Evolution.

Andere Fehler, die ich im Synthy beim Umbau der Schaltung mache, führen einfach nur zu Chaos und schlimmem Kreischen! Das einzige was geht, ist Sounds gezielt rückwäerts abzuspielen und die Parameter zu invertieren etc und dann zu schauen, was kommmt.

Biologen werden jetzt natürlich sagen, daß sich KI-Software genau so entwickelt und den Vergleich bringen, dass sich hier die Eigenschaft "schön falsch rechnen" in der Natur der Elektrotechnikfreunde durchgesetzt - und deswegen diese FPGA-Software "überlebt" hat, während die anderen "ausgestorben" sind. Ob es sich aber dauerhaft hält, wird davon abhängen, wer mir den Kram nachbaut

Neue Sounds lassen sich übrigens sehr viel leichter finden, wenn man die Zufallsfunktion bei den Synthies nutzt. Das konnte aber schon ein Virus vor 25 Jahre. Aber wie gesagt, nix Neues.

losch · 16.03.24

engineer schrieb:
Alles was Computer an neuen Klassen und Typen erkennen können, das können sie nur, weil der Programmierer vorgesehen hat, Unbekanntes ersatzweise als Neues zu klassifizieren und Kriterien gesetzt hat

Du verfügst offenbar über große Kompetenzen der konventionellen Informationsverarbeitung und hast sie hier ausführlich beschrieben.

Allerdings hat die derzeitige Entwicklung im Bereich KI sehr wenig mit dem zu tun, was seit 30 Jahren in dieser Hinsicht gängig war.

KI arbeitet eben nicht unbedingt strikt deterministisch, wie du es nahelegst. Gleiche Abfragen führen z.B. eben nicht zu gleichen Ergebnissen. Die Arbeitsweise ist eine völlig andere, als die der konventionellen Informationsverarbeitung,

Christian_Hofmann · 16.03.24

losch schrieb:
KI arbeitet eben nicht unbedingt strikt deterministisch, wie du es nahelegst. Gleiche Abfragen führen z.B. eben nicht zu gleichen Ergebnissen. Die Arbeitsweise ist eine völlig andere, als die der konventionellen Informationsverarbeitung,

Aber die KI hat trotzdem Einschränkungen. Simples Beispiel: ich arbeite an einer Improvisation an der Orgel. Dann fällt mir an diesem Instrument und diesem Raum eine besondere klangliche Wirkung auf bei einer Kombination, die theoretisch und praktisch eigentlich totaler Unsinn ist, trotzdem wirkt es in dem Raum trotz aller Regelbrüche klanglich sehr gut. Ich kann nun mit meinen ganzen Sinnen sagen, dass dies für klingt und ich damit arbeite. Könnte das eine KI auch?

Blumfeld · 16.03.24

Ein letztes mal sage ich noch etwas zu dem Thema.
Die Antwort auf deine Frage: Ja. Und noch viel mehr.
Es geht um die Lernmodelle. Die Lernmodelle sind inzwischen so ausgereift das sie ALLES können. Je nach Fragestellung. Googles Alpha Go hat, nachdem sie den Go Weltmeister geschlagen hat sich selber Schach Spielen beigebracht. Man hat ihr die Regeln erklärt und danach hat sie in einem Monat mehrere Milliarden Partien gegen sich selber gespielt. Nun ist sie besser als alle anderen Schachcomputer.
Wenn ich ein Modell trainiere bei Musik auch auf Auswirkungen im Raum zu achten und dabei psychologische und physiologische Besonderheiten des Menschen zu beachten wird sie das in kürzester Zeit können.
Im Moment werden die Modelle Weltweit auf Situationen angepasst und man sieht fast täglich Verbesserungen oder Neuerungen mit denen man gar nicht gerechnet hatte.
Von daher hat mein Vorredner "losch" auch recht und mein Vorredner "engineer" nicht. Das was er sagt war "früher", "damals", "vor unserer Zeit", "vor KI".

goorooj · 17.03.24

Auch wir sind trainiert, unser Musikgeschmack ist angelernt.
Antrainiert, anhand von Beispielen die wir seit frühester Kindheit vorgesetzt bekommen. Wir mögen, was wir kennen.

Andere Arten von Musik in anderen Ecken der Welt existieren, die mit dem was wir hier habene her nichts zu tun haben.
Die wurden genauso angelernt.

Es gibt allerdings bedeutend weniger Musik im Netz als Bilder. Das heisst, potentiell viel weniger Trainingsdaten. Bild- und Videoanwendungen sind die Low Hanging Fruits im KI-Bereich.
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.

losch · 17.03.24

goorooj schrieb:
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.

Versuche dich mal hieran https://www.musiker-board.de/thread...nien-heraushoeren-mit-ki.745847/#post-9626252

Moises kann das mittlerweile nicht nur mit Basslinien wirklich erstaunlich gut! So gut, dass sie das für mich nun immer öfter mit allen möglichen Instrumenten tut. Für einen kleinen monatlichen Betrag. Ist es mir wert.

Telefunky · 17.03.24

Blumfeld schrieb:
Von daher hat mein Vorredner "losch" auch recht und mein Vorredner "engineer" nicht. Das was er sagt war "früher", "damals", "vor unserer Zeit", "vor KI".

Imho gehen die Beiträge von @engineer eher Richtung: wird alles nicht so heiss gegessen, wie es (momentan) gekocht wird.

Mein ältestes Buch über Neuronale Netze ist Jahrgang 1988, Cognizers (Neural Networks and Machines That Think) von Johnson/Brown, Wiley Verlag.

Christian_Hofmann · 20.03.24

goorooj schrieb:
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.

Ehrlich gesagt glaube ich, dass der normale Zuhörer das nicht einmal kann und somit auch nicht wirklich ziehführend wäre. Für den gewöhnlichen Zuhörer spielt es ja keine Rolle welches Instrument nun was macht, da zählt der Gesamteindruck.

Ich würde einmal von mir selbst behaupten ein gutes Gehöhr zu haben, ich kann Muster erkennen und nachspielen, ohne die Noten zu kennen. Da ich aber überwiegend Orgel und Harmonium spiele, komme ich dort schnell an die Grenzen. Ein Stück mit einem einzelnen 8" gespielt ist kein Problem. Kommt noch ein 4" dazu wird es schwerer. Wenn ich nun die Registrierung nicht kenne und diese auch variiert wie 8", 4", 2" dann vielleicht den 2" durch eine Quinte oder einem 1 1/3" ersetzt oder gar eine Mixtur, dann ist es nahezu unmöglich noch zu sagen welche der gehörten Töne auch tatsächlich gespielt wurden. Spiele ich auf einen 8" ein mittleres c und nehme den 4" dazu, dann erklingt zusätzlich das c eine Oktave höher mit, oder wenn ich die Quinte dazu nehme, dann drücke ich weiterhin das c, aber es erklingen beide c und noch das g.

Jetzt Versuche zu ermitteln ob nur das c gespielt wurde oder die einzelnen Töne. Eine KI kann die Töne wohl erkennen, ob die darauf resultierenden Noten auch spielbar wären ist eine andere Frage.

marcel22 · 21.03.24

Habe gerade diesen Artikel über eine Zusammenarbeit von Roland und Universal gefunden, die KI zur Produktion von Musik nutzen möchten. Der Mensch, als Produzent von Musik, soll dabei aber im Mittelpunkt bleiben.

Musikmachen mit KI: Roland & Universal Music setzen auf Synergie

Roland und Universal Music Group, zwei große Firmen der Musikindustrie, haben ihre Partnerschaft in Sachen Musikmachen mit KI verkündet.

www.gearnews.de

engineer · 22.03.24

Telefunky schrieb:
Imho gehen die Beiträge von @engineer eher Richtung: wird alles nicht so heiss gegessen, wie es (momentan) gekocht wird

Nur zur info: Ich und andere arbeiten ja beruflich an und mit solchen Systemen - derzeit sogar recht intensiv, während die Meisten, die sich hier und anderswo dazu äußern, ihre Erfahrungen aus user-Sicht beisteuern. Da sind viele von dem überwältigt, was die Protagnoisten als Ergebnisse und Beispiele posten, vergessen aber, dass dies die gut funktionierende Spitze des Eisberg ist. Von den vielen Fehlschlägen und Ausfällen, die nicht zum Erfolg geführt haben, wissen sie nichts, weil sie ihnen nicht präsentiert wurden. Wenn du aber direkt an der Materie arbeitest, siehst du real, wie es mit den Fortschritten aussieht. Wie jemand eingeworfen hat, sind die Strukturen die für KI eingesetzt werden, seit Jahrzehnten erkannt und formuliert. Die Fortschritte, die man jetzt macht, liegen überwiegend an der Realisierbarkeit infolge von vorhandener Hardware.

Zum dem Beispiel Schach z.B. ist z.B. zu sagen, dass schon seit 25 Jahren jeder Schachcomputer jeden Großmeister schlägt, weil er einfach schneller ist. Das ist aber keine wirkliche Intelligenzleistung und sich das Spiel durch Ausprobieren selber beizubringen, eine reine Leistung der Zeit. Ich selber habe Ende der 1990er am Rechenzentrum ein solches Programm geschrieben, dass alle Kombis durchprobiert, indem es rekursiv jede Partie zu Ende spielt, bewertet und die Partien, die auf Sieg gehen markiert. Man muss dann nur eine aktuelle Partie die man spielt identifizieren und in der angelegten Bib suchen, um ab da einen bekannten Weg weiterzugehen. ch behaupte, dass es in diesem Forum wenigstens 10 Leute gibt, die genug Programmieren können, um aufgrund dieser Angaben, so ein Programm direkt runterschreiben können. Es ist wie gesagt nur eine Frage von Tempo und Speicher. Der Mechanismus ist simpel und die Schachregeln sind es auch. Die kann man an einer Hand abzählen. Die anscheinend gigantische Menge an Möglichkeiten beim Schach ist aus Computersicht winzig und leicht testbar.

Im täglichen Leben gibt es überwiegend Fälle, die nicht nach so einfachen Regeln laufen - oft auch gegen eine Regel ablaufen - und einen Fall aufwerfen, der nicht von der KI gelernt wurde und folglich auch kein Muster oder Methode exisitert, weil es kein Kriterium für richtig oder falsch gibt. D.h. die KI kann ohne Hilfe und Input nicht entscheiden, ob eine Methode eine gute Lösung lieferte oder nicht - anders als beim Schach.

Mein Schachprogramm scheiterte damals auch eben genau an Speichergrößen und Rechenzeit. Eine Verbesserung war, die Partien nicht zuende zu spielen und sie vollständig zu bewerten, sondern mittendrin abzubrechen und die Lage zu bewerten. Wenn man dann rekursiv in die Tiefe geht und mit dieser Lagebewertung zurückkommt, reicht es auch schon um eine Zugfolge zu bewerten. Leider reichte auch das nur bis 4-5 Züge für ein volles Brett. Gute Schachspieler denken aber angeblich 10 Züge voraus. Am Ende also eine Frage der Rechenzeit.

losch · 22.03.24

Es dreht sich im Kreis https://www.musiker-board.de/threads/ai-neuronale-netzwerke-fuer-effekte-mixing.713042/post-9654724

In Rekursionen immerhin bist du auch gut...

Blumfeld · 22.03.24

engineer schrieb:
Die Fortschritte, die man jetzt macht, liegen überwiegend an der Realisierbarkeit infolge von vorhandener Hardware.

Und auch hier: Das war "früher", "damals", "vor unserer Zeit", "vor KI". Meine KI Systeme laufen auf Gaming Rechnern. Völlig undenkbar früher. Deine Aussaggen sind einfach falsch. Aber was solls.

MaxJoy · 22.03.24

RipX ist nirgendwo in diesem Thread erwähnt, dabei ist das doch genau das, was hier gesucht ist: Ein AI-gestützte Software, mit der man fertige Mixe auseinander nehmen und die Spuren direkt manipulieren kann (Spuren als Audio oder Midi exportieren, Samples direkt im Mix verschieben oder austauschen etc.).

View: https://www.youtube.com/watch?v=RntacVYLnAo

Telefunky · 22.03.24

Blumfeld schrieb:
Meine KI Systeme laufen auf Gaming Rechnern. Völlig undenkbar früher. Deine Aussaggen sind einfach falsch. Aber was solls.

Ich wüsste nicht, was daran falsch sein soll :gruebel:

Als die Grundlagen dieser Technik entwickelt wurden, gab es halt noch keine geeignete Hardware für den praktischen Einsatz.
Und auch noch keine einfach verfügbaren Quellen von Massendaten.
Oder glaubst du ernsthaft, dass man mit dem Design erst angefangen hat seit es „Gaming Rechner“ gibt ?

Blumfeld · 22.03.24

Telefunky schrieb:
Ich wüsste nicht, was daran falsch sein soll

Alles. Weil KI Systeme einfach nicht so funktionieren.

goorooj · 22.03.24

Ich habe gerade in suno.ai den prompt eingegeben: "FOLK Song, a witch cursing the Land because a Farmer killed her "my little pony""

Das ist komplett computergeneriert, den Text hat sich suno.ai von chatgpt geholt. Die Stimme ist auch computergeneriert, ebenso der Mix etc. ... alles.
Und jetzt sag nochmal dass KI das nicht irgendwann beherrscht.

Curse of the Witch's Revenge | Suno

haunting acoustic folk song. Listen and make your own with Suno.

app.suno.ai

Natürlich ist das hier noch ausbaubar, aber das ist v3 ... schauen wir bei v5 mal weiter

Blumfeld · 22.03.24

NVIDIA hat gerade den neuen KI Chip B200 vorgestellt. Damit kann man ChatGTP in 3 Minuten trainieren -anstatt 2 Jahre wie bei ChatGTP 3.5 - das wird die Trainigskosten (Mietzeit von Supercomputern) dramatisch verringern. Dann werden auch kleinere Projekte rentabel. Im Moment kostet KI Trainig noch ca. 500k € aufwärts.

MaxJoy · 23.03.24

goorooj schrieb:
Und jetzt sag nochmal dass KI das nicht irgendwann beherrscht.

Folksongs sind natürlich nicht gerade überkompliziert, aber sie so hinzubekommen, ist große Kunst. Das Lied ist gut und klingt sehr authentisch, ich bin beeindruckt.

adrachin · 23.03.24

Tja. So unterschiedlich sind die Bewertungen. Ich finde das ist bestenfalls eine grobe Skizze, die vielleicht mal ein Song werden kann. Mal abgesehen von dem Kraut und Rüben Text.....

trichtersoft · 23.03.24

Was dort auf der Website als Beispiele aufgeführt wird ist aber schon ziemlich beeindruckend.
Insbesondere bei Powermetal (wo gefühlt jeder zweite Track gleich klingt

).

Unleash the power | Suno

High energy intense powermetal, epic song. Listen and make your own with Suno.

app.suno.ai

AI/ neuronale Netzwerke für Effekte, Mixing

Beiträge mit meisten Reaktionen

So schön können Rechenfehler sein

Musikmachen mit KI: Roland & Universal Music setzen auf Synergie

Curse of the Witch's Revenge | Suno

Unleash the power | Suno

Quick Links

Plugins / Audio-Apps zu reduzierten Preis: Groupbuys, Discounts,...

Native access update auf neueste Version geht nicht

Room Reverb für 90s Sound