Epilog und Ausblick¶
Was ist, was wird?
- Bild- und textgenerierende KI-Systeme lassen sich mit Hilfe von Open-Source-Software innerhalb von Minuten aufsetzen.
- Die Auswahl an verfügbaren Modellen ist groß und wird täglich größer.
- Zum Betreiben eines eigenen KI-Systems reicht ein handelsüblicher Rechner mit leistungsfähiger Grafikkarte.
- Erfahrungen mit selbstbetriebenen Systemen lassen sich zum großen Teil auf kommerzielle Dienstleistungen übertragen und umgekehrt.
- Die aktuelle 'Goldgräberstimmung' wird perspektivisch durch Übernahmen und eine damit einhergehende 'Marktkonsolidierung' abgelöst. Die Folge davon ist wahrscheinlich Enshitification.
Bonus: Txt2Img -> Img2Snd¶
SD-Modelle können darauf trainiert werden, Bilder von Spektrogrammen auszugeben. Diese können dann in Musik umgewandelt werden. Nachfolgend kann Sprache, die durch Text-to-Speeche erzeugt wurde, in ihrer Modulation und Tonalität auf die Musik angepasst werden.