ChatGPT, TTS, Midjourney… in der Podcastproduktion eröffnet Künstliche Intelligenz aktuell ganz neue Möglichkeiten. Manche davon sind mit Vorsicht zu genießen, andere erleichtern die Arbeit. Oder machen einfach Spaß.

Viele von uns klicken sich dieser Tage atemlos durch die neuesten KI-Anwendungen. Die Zurufe kommen ja von allen Seiten. Meine Nachbarin gibt mir im Treppenhaus Tipps zum Textgenerator ChatGPT, der Bürokollege probiert gerade die Text-to-Spech-Engine von Google aus und mich führt ein Link zu Midjourney. Wo ich gleich mal einen Text eingebe, um ein Coverbild generieren zu lassen. Und das sind nur drei von vielen KI-Anwendungen, die sich für die Podcastproduktion nutzen lassen. Gewusst wie – und wofür.

Eine KI, die flott antwortet und schnell Überblick verschafft

Das heiß diskutierte ChatGPT findet bei meinem ersten Test überraschend sinnvolle Antworten. Etwa auf die Frage „Wie sollte ein Wissenschaftspodcast konzipiert werden?“ Der Chatbot von Open AI zögert nur eine Sekunde. Dann tippt er los: „1. Klare Struktur: Ein Wissenschaftlicher Podcast sollte eine klare Struktur haben, um die Zuhörer zu führen und ihnen das Verständnis zu erleichtern. Dazu gehört zum Beispiel eine Einführung ins Thema, die Darstellung von Hintergründen und Ergebnissen, sowie ein Fazit oder Ausblick…“ Nicht schlecht, vor allem wenn die nächsten Punkte „verständliche Sprache, Interaktion, Verweise und Quellen“ heißen.

In genau solchen Aufzählungen besteht die Stärke des selbstlernenden Algorithmus, der mit umfangreichen Trainingsdaten gefüttert wurde, die bis ins Jahr 2021 reichen. Die Textausgabe ist also nicht topaktuell und es schleichen sich Fehler ein. Auch einen roten Faden durch den Podcast schafft die KI allenfalls nach Schema F – aber die meistgefragten Aspekte eines Themas lassen sich mit einem Klick einsammeln. Schlichte Shownotes schafft ChatGPT ebenso wie die Ausgabe relevanter Keywords. Originelle Teaser eher nicht.

KI-Nutzung und Studierendenpodcasts

Auch Studierende werden Textgeneratoren zunehmend für schriftliche Arbeiten nutzen. An manchen Hochschulen gibt es deswegen Aufruhr. Für mich heißt das, dass ich in meine nächsten Workshops zu Lehrpodcasts ein neues Format aufnehme: das Audiolerntage„buch“. In 1- bis 2-minütigen Audioaufnahmen können Studierende beispielsweise dokumentieren, auf welche Weise sie sich gerade mit dem Gegenstand der Lehre auseinandersetzen, und ihre Lernerfahrungen beschreiben. Die Audios sind später nicht nur Beleg der eigenständigen Arbeit (die KI gezielt miteinbeziehen kann), sie können auch dem Austausch dienen und Lernprozesse verbessern helfen. Wenn gewünscht, kann Speech-to-Text-Software das Audio wieder in einen Text verwandeln.

Schöne Stimmen… leider ohne Schwung und Empathie

Text-to-Speech-Software erfreut alle, die sich Texte gerne mal vorlesen lassen. Inzwischen ist sie ziemlich ausgereift. Einige der angebotenen deutschen Stimmen, wie „Kilian“ auf play.ht, klingen durchaus angenehm. Seit dem Start von Siri und Alexa hat sich hörbar einiges getan. Können wir nun – dank KI – Manuskripte einfach direkt in Audios umwandeln lassen? Sicher. Wenn man bereit ist auf das zu verzichten, was sich neben purem Inhalt über Stimmen normalweise noch vermittelt: Einfühlung, Engagement, Spontaneität, Verbindung. Hier tun sich Welten auf. Ob ein Text verlesen wird, oder ob jemand seine Gedanken teilt, in eine lebhafte Diskussion einsteigt, oder als Expert*in spontan auf eine Frage antwortet, sich beim Denken zuhören lässt – das macht einen großen Unterschied. In einer Hinsicht sind TTS-Einbindungen allerdings unverzichtbar: wenn es um barrierefreies Lernmaterial geht.

Coole Cover-Optik – mit überraschenden Effekten

KI-gefertigte Podcastcover, würde ich prophezeien, wird es in den nächsten Monaten immer mehr geben. Mir hat es auch Spaß gemacht, zu schauen, was Midjourney aus meinen Anweisungen macht. Hierzu musste ich über Discord gehen. Das Foto zu diesem Artikel entstand bei diesem Test. Eingegeben habe ich ins Textfeld: „scientist with headphones speaking in a podcast microphone in laboratory“. Zwölf Variationen lieferte mir die Anwendung, die oben stehende habe ich ausgesucht. Gut, vielleicht hätte ich „Labor“ und „Mikrofon“ im Anweisungstext noch trennen sollen. Wer es seriöser mag, kann sein Podcast-Cover auch mit einer kostenlosen Grafik-App wie Canva erstellen. Unter „text to image“ ist übrigens auch hier bereits eine KI integriert.

Kategorien: Podcast