Bei KI-generierten Untertiteln sieht es anders aus als bei der Audiodeskription. Es gibt deutlich mehr Tools und sie sind weiter verbreitet. Das macht die Suche nach dem passenden Tool allerdings nicht einfacher. Natürlich könnte man die Texte per Hand schreiben, doch das kostet viel Zeit.

Bei der ersten Recherche haben wir erstmal geschaut, welche Arten an Untertiteln  gibt, denn Untertitel können verschiedene Zwecke erfüllen: In erster Linie dienen sie der Barrierefreiheit und ermöglichen es Menschen mit einer Hörbeeinträchtigung, verschiedene Inhalte, die eigentlich über den Ton vermittelt werden, zugänglich zu machen. Sie können aber auch Sprachbarrieren überbrücken und somit Inhalte in anderen Sprachen eröffnen.

In den sozialen Medien werden Untertitel vor allem zur Barrierefreiheit genutzt, sowie um die Verständlichkeit zu verbessern. Außerdem werden heutzutage immer mehr Inhalte auf den sozialen Medien ohne Ton wiedergegeben und dafür benötigt es ebenfalls Untertitel. Um unsere Sendungen barrierefreier zu gestalten, wollen wir den Zuschauer*innen und Zuhörer*innen die Möglichkeit bieten, das gesprochene Wort mitzulesen. Da dies bei einer halbstündigen Dokumentation natürlich eine Riesenaufgabe ist, wollen  wir uns hier die KI zunutze machen.

 


Programme zur Untertitelung

Nun zu Programmen beziehungsweise Webseiten, die wir uns rausgesucht haben, da es wirklich Unmengen an Anbietern gibt. Zu Beginn haben wir die Kategorie Professionelle Schnittsoftware. Aktuell gibt es drei große Programme für den Videoschnitt: Adobe Premiere Pro, Davinci Resolve und Avid Media Composer. Alle drei Programme fügen sich optimal in den Schnittbetrieb ein und bieten die Option, die automatischen Untertiteln komplett nach belieben zu bearbeiten.

 

Die nächste Kategorie sind die semiprofessionellen bis Einsteigerprogramme, welche man fast schon wie Sand am Meer findet. Deshalb haben wir uns auf Canva, Veed.io, Media.io und Capcut fokussiert.

In der letzten Kategorie sind die automatischen Untertitel der Sozialen Medien, insbesondere Youtube und Instagram.


Passende Filmausschnitte für den Test

Um die verschiedenen KI-Modelle vergleichen zu können, haben wir Filmausschnitte herausgesucht, die verschiedene Aspekte abdecken sollten. Aus unserem Film Der magische Ort der Jugend – Die Künstlerfamilie Arenz im Porträt“ haben wir uns eine Sequenz herausgenommen, die in unserem Test Hochdeutsch repräsentieren soll. Für Dialekte haben wir uns für das oberpfälzische Gedicht aus Unter Hochdruck – Die Original Hersbrucker Bücherwerkstätte” entschieden. Natürlich darf Fränkisch auch nicht fehlen. Hierfür haben wir uns für den Film Pottenstein –  eine trügerische Idylle” entschieden. Außerdem ist für unseren Vergleich gebrochenes Deutsch höchst interessant. Um das zu testen, nutzen wir Ausschnitte aus Frau, Leben, Freiheit – Iranische Aktivistinnen in Nürnberg”.

                                   

                                     


 

Das erstmal als ein grober Überblick. Im nächsten Schritt geht es für uns ans testen.
Unsere Ergebnisse dazu findet ihr, nachdem wir uns noch die Leichte Sprache angeschaut haben,
wieder hier in unserem Blog.