Untertitel von Sendungen in der Vergangenheit
-
Guten Tag,
für ein Forschungsprojekt benötige ich den Inhalt von Nachrichtensendungen des ÖRR in Textform. Bei der Recherche bin ich auf MediathekView gestoßen, das viele meiner Datenprobleme zu lösen scheint. Alle Nachrichtenformate, die ich benötige, sind zumindest für die jüngste Vergangenheit vorhanden, und ich komme über das Programm bequem an die Untertitel, die ich wiederum für die Analyse nutzen kann.
Nun meine Frage: Je weiter es in die Vergangenheit geht, desto lückenhafter wird die Verfügbarkeit, d.h. nicht mehr alle der täglich ausgestrahlten Sendungen sind im Archiv von MediathekView verfügbar. Werden diese nach einiger Zeit gelöscht, oder gibt es mögliche Lösungswege, um an die Untertitel von Sendungen zu kommen, die etwa ein, zwei oder sogar mehrere Jahre in der Vergangenheit liegen? Mit MediathekView oder anderweitig?
Für jeglichen Hinweis bin ich dankbar!
Viele Grüße -
@fabianbios Du hast eine falsche Vorstellung: MediathekView hat kein Archiv. Es ist “nur” eine sinnvolle Oberfläche für Leute, die wissen, was sie sehn wollen, aber an den zwar kunterbunten, doch unstrukturierten ÖRR-Mediatheken verzweifeln.
Die ÖR-Sender haben Archive. Im Zweifel müsstest du da nachfragen. MediathekView findet nur, was beim ÖRR öffentlich verfügbar ist. -
@_Katharina sagte in Untertitel von Sendungen in der Vergangenheit:
MediathekView hat kein Archiv.
Das so nicht richtig. Bei MVs eigenen Daten gibts sehr wohl eins. Tut aber nichts zu fabianbios’ Sache.
Aber: MV speichert nur Metadaten & die URLs zu den eigentlichen Dateien und keinerlei Inhalte (weder Video, noch Audio, noch UT).
Ansonsten gibt’s einen aktuellen Rundfunkstaatsvertrag, der regelt, wie lang welche Art von Sendung online bleiben darf. Daher wird man auch keine ÖR-Inhalte egal in welche Form finden, die viele Jahre alt sind. Die tagesschau offenbar bis zu vier Jahre und dann immer lückenhafter je länger es her ist…
-
@fabianbios wenn die Sendungen in den Mediatheken heute noch abrufbar sind, kann MediathekView diese auch finden.
Aufgrund der Laufzeit der Crawler werden die Mediatheken nicht in der vollen Tiefe permanent durchsucht.Wenn die für einzelne Sendungen alte Folgen fehlen, kannst du mit etwas Programmierkenntnis durchaus den Crawler so anpassen, dass du gezielt die notwendigen Sendungen suchen kannst.
Ansonsten kannst du hier auch schreiben, was dir fehlt und ich schaue bei Gelegenheit, ob wir den Crawler diese Sendungen mal in der vollen Tiefen suchen lassen können. -
@_Katharina Danke für die Rückmeldung. Mit den Archiven der einzelnen Sender bin ich in Kontakt. Die Archivierung ist hier allerdings sehr unterschiedlich, meist werden die Untertitel nicht archiviert und keine Transkripte erstellt. Insofern scheint MediathekView als eine der wenigen gangbaren Lösungen zu sein.
-
@tvRR Danke. Die URL würden mir tatsächlich schon weiterhelfen. Nur müsste ich die ermitteln können für Sendungen in der Vergangenheit, selbst wenn sie derzeit nicht in MediathekView sind. Wäre die Frage, ob das nachträglich ginge.
-
@pidoubleyou Danke für die Rückmeldung. Wenn es generell möglich ist, wäre das natürlich super. Meine Programmierkenntnisse reichen sicher nicht aus, ggf. müsste ich mir Hilfe holen. Kann ich dich per DM oder E-Mail direkt für weitere Details kontaktieren?
-
@fabianbios sagte in Untertitel von Sendungen in der Vergangenheit:
@tvRR Danke. Die URL würden mir tatsächlich schon weiterhelfen. Nur müsste ich die ermitteln können für Sendungen in der Vergangenheit, selbst wenn sie derzeit nicht in MediathekView sind. Wäre die Frage, ob das nachträglich ginge.
Ja, die alten Filmlisten sind im Archiv.
-
@fabianbios sagte: Die Archivierung ist hier allerdings sehr unterschiedlich, meist werden die Untertitel nicht archiviert und keine Transkripte erstellt.
Solange du zu den Videos kommst, aber Untertitel dazu fehlen, dann kannst du aus den Videos mithilfe von Whisper-Faster (Windows, Linux) oder mithilfe von MacWhisper kostenlos und ohne Einschränkungen in Sachen Dateigrösse/Datenschutz entsprechende Transkripte lokal generieren.
Ersteres ist zwar ein Kommandozeilen-Tool, kann aber dank einer Batchdatei (Anleitung) einfach genutzt werden.@fabianbios sagte: Nur müsste ich die ermitteln können für Sendungen in der Vergangenheit, selbst wenn sie derzeit nicht in MediathekView sind.
Im MV-Archiv für Filmlisten wirst du auch definitiv viele Einträge finden, die auf Sendungen verweisen, die es auch in den Mediatheken nicht mehr gibt.
-
@fabianbios ÖRR in Deutschland oder deutschsprachig?
Aus Erfahrung kann ich sagen, dass es bei ORF durchaus möglich ist, die Untertitel zu Beiträgen herunterzuladen, die längst depubliziert wurden…