@DaDirnbocher sagte in Falsche ARD Mediathek Website-URLs:
@Andi34 sagte in Falsche ARD Mediathek Website-URLs:
Es geht immer noch um dasselbe. Bitte lies genau, was ich beschrieben habe.
LOL, Hab ich, darum habe ich ja festgestellt dass Deine Beschreibung “ARD aktuell 16:00” und der von Dir als richtig behauptete Link (SWR Aktuell Rheinland Pfalz 19:30") net zusammen passen.
Ich habe des jetzt erst geblickt, weil ich das Stream-MP4 nicht beachtet hatte.
Problem: Viele Sendungen erscheinen doppelt, einmal unter ARD, dann der gleiche Webseitenlink unter einem Regionalsender. Diese zu einem Datensatz zusammenzufassen wäre sinnvoll.
Das ist so gewünscht, Und zwar seit Jahren.
Nachvollziehbar. Es wäre auch zu aufwendig, das Datenmodell jetzt grundlegend zu ändern. Der Nachteil besteht darin, dass gleicher Content in der Suche (wenn nach Sender sortiert) mehrfach auftaucht, was die Nutzung (gesehen, Markierungen) nicht erleichtert.
Beobachtung: Beiträge verschwinden aus den Mediatheken, die Website-Links sind tot, und die MP4-Links funktionieren länger.
So hat man Sendungen in MV oder MVW noch gelistet, die in den Sender Mediatheken selbst gar nicht mehr findet und kann sie trotzdem noch anschauen/runterladen. Ich finde das ein tolles Feature von MV/MVW.
Volle Zustimmung 👍
Korrektur meines Beitrags oben: Der von Google gefundene Link ist
nicht der korrekte zum SR-Video.
Genau. Und damit kommen wir zum Thema zurück. Das was Du mit Deinem Thementitel “Falsche ARD Mediathek Website-URLs” und dem vermeintlichen Beispiel behauptet hast, stimmt so nämlich gar nicht.
Ein Beispiel ist ARD aktuell - 16.00 Uhr (04.04.2023) mit der in der MVDB angegebenen URL , die ins Leere führt, wohingegen eine Google-Suche nach “ARD aktuell - 16.00 Uhr (04.04.2023)” den korrekten Link liefert.
Denn zu der Sendung des SR vom 4.4. 16:00 mit dem nicht funktionierenden Link gibts keinen “richtigen” Link (den man mit einer Google-Suche finden könnte), weil die Sendung in der ARD-Mediathek gar nicht mehr verfügbar ist.
Siehe oben, und: Wie gesagt, ein Datensatz mit totem Website-Link und funktionierenden Streams ist natürlich immer noch gut. Und sicher ist es auch besser, den Link nicht zu entfernen, um die URL weiterhin als Identifier nutzen zu können.
Und damit kommen wir zu Deiner Frage/Deinen Vorschlag:
Gerade wenn man wie ich ausschließlich die Webseite selbst für das Streaming oder yt-dlp für den Download nutzt, ist das ein Problem. Vielleicht wäre es eine Idee, in der Ergebnisliste Suchmaschinenlinks anzubieten.
Welchen Suchmaschinen-Link hättest Du den gerne für “ARD aktuell - 16.00 Uhr (04.04.2023)”?
Kein spezieller Wunsch. Ich habe in einem Script, das ich gerade entwickle und das Datensätze zum gleichen Film “mergen” wird, folgendes simple Template für die Ausgabe im Terminal via node.js:
const localeOpts = { timeZone: 'Europe/Berlin' }
slicedResults.forEach((f, i) => {
// See https://www.google.com/advanced_video_search
log(
start + i + 1, `${f.channel} - ${f.topic}: ${f.title}
${f.description}
${f.getDate().toLocaleString('de', localeOpts)}
${f.url_website}
https://www.google.com/search?tbm=vid&as_q=${encodeURIComponent(`${f.getDate().toLocaleDateString('de', localeOpts)} ${f.topic} ${f.title}`)}
`
)
})
Interessant wäre es auch noch, Metadaten zu Filmen mit yt-dlp info.json-Daten anzureichern. Hier bekommt man auch eine vollständige Liste aller Video-URLs ausgegeben.