Falsche ARD Mediathek Website-URLs
-
Header der MVDB:
["11.07.2023, 22:32","11.07.2023, 20:32","3","MSearch [Vers.: 3.1.213]","f253c35700fc2229f48fc1a6cdf951ce"]
Ein Beispiel ist ARD aktuell - 16.00 Uhr (04.04.2023) mit der in der MVDB angegebenen URL , die ins Leere führt, wohingegen eine Google-Suche nach “ARD aktuell - 16.00 Uhr (04.04.2023)” den korrekten Link liefert. Bei vielen weiteren URLs das gleiche Problem. Entscheidend ist, dass die von MVDB gelieferte ID im Link falsch ist. Ich kann beim funktionierenden Link den Zwischenteil der URL weglassen, sodass nur die ID verbleibt, und der Link funktioniert.
Gerade wenn man wie ich ausschließlich die Webseite selbst für das Streaming oder yt-dlp für den Download nutzt, ist das ein Problem. Vielleicht wäre es eine Idee, in der Ergebnisliste Suchmaschinenlinks anzubieten.
-
@Andi34 Sorry ich verstehe nur Bahnhof.
Ein Beispiel ist ARD aktuell - 16.00 Uhr (04.04.2023) mit der in der MVDB
Was soll das (ARD Aktuell) für eine Sendung sein?
“ARD aktuell - 16.00 Uhr (04.04.2023)” den korrekten Link liefert.
Der als korrekte bezeichnete Link (https://www.ardmediathek.de/video/swr-aktuell-rheinland-pfalz/sendung-19-30-uhr-vom-4-4-2023/swr-rp/Y3JpZDovL3N3ci5kZS9hZXgvbzE4MzU3OTM ) liefert bei mir das:
Wenn ich zu der Sendung dann in MV die website url anschaue ist der link (https://www.ardmediathek.de/video/Y3JpZDovL3N3ci5kZS9hZXgvbzE4MzU3OTM) auch korrekt.
Wenn ich dann im Gegencheck die 16:00 Sendung anschaue, passt der Link auch:
Mit anderen Worten: Worum gehts wirklich?
-
@DaDirnbocher sagte in Falsche ARD Mediathek Website-URLs:
Mit anderen Worten: Worum gehts wirklich?
Es geht immer noch um dasselbe. Bitte lies genau, was ich beschrieben habe. Der von mir verlinkte Datensatz findet sich auch auf MediathekViewWeb:
- ARD (Sender), “aktuell (16 Uhr)” (Thema), “aktuell - 16.00 Uhr (04.04.2023)” (Titel) … 04.04.2023 16:00 - der Link zur Webseite (im Sendernamen) ist tot.
Der Videoplayer auf MediathekViewWeb spielt zu dieser Sendung (“aktuell (16 Uhr)”) jedenfalls ein Video aus dem SR ab, obwohl als Sender “ARD” angegeben ist.
Bei nachfolgenden Sendungen in der oben verlinkten Ergebnisliste von diesem Tag aus SWR RP/BW funktionieren die Webseiten-Links, aber auch hier bleibt die Frage offen, warum doppelte Einträge für SWR und ARD angelegt werden:
- ARD, SWR Aktuell Rheinland-Pfalz, Sendung 16:00 Uhr vom 4.4.2023, 04.04.2023, 16:00
- SWR, SWR Aktuell Baden-Württemberg, Sendung 16:00 Uhr vom 4.4.2023, 04.04.2023, 16:00
- SWR, SWR Aktuell Rheinland-Pfalz, Sendung 16:00 Uhr vom 4.4.2023, 04.04.2023, 16:00, 04:37
- ARD, SWR Aktuell Baden-Württemberg, Sendung 16:00 Uhr vom 4.4.2023, 04.04.2023 16:00
Zusammenfassung:
1. - Problem: Viele Sendungen erscheinen doppelt, einmal unter ARD, dann der gleiche Webseitenlink unter einem Regionalsender. Diese zu einem Datensatz zusammenzufassen wäre sinnvoll.
2. - Beobachtung: Beiträge verschwinden aus den Mediatheken, die Website-Links sind tot, und die MP4-Links funktionieren länger.
Korrektur meines Beitrags oben: Der von Google gefundene Link ist nicht der korrekte zum SR-Video.
-
@Andi34 sagte in Falsche ARD Mediathek Website-URLs:
Es geht immer noch um dasselbe. Bitte lies genau, was ich beschrieben habe.
LOL, Hab ich, darum habe ich ja festgestellt dass Deine Beschreibung “ARD aktuell 16:00” und der von Dir als richtig behauptete Link (SWR Aktuell Rheinland Pfalz 19:30") net zusammen passen.
Der von mir verlinkte Datensatz findet sich auch auf MediathekViewWeb:
ARD (Sender), “aktuell (16 Uhr)” (Thema), “aktuell - 16.00 Uhr (04.04.2023)” (Titel) … 04.04.2023 16:00 - der Link zur Webseite (im Sendernamen) ist tot.Ja, das kommt vor, und zwar dann, wenn die Sendungswebsite von den Sendern “runtergenommen” wurde, der direkte (Download-/Abspiel-)Link zur Sendung noch funktioniert.
Zusammenfassung:
Schön, diese Punkte haben zwar mit Deinem Ursprungspost nicht mehr viel zu zun, aber gerne können wir auch darüber reden.
-
- Problem: Viele Sendungen erscheinen doppelt, einmal unter ARD, dann der gleiche Webseitenlink unter einem Regionalsender. Diese zu einem Datensatz zusammenzufassen wäre sinnvoll.
Das ist so gewünscht, Und zwar seit Jahren.
-
- Beobachtung: Beiträge verschwinden aus den Mediatheken, die Website-Links sind tot, und die MP4-Links funktionieren länger.
So hat man Sendungen in MV oder MVW noch gelistet, die in den Sender Mediatheken selbst gar nicht mehr findet und kann sie trotzdem noch anschauen/runterladen. Ich finde das ein tolles Feature von MV/MVW.
Korrektur meines Beitrags oben: Der von Google gefundene Link ist
nicht der korrekte zum SR-Video.Genau. Und damit kommen wir zum Thema zurück. Das was Du mit Deinem Thementitel “Falsche ARD Mediathek Website-URLs” und dem vermeintlichen Beispiel behauptet hast, stimmt so nämlich gar nicht.
Ein Beispiel ist ARD aktuell - 16.00 Uhr (04.04.2023) mit der in der MVDB angegebenen URL , die ins Leere führt, wohingegen eine Google-Suche nach “ARD aktuell - 16.00 Uhr (04.04.2023)” den korrekten Link liefert.
Denn zu der Sendung des SR vom 4.4. 16:00 mit dem nicht funktionierenden Link gibts keinen “richtigen” Link (den man mit einer Google-Suche finden könnte), weil die Sendung in der ARD-Mediathek gar nicht mehr verfügbar ist.
Und damit kommen wir zu Deiner Frage/Deinen Vorschlag:
Gerade wenn man wie ich ausschließlich die Webseite selbst für das Streaming oder yt-dlp für den Download nutzt, ist das ein Problem. Vielleicht wäre es eine Idee, in der Ergebnisliste Suchmaschinenlinks anzubieten.
Welchen Suchmaschinen-Link hättest Du den gerne für “ARD aktuell - 16.00 Uhr (04.04.2023)”?
-
-
@DaDirnbocher sagte in Falsche ARD Mediathek Website-URLs:
@Andi34 sagte in Falsche ARD Mediathek Website-URLs:
Es geht immer noch um dasselbe. Bitte lies genau, was ich beschrieben habe.
LOL, Hab ich, darum habe ich ja festgestellt dass Deine Beschreibung “ARD aktuell 16:00” und der von Dir als richtig behauptete Link (SWR Aktuell Rheinland Pfalz 19:30") net zusammen passen.
Ich habe des jetzt erst geblickt, weil ich das Stream-MP4 nicht beachtet hatte.
-
- Problem: Viele Sendungen erscheinen doppelt, einmal unter ARD, dann der gleiche Webseitenlink unter einem Regionalsender. Diese zu einem Datensatz zusammenzufassen wäre sinnvoll.
Das ist so gewünscht, Und zwar seit Jahren.
Nachvollziehbar. Es wäre auch zu aufwendig, das Datenmodell jetzt grundlegend zu ändern. Der Nachteil besteht darin, dass gleicher Content in der Suche (wenn nach Sender sortiert) mehrfach auftaucht, was die Nutzung (gesehen, Markierungen) nicht erleichtert.
-
- Beobachtung: Beiträge verschwinden aus den Mediatheken, die Website-Links sind tot, und die MP4-Links funktionieren länger.
So hat man Sendungen in MV oder MVW noch gelistet, die in den Sender Mediatheken selbst gar nicht mehr findet und kann sie trotzdem noch anschauen/runterladen. Ich finde das ein tolles Feature von MV/MVW.
Volle Zustimmung
Korrektur meines Beitrags oben: Der von Google gefundene Link ist
nicht der korrekte zum SR-Video.Genau. Und damit kommen wir zum Thema zurück. Das was Du mit Deinem Thementitel “Falsche ARD Mediathek Website-URLs” und dem vermeintlichen Beispiel behauptet hast, stimmt so nämlich gar nicht.
Ein Beispiel ist ARD aktuell - 16.00 Uhr (04.04.2023) mit der in der MVDB angegebenen URL , die ins Leere führt, wohingegen eine Google-Suche nach “ARD aktuell - 16.00 Uhr (04.04.2023)” den korrekten Link liefert.
Denn zu der Sendung des SR vom 4.4. 16:00 mit dem nicht funktionierenden Link gibts keinen “richtigen” Link (den man mit einer Google-Suche finden könnte), weil die Sendung in der ARD-Mediathek gar nicht mehr verfügbar ist.
Siehe oben, und: Wie gesagt, ein Datensatz mit totem Website-Link und funktionierenden Streams ist natürlich immer noch gut. Und sicher ist es auch besser, den Link nicht zu entfernen, um die URL weiterhin als Identifier nutzen zu können.
Und damit kommen wir zu Deiner Frage/Deinen Vorschlag:
Gerade wenn man wie ich ausschließlich die Webseite selbst für das Streaming oder yt-dlp für den Download nutzt, ist das ein Problem. Vielleicht wäre es eine Idee, in der Ergebnisliste Suchmaschinenlinks anzubieten.
Welchen Suchmaschinen-Link hättest Du den gerne für “ARD aktuell - 16.00 Uhr (04.04.2023)”?
Kein spezieller Wunsch. Ich habe in einem Script, das ich gerade entwickle und das Datensätze zum gleichen Film “mergen” wird, folgendes simple Template für die Ausgabe im Terminal via node.js:
const localeOpts = { timeZone: 'Europe/Berlin' } slicedResults.forEach((f, i) => { // See https://www.google.com/advanced_video_search log( start + i + 1, `${f.channel} - ${f.topic}: ${f.title} ${f.description} ${f.getDate().toLocaleString('de', localeOpts)} ${f.url_website} https://www.google.com/search?tbm=vid&as_q=${encodeURIComponent(`${f.getDate().toLocaleDateString('de', localeOpts)} ${f.topic} ${f.title}`)} ` ) })
Interessant wäre es auch noch, Metadaten zu Filmen mit yt-dlp info.json-Daten anzureichern. Hier bekommt man auch eine vollständige Liste aller Video-URLs ausgegeben.
-