"Dahoam is Dahoam" Einträge mit falschem Datum
-
Hallo Zusammen,
ich kann immer wieder beobachten, dass die Einträge von “Dahoam is Dahoam” in der Datenbank mit einem falschen Datum versehen werden:
Als korrektes Datum sehe ich diese Angabe auf der Webseite an:
Hier die aktuellsten 4 Beispiele:
-
Kein frischer Wind (2666)
** Link
** Datum in Datenbank: 2021-01-11
** Datum auf Webseite: 2021-01-11 -
Eine Frau steht ihren Mann (2667)
** Link
** Datum in Datenbank: 2021-01-16
** Datum auf Webseite: 2021-01-12 -
Eine Frau - ein Wort (2668)
** Link
** Datum in Datenbank: 2021-01-17
** Datum auf Webseite: 2021-01-13 -
Führungswechsel (2669)
** Link
** Datum in Datenbank: 2021-01-15
** Datum auf Webseite: 2021-01-14
Ich weiß leider nicht, wie und an welcher Stelle der Crawler beim BR das Datum einer Sendung ausliest. Vielleicht lohnt es sich, das Verhalten hier zu prüfen.
Danke
Beste Grüße
anoniman -
-
@anoniman sagte in "Dahoam is Dahoam" Einträge mit falschem Datum:
Ich weiß leider nicht, wie und an welcher Stelle der Crawler beim BR das Datum einer Sendung ausliest.
Ich weiß es auch nicht, habe aber mal in der Quellcode der BR-Seite geschaut und vier Ausstrahlungstermine, die auch von fernsehserien.de bestätigt werden, gefunden:
{"__typename":"BroadcastEvent","start":"2021-01-17T06:00:00.000Z","end":"2021-01-17T06:30:00.000Z" {"__typename":"BroadcastEvent","start":"2021-01-15T05:00:00.000Z","end":"2021-01-15T05:30:00.000Z" {"__typename":"BroadcastEvent","start":"2021-01-15T01:00:00.000Z","end":"2021-01-15T01:30:00.000Z" {"__typename":"BroadcastEvent","start":"2021-01-14T18:30:00.000Z","end":"2021-01-14T19:00:00.000Z"
Da weder das erste noch das vierte Datum in die Datenbank übernommen wurde, ist die Quelle vermutlich eine andere.
-
Dieser Beitrag wurde gelöscht! -
Das sind offensichtlich immer die Daten der letzten Wiederholung, nicht der Erstausstrahlung.
https://www.tvinfo.de/fernsehprogramm/1308833983-dahoam-is-dahoam
https://www.tvinfo.de/fernsehprogramm/1308834252-dahoam-is-dahoamDa der BR die jeweils 2-4 mal an den folgenden Tagen sendet muß der Crawler ja notgedrungen irgendein Datum auswählen, ansonsten wäre alles voller Doubletten.
Warum er das Letztere verwendet muß ein Entwickler erklären. -
Da der BR die jeweils 2-4 mal an den folgenden Tagen sendet muß der Crawler ja notgedrungen irgendein Datum auswählen, ansonsten wäre alles voller Doubletten.
Warum er das Letztere verwendet muß ein Entwickler erklären.Wenn man sich die Beispiele anschaut, sieht man das da was nicht passt - hier 2 rausgegriffen:
- Folge 2666: Ausstrahlungsdaten lt. fernsehserien.de 11.1., 2x 12.1., 16.1. und MV hat 11.1. als Datum, also das älteste Datum
- Folge 2668: Ausstrahlungsdaten lt. fernsehserien.de 13.1., 2x 14.1., 17.1. und MV hat 17.1. als Datum, also das jüngste.
Nachdem das Datum immer wieder Thema hier im Forum ist, gibts auch immer wieder Erklärungen der Entwickler dazu, z.B. im August 2020:
Ein wichtiger Grund warum wir bisher nur ein Datum nutzen und möglichst das originale Ausstrahlungsdatum (übrigens bei allen Sendern) Ist um zu erkennen ob ein Film neu in der Filmliste ist.
All das kennend und ergänzt mit meiner konkreten Erfahrung mit einer (anderen) BR-Sendereihe, würde ich daher vermuten, dass der BR via API eine nicht ganz konsequente Auslieferungsstrategie bez. Sendungsdatum hat.
An @anoniman: Mag sein, dass das …
Als korrektes Datum sehe ich diese Angabe auf der Webseite an
… Deine Erwartungshaltung ist. Von der solltest Du Dich lösen. Im Grunde wird das älteste Sendungsdatum genommen, das die Sender via API liefern und was die Sender liefern, liegt in deren Verantwortung auch und insbesondere was die die Datenqualität betrifft.
-
Hallo @georg-j & @dadirnbocher & @vitusson,
ich Danke Euch für Eure ausführlichen Antworten; insb. dieser Post hat mir geholfen.
- Es gibt pro Sendung evtl. mehrere Sendezeiten
- Dies sind i.d.R. der Originaltermin sowie die Wiederholungen
Was ich aktuell nicht verstehe ist, warum (anscheinend) nicht einfach der frühest vorhandene Zeitpunkt als Originaltermin gespeichert wird. Die Zeiten sind ja anscheinend im Quelltext der BR-Seiten vorhanden. Man kann doch annehmen, dass dieser Zeitpunkt auch der Originaltermin ist, oder?
Servus
@anoniman -
@anoniman sagte in "Dahoam is Dahoam" Einträge mit falschem Datum:
Was ich aktuell nicht verstehe ist, warum (anscheinend) nicht einfach der frühest vorhandene Zeitpunkt als Originaltermin gespeichert wird.
Wird es doch, nur halt nicht von …
ie Zeiten sind ja anscheinend im Quelltext der BR-Seiten vorhanden.
… den BR-Seiten, sondern via API.
Sagte ich aber bereits.
@dadirnbocher sagte in "Dahoam is Dahoam" Einträge mit falschem Datum:
Im Grunde wird das älteste Sendungsdatum genommen, das die Sender via API liefern und was die Sender liefern, liegt in deren Verantwortung auch und insbesondere was die die Datenqualität betrifft.
-
@dadirnbocher Jetzt verstehe ich Dich hoffentlich richtig: Der BR-Crawler nutzt nicht den Seitenquelltext sondern die BR-Mediatheken-API.
Im Grunde wird das älteste Sendungsdatum genommen, das die Sender via API liefern
Was ist hier mit “älteste Sendungsdatum” gemeint?
- Liefert auch die API pro Sendung mehrere Daten?
- Ist “älteste Sendungsdatum” gleichbedeutend mit “früheste Sendungsdatum”?
-
Ernsthaft … ein -1, weil ich das ganze nochmal für mich zusammengefasst habe? Ist das verboten? Habe ich jemanden damit beleidigt oder seine Kompetenz angezweifelt?
Super -1-Klicker, kannst Dir jetzt überlegen vorkommen. -
@anoniman also ich sehe aktuell keine negative Bewertung für deine Beiträge. Vermutlich ist das passiert, weil deine Zusammenfassung aus Fragen besteht, die hier im Thread zum Teil schon mehrfach beantwortet wurden.
-
@mvsfsvm
Heute morgen hatte @anoniman noch Minus 1, vermutlich haben ihm andere Nutzer jetzt aus dem Tief befreit. Leider passiert es immer wieder, dass unsere Poweruser ab und an mal negative Bewertungen vergeben, wenn sie sich über etwas ärgern.Ich würde anonyme negative Bewertungen ganz abschaffen, denn fehlende positive Bewertungen sind genauso aussagekräftig und verletzen nicht das allgemeine Persönlichkeitsrecht, aber diese Entscheidung obliegt den Administratoren.
-
@mvsfsvm Ich habe nichts gegen negative Bewertungen, sofern es sich um beleidigende Beiträge handelt oder der Autor Fragen stellt, die bereits beantwortet wurden.
Was mich hier wirklich ärgert: Die Fragen- Liefert auch die API pro Sendung mehrere Daten?
- Ist “älteste Sendungsdatum” gleichbedeutend mit “früheste Sendungsdatum”?
wurden nicht explizit beantwortet - weder hier noch im verlinkten Beitrag.
Was der BR-Crawler wirklich macht, könnte ich natürlich aufwendig selber herausfinden, sofern ich mich durch den Quelltext kämpfen würde. Vielleicht liege ich hier richtig, vielleicht auch nicht. Aber ist das wirklich nötig, nur um kein Minus1 zu bekommen? -
@anoniman sagte in "Dahoam is Dahoam" Einträge mit falschem Datum:
- Liefert auch die API pro Sendung mehrere Daten?
@DaDirnbocher schrieb
Im Grunde wird das älteste Sendungsdatum genommen, das die Sender via API liefern
Das ist vielleicht nicht explizit, aber beantwortet doch die Frage.
- Ist “älteste Sendungsdatum” gleichbedeutend mit “früheste Sendungsdatum”?
Diese Frage ist praktisch nicht zu beantworten, für mich klingt das nämlich gleich. Für dich offenbar nicht. Dann solltest du uns aber erklären, was für dich der Unterschied ist.
-
Vergessen wir das mit der Bewertung.
Wichtiger ist Folgendes: Ich habe mich mal etwas durch den Code von BrFilmDeserializer.java gearbeitet.
In der Funktion getBroadcastStart(…) wird ab Zeile 313final JsonObject arrayItem = edges.get(0).getAsJsonObject(); if (!arrayItem.has(JSON_ELEMENT_NODE)) { return Optional.empty(); } final JsonObject node = arrayItem.getAsJsonObject(JSON_ELEMENT_NODE); if (!node.has(JSON_ELEMENT_START)) { return Optional.empty(); } return Optional.of(node.get(JSON_ELEMENT_START));
anscheinend lediglich der erste der vorhandenen Sendezeitpunkte genommen, unabhängig davon, ob dies unter den vorhandenen der zeitlich früheste ist. Vielleicht könnte man hier durch alle vorhandenen Zeitpunkte durchiterieren und dadurch den zeitlich ersten Sendezeitpunkt ermitteln. @pidoubleyou Was meinst Du?
-
@anoniman ich habe mir das mal angeschaut: es ist möglich, das erste Sendedatum zu bekommen.
Bei vielen Sendung passt diese Logik, dann wird die erste Ausstrahlung und nicht die der Wiederholung verwendet. Bei Sendungen, die häufiger ausgestrahlt werden (z.B. Bob Ross), wird die Sendung unter dem ersten verfügbaren Datum gelistet, also z.B. ein Datum im Sommer statt das aktuelle Ausstrahlungsdatum.
Das Verhalten ist dann analog dem des ZDF.
Hier das Github-Ticket dazu: https://github.com/mediathekview/MServer/issues/666
-
Hallo @pidoubleyou ,
ich habe die Änderung (Commit) bemerkt.
Vielen Dank dafür
Beste Grüße
anoniman