Redundanz bei ZDF-History
-
3 mal ein identischer Eintrag:
https://mediathekviewweb.de/#query=Sinti%20und%20Roma.%20Eine%20deutsche%20Geschichte&everywhere=true&future=true -
Die Sendung wurde vermutlich 3 x ausgestrahlt innerhalb von ein paar Tagen - am 28.7., 30.7. und 2.8. MV zeigt da auch drei verschiedene Links zum Film:
https://rodlzdf-a.akamaihd.net/none/zdf/19/08/190802_sinti_roma_neu_his/1/190802_sinti_roma_neu_his_3328k_p36v14.mp4
https://rodlzdf-a.akamaihd.net/none/zdf/19/07/190730_sinti_roma_his/1/190730_sinti_roma_his_3328k_p36v14.mp4
https://rodlzdf-a.akamaihd.net/none/zdf/19/07/190728_sinti_und_roma_his/4/190728_sinti_und_roma_his_3328k_p36v14.mp4
Was ist dein Problem damit?
-
@mac-christian Möglicherweise ist sein Problem dasselbe wie meines: Leider wimmelt es im ZDF und auch in 3sat vor reduntanten Einträgen, manchmal erscheinen alle miteinander in der Filmliste, manchmal mit grösseren Abständen, markiert man sie “als gelesen”, sind sie wie schlecht übermalte Schimmelflecken bei nächster Gelegenheit wieder da, also muss man jedesmal abchecken, ob man den gewünschten Film bereits hat, oder ob er neu in der Filmliste ist = Zeitaufwand. Ich weiss schon, dass das daran liegt, dass ZDF/3sat laufend die URLs ein wenig verändern, und sie somit von MV als neu eingestuft werden, und ich will mich ja auch nicht darüber beklagen, weil besser so, als gar nicht. Aber du wolltest wissen, was sein Problem ist, und ich habe - auf mein Problem in dieser Angelegenheit Bezug nehmend - eine mögliche Antwort abgeleitet. Ich wünsche dir eine gute Nacht und einen erfolgreichen Montag.
-
Gut da gibt es also intern mehrere Ausstrahlungstermine.
Die zeitliche Zuordung in der MVW ist jedoch bei allen dreien gleich “28.07.2019 - 23:45”.
Ist das also so in Ordnung und kein Problem, meinst Du? Auch nicht für die Größe des MVW-Datensatzes, falls das Problem generell gehäuft auftritt bzw. systemimmanent ist?
-
@krudan sagte in Redundanz bei ZDF-History:
Ist das also so in Ordnung und kein Problem, meinst Du? Auch nicht für die Größe des MVW-Datensatzes, falls das Problem generell gehäuft auftritt bzw. systemimmanent ist?
MediathekView und MediathekView Web speichern ja beide keine Filme in irgendwelchen Datenbanken, sondern nur die Verweise dorthin, damit man sich die Filme ansehen / runterladen kann. Und die Filmliste wird ja erzeugt, indem die Mediatheken der Sender abgesucht werden. Wenn also ein Film mehrere Male vom Sender mit unterschiedlichen Adressen angeboten wird, wird der FIlm auch mehrmals in MV / MVW gelistet.
Woran es liegt, dass alle drei FIlmversionen in MV / MVW das gleiche Sendedatum haben, kann ich dir aber auch nicht beantworten.
Falls es von den Programmierern als wichtig erachtet wird, dürfte es eine Korrektur am ZDF-Crawler geben. Falls nicht, wird es auch in Zukunft so bleiben.
-
@krudan sagte in Redundanz bei ZDF-History:
falls das Problem generell gehäuft auftritt bzw. systemimmanent ist?
Nehmen wir an, dass es ein Problem ist. Dann wäre noch zu klären, …
a. wer der Verursacher ist
b. wie eine Lösung aussehen kann.Nun, die Crawler suchen nur das zusammen, was die Sender anbieten. In dem Fall bietet ZDF den Film 3x an (ist es sicher, dass es 3x exakt derselbe Film ist?)
Also wäre die Antwort auf a) also ZDF.
Damit kommen wir auch zu b), lösen kann das nur das ZDF in dem sie die Redundanzen reduziert.
Das was Du offensichtlich möchtest, ist, das MV eine Erkennung von Redundanzen einbaut. Hier stellt sich die Frage, wie solch eine Erkennung funktionieren soll und wie vor allem verhindert werden soll, dass es zu false positive Erkennungen kommt.
Wem das ein Bedürfnis ist, kann gerne Lösungsansätze vorschlagen, die dann diskutiert werden können.
-
@DaDirnbocher sagte in Redundanz bei ZDF-History:
und wie vor allem verhindert werden soll, dass es zu false positive Erkennungen kommt.
Ich denke, das Risiko ist zu groß. Denn manchmal ist eine Sendung in Beiträge unterteilt und da kann einiges durchrutschen. Beispiel “Heute Journal”
Also viele Beiträge zum selben Startzeitpunkt aber unterschiedlicher Länge. Nicht immer wird die Größe dargestellt oder eine Unterscheidung im Thema/Titel ersichtlich.
-
@DaDirnbocher sagte: Wem das ein Bedürfnis ist, kann gerne Lösungsansätze vorschlagen, die dann diskutiert werden können.
Zum Problem “Duplikate-Erkennung” gibt es einige Threads. Der substanziellste Thread weist am Schluss einen interessanten Kommentar von @Nicklas2751 auf.
Fazit war eigentlich immer, dass die Unzulänglichkeiten bei den Sendern nicht ausgeglichen/abgefangen werden können…@DaDirnbocher sagte: ist es sicher, dass es 3x exakt derselbe Film ist?
Das hätte @krudan selbst beantworten können, wenn er in MVW mit der Maus kurz über das Filmklappen-Symbol gefahren wäre: Da sieht man, dass z.B. die Dateigrösse bei den 3 Varianten jedes Mal geringfügig anders ist (hohe Auflösung). Es liegen also effektiv nicht mal Duplikate vor…
-
Der Sender-Link zur ZDF-Mediathek ist bei allen drei Titeln der Selbe, mit dem Datum 30.07.2019. In den einzelnen MVW-Video-Links sind jeweils unterschiedliche Datumsangaben zu erkennen.
Trotzdem wird in MVW bei allen Links allein der 28.07.2019 um 23:45 Uhr angezeigt, was chronologisch auch als erste Onlinestellung entsprechend der Erstausstrahlung am 30.07.2019 zu erkennen ist.
Bezieht der MVW-Crawler nun die Angaben zu Datum und Zeit aus dem Video-Link oder wo greift er diese ab? Wenn er sie aus dem Video-Link beziehen würde, müsste er ja zumindest das Datum der Ausstrahlungen nach dem 28.07.2019 auch zuordnen und korrekt anzeigen können.
Zeigt der MVW-Crawler schliesslich eher den TV-Ausstrahlungtermin an oder den Mediathek-Onlinestellungszeitpunkt?
Die “neue angestrebte Architektur” (@Nicklas2751) wurde ja schon mehrmals erwähnt. Gibt es dafür schon eine Deadline oder ist das Ende weiterhin offen?
-
@krudan sagte: Zeigt der MVW-Crawler schliesslich eher den TV-Ausstrahlungtermin an oder den Mediathek-Onlinestellungszeitpunkt?
Wie @DaDirnbocher schon sagte, der Crawler liest das aus, was das ZDF bzw. die ZDF-API liefert (inkl. aller Merkwürdigkeiten und Inkonsistenzen)…
Der Sender-Link zur ZDF-Mediathek ist bei allen drei Titeln der Selbe, mit dem Datum 30.07.2019. […] Bezieht der MVW-Crawler nun die Angaben zu Datum und Zeit aus dem Video-Link
Seltsame Frage – offensichtlich nicht…
Es ist ganz einfach: Das ZDF änderte für die gleiche Sendung bzw. Webseite 2-mal das Video im Hintergrund, wobei die vorhergehenden Videos nicht gelöscht wurden, womit die Links weiterhin gültig sind. Solange die Video-URL gültig ist, bleibt der entsprechende Eintrag auch in der Filmliste.
PS:
@mods: Nach 3 Tagen könnte man diesen Thread schon mal in die richtige Kategorie verschieben… -
Also die ZDF-API sendet hier 3 mal 28.07.2019 - 23:45 - 44:26 trotz nicht identischer Video-Links. Und der MVW-Crawler übernimmt das 1:1. Ok.
-
@krudan sagte: Also die ZDF-API sendet hier 3 mal 28.07.2019 - 23:45 - 44:26 trotz nicht identischer Video-Links. Und der MVW-Crawler übernimmt das 1:1.
“Trotz”? Ich würde eher sagen “wegen”…
Es gibt keinen MVW-Crawler, sondern nur einen MV-Crawler. Deshalb hat dein Problem ja auch nichts mit MVW zu tun…
-
@krudan sagte in Redundanz bei ZDF-History:
Die “neue angestrebte Architektur” (@Nicklas2751) wurde ja schon mehrmals erwähnt. Gibt es dafür schon eine Deadline oder ist das Ende weiterhin offen?
Wir haben grundsätzlich keine Deadlines. Wir machen das hier ja nur zum Spaß, da brauchen wir uns nicht noch irgendwelchen Termindruck aussetzen.
-
Kein Problem. Dennoch klang das von bagbag (Entwickler) in 2017 noch etwas anders
“…schließlich muss ich ja endlich mal MVW 2.0 fertig bekommen.”
Falls mit MVW 2.0 auch die “neue angestrebte Architektur” gemeint ist.
-
@krudan sagte: Dennoch klang das von bagbag (Entwickler) in 2017 noch etwas anders
Du bringst erneut einiges durcheinander.
Nochmals: Bei deinem Problem geht es um die Filmliste und nicht um ein MVW-spezifisches Problem. Die Filmliste wird sowohl vom Desktop-Client MV wie auf von der “Web-App” MVW verwendet. @bagbag ist der Entwickler von MVW, und er sprach von MVW und nicht von der Filmliste, die durch “MServer” erstellt wird.
-
Passiert. Danke trotzdem für Eure Bemühungen.