Redundanz bei ZDF-History
-
@DaDirnbocher sagte in Redundanz bei ZDF-History:
und wie vor allem verhindert werden soll, dass es zu false positive Erkennungen kommt.
Ich denke, das Risiko ist zu groß. Denn manchmal ist eine Sendung in Beiträge unterteilt und da kann einiges durchrutschen. Beispiel “Heute Journal”
Also viele Beiträge zum selben Startzeitpunkt aber unterschiedlicher Länge. Nicht immer wird die Größe dargestellt oder eine Unterscheidung im Thema/Titel ersichtlich.
-
@DaDirnbocher sagte: Wem das ein Bedürfnis ist, kann gerne Lösungsansätze vorschlagen, die dann diskutiert werden können.
Zum Problem “Duplikate-Erkennung” gibt es einige Threads. Der substanziellste Thread weist am Schluss einen interessanten Kommentar von @Nicklas2751 auf.
Fazit war eigentlich immer, dass die Unzulänglichkeiten bei den Sendern nicht ausgeglichen/abgefangen werden können…@DaDirnbocher sagte: ist es sicher, dass es 3x exakt derselbe Film ist?
Das hätte @krudan selbst beantworten können, wenn er in MVW mit der Maus kurz über das Filmklappen-Symbol gefahren wäre: Da sieht man, dass z.B. die Dateigrösse bei den 3 Varianten jedes Mal geringfügig anders ist (hohe Auflösung). Es liegen also effektiv nicht mal Duplikate vor…
-
Der Sender-Link zur ZDF-Mediathek ist bei allen drei Titeln der Selbe, mit dem Datum 30.07.2019. In den einzelnen MVW-Video-Links sind jeweils unterschiedliche Datumsangaben zu erkennen.
Trotzdem wird in MVW bei allen Links allein der 28.07.2019 um 23:45 Uhr angezeigt, was chronologisch auch als erste Onlinestellung entsprechend der Erstausstrahlung am 30.07.2019 zu erkennen ist.
Bezieht der MVW-Crawler nun die Angaben zu Datum und Zeit aus dem Video-Link oder wo greift er diese ab? Wenn er sie aus dem Video-Link beziehen würde, müsste er ja zumindest das Datum der Ausstrahlungen nach dem 28.07.2019 auch zuordnen und korrekt anzeigen können.
Zeigt der MVW-Crawler schliesslich eher den TV-Ausstrahlungtermin an oder den Mediathek-Onlinestellungszeitpunkt?
Die “neue angestrebte Architektur” (@Nicklas2751) wurde ja schon mehrmals erwähnt. Gibt es dafür schon eine Deadline oder ist das Ende weiterhin offen?
-
@krudan sagte: Zeigt der MVW-Crawler schliesslich eher den TV-Ausstrahlungtermin an oder den Mediathek-Onlinestellungszeitpunkt?
Wie @DaDirnbocher schon sagte, der Crawler liest das aus, was das ZDF bzw. die ZDF-API liefert (inkl. aller Merkwürdigkeiten und Inkonsistenzen)…
Der Sender-Link zur ZDF-Mediathek ist bei allen drei Titeln der Selbe, mit dem Datum 30.07.2019. […] Bezieht der MVW-Crawler nun die Angaben zu Datum und Zeit aus dem Video-Link
Seltsame Frage – offensichtlich nicht…
Es ist ganz einfach: Das ZDF änderte für die gleiche Sendung bzw. Webseite 2-mal das Video im Hintergrund, wobei die vorhergehenden Videos nicht gelöscht wurden, womit die Links weiterhin gültig sind. Solange die Video-URL gültig ist, bleibt der entsprechende Eintrag auch in der Filmliste.
PS:
@mods: Nach 3 Tagen könnte man diesen Thread schon mal in die richtige Kategorie verschieben… -
@krudan sagte: Also die ZDF-API sendet hier 3 mal 28.07.2019 - 23:45 - 44:26 trotz nicht identischer Video-Links. Und der MVW-Crawler übernimmt das 1:1.
“Trotz”? Ich würde eher sagen “wegen”…
Es gibt keinen MVW-Crawler, sondern nur einen MV-Crawler. Deshalb hat dein Problem ja auch nichts mit MVW zu tun…
-
@krudan sagte in Redundanz bei ZDF-History:
Die “neue angestrebte Architektur” (@Nicklas2751) wurde ja schon mehrmals erwähnt. Gibt es dafür schon eine Deadline oder ist das Ende weiterhin offen?
Wir haben grundsätzlich keine Deadlines. Wir machen das hier ja nur zum Spaß, da brauchen wir uns nicht noch irgendwelchen Termindruck aussetzen.
-
Kein Problem. Dennoch klang das von bagbag (Entwickler) in 2017 noch etwas anders
“…schließlich muss ich ja endlich mal MVW 2.0 fertig bekommen.”
Falls mit MVW 2.0 auch die “neue angestrebte Architektur” gemeint ist.
-
@krudan sagte: Dennoch klang das von bagbag (Entwickler) in 2017 noch etwas anders
Du bringst erneut einiges durcheinander.
Nochmals: Bei deinem Problem geht es um die Filmliste und nicht um ein MVW-spezifisches Problem. Die Filmliste wird sowohl vom Desktop-Client MV wie auf von der “Web-App” MVW verwendet. @bagbag ist der Entwickler von MVW, und er sprach von MVW und nicht von der Filmliste, die durch “MServer” erstellt wird.