Blacklist nach Grösse der Datei
-
Re: Feature Sammlung MediathekView 14.0.0
manche Trailer haben die gleiche angezeigte Länge wie die Folge. In der Blacklist kann man diese nicht über die Länge ausfiltern. Gäbe es das Feld Mindestgrösse in MB ginge dies.
Beispiel: Der Kriminalist ‘‘Esthers Geheimnis’’ ZDF 24.11.17. Die Hörfassung lässt sich ausfiltern, der Trailer nicht. -
@holgermh Ich kann dein Beispiel nicht nachvollziehen. Kannst du einen Screenshot machen?
In der Filmliste von gestern, 10:15 Uhr, ist nur der Trailer mit 20 Sekunden Dauer enthalten. In MVW sind aktuell der Trailer mit 20 Sekunden und der Film mit 58:05 Minuten sichtbar. Für beide wird auf die selbe Website verlinkt, auf der nicht mehr der Trailer sondern nur noch der Film abspielbar ist. -
Hallo Georg
in der Blacklist sind ausgeschlossen alle unter 5 Minuten, Hörfassungen und “(AD)”
in der Abo-Auswahl kommt dann:
Bei Download über aufzeichnen ist die erste winzig und die zweite 1 Gig. Die Verknüpfungen sind also nicht gleich
https://rodlzdf-a.akamaihd.net/none/zdf/17/11/171124_2015_sendung_tr_kst/1/171124_2015_sendung_tr_kst_2328k_p35v13.mp4
https://rodlzdf-a.akamaihd.net/de/zdf/17/11/171124_2015_sendung_neu_kst/4/171124_2015_sendung_neu_kst_2328k_p35v13.mp4
beide “Hohe Auflösung”
Die im Text genannte Webseite ist gleich.Holger
-
@holgermh sagte: manche Trailer haben die gleiche angezeigte Länge wie die Folge
Du hast das Problem korrekt beschrieben.
In der aktuellen Filmliste (13:12 Uhr) ist das Problem mit der Länge bereits korrigiert (in jener davor war sie noch “falsch”)…
-
@holgermh Danke für deinen Screenshot. Hier ist meiner mit der Filmliste von gestern:
Jetzt stellt sich die Frage, wie es zu dem Fehler kommen konnte, dass in der Filmliste der Trailer zuerst die korrekte Dauer hat und dann die Dauer der Folge erhält.
- Liegt es an der API des ZDF (bzw. an den dahinter liegenden Daten)?
- Liegt es am Crawler, der auf der Website eine geänderte Dauer findet, aber keine geänderte Film-URL erkennt?
Eine Beseitigung des Fehlers wäre erstrebenswerter als mit der Blacklist nachzubessern.
Eine andere Möglichkeit, eine falsche Dauer in der Filmliste zu vermeiden, besteht darin, die Dauer des Films zum Zeitpunkt der Aufnahme in die Filmliste aus den Metadaten der mp4-Datei auszulesen. (Dabei könnte auch gleichzeitig die Auflösung des Films ausgelesen werden, so dass der Crawler diese nicht aus dem Dateinamen vermuten muss.)
-
@georg-j sagte in Blacklist nach Grösse der Datei:
Liegt es an der API des ZDF
Ja, denn die Dauer des Films wird darüber ermittelt.
-
@georg-j sagte in Blacklist nach Grösse der Datei:
Eine Beseitigung des Fehlers wäre erstrebenswerter als mit der Blacklist nachzubessern.
Eine andere Möglichkeit, eine falsche Dauer in der Filmliste zu vermeiden, besteht darin, die Dauer des Films zum Zeitpunkt der Aufnahme in die Filmliste aus den Metadaten der mp4-Datei auszulesen. (Dabei könnte auch gleichzeitig die Auflösung des Films ausgelesen werden, so dass der Crawler diese nicht aus dem Dateinamen vermuten muss.)
Viel Spaß mit der Last wenn der Crawler erstmal bei jedem Durchlauf hunderte Links (grob geschätzt, eher mehr) von neuen Mediendateien verarbeiten muß und für jeden einzelnen Link dessen Mediendaten remote ausliest.
time mediainfo https://arteptweb-a.akamaihd.net/am/ptweb/055000/055900/055904-000-A_EQ_0_VOA_03346374_MP4-1500_AMM-PTWEB_rWDX1D7iMF.mp4 real 0m7.371s user 0m0.936s sys 0m0.068s
Nu schreib dir mal ein Skript und mach das für ein paar Dutzend. Ja. wahrscheinlich gibt es da noch more fancy Methoden als mediainfo, aber es geht um das Konzept das du hunderte Anfragen rausschicken, auf ihr Ergebnis warten und das wieder in die Liste eintragen müsstest.
Theoretisch gute Idee, praxistauglich glaube ich nicht. Aber ich lasse mich gerne vom Gegenteil überzeugen.