@georg-j sagte in Blacklist nach Grösse der Datei:
Eine Beseitigung des Fehlers wäre erstrebenswerter als mit der Blacklist nachzubessern.
Eine andere Möglichkeit, eine falsche Dauer in der Filmliste zu vermeiden, besteht darin, die Dauer des Films zum Zeitpunkt der Aufnahme in die Filmliste aus den Metadaten der mp4-Datei auszulesen. (Dabei könnte auch gleichzeitig die Auflösung des Films ausgelesen werden, so dass der Crawler diese nicht aus dem Dateinamen vermuten muss.)
Viel Spaß mit der Last wenn der Crawler erstmal bei jedem Durchlauf hunderte Links (grob geschätzt, eher mehr) von neuen Mediendateien verarbeiten muß und für jeden einzelnen Link dessen Mediendaten remote ausliest.
time mediainfo https://arteptweb-a.akamaihd.net/am/ptweb/055000/055900/055904-000-A_EQ_0_VOA_03346374_MP4-1500_AMM-PTWEB_rWDX1D7iMF.mp4
real 0m7.371s
user 0m0.936s
sys 0m0.068s
Nu schreib dir mal ein Skript und mach das für ein paar Dutzend. Ja. wahrscheinlich gibt es da noch more fancy Methoden als mediainfo, aber es geht um das Konzept das du hunderte Anfragen rausschicken, auf ihr Ergebnis warten und das wieder in die Liste eintragen müsstest.
Theoretisch gute Idee, praxistauglich glaube ich nicht. Aber ich lasse mich gerne vom Gegenteil überzeugen.