ARTE: Fehlermeldung bei 2 Sendungen / falsche Film-URLs



  • Hallo,

    erst einmal vielen Dank für das tolle Programm sowie dafür, dass es ehrenamtlich gepflegt wird und auch für die häufig schnellen Fehlerbehebungen.

    Ich habe Fehlermeldungen bei zwei Downloads bei arte, die sowohl über das Programm als auch bei MVW auftreten:

    Sendung 1

    Sender:
    ARTE

    Datum und Uhrzeit:
    31/01, 05:00h

    Titel:
    Warum es sich lohnt, “Der gekaufte Tod” anzuschauen

    Link zur Sendungsseite in der Mediathek:
    https://www.arte.tv/de/videos/080020-000-A/warum-es-sich-lohnt-der-gekaufte-tod-anzuschauen/

    Direkter Link zur Sendung

    Sendung 2

    Sender:
    ARTE

    Datum und Uhrzeit:
    31/01, 05:00h

    Titel:
    Warum es sich lohnt, “Taxi Teheran” anzuschauen

    Link zur Sendungsseite in der Mediathek:
    https://www.arte.tv/de/videos/080021-000-A/warum-es-sich-lohnt-taxi-teheran-anzuschauen/

    Direkter Link zur Sendung

    Betriebssystem:
    Win7, 64-Bit

    MediathekView-Version:
    13.0.6

    Der Fehler kommt wohl daher, dass der Crawler für beide Filme falsche URLs liefert. Meine direkten Links funktionieren und ich weiß auch, dass ich die Filme mit denen selbst downloaden kann.

    Seht es also bitte als einen Hinweis darauf, dass der Crawler gefixt werden muss.

    Und ich selbst würde mich natürlich freuen, MV benutzen zu können, weil es bequemer ist und mir die sehr nützlichen Infodateien liefert.

    Vielen Dank!



  • @benem sagte: Der Fehler kommt wohl daher, dass der Crawler für beide Filme falsche URLs liefert. […] Seht es also bitte als einen Hinweis darauf, dass der Crawler gefixt werden muss.

    In der aktuellen Liste von 09:14 findet sich der erste Film in voller Länge, dafür ist der von dir aufgeführte Kurzbeitrag nicht mehr in der Liste.

    Wenn Video-URLs nicht mehr stimmen bzw. ein “Fehler 404” auftritt, dann verschwinden die entsprechenden Sendungen nach 24 h aus der Filmliste.



  • @styroll sagte: In der aktuellen Liste von 09:14 findet sich der erste Film in voller Länge

    Das kann ich nicht bestätigen.

    0_1518859296465_Taxi Teheran.JPG



  • @nrek-64 sagte: Das kann ich nicht bestätigen.

    Du bestätigst jedoch implizit, dass Lesen i.A. hilfreich wäre. Dein Screenshot bezieht sich auf die zweite Sendung, meine Aussage jedoch explizit auf die erste…



  • @styroll sagte in ARTE: Fehlermeldung bei 2 Sendungen / falsche Film-URLs:

    In der aktuellen Liste von 09:14 findet sich der erste Film in voller Länge, dafür ist der von dir aufgeführte Kurzbeitrag nicht mehr in der Liste.

    Aber auch Du hast nicht präzise gelesen. Mir geht es in beiden Fällen um die von Dir so genannten “Kurzbeiträge”, was auch deutlich jeweils unter “Titel:” steht. Für diese Sendungen werden falsche URLs vom Crawler gesammelt.

    Dass der erste Film in voller Länge in der Filmliste steht, habe ich nie bezweifelt.

    Bisher waren die “Warum es sich lohnt…”-Beiträge immer fehlerfrei in der Liste von MV zu finden. Und wenn dies wieder so wäre, fände ich es toll.



  • @benem sagte: Aber auch Du hast nicht präzise gelesen. Mir geht es in beiden Fällen um die von Dir so genannten “Kurzbeiträge”, was auch deutlich jeweils unter “Titel:” steht. Für diese Sendungen werden falsche URLs vom Crawler gesammelt.

    Hab ich etwas anderes gesagt? Ich hab erwähnt, dass dein erwähnter Kurzbeitrag im Falle der 1. Sendung gar nicht mehr in der Liste zu finden ist. Immerhin macht so dein Posting unter der Rubrik “Fehlende Sendungen” zum aktuellen Zeitpunkt in einem Fall sogar Sinn. Zudem hab dir eine Erklärung dafür gegeben, die im Zusammenhang mit der falschen Video-URL steht.
    Und beiläufig habe ich noch angemerkt, dass dafür die ganze Sendung (im Unterschied zur 2. Sendung) in der Filmliste zu finden ist.

    @benem sagte: Für diese Sendungen werden falsche URLs vom Crawler gesammelt.

    Hier etwas detaillierter eine mögliche Erklärung (am Bsp. der ersten Sendung) ergänzend zur Erklärung in deinem anderen Posting:
    Die Sendung wurde am 31.1. auf der ARTE-Website publiziert. Der Crawler findet die Sendung und extrahiert die Video-URL. Nach mehr als 14 Tagen (16 Tage?) ändert ARTE die Video-URL, aber nicht die Webpage. Der Crawler sucht jedoch nur 14 Tage zurück, prüft jedoch bei älteren Sendungen, ob die Video-URL noch gültig ist. Er stellt diese Nacht fest, dass die Video-URL nicht mehr gültig ist und nimmt den entsprechenden Beitrag aus der Filmliste.

    @pidoubleyou kann mich gerne korrigieren, falls gewisse Aussagen zum Crawler nicht mehr stimmen.



  • Oh Mann, dieser Tonfall ist echt aggressiv und unangenehm. Aber betrifft ja nicht nur mich und fällt auch anderen auf. Soll so das Engagement neuer Community-Mitglieder verhindert werden?

    Na ja… zurück zum Thema:

    @styroll sagte: Hab ich etwas anderes gesagt? Ich hab erwähnt, dass dein erwähnter Kurzbeitrag im Falle der 1. Sendung gar nicht mehr in der Liste zu finden ist. Immerhin macht so dein Posting unter der Rubrik “Fehlende Sendungen” zum aktuellen Zeitpunkt in einem Fall sogar Sinn.

    Um es zukünftig richtig zu machen:
    Gibt es eine andere Rubrik, die für mein Posting richtig gewesen wäre, damit meine Einträge auch sinnvoll sind?

    Für mich ist es eine “Fehlende Sendung”, wenn eine falsche Film-URL extrahiert wird, mithin die Sendung nicht abgerufen werden kann. Aber natürlich existiert der Eintrag noch. In welche Rubrik gehören denn existierende Sendungstitel mit falscher URL dann hin?

    @styroll sagte: Die Sendung wurde am 31.1. auf der ARTE-Website publiziert. Der Crawler findet die Sendung und extrahiert die Video-URL. Nach mehr als 14 Tagen (16 Tage?) ändert ARTE die Video-URL, aber nicht die Webpage. Der Crawler sucht jedoch nur 14 Tage zurück, prüft jedoch bei älteren Sendungen, ob die Video-URL noch gültig ist. Er stellt diese Nacht fest, dass die Video-URL nicht mehr gültig ist und nimmt den entsprechenden Beitrag aus der Filmliste.

    Danke für die Erklärung.

    Nur noch mal zur Vergewisserung: Der Crawler nimmt die Sendung aus der Liste und ignoriert sie bei künftigen Suchvorgängen, ja? Das heißt, es ist nicht damit zu rechnen, dass die Sendung beim nächsten Crawling dann noch mal mit der korrekten Film-URL in die Liste aufgenommen wird?

    Vielen Dank für die Mühe!


  • Entwickler

    @benem sagte in ARTE: Fehlermeldung bei 2 Sendungen / falsche Film-URLs:

    Nur noch mal zur Vergewisserung: Der Crawler nimmt die Sendung aus der Liste und ignoriert sie bei künftigen Suchvorgängen, ja? Das heißt, es ist nicht damit zu rechnen, dass die Sendung beim nächsten Crawling dann noch mal mit der korrekten Film-URL in die Liste aufgenommen wird?

    Normalerweise würde der Crawler die Film-URL beim nächsten Suchlauf anpassen, wenn eine Änderung erfolgt ist. Allerdings gibt es aktuell ein Problem mit dem ARTE-Crawler, so dass vermutlich deshalb aktuell keine Aktualisierung erfolgt.


 

114
Online

2.5k
Benutzer

2.1k
Themen

12.4k
Beiträge