Kaputte URLs in den Info-Dateien
-
Bei den Filmen Über die Grenze - Alles auf eine Karte und Über die Grenze - Gesetzlos ist mir aufgefallen, dass in den Info-Dateien kaputte URLs landen. Das Problem ist das Ü, welches dort nicht unkodiert vorkommen darf (auch wenn das im Browser und hier im Forum kommentarlos akzeptiert wird und funktioniert).
Bei weiterer Nachforschung wurde klar, dass das Problem nicht erst in den Info-Dateien entsteht, sondern bereits in den Filmlisten besteht und seinen Anfang in der Mediathek findet. Denn bereits da sind die URLs kaputt.
Edit: Möglicherweise liegt das Problem auch nur in meinem Editor, welcher wohl mit RFC3987 nichts anfangen kann.
-
@mvsfsvm Ich seh da eigentlich kein Problem. Sowohl in der Info-Datei als auch in der Links wird ein Umlaut angezeigt. Kopiere ich den Link aus dem Editor in den Browser, lande ich beim Film. Falls Dein Editor Umlaute nicht anzeigt, hat er vielleicht die falsche Codepage eingestellt. UTF-8 sollte passen.
-
@menchensued sagte in Kaputte URLs in den Info-Dateien:
@mvsfsvm Ich seh da eigentlich kein Problem. Sowohl in der Info-Datei als auch in der Links wird ein Umlaut angezeigt. Kopiere ich den Link aus dem Editor in den Browser, lande ich beim Film.
Deshalb auch die Ergänzung mit dem Hinweis auf den RFC. Nur hab ich da nicht so den Durchblick, um überhaupt entscheiden zu können, ob es überhaupt außerhalb des Editors ein Problem gibt und falls ja, wo es liegt. Jedenfalls ist mir aufgefallen, dass es wohl wie bei IDNs einen Unterschied zwischen der Anzeige und dem, was dann tatsächlich über die Leitung geht einen Unterschied gibt.
Falls Dein Editor Umlaute nicht anzeigt, hat er vielleicht die falsche Codepage eingestellt. UTF-8 sollte passen.
Die Anzeige der Umlaute ist nicht das Problem, die URL-Erkennung im Editor schneidet die URL vor dem Umlaut ab. Und nein, UTF-8 ist nicht passend. MV verwendet da zum Speichern unter Windows offensichtlich die Codepage des Systems und das ist hier windows-1252.
-
Das ‘Ü’ in der URL http://www.ardmediathek.de/tv/Filme-im-Ersten/Über-die-Grenze-Gesetzlos/Das-Erste/Video?bcastId=1933898&documentId=48392566 ist in der Filmliste UTF-8-kodiert (0xC39C) und in der Infodatei mit dem Zeichensatz 1252 “ANSI - Lateinisch I” (0xDC).