Crawler Ersetzungstabelle
-
Heute hatte ich Spaß mit Sendungen auf Arte. Die Sendungen hießen beispielsweise “Dreimal Manon (1/3)” oder “Manon, 20 Jahre (1/3)”. Ist schon interessant, was da als Ergebnis herauskommt, denn die Slashes führen zu unerwünschten Unterverzeichnissen. Beim Dateinamen habe ich schon eine Ersetzungstabelle, um Leerzeichen etc. umzuwandeln, aber beim Verzeichnisname wird wohl einfach das Thema hergenommen. Es wäre sicherlich hilfreich, im Crawler bereits ungültige Zeichen aus dem Titel / Thema zu entfernen, denn wer weiß, welchen Unfug die Namen sonst über die Filmliste mit MV anstellen. Linux und Windows haben vielleicht andere Zeichen mit Sonderfunktionen, aber die folgenden Zeichen sind neben nicht darstellbaren Zeichen sicherlich kritisch:
-
- Sternchen (*)
Senkrechter Strich (|)
Umgekehrter Schrägstrich (\)
Doppelpunkt (:)
Doppeltes Anführungszeichen (")
Kleiner als (<)
Größer als (>)
Fragezeichen (?)
Schrägstrich (/)
- Sternchen (*)
-
-
Die tags, die der Xaver zuletzt als ‘Thema’ benutzt hat, hatten keine Sonderzeichen. Vermutlich wird deshalb die Ersetzungstabelle nur auf den Titel angewandt, und nicht auf das Thema. - Sonderzeichen im Titel, insbesondere der Schrägstrich bei der Teile-Nummer des Serientitels, werden bei mir problemlos ersetzt.
Ich wiederhole mich: die Spalte ‘Thema’ ist für den Namen der Sendereihe gedacht, nicht für den Titel einer Sendung. Insbesondere nicht für veränderliche Serientitel, mit Schrägstrich.
Bei Sendereihen bleibt das Thema immer gleich, weil es nicht aus einem Sendungstitel genommen wird, sondern es ist der Ordnername, in dem sich die Sendereihen-Folgen befinden. Diese ‘Thema’’ wird nur einmal ausgelesen, und wird dann solange beibehalten, bis alle Sendungen des Ordners verarbeitet sind. Ein neues 'Thema ’ gibt es erst beim nächsten Ordner.
Wer sich den Unterschied zwischen Thema und Titel vor Augen führen will: bei der ARD gibt es in der Filmliste 2 Einträge mit Titel: ‘In search of Chopin’ mit dem Thema ‘WDR Klassik’.
Hier haben wir den seltenenFall, dass es innerhalb einer Sendereihe (WDR Klassik) eine 2-teilige Serie gibt. - Daran ist klar zu erkennen, dass der Serientitel niemals ins Feld ‘Thema’ darf. Sonst wird das Arte-Chaos nie enden. -
@MenchenSued Richtig. Genau diese neun Zeichen sind unter Windows nicht erlaubt.
Allerdings funktioniert bei mir die Übersetzungstabelle beim manuellen Download sowohl für Datei- wie auch für Verzeichnisnamen. (Abos habe ich nicht getestet.) -
Änderung der Benennung von ARTE Sendungen ab dem 3.06.2017.
Ab dem Datum werden die ARTE Sendungen (Thema und Titel) anders in der Filmliste aufgenommen.
Kontrolliert also ob eure ABOs noch funktionieren und aktualisiert sie gegebenfalls.
Mehr könnt ihr hier https://github.com/mediathekview/MServer/issues/162 nachlesen. -
eigentlich werden Pfadtrenner (je nach Betriebssystem: /) wie auch die im BS nicht erlaubten Zeichen erkannt und entfernt.
(wenn man die Ersetzungsfunktion nicht abgeschaltet hat)