Skip to content
  • Kategorien
  • Aktuell
  • Tags
  • Beliebt
  • Benutzer
  • Gruppen
Skins
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Standard: (Kein Skin)
  • Kein Skin
Einklappen
MediathekView Logo

MediathekView-Forum

  1. Übersicht
  2. Ideen, Anregungen, Verbesserungen
  3. Eigene Duplikat-Erkennung via Regex (Title-Normalization)

Eigene Duplikat-Erkennung via Regex (Title-Normalization)

Geplant Angeheftet Gesperrt Verschoben Ideen, Anregungen, Verbesserungen
2 Beiträge 2 Kommentatoren 45 Aufrufe 1 Watching
  • Älteste zuerst
  • Neuste zuerst
  • Meiste Stimmen
Antworten
  • In einem neuen Thema antworten
Anmelden zum Antworten
Dieses Thema wurde gelöscht. Nur Nutzer mit entsprechenden Rechten können es sehen.
  • D Offline
    D Offline
    dolebo
    schrieb zuletzt editiert von
    #1

    Die Duplikat-Erkennung scheitert oft an variierenden Schreibweisen (Präfixe, Jahreszahlen). Es wäre hilfreich, eigene Regex-Regeln (pro Filter) zu definieren, die den Titel vor dem Abgleich bereinigen.

    Zum Beispiel:

    • Der Irre Iwan
    • Tatort: Der Irre Iwan
    • Der Irre Iwan (2020)

    Beispiel-Regex:
    ((?i)^Tatort:\s*)|(\s*\(\d{4}\)$)
    würde alle obigen Sendungen zu

    Der Irre Iwan

    normalisieren.

    Einfach erst alles wild herunterladen und danach (mit externem Tool) aufräumen ist natürlich eine Option - aber auch Resourcenverschwendung.

    1 Antwort Letzte Antwort
    • DaDirnbocherD Offline
      DaDirnbocherD Offline
      DaDirnbocher
      schrieb zuletzt editiert von
      #2

      Welche der drei Versionen soll dann runtergeladen werden?

      In dem Beispiel mit dem irren Iwan haben die 3 Versionen jeweils in der höchsten Auflösung eine Filegröße von ca. 2300 MB bis ca. 3200 MB.

      1 Antwort Letzte Antwort
      Antworten
      • In einem neuen Thema antworten
      Anmelden zum Antworten
      • Älteste zuerst
      • Neuste zuerst
      • Meiste Stimmen


      101

      Online

      7.0k

      Benutzer

      6.5k

      Themen

      41.2k

      Beiträge
      • Anmelden

      • Du hast noch kein Konto? Registrieren

      • Anmelden oder registrieren, um zu suchen
      • Erster Beitrag
        Letzter Beitrag
      0
      • Kategorien
      • Aktuell
      • Tags
      • Beliebt
      • Benutzer
      • Gruppen