Skip to content
  • Kategorien
  • Aktuell
  • Tags
  • Beliebt
  • Benutzer
  • Gruppen
Skins
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Standard: (Kein Skin)
  • Kein Skin
Einklappen
MediathekView Logo

MediathekView-Forum

  1. Übersicht
  2. Ideen, Anregungen, Verbesserungen
  3. Eigene Duplikat-Erkennung via Regex (Title-Normalization)

Eigene Duplikat-Erkennung via Regex (Title-Normalization)

Geplant Angeheftet Gesperrt Verschoben Ideen, Anregungen, Verbesserungen
4 Beiträge 2 Kommentatoren 78 Aufrufe 1 Watching
  • Älteste zuerst
  • Neuste zuerst
  • Meiste Stimmen
Antworten
  • In einem neuen Thema antworten
Anmelden zum Antworten
Dieses Thema wurde gelöscht. Nur Nutzer mit entsprechenden Rechten können es sehen.
  • D Offline
    D Offline
    dolebo
    schrieb zuletzt editiert von
    #1

    Die Duplikat-Erkennung scheitert oft an variierenden Schreibweisen (Präfixe, Jahreszahlen). Es wäre hilfreich, eigene Regex-Regeln (pro Filter) zu definieren, die den Titel vor dem Abgleich bereinigen.

    Zum Beispiel:

    • Der Irre Iwan
    • Tatort: Der Irre Iwan
    • Der Irre Iwan (2020)

    Beispiel-Regex:
    ((?i)^Tatort:\s*)|(\s*\(\d{4}\)$)
    würde alle obigen Sendungen zu

    Der Irre Iwan

    normalisieren.

    Einfach erst alles wild herunterladen und danach (mit externem Tool) aufräumen ist natürlich eine Option - aber auch Resourcenverschwendung.

    1 Antwort Letzte Antwort
    • DaDirnbocherD Offline
      DaDirnbocherD Offline
      DaDirnbocher
      schrieb zuletzt editiert von
      #2

      Welche der drei Versionen soll dann runtergeladen werden?

      In dem Beispiel mit dem irren Iwan haben die 3 Versionen jeweils in der höchsten Auflösung eine Filegröße von ca. 2300 MB bis ca. 3200 MB.

      1 Antwort Letzte Antwort
      • D Offline
        D Offline
        dolebo
        schrieb zuletzt editiert von
        #3

        Spontan fallen mir drei Optionen ein:

        • man legt in den Settings eine Priorität fest: größte Size, höchste Bitrate, ARD vor MDR oder ähnlich
        • der User Entscheidet Fall für Fall
        • random
        DaDirnbocherD 1 Antwort Letzte Antwort
        • D dolebo

          Spontan fallen mir drei Optionen ein:

          • man legt in den Settings eine Priorität fest: größte Size, höchste Bitrate, ARD vor MDR oder ähnlich
          • der User Entscheidet Fall für Fall
          • random
          DaDirnbocherD Offline
          DaDirnbocherD Offline
          DaDirnbocher
          schrieb zuletzt editiert von
          #4

          @dolebo sagte in Eigene Duplikat-Erkennung via Regex (Title-Normalization):

          der User Entscheidet Fall für Fall

          Zumindest diese Option hat man jetzt schon, in dem man Downloads nicht sofort starten läßt und via Download-Tab entscheidet, was runtergeladen werden soll und was nicht.

          1 Antwort Letzte Antwort
          Antworten
          • In einem neuen Thema antworten
          Anmelden zum Antworten
          • Älteste zuerst
          • Neuste zuerst
          • Meiste Stimmen


          85

          Online

          7.0k

          Benutzer

          6.5k

          Themen

          41.2k

          Beiträge
          • Anmelden

          • Du hast noch kein Konto? Registrieren

          • Anmelden oder registrieren, um zu suchen
          • Erster Beitrag
            Letzter Beitrag
          0
          • Kategorien
          • Aktuell
          • Tags
          • Beliebt
          • Benutzer
          • Gruppen