Skip to content
  • Kategorien
  • Aktuell
  • Tags
  • Beliebt
  • Benutzer
  • Gruppen
Skins
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Standard: (Kein Skin)
  • Kein Skin
Einklappen
MediathekView Logo

MediathekView-Forum

  1. Übersicht
  2. Fragen, Hilfe, Kritik
  3. Erkennung doppelter Beiträge

Erkennung doppelter Beiträge

Geplant Angeheftet Gesperrt Verschoben Fragen, Hilfe, Kritik
10 Beiträge 4 Kommentatoren 395 Aufrufe 1 Watching
  • Älteste zuerst
  • Neuste zuerst
  • Meiste Stimmen
Antworten
  • In einem neuen Thema antworten
Anmelden zum Antworten
Dieses Thema wurde gelöscht. Nur Nutzer mit entsprechenden Rechten können es sehen.
  • K Offline
    K Offline
    Konstrukteur
    schrieb am zuletzt editiert von Konstrukteur
    #1

    Ich benutze Mediathekview und ein eigenes Programm, um Medien zu abonnieren und zu verwalten. Wie andere Nutzer habe ich das Problem der Erkennung von doppelten Beiträgen. Ich würde gern näheres über die Metadaten erfahren, um diese eventuell zum Sortieren verwenden zu können.

    Meine Fragen beziehen sich auf den Ursprung von “timestamp”, “filmlisteTimestamp” und die “id”. Worauf beziehen sich die beiden timestamp Attribute? Wann ändern sie sich? Wann wird eine ID vergeben? Identifiziert diese ein Medium, einen Sendetermin? Ab welchem Punkt wird für einen Film, eine Episode eine neue ID vergeben? Neuer Sendetermin, neuer Kanal, leicht geänderter Name oder Beschreibung?

    Danke im Voraus für euer Feedback

    mac-christianM 1 Antwort Letzte Antwort
    • K Konstrukteur

      Ich benutze Mediathekview und ein eigenes Programm, um Medien zu abonnieren und zu verwalten. Wie andere Nutzer habe ich das Problem der Erkennung von doppelten Beiträgen. Ich würde gern näheres über die Metadaten erfahren, um diese eventuell zum Sortieren verwenden zu können.

      Meine Fragen beziehen sich auf den Ursprung von “timestamp”, “filmlisteTimestamp” und die “id”. Worauf beziehen sich die beiden timestamp Attribute? Wann ändern sie sich? Wann wird eine ID vergeben? Identifiziert diese ein Medium, einen Sendetermin? Ab welchem Punkt wird für einen Film, eine Episode eine neue ID vergeben? Neuer Sendetermin, neuer Kanal, leicht geänderter Name oder Beschreibung?

      Danke im Voraus für euer Feedback

      mac-christianM Offline
      mac-christianM Offline
      mac-christian
      schrieb am zuletzt editiert von
      #2

      @Konstrukteur ich kann dir nur zur ID etwas sagen: die wird nämlich individuell angelegt - vermutlich damit das Programm die Übersicht über die Filme behält. Wenn du zwei Computer hast, wird die ID auf den beiden Geräten unterschiedlich sein.

      In der Filmliste von heute, 9:34 ist z.B. “10 vor 10” von SRF gestern abend:
      1322769 auf dem MacBook
      1326532 auf dem iMac

      Die ID eignet sich also nicht als Referenz für einen Film.

      Die ID ist auch bei “doppelten Einträgen” jeweils unterschiedlich.

      K 1 Antwort Letzte Antwort
      • mac-christianM mac-christian

        @Konstrukteur ich kann dir nur zur ID etwas sagen: die wird nämlich individuell angelegt - vermutlich damit das Programm die Übersicht über die Filme behält. Wenn du zwei Computer hast, wird die ID auf den beiden Geräten unterschiedlich sein.

        In der Filmliste von heute, 9:34 ist z.B. “10 vor 10” von SRF gestern abend:
        1322769 auf dem MacBook
        1326532 auf dem iMac

        Die ID eignet sich also nicht als Referenz für einen Film.

        Die ID ist auch bei “doppelten Einträgen” jeweils unterschiedlich.

        K Offline
        K Offline
        Konstrukteur
        schrieb am zuletzt editiert von
        #3

        @mac-christian Danke dir für dein Feedback. Du meinst den Hash am Ende der heruntergeladenen Datei? Der müsste laut online Beschreibung in der Hilfe ein Hash der URL sein. Keine Ahnung ob mit oder ohne Protokoll… Der Unterschied könnte bei dir eventuell auch daran liegen, dass du einmal ‘HD’, und ein anderes mal ‘normal’ oder ‘low’ abgerufen hast? Da jede Version jeweils eine eigene URL hat, entstehen unterschiedliche Hashs.

        Leider habe ich keine Ahnung, was fuer ein Verfahren verwendet wird, um den Hash zu erzeugen. SHA1, SHA256 oder MD5 erzeugen alphanumerische Hashs. Hier könnte es allerhöchstens sein, dass nur die Zahlen genommen werden. Numerische Hashs könnte man mit CRC32 oder FNV1a_32 erstellen. Ich würde gern wissen, welche Funktion verwendet wird, um den Hash zu erzeugen, da ich doppelte Dateien habe, mit der URL aber ohne den Hash und Dateien ohne URL, aber mit Hash. Wenn ich wüsste, welcher Hash verwendet wird, könnte ich schon mal einen Teil meiner doppelten Dateien identifizieren.

        Ich würde ausserdem gern erfahren, für was der Timestamp steht? Letzter Drehtag, Schnitt, Premiere, erstes mal gesendet, erstes mal in einer Mediathek, letztes mal in der Mediathek??? Wenn man wenigstens den Timestamp zuordnen könnte, hätte ich noch einen Angriffspunkt zur Identifikation.

        Die ID der Medien müsste ne Art UUID sein wie z.B.: SG2S8Zg3ismgMWlinYGwtTqNfdW3LTS0QXUEQpExajk=

        mac-christianM Georg-JG 2 Antworten Letzte Antwort
        • K Konstrukteur

          @mac-christian Danke dir für dein Feedback. Du meinst den Hash am Ende der heruntergeladenen Datei? Der müsste laut online Beschreibung in der Hilfe ein Hash der URL sein. Keine Ahnung ob mit oder ohne Protokoll… Der Unterschied könnte bei dir eventuell auch daran liegen, dass du einmal ‘HD’, und ein anderes mal ‘normal’ oder ‘low’ abgerufen hast? Da jede Version jeweils eine eigene URL hat, entstehen unterschiedliche Hashs.

          Leider habe ich keine Ahnung, was fuer ein Verfahren verwendet wird, um den Hash zu erzeugen. SHA1, SHA256 oder MD5 erzeugen alphanumerische Hashs. Hier könnte es allerhöchstens sein, dass nur die Zahlen genommen werden. Numerische Hashs könnte man mit CRC32 oder FNV1a_32 erstellen. Ich würde gern wissen, welche Funktion verwendet wird, um den Hash zu erzeugen, da ich doppelte Dateien habe, mit der URL aber ohne den Hash und Dateien ohne URL, aber mit Hash. Wenn ich wüsste, welcher Hash verwendet wird, könnte ich schon mal einen Teil meiner doppelten Dateien identifizieren.

          Ich würde ausserdem gern erfahren, für was der Timestamp steht? Letzter Drehtag, Schnitt, Premiere, erstes mal gesendet, erstes mal in einer Mediathek, letztes mal in der Mediathek??? Wenn man wenigstens den Timestamp zuordnen könnte, hätte ich noch einen Angriffspunkt zur Identifikation.

          Die ID der Medien müsste ne Art UUID sein wie z.B.: SG2S8Zg3ismgMWlinYGwtTqNfdW3LTS0QXUEQpExajk=

          mac-christianM Offline
          mac-christianM Offline
          mac-christian
          schrieb am zuletzt editiert von mac-christian
          #4

          @Konstrukteur sagte in Erkennung doppelter Beiträge:

          Du meinst den Hash am Ende der heruntergeladenen Datei?

          Nein, ich meine die ID, oder auch “Film-Nummer”.
          Bildschirmfoto 2024-11-13 um 21.32.21.jpg

          Wie du aus dem Bild sehen kannst, wird die Film-Nr. / ID wohl bei jedem Öffnen des Programms neu generiert, auch wenn es die gleiche Filmliste ist (ist mir bisher auch nicht aufgefallen).

          K 1 Antwort Letzte Antwort
          • K Konstrukteur

            @mac-christian Danke dir für dein Feedback. Du meinst den Hash am Ende der heruntergeladenen Datei? Der müsste laut online Beschreibung in der Hilfe ein Hash der URL sein. Keine Ahnung ob mit oder ohne Protokoll… Der Unterschied könnte bei dir eventuell auch daran liegen, dass du einmal ‘HD’, und ein anderes mal ‘normal’ oder ‘low’ abgerufen hast? Da jede Version jeweils eine eigene URL hat, entstehen unterschiedliche Hashs.

            Leider habe ich keine Ahnung, was fuer ein Verfahren verwendet wird, um den Hash zu erzeugen. SHA1, SHA256 oder MD5 erzeugen alphanumerische Hashs. Hier könnte es allerhöchstens sein, dass nur die Zahlen genommen werden. Numerische Hashs könnte man mit CRC32 oder FNV1a_32 erstellen. Ich würde gern wissen, welche Funktion verwendet wird, um den Hash zu erzeugen, da ich doppelte Dateien habe, mit der URL aber ohne den Hash und Dateien ohne URL, aber mit Hash. Wenn ich wüsste, welcher Hash verwendet wird, könnte ich schon mal einen Teil meiner doppelten Dateien identifizieren.

            Ich würde ausserdem gern erfahren, für was der Timestamp steht? Letzter Drehtag, Schnitt, Premiere, erstes mal gesendet, erstes mal in einer Mediathek, letztes mal in der Mediathek??? Wenn man wenigstens den Timestamp zuordnen könnte, hätte ich noch einen Angriffspunkt zur Identifikation.

            Die ID der Medien müsste ne Art UUID sein wie z.B.: SG2S8Zg3ismgMWlinYGwtTqNfdW3LTS0QXUEQpExajk=

            Georg-JG Offline
            Georg-JG Offline
            Georg-J
            schrieb am zuletzt editiert von
            #5

            @Konstrukteur md5 wird benutzt.

            K P 2 Antworten Letzte Antwort
            • mac-christianM mac-christian

              @Konstrukteur sagte in Erkennung doppelter Beiträge:

              Du meinst den Hash am Ende der heruntergeladenen Datei?

              Nein, ich meine die ID, oder auch “Film-Nummer”.
              Bildschirmfoto 2024-11-13 um 21.32.21.jpg

              Wie du aus dem Bild sehen kannst, wird die Film-Nr. / ID wohl bei jedem Öffnen des Programms neu generiert, auch wenn es die gleiche Filmliste ist (ist mir bisher auch nicht aufgefallen).

              K Offline
              K Offline
              Konstrukteur
              schrieb am zuletzt editiert von
              #6

              @mac-christian Ja genau, das ist die Filmnummer, die vom Client bei jedem Laden der Liste neu vergeben wird. Das Backend hat dann ne eigene. Ich danke dir!

              1 Antwort Letzte Antwort
              • Georg-JG Georg-J

                @Konstrukteur md5 wird benutzt.

                K Offline
                K Offline
                Konstrukteur
                schrieb am zuletzt editiert von
                #7

                @Georg-J Vieeeeelen Dank!!! Damit kann ich mal versuchen weiter zu kommen und einen Teil meiner Dopplungen zu identifizieren. Wünsch dir einen schönen Tag!

                1 Antwort Letzte Antwort
                • Georg-JG Georg-J

                  @Konstrukteur md5 wird benutzt.

                  P Offline
                  P Offline
                  pidoubleyou
                  Entwickler
                  schrieb am zuletzt editiert von
                  #8

                  @Konstrukteur eine eindeutige Identifikation eines Films/Episode gibt es leider in MediathekView nicht - sonst könnten wir doppelte Beiträge selbst auch besser erkennen.

                  der Hash, der mittels %z in den Dateinamen integriert werden kann, ist ein Hash der Download-Url, Details zur Erzeugung siehe Code
                  Die Url kann sich verändern, wenn der Sender die Auflösungen ändern, eine Sendung erneut online stellt oder beim ZDF auch manchmal ohne erkennbaren Grund. Deshalb tauchen in MediathekView-Sendungen manchmal in der Downloadliste auf, obwohl sie schon heruntergeladen wurden.

                  der Timestamp, der mittels %D/%d in den Dateinamen integriert werden kann, bezieht sich auf das Sendedatum. MediathekView ermittelt dieses aus den Infos der Mediatheken. Im Regelfall ist es der Zeitpunkt der (Erst-)Ausstrahlung der Sendung, bei nur online verfügbaren Beiträgen der Zeitpunkt der Online-Stellung. Ob ein Sender bei einer erneuten Bereitstellung in der Mediathek das alte Erstausstrahlungsdatum benutzt oder ein neues, ist nicht vorhersagbar.

                  K 2 Antworten Letzte Antwort
                  • P pidoubleyou

                    @Konstrukteur eine eindeutige Identifikation eines Films/Episode gibt es leider in MediathekView nicht - sonst könnten wir doppelte Beiträge selbst auch besser erkennen.

                    der Hash, der mittels %z in den Dateinamen integriert werden kann, ist ein Hash der Download-Url, Details zur Erzeugung siehe Code
                    Die Url kann sich verändern, wenn der Sender die Auflösungen ändern, eine Sendung erneut online stellt oder beim ZDF auch manchmal ohne erkennbaren Grund. Deshalb tauchen in MediathekView-Sendungen manchmal in der Downloadliste auf, obwohl sie schon heruntergeladen wurden.

                    der Timestamp, der mittels %D/%d in den Dateinamen integriert werden kann, bezieht sich auf das Sendedatum. MediathekView ermittelt dieses aus den Infos der Mediatheken. Im Regelfall ist es der Zeitpunkt der (Erst-)Ausstrahlung der Sendung, bei nur online verfügbaren Beiträgen der Zeitpunkt der Online-Stellung. Ob ein Sender bei einer erneuten Bereitstellung in der Mediathek das alte Erstausstrahlungsdatum benutzt oder ein neues, ist nicht vorhersagbar.

                    K Offline
                    K Offline
                    Konstrukteur
                    schrieb am zuletzt editiert von
                    #9

                    @pidoubleyou Super! Danke dir recht herzlich für die Informationen. Mal schauen, ob ich damit der Situation hier Herr werde ;0)

                    1 Antwort Letzte Antwort
                    • P pidoubleyou

                      @Konstrukteur eine eindeutige Identifikation eines Films/Episode gibt es leider in MediathekView nicht - sonst könnten wir doppelte Beiträge selbst auch besser erkennen.

                      der Hash, der mittels %z in den Dateinamen integriert werden kann, ist ein Hash der Download-Url, Details zur Erzeugung siehe Code
                      Die Url kann sich verändern, wenn der Sender die Auflösungen ändern, eine Sendung erneut online stellt oder beim ZDF auch manchmal ohne erkennbaren Grund. Deshalb tauchen in MediathekView-Sendungen manchmal in der Downloadliste auf, obwohl sie schon heruntergeladen wurden.

                      der Timestamp, der mittels %D/%d in den Dateinamen integriert werden kann, bezieht sich auf das Sendedatum. MediathekView ermittelt dieses aus den Infos der Mediatheken. Im Regelfall ist es der Zeitpunkt der (Erst-)Ausstrahlung der Sendung, bei nur online verfügbaren Beiträgen der Zeitpunkt der Online-Stellung. Ob ein Sender bei einer erneuten Bereitstellung in der Mediathek das alte Erstausstrahlungsdatum benutzt oder ein neues, ist nicht vorhersagbar.

                      K Offline
                      K Offline
                      Konstrukteur
                      schrieb am zuletzt editiert von
                      #10

                      @pidoubleyou Der Hinweis auf den SourceCode war Gold wert. Jetzt kann ich den Hash nachbilden und die bei mir doppelten Dateien ohne Hash mit denen mit Hash abgleichen! Vielen Dank!

                      1 Antwort Letzte Antwort
                      Antworten
                      • In einem neuen Thema antworten
                      Anmelden zum Antworten
                      • Älteste zuerst
                      • Neuste zuerst
                      • Meiste Stimmen


                      37

                      Online

                      7.0k

                      Benutzer

                      6.5k

                      Themen

                      41.0k

                      Beiträge
                      • Anmelden

                      • Du hast noch kein Konto? Registrieren

                      • Anmelden oder registrieren, um zu suchen
                      • Erster Beitrag
                        Letzter Beitrag
                      0
                      • Kategorien
                      • Aktuell
                      • Tags
                      • Beliebt
                      • Benutzer
                      • Gruppen