Serienerkennung?
-
Hallo @Hildegard,
vielen Dank für den Hinweis. Über
fersehserien.de
wusste ich zumindest von der Existenz vonwunschliste.de
, konnte mich aber bisher nicht damit anfreunden. Hast du Erfahrungen wie genau man seine Wünsche eingrenzen kann? Mich interessieren ja nur die Serien, die man dann über die ÖR-Mediatheken sehen kann. Und nicht die Masse von anderen Serien über andere Kanäle.herbivore
-
Hallo zusammen,
kurze Anmerkung von mir: die Serienerkennung des AddOns ist keine wirklich gute Idee. Ich habe den ganzen NFO-Krams eigentlich auch nur eingebaut, da ich es als Vorteil ansehe bei Sendungen die ich mir herunter lade um sie in meiner persönlichen Mediathek zu archivieren nicht den NFO komplett manuell erstellen zu müssen - was im Umkehrschluss bedeutet, dass ich einen manuellen Redaktionspassus/Eingriff immer eingeplant habe. Es war ein Freund von mir, der mich so lange gepiesackt hat, bis dass ich ihm die sogenannte Serienerkennung eingebaut habe. Wie aber hier schon von verschiedenen Foristen angemerkt wurde, wissen die Fernsehsender nicht wirklich, was Sache ist und geben sich auch nicht die Mühe die Daten korrekt in die Mediatheken einzugeben. Über die Mühen des Archivars kann ich ein Lied von Singen, da ich einer der Hauptbeteiligten bei der Eingabe der Daten zu Tatort und Polizeiruf 100 im TMDb bin.
Unter Umständen wäre es natürlich möglich gewisse Inhalte mit Daten aus anderen Datenbanken anzureichern. Wobei auch hier nicht wirklich Freude aufkommt, da nicht jede Datenbank bzgl. ihrer Nutzungsbedingungen so einfach mal abgefragt werden darf (Stichwort fersehserien.de und serienjunkies.de)
Bezüglich des neuen Features Native Updates im Plugin (Server der für die interne Datenbank native Update-Informationen für die jeweiligen Datenbanksysteme zur Verfügung stellt um die Updates zu beschleunigen) erwäge ich zur Zeit auch die Anreicherung von Daten - in erster Linie so eine Art Kategorisierung um eine bessere Navigation zu ermöglichen. In diesem Zuge wäre die Abfrage externer Datenbanken natürlich denkbar. Ein solches Vorgehen hat allerdings Grenzen:
- Viele Sendungen lassen sich nicht in externe Datenbanken abfragen, weil sie weder ein Film noch eine Serie darstellen. Zu solchen Sendungen werden sich kaum brauchbare Metadaten finden lassen.
- Alle Sendungen die Erstausstrahlungen sind, lassen sich ganz schlecht anreichern, weil sie in den externen Datenbanken noch nicht verzeichnet sind. Bestes Beispiel Tatort. Spätestens am Sonntag um 21:50 oder so ist die aktuelle Folge in der Mediathek. Sehr selten - also wirklich nur sehr selten - bin ich mal so artig und schaffe es alle Daten zur aktuellen Folge schon im voraus in TMDb einzutragen. In der Regel mache ich das aber erst nach der Ausstrahlung.
-
Dieser Beitrag wurde gelöscht!
-
@konnerapono sagte in Serienerkennung?:
Mir würde schon reichen, wenn am Anfang von Thema, Titel oder Beschreibung z.B. "Serie: " eingefügt werden würde. Das wäre für mich eine sehr große Hilfe.
Und woher soll diese Info kommen?
Konkreter: Wie sollen die Crawler wissen, was eine Serie ist und was nicht? (Anmerkung: warum das nämlich nicht so einfach ist, hat @tuxpoldo im Post davor wunderschön erklärt).
-
Hallo zusammen,
die Schwierigkeiten einer Serienerkennung sind in der Tat beschrieben; die Möglichkeiten wurden allerdings auch schon zumindest angerissen. Zudem kann man die Schwierigkeiten als Herausforderung sehen. Sie müssen nicht zwangsläufig ein Hinderungsgrund sein.
Davon unabhängig ist der Wunsch von @konnerapono aus Benutzersicht legitim, selbst wenn er nicht weiß, wie das ganze technisch realisiert werden könnte.
Trotzdem respektiere ich die Entscheidung der Entwickler, den Vorschlag nicht aufzugreifen. Das macht allerdings den Vorschlag nicht per se schlecht oder unsinnig.
Ich habe mir inzwischen mit etwas Regex beholfen, quasi eine Erkennung von gängigen formalen Merkmalen wie Folgenummern in Klammern, die in der Praxis bisher ganz gut funktioniert hat. Immerhin gab es seitdem (also Februar) keine Serie mehr, von deren Existenz ich wie manchmal früher erst erfahren habe, nachdem diese schon wieder aus der Mediathek verschwunden war. Dafür nehme ich gerne in Kauf, dass der Pattern keinen Unterschied macht, ob es sich um Unterhaltungs- oder Doku-Serien handelt und er außerdem fälschlich einige Einträge findet, die zu keiner Serie gehören. Und andersherum leider auch die Einträge von Serien nicht, die diese Merkmale nicht aufweisen.
Vielleicht hilft der Pattern dem einen oder der anderen weiter:
#:[\s\S]*(serie|(?:folge|teil) \d|\d\. (?:folge|teil)|staffel|\(s?\d+\s*(?:(?:/|von|of)\s*[ef]?\d+)?\))[\s\S]*
herbivore
PS: Etwaige Verbesserungen des Patterns sind gerne gesehen.
-
@herbivore Ich hab dein Pattern mal genutzt und mir ein Abo dafür nur für die ARD angelegt. Die Performance ist dann aber echt grausam oder? Das sind ja 10 Sekunden und teilweise mehr wo die App einfriert und nichts passiert. Dafür findet sie bei mir dann auch um 2500 Einträge die das Pattern matchen.
Ist das bei dir auch so langsam? Bzw. Wie nutzt Du das Pattern?
-
Hallo @DerReisende77,
vielen Dank für dein Interesse.
Also meine Erfahrung mit Regex generell in der Programmierwelt ist, dass die Performance in den allermeisten Fällen sehr brauchbar ist. Da bei Mediathekview 13.0.6 allerdings die Suche über den gesamten Bestand - zumindest mit “Irgendwo” und mehreren Suchbegriffen - mit spürbarer Verzögerung erfolgt, wird es durch Regex in der Tat eher noch etwas langsamer. Diese Beobachtung habe ich in MV für die verschiedensten Suchanfragen gemacht und scheint mir kein Problem dieses speziellen Pattern zu sein. Das vorweg geschickt. (13.x habe ich diesbezüglich noch nicht ausprobiert.)
Da ich aber den Pattern eh nur für die jeweils neuen Einträge benutze, ist die Suche mit dem Pattern bei mir vollkommen verzögerungsfrei.
Wenn ich ihn im Suchfeld Thema/Titel (mit “Igendwo” ausgewählt) über den gesamten Bestand benutze, dauert es auch bei mir ca. 10 Sekunden.
herbivore
-
@graceinc Ich würde gerne sehen, dass du die Option selbst in deiner Freizeit ein baust so, dass sie zuverlässig funktioniert und die Performance nicht drastisch verschlechtert.