Skip to content

API Quellen der einzelnen Add ons

prof-membrane edited this page Oct 3, 2017 · 2 revisions

Die verschiedenen Scraper (z.B. libdaserste) meiner Add-ons bedienen sich an verschiedensten Quellen. Oft stehen bei den Sendeanstalten mehrere APIs zur Auswahl. Für ein Add-on wird in der Regel die Quelle genommen, die möglichst alle Informationen liefert. Dies umfasst:

  • vollständige Videolisten
  • Metadaten (Plot, Laufzeit, ...)
  • bestmögliche Videoauflösung
  • saubere Datensätze
  • möglichst viele Videos pro Seitenaufruf
  • kurze Ladezeiten

Die Scraper bedienen sich teilweise bei mehreren Schnittstellen.

Schnittstellen

HTML

Fast jede Quelle gibt es als klassische HTML Webseite. Teilweise sind auch Android Apps einfach nur verpackte Webseiten. Ca. 50% aller HbbTV Webseiten liefern ihre Daten so aus. Oftmals gibt es hier weniger Metadaten wie Plot oder auch Thumbnails. Diese Schnittstelle ist durch Veränderung der Seitenstruktur äußerst fehleranfällig.

JSON

Fast alle Android Apps nutzen ein JSON Interface. Dies lässt sich wunderbar in Kodi einbauen, ist sehr robust und bringt oft auch Metadaten mit, die von den Apps selbst nicht angezeigt werden.

RSS

Einige Seiten liefern ihre Inhalte auch per RSS aus. Dies kann teilweise für Add-ons genutzt werden.

XML

XML verschwindet immer mehr. Diese Interfaces sind in der Regel sehr informationshaltig und robust, sodass sie auch jetzt noch zum Einsatz kommen.

Genutze APIs

Sender HTML JSON RSS XML Von Scraper genutzt
3sat w - w v XML
ARD w,h a w v JSON, RSS, XML
BR w,h a - - JSON
Das Erste w a,h - - JSON (App)
Funk.net w a - - JSON
HR w - w - RSS
KiKa w h - w JSON, XML
MDR w,h - - v XML
NDR w h - - HTML
Phoenix w a w w JSON, RSS, XML
SR w h - - JSON
SWR w,a,m - - - HTML (App)
WDR w - v - RSS
ZDF w,h a,v - - JSON (versteckt)

Legende:

w: auf Webseite genutzt

v: versteckt

h: Hbbtv

a: App

m: Mobile

Auswirkungen auf Add-ons

Verfügbarkeit von Videos

Es kann durchaus vorkommen, dass Webseite und Add-on unterschiedliche Daten anzeigen, falls sich etwas in der Senderdatenbank direkt ändert. Die verschiedenen Quellen sollten sich aber innerhalb kurzer Zeit synchronisieren.

Abweichende Datensätze

Teilweise stimmen die Datensätze von z.B. HbbTV und Webseite nicht überein. Dies betrifft in der Regel nur unwesentliche Videos, wie z.B. Clips aus einer Sendung, die auch als komplette Fassung vorliegt. Nach Möglichkeit werden derartige Videos ignoriert.

Größerer Funktionsumfang

Im Vergleich zu den offiziellen Ausgaben der Quellen (App, Webseite, HbbTV) können die Add-ons durchaus mehr anzeigen. Vorallem mit dem 3sat Add-on können durch ein verstecktes XML Interface Sendungen nach "Meistgesehen" oder "Datum" sortiert werden. Add-ons wie WDR- oder Funk Mediathek zeigen auch den Plot an. Das ZDF Add-on wäre ohne ein verstecktes JSON Interface in dieser Form nicht möglich gewesen.

Fehlerhafte Datensätze

Generelle Probleme

Die Einträge in den Mediatheken unterscheiden sich teilweise sehr stark in ihrer Qualität. Oft fehlen Plot und ordentliche Vorschaubilder. Manchmal wird der Sendungsname seperat aufgeführt, oft ist er aber auch direkt im Titel enthalten. Diese Inkonsistenz (teilweise in einer Sendereihe) macht eine einheitliche Präsentation schwierig.

Beispiele

ARD Mediathek

Gerade die ARD Mediathek ist ein gutes Beispiel. Sendungsinhalte werden aus über zehn verschiedenen Mediatheken importiert. Dieser Prozess ist fehlerhaft und mit einer Zeitverzögerung verknüpft. Dies äußert sich z.B. bei dem Veröffentlichungsdatum: http://www.ardmediathek.de/tv/Neueste-Videos/mehr?documentId=41269152.

Im Gegensatz zu den einzelnen Mediatheken ist der Datensatz absolut unvollständig.

Die Unithek nutzt daher die ARD Mediathek nur als Quelle für "Meistgesehene Videos" und für die Sender ONE, tagesschau24, RB und RBB.

Die Videoqualität ist teilweise niedriger als in den urspünglichen Mediatheken. Dies äußert sich unter anderem bei Videos von Das Erste, NDR und DW.