#DataDeepDive – dpa Hackathon mit Schickler Data Science Team

Unter dem Motto #DataDeepDive fand vom 29. November bis 1. Dezember bereits zum dritten Mal der dpa Hackathon im Newsroom der deutschen Presseagentur (dpa) in Berlin statt. Ziel war es, datengetriebene Lösungen zu entwickeln, um die Arbeit der Journalisten im dpa-Newsroom zu erleichtern und neue datenbasierte Produkte oder Produktverbesserungen für die Nachrichtenagentur zu kreieren. Die behandelten Themen umfassten unter anderem die automatisierte Erstellung von journalistischen Inhalten in Text und Graphiken (Robot Journalism), die Auswertung und Erkenntnisgewinnung aus öffentlichen Datenquellen (Public Data) und die Verwendung von Nutzerdaten zur optimalen Ausspielung von Inhalten (DataDriven-Publishing).

Abbildung 1: Logo des Hackathons

Das Format des Hackathons und die bunte Mischung von circa 80 Teilnehmen aus den Bereichen Software-Entwicklung, Journalismus und Data Science boten optimale Voraussetzungen für die Entwicklung innovativer Ideen. Zudem bekamen die Teilnehmer von den dpa-Mitarbeitern im Newsroom direkte Einschätzungen zur Umsetzbarkeit und zum Nutzen ihrer Konzepte.
Nur 50 Stunden hatten die Teilnehmer Zeit um von den ersten Ideen bis zum finalen Pitch tragfähiger Konzepte und zur Vorstellung funktionsfähiger Prototypen zu gelangen. Trotzdem haben sich insgesamt 11 Teams gefunden, denen es in dieser kurzen Zeit gelungen ist 11 Projekte zu erarbeiteten, die aufzeigen wie die Zukunft redaktioneller Arbeit und journalistischer Produkte aussehen könnte.

Mit Robot Journalism werden automatisiert Texte und Graphiken erstellt

Die Teams Regio Reports und Loki beschäftigten sich mit der Frage, wie Lokaljournalisten aus großen öffentlichen Datensätzen, wie sie zum Beispiel das statistische Bundesamt regelmäßig veröffentlicht, mit geringem Aufwand für ihre Region relevante Einsichten gewinnen können. Sie entwickelten Algorithmen, die automatisiert Zusammenfassungen und Graphiken für jede Region erstellen und diese an die Lokalredaktionen versenden. Das Team Loki programmierte zudem einen Chatbot, über den Journalisten entsprechende Inhalte anfragen können und der diese dann automatisiert bereitstellt. Das Team Regio Reports wurde für sein Konzept mit dem Preis Best of API Prototype ausgezeichnet.

Abbildung 2: Das Team VizGov gewinnt den Preis Best Overall (Foto dpa)

Das Team VizGov, das mit dem Preis Best Overall ausgezeichnet wurde, konnte die Jury mit einem Programm überzeugen, das automatisiert Bundestagsprotokolle auswertet. So kann das Tool zum Beispiel feststellen, welche Fraktion für die meisten Zwischenrufe verantwortlich ist oder welcher Abgeordnete bei seinen Redebeiträgen den meisten Applaus oder die meisten Lacher erntet. Auch das Team VizGov programmierte einen Chatbot, dem Journalisten solche Fragen stellen können und der dann automatisiert die erfragte Information aus den Protokollen extrahiert.
Journalisten bietet sich eine Vielzahl von Möglichkeiten einen Text oder eine Graphik zu gestalten. Oft jedoch fehlt die nötige Information darüber, welche Form dem Leser am besten gefallen wird. Einen interessanten Workaround für dieses Problem entwickelte das Team Fluid Articles. Es kreierte ein Tool zur Erstellung interaktiver Graphiken, die der Nutzer selbst verändern kann. Anhand der Veränderungen der Graphik durch die Nutzer lernt der Algorithmus welche Darstellung den Nutzern am besten gefällt und präsentiert neuen Nutzern eine überarbeitete Darstellung. Potentiell ist ein ähnliches Konzept auch für Textinhalte denkbar. So können zum Beispiel Textteile, bei denen ein Nutzer das Lesen abbricht, automatisiert überarbeitet werden.

Smarte Algorithmen erleichtern die Arbeit in der Redaktion

Redaktionen stehen bei der Erstellung journalistischer Inhalte permanent unter Zeitdruck. Viele Teams suchten deswegen nach Lösungen um die Arbeit der Journalisten zu erleichtern und zu beschleunigen. Das Team Robocop beschäftigte sich mit dem Problem, dass täglich hunderte von Pressemitteilungen in Redaktionen eingehen und manuell die berichtenswerten Mitteilungen herausgefiltert werden müssen. Für die Entwicklung eines Algorithmus, der automatisiert Polizeiberichte scannt und nach ihrer Wichtigkeit sortiert, wurde das Team mit dem Preis Most Innovative ausgezeichnet. Weitere denkbare Anwendungen des Algorithmus umfassen die automatisierte Prüfung beliebiger Pressemitteilungen auf Relevanz oder das Durchsuchen von Social Media Feeds nach berichtenswerten Ereignissen.

Abbildung 3: Das Team Robocop bei der Arbeit (Foto dpa)

Um Journalisten bei der Recherche zu unterstützen, entwickelte das Team Context ein Programm, das die Berichterstattung über eine Person auswertet und visualisiert. So wird auf einen Blick deutlich, in welchem Kontext eine Person in der Vergangenheit im öffentlichen Interesse stand. Der Algorithmus kann zudem angepasst werden um die Berichterstattung über Organisationen, Länder, Orte und ganz allgemein Themen zu visualisieren.
Ein weiterer wichtiger Punkt für die Produktion qualitativ hochwertiger journalistischer Inhalte ist die Verifizierung von Quellen. Das Team veri easy entwickelte hierfür einen Algorithmus, der die Echtheit von Fotos analysiert. Mit dem Ziel Nachrichtenhäusern Fotos und Videos schneller zur Verfügung zu stellen kreierte das Team Crowdforce eine App, über die sowohl professionelle Fotografen als auch Amateure ihr Bildmaterial anbieten können. Journalisten können in der App dann mit Hilfe von Stichworten, Zeit- und Ort-Restriktionen passendes Material finden.

Durch DataDriven-Publishing werden Leser optimal angesprochen

Bei digitalen Medieninhalten besteht die Möglichkeit eine Vielzahl an Nutzungsparametern wie Leserzahl, Lesedauer und Lesetiefe zu erfassen. Basierend auf diesen Werten können Inhalte optimiert oder Leser-individuell ausgespielt werden. Im Gegensatz zu den Medienhäusern, die die Inhalte direkt an die Leser weitergeben, verfügt die dpa als Nachrichtenagentur, die ihre Inhalte an die Medienhäuser verkauft, allerdings nicht über diese Informationen. Deswegen entwickelte das Team HillSight ein Kooperationsmodell zur Weitergabe relevanter Performance-Parameter von den Medienhäuser an die dpa. Die dpa kann mit Hilfe dieser Informationen ihre Inhalte optimieren und ein werthaltigeres Produkt anbieten. Die Medienhäuser profitieren von der Kooperation dadurch, dass sie für die Erreichung ihrer strategischen Ziele wie Reichweite und Paid-User-Conversion maßgeschneiderte Inhalte erhalten.
Um möglichst vielen Artikeln eine interessierte Leserschaft zu verschaffen, entwickelte das Team Fair chance ein Recommender System für Online-Artikel. Das Team Vor der Tür entwickelte ein Content-Portal, auf dem auf Nachbarschaftsebene interessante Nachrichten gesammelt werden. Über das Portal können lokal relevante Nachrichten, Veranstaltungsinformationen und viele weitere Inhalte sowohl von kommerziellen Anbietern als auch von Privatpersonen geteilt werden. Die Nutzer können selbst steuern über welche Inhalte sie durch das Portal informiert werden möchten.

Schickler begleitete den Hackathon als Sponsor und war mit dem Data Science Team vor Ort. Amr Rekaby Salama und Ole Martin fungierten als Mentoren und unterstützten die Teams bei technischen und konzeptionellen Fragestellungen. Dr. Christoph Mayer war als Jury-Mitglied bei der Auswahl der besten Beiträge beteiligt.

Schickler Data Science: Künstliche Intelligenz für Medienunternehmen

Google wird bei allen seinen Angeboten in den nächsten Jahren Machine Learning einsetzen. Das gibt CEO Sundar Pichai bekannt.

Was daran bemerkenswert ist: Google sieht die größten Potenziale offenbar nicht in der Entwicklung neuer Produkte und Services, sondern im Einsatz Künstlicher Intelligenz in bestehenden Produkten, Services und Prozessen.

Und was noch bemerkenswerter ist: Die Chancen, die Google mit Künstlicher Intelligenz und Machine Learning hat, hat jedes Unternehmen – und Medienunternehmen ganz besonders: Da die Prozesse und Geschäftsbeziehungen hin zu Kunden und Unternehmen hier so vielfältig sind, ergeben sich durch den Einsatz von Künstlicher Intelligenz vielfältige Chancen – und zwar ebenfalls in der deutlichen Verbesserung bestehender Produkte, Services und Prozesse.

Schickler Data Science

Um Medienunternehmen beim Einsatz Künstlicher Intelligenz zu unterstützen hat Schickler ein eigenes in-house Data Science Team aufgebaut. Es arbeitet in Projekten Hand in Hand mit den Schickler-Beratern. Gemeinsam identifizieren sie Chancen für den Einsatz Künstlicher Intelligenz, entwickeln Algorithmen und programmieren Prototypen.

Hier einige Beispiele dafür, wie Künstliche Intelligenz das Google-Angebot verbessert:
Mithilfe Künstlicher Intelligenz kann…

  • Google Translate noch natürlicher übersetzen,
  • dem Nutzer noch passendere und relevantere Werbung angezeigt werden,
  • Google Suche noch besser verstehen, wonach der Nutzer sucht,
  • der Smartspeaker Google Home wissen, wer gerade mit ihm spricht und der Person auf sie zugeschnittene, passende Antworten geben
  • Google Maps Staus noch besser vorhersagen und Autofahrer bestmöglich zum Ziel bringen.

Diese Verbesserungen stehen natürlich nicht nur Google gut. Use Cases für Künstliche Intelligenz in Medienunternehmen gibt es viele. Einige Beispiele hierfür sind:

  • Verkaufssteuerung: Erstellen von Empfehlungen, welche Werbekunden wann und mit welchem Angebot angesprochen werden sollen,
  • Identifizierung von Upselling Möglichkeiten: Wo es sie gibt und bei welchen Kunden die höchsten Verkaufschancen bestehen; welche Leser für ein E-Paper Upselling angesprochen werden sollten und wer die höchsten Upselling-Chancen hat,
  • Paid Content: einen Online-Leser in Echtzeit klassifizieren und entscheiden, welche Inhalte vor und welche hinter die Paywall müssen und so die Conversion auf ein Paid Content-Abo erhöhen,
  • Vermeidung von Zustellproblemen Historische Daten, Wetter, Druckspezifika etc. geben preis, in welchen Bezirken der Zustelllogistik es am nächsten Tag Herausforderungen geben kann – so dass rechtzeitig gegengesteuert werden kann,
  • Prognosen im Produktionsprozess: Früherkennung, wo Herausforderungen auftauchen können, die bereits pro aktiv gelöst werden könnten (z. B. in Druckereien)
  • Die Liste lässt sich beliebig fortführen. Das Schickler Data Science Team hat einen umfassenden Katalog an Anwendungsfällen von Künstlicher Intelligenz in Medienunternehmen zusammengestellt: die Schickler Data Science Landkarte gewährt einen exklusiven Einblick.

Produkte, Services und Prozesse werden durch Künstliche Intelligenz günstiger, maßgeschneiderter und effizienter.

Welche Chancen ergeben sich bei Ihnen?

UKW vs. DAB+: Die Zukunft des Digitalradios in Deutschland

Ist DAB+ die Zukunft des Radios? Oder haben 5G, Smartspeaker & Co. die Übertragungstechnologie längst überholt? Und welchen wirtschaftlichen Effekt haben DAB+ und die immer wieder diskutierte UKW-Abschaltung für Radiosender?

DAB+ – „Digital Audio Broadcast“ – steht für die digitale statt der analogen UKW-Übertragungstechnologie. Das „+“ steht dabei für einen weiterentwickelten Standard – denn digitales Radio gibt es tatsächlich schon seit einiger Zeit. Entwickelt wurde die erste Version des Digitalradios bereits in den 90er Jahren. 2011 wurde die weiterentwickelte Version DAB+ vorgestellt. Mit einer nochmals verbesserten Audioqualität und geringeren Sendekosten soll sie UKW den Kampf ansagen. Die Vorteile, die digitales Radio mit sich bringt sind vielfältig: verbesserte Audioqualität, geringere Übertragungskosten und mehr Sender. Anders als bei UKW gibt es für DAB+-Sender fast unbegrenzt Übertragungskapazitäten. Sie bietet den Hörern eine größere Auswahl an Programmen. Zudem eröffnet DAB+ den Hörern weitere Mehrwertdienste, beispielsweise blendet es Album-Cover der jeweiligen Songs ein.

Deutschlandweit wurden bis heute fast 12 Millionen DAB+-fähige Geräte verkauft. Alleine im Jahr 2017 waren es 1,3 Millionen (Quellen: Arbeitsgemeinschaft der Landesmedienanstalten, HEMIX). Damit ist der Verkauf von DAB+-Radios im Vergleich zum Vorjahr um 11 Prozent gewachsen. Demnach haben inzwischen knapp 16 Prozent aller Deutschen Zugang zu einem DAB+-fähigen Gerät – Tendenz steigend. Die Mehrheit setzt allerdings nach wie vor auf analoges Radio – was die Reichweite von UKW mit 95 Prozent zeigt. Zudem laufen bisher lediglich 7 Prozent der Autoradios über DAB+ (Quelle: Die Medienanstalten, Digitalisierungsbericht 2017). Um die Vielfalt der verschiedenen Sender zu fördern und Kosten zu sparen, kommt immer wieder die Diskussion einer UKW-Abschaltung auf. Private Radiosender fürchten, dass sie damit in naher Zukunft deutlich an Hörern verlieren würden und so auch weniger Erlöse aus Werbung erzielen könnten. Möglicherweise könnten Hörer ohne DAB+-Gerät eher auf ein Radio verzichten, statt ein Gerät mit der neuen Technologie zu kaufen.

Die Schickler Unternehmensberatung hat in einer eigenen Studie untersucht, wie eine UKW-Abschaltung sich auf die wirtschaftlichen Effekte von privaten Radiosendern auswirkt. Die Ergebnisse präsentierte Schickler-Berater Dr. Christoph Mayer auf den Medientagen München. Aus der Studie geht hervor, dass eine Abschaltung von UKW für private Radiosender erst dann tragbar sein wird, wenn DAB+ eine Reichweite von ca. 90 Prozent erreicht. Basis der Berechnungen sind die Kosten und Einnahmen realer Radiosender in Deutschland, die stündlich zwischen 20.000 und 1 Million Hörer haben und so eine Bandbreite an privaten Radiosendern repräsentieren. Um zu prognostizieren, wann DAB+ eine Reichweite von 90 Prozent erreicht, nutzt die Studie verschiedene mathematische Modelle, die zu unterschiedlichen Verlaufsszenarien für die DAB+-Reichweite in Deutschland führen (Abbildung 1).

Abbildung 1: Szenarien für die Entwicklung der DAB+-Reichweite in Deutschland

  • Ländermodelle Norwegen und Großbritannien: Das Ländermodell überträgt die Entwicklung von DAB+ in den vergangenen zehn Jahren in Großbritannien und Norwegen auf Deutschland (Abbildung 2).

    Abbildung 2: DAB+-Reichweite Deutschland, Norwegen und Großbritannien

    Basis für das Modell lieferte die Beobachtung, dass der Stand von DAB+ in Deutschland momentan etwa dem Stand in Norwegen und Großbritannien vor zehn Jahren entspricht. Bei näherer Betrachtung allerdings erscheint ein Vergleich mit Norwegen unrealistisch: politische Abläufe in Deutschland und Norwegen unterscheiden sich grundlegend. Einen weitaus tragbareren Vergleich liefert Großbritannien: politisch und technologisch ähnliche Rahmenbedingungen ermöglichen einen direkten Vergleich. Demnach hat Deutschland im Jahr 2039 eine DAB+-Reichweite von 90 Prozent entwickelt.

  • Durchdringungsmodell: Das zweite Szenario beruht auf dem Bass-Diffusionsmodell. Das mathematische Modell untersucht den Verlauf der Durchdringung neuer Technologien am Markt und wendet es auf DAB+ an. Demnach ist die Reichweite von DAB+ in Deutschland frühestens ab 2033 groß genug, um UKW abzuschalten, ohne dass es die Überlebensfähigkeit privater Radiosender bedroht.
  • Erneuerungsmodell: Diesem Szenario liegt die Erneuerungsrate von Radiogeräten in Haushalten und Autos in Deutschland zu Grunde. Sie steigt deutlich, wenn UKW abgeschaltet ist. Das wiederum beeinflusst den Verkauf von DAB+ stark. Das Erneuerungsmodell sagt für 2036 eine Entwicklung der Reichweite auf 90 Prozent voraus.

Die Modelle vereint, dass die Reichweite von DAB+ erst in ferner Zukunft hoch genug sein wird, um für private Radiosender eine tatsächliche Alternative zu UKW darzustellen. Um die Konsequenzen einer zeitnahen UKW-Abschaltung abschätzen zu können, berechnet die Studie zusätzlich die Umsatzverluste der Radiosender bei einer Abschaltung im Jahr 2030, 2025 und zum jetzigen Zeitpunkt (Abbildung 3).

Abbildung 3: Umsatzverluste durch UKW-Abschaltung in Abhängigkeit vom Zeitpunkt der Abschaltung

Bei einer Abschaltung von UKW im Jahr 2018 müssen die untersuchten Sender mit einem Umsatzverlust von durchschnittlich über 60 Prozent rechnen.  Auch 2025 kostet eine Abschaltung noch mehr als 25 Prozent des Umsatzes.

Die Studie zeigt deutlich, dass eine vorschnelle Abschaltung von UKW die Existenz vieler Radiosender bedroht. Dem politischen Ziel von DAB+, nämlich eine größere Vielfalt an Sendern zu schaffen, könnte also schnell ein Sterben von Radiosendern folgen. Auch die eng gefasste Gegenüberstellung UKW vs. DAB+ hat sich in der Realität bereits überholt. Neue Technologien wie Smartspeaker, 5G Broadcast Mode und Co. führen zu einer Vielzahl neuer Übertragungswege. Radiosender müssen sich darauf einstellen, sämtliche Übertragungswege zu bespielen – denn am Ende entscheidet der Hörer.

Die vollständige Studie kann beim VBRA heruntergeladen werden, der auch einen Bericht zur Veranstaltung auf den Medientage München bereitstellt.