plista Recommendation Engine - Relevanz, powered by data

Unsere eigens entwickelte Empfehlungstechnologie ist das Herzstück von plista. Durch das Zusammenspiel von dutzenden Algorithmen ermöglicht sie eine äußerst präzise Zielgruppenansprache mit hoher Treffsicherheit und geringen Streuverlusten. So lassen sich Werbung und Content stets passend zu den individuellen Präferenzen eines Nutzers ausliefern. Durch die hohe Nutzerrelevanz der Empfehlungen profitieren Advertiser, Publisher und User gleichermaßen. 


Werfen Sie einen Blick hinter die Kulissen der plista Recommendation Engine und lernen Sie die Schlüsseltechnologien kennen, welche die Präzision unserer Empfehlungen ermöglichen. 



Products

Daten: Treibstoff für die plista Recommendation Engine

Daten sind die Grundlage für die präzisen, nutzerindividuellen Empfehlungen von plista. Dafür werden von uns riesige Datenmengen verarbeitet: Täglich verzeichnen die plista Server ca. 600 Mio. Anfragen, sogenannte Events. Ein Event entsteht jedes Mal, wenn ein Nutzer eine Seite mit einem implementierten plista Widget aufruft.

 

Datensammlung: Der Nutzer als Teil des Prozesses

Events sind genauso einzigartig wie die Nutzer, die sie auslösen. Um den individuellen Kontext von Events genau definieren zu können, erfasst plista pro Event mehr als 100 verschiedene Attribute.
Dabei handelt es sich in erster Linie um „harte“ Attribute wie Browser und Browsersprache, Betriebssystem, Endgerät und Gerätemodell, Datum und Uhrzeit, Geolocation u.v.m. Hinzu kommen Informationen über bisher besuchte Webseiten, Artikelkategorien (z.B. News, Sport, Wirtschaft, Mode etc.), semantische Informationen über den Content, der gerade gelesen wird, Ranking der Publisher in Verzeichnissen wie AGOF, Comscore oder Nielsen etc.
Der Prozess der Datenerfassung funktioniert nach dem ETL-Prinzip (Extract, Transform, Load). Dieses stellt unter anderem auch die Anonymisierung der Nutzer sicher. Nach der Extraktion der Daten aus den unterschiedlichen Quellen werden diese transformiert, um genutzt werden zu können. Dabei werden sie anonymisiert, bevor irgendwelche Informationen überhaupt gespeichert werden. Der Nutzer existiert im System fortan lediglich als Nummer, sodass  keine Rückschlüsse auf seine Person mehr möglich sind. Zudem werden personenbezogene Daten wie Name, Adresse etc. grundsätzlich nicht gesammelt.

 

Nutzerindividuelle Empfehlungen: Der Nutzer im Mittelpunkt

Auf Basis der gesammelten und geordneten Daten berechnet die plista Recommendation Engine maßgeschneiderte Lese- und Werbeempfehlungen für jeden einzelnen Nutzer. Dafür kommen mehrere Dutzend unterschiedliche Algorithmen zum Einsatz. Der plista Ensemble Algorithmus fungiert dabei  als übergeordneter Dirigent und „orchestriert“ ihre Zusammenarbeit in Echtzeit. Zu den wichtigsten verwendeten Technologien zählen:



3.1. Behavioral Targeting

Durch Behavioral Targeting lassen sich aus den gesammelten Nutzerdaten Verhaltensmuster und daraus wiederum Interessen ableiten: Besuchte Seiten, frühere Interaktionen mit Anzeigen, Online-Käufe etc. helfen dabei, Nutzerpräferenzen zu erfassen und User in den Prozess miteinzubeziehen, um anschließend jedem passende, individuell zugeschnittene Empfehlungen unterbreiten zu können. Hält sich ein User beispielsweise auf Reiseportalen auf oder liest Artikel über Reisen, so kann man davon ausgehen, dass er sich auch für Reisen interessiert. Darauf basierend werden dem Nutzer beispielsweise Anzeigen für Urlaubsreisen, Flugangebote bzw. Artikel  rund um das Thema Tourismus empfohlen. Behavioral Targeting berücksichtigt dabei sowohl die langfristige als auch die akuten Interessen (Browserverlauf sowie die Seite, auf der man ich aktuell befindet).



Products

3.2. Collaborative Filtering

Die Schlüsseltechnologie, die in der plista Recommendation Engine zum Einsatz kommt, ist Cross-Domain Collaborative Filtering. Dieser höchst effektive Behavioral-Targeting-Ansatz basiert auf der Annahme, dass Nutzer mit gemeinsamen Interessen sich auch für ähnliche Themen interessieren. Zu diesem Zweck wird das Lese- und Klickverhalten von Nutzern nicht nur ausgewertet, sondern auch miteinander verglichen. Es werden Gruppen von Usern gebildet, die ähnliche Verhaltensmuster und Interessen aufweisen. Diese werden als „statistische Zwillinge“ bezeichnet. Interessiert sich z.B. einer der Zwillinge auch für das Thema Immobilien, so stehen die Chancen gut, dass sich der andere Zwilling ebenfalls dafür interessiert. Entsprechend bekommt er ähnliche Inhalte oder Anzeigen empfohlen. Je mehr Daten über die Interessen der Nutzer vorliegen, desto besser funktioniert Collaborative Filtering. 



Products

3.3. Semantic Targeting

Um bestmögliche Ergebnisse zu liefern, berücksichtigt die plista Recommendation Engine auch das redaktionelle Umfeld, in dem die Empfehlungen eingebettet sind. Dafür wird mithilfe semantischer Analyse nicht bloß nach einzelnen Signalwörtern (Keywords) gesucht. Die plista Recommendation Engine führt eine umfassende inhaltliche Analyse der jeweiligen Seite durch. Dabei wird der Content genau kategorisiert, z.B. in Kategorien wie „Nachrichten“, „Sport“, „Tennis“, „Wimbledon“ etc.  Darauf basierend und mithilfe von weiterführenden Textanalysen, lassen sich semantische Ähnlichkeiten mit anderen Artikeln sowie Anzeigen aus dem plista Datenbanksystem ermitteln. So können plista Empfehlungen leicht zu thematisch passenden Artikeln zugeordnet werden: Eine Sportartikel-Anzeige bzw. eine Reportage über den aktuellen Wimbledon-Gewinner wird deshalb eher unter einem  anderen Tennis- oder Sportartikel ausgespielt. Das steigert die thematische Relevanz der Empfehlungen und somit auch die Nutzerakzeptanz. 



Products

3.4. Combined Contextual Most Popular

Je nach Optimierungsziel (CTR, Viewtime, Conversions etc.), eignen sich bestimmte Empfehlungen besonders gut, um diese zu erreichen. Dabei setzt plista die Performance der Empfehlungen in Relation  zu den verschiedenen Attributen und erstellt für jedes Attribut (z.B. Publisher, Gerätemodell, Browser etc.) eine Liste der Top-Empfehlungen. Z. B. bei iPhone6 Nutzern erzielt Artikel D die meisten Clicks, bei Usern aus Berlin liefert wiederum Artikel X die besten Ergebnisse usw. 
Um passgenaue Empfehlungen zu generieren, kombiniert die plista Recommendation Engine die „Most Popular“ Listen mehrerer Attribute in Echtzeit miteinander. Je mehr Attribute mit ihren Listen dafür herangezogen werden, umso persönlicher sind die Empfehlungen.  
Dieser Ansatz eignet sich hervorragend dazu, um sogenannte „Cold Starts“ zu umgehen – d.h. wenn keine oder zu wenige Informationen über den Nutzer vorliegen. Das ist meist dann der Fall, wenn der User zum ersten Mal ein plista Event auslöst oder die Cookies in seinem Cache gelöscht hat.

 



Products

3.5. Weitere Empfehlungsansätze

Neben den beschriebenen Kerntechnologien kommt eine Vielzahl weiterer Algorithmen zum Einsatz, die unterschiedlichste Parameter miteinander kombinieren. So optimieren manche Algorithmen die Auslieferung von Artikeln basierend auf ihrer Aktualität. Sie berücksichtigen dabei, ab welchem Artikelalter das Interesse der Leser tendenziell zu sinken beginnt, auf welcher Art von Publishern die Aktualität wichtiger ist (z.B. Newsportal vs. Special-Interest-Site), aber auch das individuelle Interesse eines Nutzers an aktuellen Inhalten.
Durch die große Bandbreite an Empfehlungsansätzen ist die plista Recommendation Engine imstande, stets eine optimale Lösung zu bieten.



Products

Globale Optimierung in Echtzeit

Die plista Recommendation Engine umfasst Dutzende von Algorithmen, die in Echtzeit gleichzeitig mit einer Vielzahl von Parametern arbeiten. Ihre komplexe Koordination übernimmt der plista Ensemble Algorithm, der als eine Art Dirigent fungiert und für den perfekten Einklang im Algorithmen-Orchester sorgt. Auf Basis des individuellen Kontexts eines Events entscheidet er, welcher Algorithmus eingesetzt werden soll, um das anvisierte Ziel (z.B. Generierung von Klicks etc.) zu erreichen. In der Regel handelt es sich dabei um einen Mix aus mehreren Algorithmen: Durch Kombination mehrerer Verfahren können Nachteile ausgeglichen und für jedes Szenario eine optimale, auf die konkrete Situation zugeschnittene Empfehlung  generiert werden. 
Dafür muss der Dirigent allerdings zunächst herausfinden, welcher Algorithmus am besten funktioniert. Deshalb treten mehrere Algorithmen in Echtzeit  gegeneinander an. Der Dirigent gewichtet dann ihren Einfluss nach ihrer Performance: Die Algorithmen, die gut funktionieren, werden höher gewichtet und umgekehrt.  Das Besondere daran: Algorithmen mit schlechter Performance bekommen weiterhin die Chance sich zu verbessern, da sie ihr Potenzial manchmal erst langfristig offenbaren. Dadurch wird Meta Learning ermöglicht – ein kontinuierlicher Lernprozess, der sowohl die plista Recommendation Engine als Ganzes als auch die Ergebnisse für Advertiser und Publisher verbessert.



Products

Der Meta-Algorithmus ist zudem imstande, nicht bloß ein, sondern mehrere Ziele  gleichzeitig zu verfolgen (Click- und Engagement-Raten, Nutzerverweildauer, Conversions, CPC etc.) und für eine optimale Balance zu sorgen.
Die Datenverarbeitung in Echtzeit spielt eine Schlüsselrolle für die Qualität der Empfehlungen. Gemeinsames Ziel aller Algorithmen ist daher, erfasste Informationen bzw. User Feedback als Wissen möglichst schnell verfügbar zu machen. Sobald eine neue Präferenz erfasst wird, fließt sie direkt in die nächsten Empfehlungen ein und verbessert somit ihre Genauigkeit



Hier geht's zum plista Tech Blog

Scroll To Top