Silnik Rekomendacji plista: Trafność zasilana danymi

 Technologia Rekomendacji, którą opracowaliśmy, stanowi serce plista. Dzięki wspólnemu oddziaływaniu dziesiątek algorytmów, pozwala ona na niezwykle precyzyjne targetowanie  z niską skalą „chybionych” emisji. W ten sposób dostarczanie reklamy i treści zawsze może być dopasowane do indywidualnych potrzeb użytkownika. Reklamodawcy, wydawcy i użytkownicy czerpią korzyści z wysokiej trafności rekomendacji plista.

Dzięki tej publikacji damy Ci podgląd na to, co dzieje się za kulisami Silnika Rekomendacji plista oraz wyszczególnimy główne technologie odpowiedzialne za dokładność naszych rekomendacji.



Products

Dane: Paliwo dla Silnika Rekomendacji plista

Dane są podstawą dla tworzenia precyzyjnych, indywidualnie stargetowanych rekomendacji plista,w związku z tym przetwarzamy je w dużych ilościach. Każdego dnia serwery plista odnotowują około 600 milionów zapytań, nazywanych także zdarzeniami. Zdarzenie pojawia się za każdym razem, gdy użytkownik odwiedza stronę posiadającą zaimplementowane widgety plista.


Gromadzenie danych: gdy użytkownik staje się częścią procesu

Zdarzenia są pod każdym względem tak samo unikalne jak użytkownicy, którzy je wywołują. Plista uchwyca ponad 100 różnych właściwości w każdym zdarzeniu tak, aby dzięki temu móc dokładnie zdefiniować kontekst każdego zdarzenia.
W pierwszej kolejności mówimy tu o “twardych” atrybutach takich jak: wyszukiwarka oraz jej język, system operacyjny, nośnik i model, data i czas, geolokalizacja i wiele innych. Dodajmy do tego informacje na temat odwiedzanych wcześniej stron, kategorie artykułów (wiadomości, sport, business, moda itd.), informacje semantyczne o przeczytanym właśnie artykule, oraz ranking wydawcy w obrębie list utrzymywanych przez AGOF, Comscore czy Nielsena.
Gromadzenie danych podąża za regułami ETL (extract, transform, load) – wydobywać, przekształcać, wczytać. Gwarantują one między innymi anonimizację użytkownika. Po wydobyciu danych z różnych źródeł, przekształca się je w taki sposób, aby mogły nadawać się do użytku –  jest to proces, który uwzględnia anonimizację nawet przed procesem magazynowania danych.  Od tego momentu, użytkownik istnieje w systemie tylko jako numer, tym samym zapobiegając łączeniu go z jakąkolwiek faktyczną osobą. Co więcej, dane takie jak imię, nazwisko, adres itp. nie są nawet zachowywane.

 

Rekomendacje dla indywidualnego użytkownika: użytkownik w centrum uwagi

U podstawy zebranych i zorganizowanych danych leży to, aby Silnik Rekomendacji plista tworzył dostosowane rekomendacje odczytu i reklamy dla każdego użytkownika. Proces ten posługuje się kilkudziesięcioma algorytmami, wobec których Zespół Algorytmów plista zachowuje się jak dyrygent, który kieruje swoją orkiestrą w czasie rzeczywistym. Do najważniejszych technologii zawartych w tym procesie zaliczamy: 

 



1.    Targetowanie behawioralne


Targetowanie behawioralne pozwala na zbadanie źródeł ścieżek zachowań użytkowników, a tym samym na poznanie ich zainteresowań z zebranych danych. Odwiedzane strony, wcześniejsze interakcje z reklamami, zakupy internetowe itp. pomagają zebrać dane dotyczące preferencji użytkowników, ale równocześnie pomagają przyłączyć ich do procesu, aby w ten sposób móc kolejno zaprezentować indywidualne dostosowane rekomendacje. Przykładowo, jeśli użytkownik odwiedza strony podróżnicze, lub czyta artykuły na temat podróży, ktoś mógłby przypuścić, że ten sam użytkownik może być zainteresowany także tematem wycieczek. Na tej podstawie, użytkownik ten mógłby otrzymywać rekomendacje reklamowe na temat podróży wakacyjnych, ofert lotów, czy też artykułów powiązanych z turystyką. Podczas tego procesu, targetowanie behawioralne uwzględnia zarówno zainteresowania z przeszłości, jak i te obecne (tak jak widać w historii wyszukiwarki, jak i na stronie, która odwiedzana jest w danej chwili).

 



Products

2.    Filtrowanie Wspólnych Cech


Główna technologia używana przez Silnik Rekomendacji plista to Cross-Domain Collaborative Filtering (Filtrowanie Wspólnych Cech w Wielu Domenach). To wysoce efektywne wykorzystanie targetowania behawioralnego oparte jest na założeniu, że użytkownicy, którzy posiadają wspólne upodobania, zainteresują się także innymi podobnymi tematami. W tym celu zachowanie użytkownika związane z konsumpcją treści i klikalnością nie tylko jest oceniane, ale także porównywane do siebie nawzajem. Grupy tworzone są z użytkowników, którzy wykazują podobne wzorce zachowań i zainteresowań. Są one identyfikowane jako bliźnięta statystyczne. Przykładowo, jeśli jeden z „bliźniaków” jest zainteresowany tematyką nieruchomości, istnieje duża szansa, że drugi bliźniak także będzie nią zainteresowany. W związku z tym, otrzymuje on podobne rekomendacje dotyczące treści i reklam. Im więcej dostępnych jest danych na temat zainteresowań użytkownika, tym Filtrowanie Wspólnych Cech lepiej działa.

 



Products

3.    Targetowanie semantyczne


Aby osiągnąć jak najlepsze rezultaty, Silnik Rekomendacji plista pod uwagę bierze także otoczenie treści redakcyjnych, pod którymi osadzane są nasze widget‘y. W tym celu analizę semantyczną stosuje się w znacznie szerszym zakresie niż poszukiwanie poszczególnych słów kluczowych. Silnik Rekomendacji plista wykonuje kompleksową analizę zawartości danej strony, podczas której treść zostaje dokładnie skategoryzowana, na przykład jako „news”, „sport”, „tenis”, „Wimbledon” itd. Na tej podstawie oraz przy użyciu szerszej analizy tekstu, zidentyfikować można semantyczne podobieństwa do innych artykułów i reklam z bazy danych plista. W ten sposób rekomendacje plista mogą być łatwo przypisywane artykułom o danej tematyce: tak więc reklama artykułu sportowego lub raport na temat aktualnego zwycięzcy Wimbledonu będą także wyświetlane pod innym artykułem dotyczącym tenisa lub sportu. Zwiększa to adekwatność rekomendacji do treści jaką czytał użytkownik, a tym samym jego akceptację.

 



Products

4.    Połączenie kontekstu z najbardziej popularnymi.


W zależności od celów optymalizacyjnych (CTR, czas podglądu, konwersje, itd.), niektóre rekomendacje są odczytywane jako szczególnie dopasowane. Plista łączy wyniki rekomendacji 
z poszczególnymi atrybutami i tworzy listę najlepszych rekomendacji dla każdego atrybutu (wydawcy, model urządzenia, przeglądarka, itp). Na przykład artykuł D generuje najwięcej kliknięć wśród użytkowników iPhone 6, a artykuł X daje najlepsze rezultaty dla użytkowników znajdujących się 
w Berlinie, itd. 
W celu wygenerowania rekomendacji, które będą perfekcyjnie dopasowane do targetu, Silnik Rekomendacji plista łączy ze sobą zestawienia najbardziej popularnych artykułów na poziomie kilku atrybutów  w czasie rzeczywistym.  Im więcej atrybutów jest branych pod uwagę wraz z tymi zestawieniami, tym bardziej spersonalizowane będą rekomendacje.
Takie podejście jest doskonale, aby uniknąć tak zwanych "zimnych początków" - to znaczy, gdy istnieje niewiele lub brak jest informacji o użytkowniku. Zwykle mamy z tym do czynienia, gdy użytkownik uruchamia zdarzenie plista po raz pierwszy lub gdy usunął przechowywane pliki cookies.

 



Products

5.    Inne podejścia rekomendacyjne


Oprócz najistotniejszych technologii opisanych powyżej, plista używa wiele innych algorytmów, które łączą ze sobą najróżniejsze parametry. W taki właśnie sposób niektóre z algorytmów optymalizują dostarczanie  artykułów opierając się na ich aktualności, biorąc pod uwagę przykładowo moment w cyklu życia artykułu, w którym zainteresowanie czytelnika zaczyna spadać, czy też to dla których wydawców „świeżość” treści jest ważniejsza (tak jak jest to w przypadku strony z wiadomościami vs. strony poświęcone jakiemuś konkretnemu tematowi np. tańcowi), a także indywidualna waga dla użytkownika tego jak aktualny jest Content.
Dzięki szerokiej gamie podejść do zbudowania finalnej propozycji rekomendowanej treści , Silnik Rekomendacji plista zawsze oferuje najlepsze rozwiązanie.

 



Products

Globalna optymalizacja w czasie rzeczywistym


Silnik Rekomendacji plista obejmuje dziesiątki algorytmów, które jednocześnie przetwarzają ogromne ilości zróżnicowanych parametrów w czasie rzeczywistym. Z kolei Zespół Algorytmów plista odpowiedzialny jest za koordynację złożoności przetwarzania, i jako dyrygent dąży do osiągnięcia doskonałej harmonii w orkiestrze algorytmu. Podejmuje on decyzje bazując na indywidualnym kontekście zdarzenia, którego algorytm ustawiony jest aby osiągnąć założony cel (taki jak generowanie klików itp.). Zazwyczaj najlepszym rozwiązaniem jest użycie kilku algorytmów: złączenie kilku procedur może zminimalizować wszelkie mankamanety i wygenerować dla każdego scenariusza najlepszą rekomendację dostosowaną do danej sytuacji.
Aby do tego doprowadzić, dyrygent musi w pierwszej kolejności dowiedzieć się, który algorytm nadaje się do tego najlepiej – w tym wypadku testuje na sobie kilka z nich w czasie rzeczywistym. Dyrygent przypisuje wagi do ich wpływu na ostateczny rezultat, bazując na ich performace’ie:  Algorytmy, które osiągają dobre wyniki maja nadawane wyższe wagi i vice versa.  Należy tu zaznaczyć, iż: algorytmy, które prezentują się źle, dostają szansę na poprawę. Dzieje się tak, gdyż wiemy, że czasami ich potencjał może być rozpatrywany tylko w dłuższej perspektywie. W ten sposób możliwy staje się meta learning – ciągły proces uczenia się, który poprawia zarówno Silnik Rekomendacji plista jako całość, jak i wyniki dla reklamodawcy i wydawcy.

 



Products

Algorytm meta jest także w stanie realizować kilka celów jednocześnie (wskaźniki klików i zaangażowania, czas spędzony na stronie, konwersje, CPC itd.) i doprowadzać do jak najlepszego balansu miedzy nimi. 
Przetwarzanie danych w czasie rzeczywistym odgrywa kluczową rolę dla jakości rekomendacji. Celem wspólnym dla wszystkich algorytmów jest zatem udostępnianie w formie wiedzy ( i tak szybko jak to możliwe), zebranych informacji i/lub informacji zwrotnej od użytkownika.  Tak szybko jak nowe preferencje są gromadzone, natychmiastowo wprowadza się je do kolejnych rekomendacji w celu usprawnienia ich dokładności. 



Scroll To Top