Tworzenie skutecznych modeli Data Mining na przyktadzie prognozowania migracji klientów - Migut Grzegorz - ebook

Tworzenie skutecznych modeli Data Mining na przyktadzie prognozowania migracji klientów ebook

Migut Grzegorz

0,0

Opis

W książce przedstawiono kompletny proces budowy modelu data mining od zrozumienia i przygotowania danych po ocenę modelu i jego wdrożenie.  Z jednej strony zawiera dogłębny przegląd metod i technik analizy danych, z drugiej nie brak jej odniesienia do praktycznych aspektów związanych z budową oraz walidacją modeli.
W części empirycznej Autor mierzy się z zagadnieniem sposobu budowy skutecznego modelu data mining oraz identyfikacji czynników wpływających na tę skuteczność, zarówno w odniesieniu do modeli ekonometrycznych, jak i modeli uczenia maszynowego.
Jako obszar biznesowy książki przyjęto modele lojalności klientów, jednakże książka może być przydatna w modelowaniu kompletnego cyklu życia klientów, a także w obszarach pokrewnych takich jak scoring kredytowy czy modelowanie nadużyć.

Ebooka przeczytasz w aplikacjach Legimi na:

Androidzie
iOS
czytnikach certyfikowanych
przez Legimi
czytnikach Kindle™
(dla wybranych pakietów)
Windows
10
Windows
Phone

Liczba stron: 332

Rok wydania: 2025

Odsłuch ebooka (TTS) dostepny w abonamencie „ebooki+audiobooki bez limitu” w aplikacjach Legimi na:

Androidzie
iOS
Oceny
0,0
0
0
0
0
0
Więcej informacji
Więcej informacji
Legimi nie weryfikuje, czy opinie pochodzą od konsumentów, którzy nabyli lub czytali/słuchali daną pozycję, ale usuwa fałszywe opinie, jeśli je wykryje.



Wstęp

W obecnych czasach ilość danych gromadzonych przez przedsiębiorstwa niezależnie od branży nieustannie rośnie. Rośnie również potrzeba syntezy informacji zawartych w tych danych i w konsekwencji optymalizacji procesów biznesowych. Niezwykle ważnym aspektem działania przedsiębiorstw są aktywności związane ze sprzedażą i marketingiem. Dużym wyzwaniem w tym obszarze jest zdolność zrozumienia motywacji klientów, umiejętność dopasowania oferty do szybko zmieniających się preferencji nabywców oraz pogłębianie i poszerzanie relacji.

Wyzwanie to może być podejmowane przez budowanie modeli ekonometrycznych oraz modeli uczenia maszynowego. Modele dobrej jakości przekładają się na trafne decyzje biznesowe, wspierają racjonalne gospodarowanie dostępnymi zasobami oraz umożliwiają opracowanie skutecznych strategii zatrzymania klientów.

Termin „jakość modelu” jest pojęciem pojemnym, który najczęściej jest rozumiany jako zdolność modelu do generalizacji, mierzona za pomocą wybranej miary dobroci dopasowania. Takie rozumienie jakości modelu wymaga w praktyce poszerzenia o wymiary związane z wartością wynikającą z interpretacji reguł odkrytych przez model czy też stabilnością działania modelu w czasie.

Do głównych determinant wpływających na jakość uzyskanych modeli należy zaliczyć: techniki czyszczenia danych oraz selekcji zmiennych, przyjętą metodę analityczną, strategie optymalizacji hiperparametrów oraz dodatkowe strategie uczenia, takie jak segmentacja analizowanego zbioru, hybrydyzacja czy agregacja modeli. Lepsze zrozumienie relacji między wymienionymi determinantami oraz zbadanie wpływu poszczególnych czynników na jakość modelu może przyczynić się do poprawy procesu jego budowy, skrócenia czasu jego powstawania oraz łatwiejszej pielęgnacji.

W części teoretycznej skupiono się na modelach lojalności klienta. Utrzymanie klientów, zrozumienie, co wpływa na ich lojalność, oraz przewidywanie ich zachowań są kluczowe dla zespołów zajmujących się marketingiem i obsługą klienta. Opis poszczególnych kroków związanych z budową modeli może jednak mieć zastosowanie bardziej uniwersalne. Przedstawione metody mogą zostać wykorzystane w innych obszarach badań marketingowych, w obszarze zarządzania ryzykiem czy w badaniach naukowych.

Celem pracy jest przedstawienie czytelnikowi spójnej metodyki budowy modeli klasyfikacyjnych, wskazanie szeregu aspektów wpływających na jakość końcowego modelu oraz opis wpływu wielu determinant jakości modeli na końcowy rezultat modelowania. Analizę wykonano na jednym zbiorze danych, uzyskane wyniki należy zatem traktować z pewną dozą ostrożności, niemniej jednak sam proces identyfikacji modelu może być niezwykle przydatną ilustracją dla wszystkich pragnących pogłębić swoją wiedzę w obszarze eksploracyjnej analizy danych.

Do celów pracy należą również:

1. Identyfikacja determinant wpływających na jakość modeli migracji klientów oraz określenie relacji między nimi.

2. Ocena wpływu wybranych technik czyszczenia i transformacji danych na jakość budowanych modeli klasyfikacyjnych.

3. Identyfikacja optymalnej ścieżki budowy modelu ekonometrycznego, na przykładzie regresji logistycznej, budowanego przy wykorzystaniu szeregu technik selekcji zmiennych opartych zarówno na filtrach, jak również metodach wbudowanych (np. LASSO) czy metodach opakowujących (metody krokowe, Branch&Bound).

4. Ocena skuteczności modeli drzew klasyfikacyjnych budowanych za pomocą alternatywnych ścieżek podziału.

5. Porównanie skuteczności działania modelu regresji logistycznej z modelami uczenia maszynowego zbudowanymi za pomocą drzew klasyfikacyjnych, perceptronu wielowarstwowego oraz drzew wzmacnianych.

6. Ocena wpływu hybrydyzacji, segmentacji oraz agregacji na jakość budowanych modeli.

7. Wykazanie możliwości budowy modeli o zadowalających własnościach za pomocą metod interpretowalnych przez badacza (biała skrzynka), porównywalnych z zaawansowanymi metodami nieinterpretowalnymi (czarna skrzynka), przy użyciu odpowiednich technik przygotowania danych oraz hybrydyzacji modeli.

Budowa modeli retencji klienta została zrealizowana zgodnie z paradygmatem budowy modeli data mining zakładającym wtórne wykorzystanie danych gromadzonych w wyniku realizacji standardowych procesów biznesowych. Implikuje to pracę na zastanych zbiorach danych zgromadzonych w systemach informatycznych przedsiębiorstw. W pracy zostało wykorzystane doświadczenie autora w budowaniu modeli retencji klienta na rzeczywistych zbiorach danych klientów z branży telekomunikacyjnej, ubezpieczeniowej i usługowej. Ze względu na ograniczenia związane z poufnością danych ich bezpośrednie wykorzystanie nie było możliwe podczas wykonanych symulacji i eksperymentów. Wnioski i wiedza płynące ze zrealizowanych projektów zostały uwzględniane w pracy w sposób pośredni. Podstawą analizy był zbiór danych dostępny w domenie publicznej (repozytoriach on-line) cechujący się wystarczającą złożonością oraz odpowiednim wolumenem1.

Procedura badawcza polegała na wykonaniu badań symulacyjnych oceniających wpływ determinant na jakość modeli migracji klientów oraz określeniu relacji między nimi. Wykorzystując dostępny zbiór danych, zbudowano szereg modeli zgodnie z metodyką CRISP-DM. Podczas symulacji wzięto pod uwagę następujące czynniki:

Transformation – sposób przygotowania predyktorów, dyskretyzacja, standaryzacja itp.,Interaction – fakt uzupełnienia zbioru danych o zmienne pochodne (derived variables),Variables – sposób doboru zmiennych do modelu,Hyperparameters – metody optymalizacji hiperparametrów,Ensembles – dodatkowe strategie uczenia: segmentacja, hybrydyzacja, agregacja modeli.

Aspekty TIVHE były brane pod uwagę w sposób uwzględniający specyfikę wykorzystywanych metod analitycznych.

Punktem odniesienia oraz podstawą do szczegółowych porównań był model ekonometryczny zbudowany za pomocą regresji logistycznej. Budowa modelu logistycznego była realizowana zgodnie z koncepcją, która zakłada, że zbudowany model jest wypadkową oczekiwań biznesu oraz chęci sprostania wymaganiom statystycznym. Metodyka zakłada dyskretyzację predyktorów oraz przekodowanie istniejących kategorii do wartości WoE (Weight of Evidence). Podejście to zapewnia liniowy wpływ zmiennych na logarytm szansy modelowanego zjawiska. Dodatkowo, dzięki temu przekształceniu wpływ wartości odstających na model jest redukowany, a także w naturalny sposób są imputowane braki danych, które tworzą osobną kategorię – wartość WoE. W przypadku modelu regresji logistycznej kryteria identyfikacji modelu zostały poszerzone o: liczbę zmiennych w końcowym modelu, zgodność znaków ocen parametrów regresji z ich biznesową interpretacją oraz analizę poziomu współliniowości predyktorów.

Zasadniczą część analizy poprzedził etap zrozumienia i przygotowania danych. Dostępne zmienne zidentyfikowano pod kątem skali pomiarowej, na jakiej są mierzone. Oceniono rozkłady zmiennych ze szczególnym naciskiem na rozkład zmiennej zależnej oraz kwestie jej zbilansowania.

W kolejnym kroku wykonano analizę braków danych oraz przeprowadzono ich uzupełnienie. W zależności od charakteru zmiennej, charakteru oraz skali pomiarowej braku dobrano odpowiednią metodę imputacji. Następnie przeprowadzono wstępną selekcję zmiennych. Za pomocą filtrów odrzucono te zmienne, które nie wykazywały współzmienności ze zmienną zależną.

W procesie identyfikacji zmiennych pochodnych wykorzystano podejście automatyczne oparte na metodzie losowego lasu. Podejście to polega na zbudowaniu zestawu relatywnie płytkich drzew o głębokości 2 lub 3. W przypadku realizowanej pracy badawczej przyjęto głębokość na poziomie 2. Po zbudowaniu zestawu drzew każdy liść jest przekształcany na niezależną regułę opisującą podziały od korzenia drzewa do liścia. Losowy dobór predyktorów dla każdego z drzew zaimplementowany w losowym lesie pozwolił na identyfikację potencjalnie interesujących reguł, niemożliwych do identyfikacji za pomocą tradycyjnych algorytmów drzew klasyfikacyjnych i regresyjnych. Uzyskane reguły przefiltrowano pod kątem liczby przypadków (powszechność reguły) oraz na podstawie odsetka nielojalnych klientów spełniających tę regułę i wartości przyrostu (siła reguły). Najbardziej interesujące reguły przekształcono na zmienne binarne (na zasadzie informacji, że dany przypadek spełnia regułę lub jej nie spełnia), które zasiliły zbiór potencjalnych predyktorów.

Dane, które przeszły wstępną selekcję zmiennych, poddano transformacjom mogącym potencjalnie ułatwić proces budowy modeli o pożądanych właściwościach. Pierwszym przekształceniem, jakie zastosowano dla pierwotnego zbioru danych, była standaryzacja logistyczna zaproponowana przez Pyle’a. Ten rodzaj standaryzacji zastosowano dla predyktorów ilościowych, redukując tym samym skalę występowania wartości odstających w analizowanym zbiorze. W analizie przyjęto granicę na poziomie 6 odchyleń standardowych. Powyżej tej granicy wartości predyktorów zredukowano do wartości bliskich 0 lub 1 w zależności od kierunku odchylenia.

Drugim rodzajem zastosowanej standaryzacji była standaryzacja WoE. Wykonana została dla wszystkich predyktorów, zarówno dla predyktorów jakościowych, jak i poddanych uprzedniej dyskretyzacji predyktorów ilościowych. Dyskretyzację zmiennych ilościowych przeprowadzono dwoma sposobami: za pomocą podziału na decyle oraz za pomocą podziału algorytmem CART, przy założeniu że maksymalna głębokość drzewa wynosi 5. Analizie poddano zatem cztery zbiory danych:

1) oczyszczone zmienne surowe,

2) zmienne przekształcone za pomocą standaryzacji Pyle’a,

3) zmienne WoE na podstawie decyli (WoE–Decyle),

4) zmienne WoE na podstawie algorytmu CART (WoE–CART).

Kontynuacją analizy była segmentacja statystyczno-ekspercka wykonana za pomocą algorytmu CART. Segmentacja umożliwiła podział zbioru danych na dwa podzbiory, dla których wykonano budowę odrębnych modeli migracji klientów. Podejście to pozwoliło zatem na budowę modeli hybrydowych, a w zależności od przyjętej metody modelowania był to na przykład CART – logit bądź CART – sieć neuronowa. Oprócz modeli hybrydowych do celów porównawczych zbudowano również modele na podstawie całego zbioru danych, bez hybrydyzacji.

Analizowane zbiory danych różniły się zatem ze względu na fakt zastosowania w ich przypadku trzech rodzajów modyfikacji lub ich braku (w nawiasie podano liczbę wariantów):

1) standaryzacja zmiennych (4),

2) dodanie zmiennych pochodnych (2),

3) segmentacja zbioru danych (2).

Daje to 16 wariantów zbiorów danych, dla których wykonano badania. W pracy badawczej porównaniu zostały poddane powyższe kombinacje dla wybranych metod analitycznych. Dla każdego z wariantów wykonano optymalizację hiperparametrów. W obrębie danej metody przygotowano dodatkowo agregację najlepszych modeli w celu oceny wpływu tego zabiegu na uzyskaną siłę predykcyjną.

Łączna liczba modeli (liczona w dziesiątkach tysięcy), głównie ze względu na przeprowadzoną optymalizację hiperparametrów, przekraczała o kilka rzędów wielkości możliwości ręcznej parametryzacji i strojenia poszczególnych metod, stąd też krytycznym elementem procedury stało się opracowanie skryptów automatyzujących większą część obliczeń. Podczas analizy wykorzystano pakiet TIBCO Statistica, pakiety R oraz biblioteki dostępne w języku Python.

Praca składa się z pięciu rozdziałów. W rozdziale pierwszym zaprezentowano temat retencji klientów, będący kluczowym elementem modelowania w marketingu. Omówiono w nim rolę modelowania w badaniach marketingowych, przedstawiono koncepcję marketingu relacji w budowie lojalności klientów, a także zaprezentowano definicje i determinanty lojalności nabywców. W dalszej części rozdziału omówiono rodzaje i poziomy lojalności konsumentów oraz wybrane podejścia pomiaru i modelowania lojalności. Rozdział zamyka przedstawienie metodyki budowy modeli data mining w obszarze retencji klientów.

W rozdziale drugim podjęto tematykę przygotowania danych na potrzeby budowy modeli retencji klientów. Omówiono w nim zagadnienia związane z określaniem kluczowych parametrów projektu analitycznego, oceną wiarygodności danych oraz identyfikacją i uzupełnieniem braków danych. W rozdziale przedstawiono także sposoby łagodzenia problemów związanych z niejednorodnym zbiorem danych oraz zaprezentowano techniki związane z transformacją zmiennych i przygotowaniem zmiennych pochodnych. Ostatnim zagadnieniem opisanym w tym rozdziale jest problem niezbilansowanego rozkładu zmiennej zależnej.

W rozdziale trzecim przedstawiono zagadnienia związane z budową optymalnego modelu klasyfikacyjnego. Są w nim omówione techniki wyboru zmiennych do budowy modelu, a także wybrane metody modelowania, począwszy od regresji logistycznej, poprzez sieci neuronowe, a skończywszy na podejściu wielomodelowym. Podjęto również tematykę optymalizacji hiperparametrów i jej wpływu na wynik modelowania.

W rozdziale czwartym omówiono kwestie odnoszące się do walidacji i stosowania modeli retencji klientów. Przedstawiono w nim miary dobroci dopasowania modeli retencji klientów uzupełnione o obszerne omówienie ich wrażliwości na zjawisko niezbilansowanego rozkładu zmiennej zależnej. W kolejnych częściach rozdziału zaprezentowano kwestie wyboru strategii walidacji modeli retencji klientów oraz określono optymalny punkt decyzyjny. Rozdział uzupełniono o zagadnienie związane z wyborem klientów, którzy wymagają kontaktu w ramach strategii sprzedażowych i retencyjnych.

W rozdziale piątym przedstawiono wyniki pracy badawczej związane z identyfikacją optymalnej ścieżki selekcji modelu migracji klientów. W pierwszej części rozdziału zaprezentowano metodykę przeprowadzonych badań oraz cel wykonanych analiz. Następnie przedstawiono kolejne kroki pracy badawczej związane ze zrozumieniem i przygotowaniem danych. Rozdział kończy część związana z zasadniczym eksperymentem analitycznym mającym na celu identyfikację kluczowych czynników wpływających na jakość modeli migracji klientów.

1. Retencja klientów jako obszar modelowania marketingowego

Temat retencji klientów jest niezwykle istotnym zagadnieniem z zakresu modelowania marketingowego o znaczących podstawach teoretycznych oraz wielu praktycznych realizacjach w obszarze biznesu. Rozdział rozpoczyna się omówieniem roli modelowania w badaniach marketingowych oraz jego znaczenia w zrozumieniu złożonej i dynamicznej rzeczywistości biznesowej. W dalszej części rozdziału przedstawiono założenia marketingu relacyjnego, szkoły marketingu skoncentrowanej na budowaniu długotrwałych relacji z klientami. Podkreślono znaczenie CRM (Customer Relationship Management) oraz jego trzy podstawowe poziomy: operacyjny, analityczny i interakcyjny, z naciskiem na analityczny CRM związany z budową modeli marketingowych. W rozdziale omówiono również koncepcję cyklu życia klienta, dzieląc go na fazy: pozyskiwania, rozwoju i utrzymania klienta.

W kolejnych podrozdziałach omówiono zagadnienia związane z lojalnością klientów, przedstawiając definicje, determinanty oraz różne typologie lojalności, w tym dualizm lojalności związany z wymiarem behawioralnym oraz aspektem postawy klienta wobec dostawcy. Wskazano również na różne poziomy lojalności oraz omówiono koncepcje, które ilustrują dynamiczny charakter tego zjawiska. Następnie opisano różne metody pomiaru i modelowania lojalności klientów. Przedstawiono kluczowe wskaźniki używane do oceny lojalności. Omówiono również bardziej złożone modele, takie jak ACSI (American Customer Satisfaction Index) i EPSI (European Performance Satisfaction Index), które analizują zależności między satysfakcją a lojalnością klientów. Wyjaśniono też najważniejsze terminy związane z modelami dotyczącymi z obszaru lojalności klientów.

Ostatni podrozdział jest wprowadzeniem w tematykę eksploracyjnej analizy danych. Omówiono w nim metodyki budowy modeli data mining, które są kluczowe w analizie retencji klientów. W tej części przedstawiono proces wydobywania wiedzy z danych oraz kluczowe etapy modelowania, które szczegółowo zostaną omówione w kolejnych rozdziałach pracy.

1.1. Rola modelowania w badaniach marketingowych

Rzeczywistość biznesowa otaczająca przedsiębiorstwa działające na rynku jest niezwykle złożona i skomplikowana. Dodatkową trudność w jej zrozumieniu wprowadza dynamiczny charakter zmian, które w niej zachodzą. Skuteczne działanie wymaga zatem odpowiednich narzędzi, które pozwolą na racjonalne i umiejętne wsparcie procesów decyzyjnych. Naturalnymi instrumentami używanymi przez każdego człowieka pozwalającymi radzić sobie ze złożoną rzeczywistością są modele. Modele, którymi człowiek posługuje się w życiu codziennym, są wypadkową spuścizny społecznej przekazywanej w formie tradycji, zasad, uprzedzeń, stereotypów czy praw oraz modeli budowanych na bazie własnych doświadczeń. Skuteczność takich modeli zależy od prawdziwości przesłanek, na których są budowane, oraz umiejętności ich twórcy do dostosowania ich do zmieniającej się rzeczywistości.

Badania naukowe, w tym także badania marketingowe, oraz praktyka menedżerska to obszary, w których modele wykorzystywane są w sposób powszechny. Modele mogą przyjmować różną formę. P. Leeflang i współpracownicy [2000; 2016] wyróżniają cztery podstawowe ich reprezentacje. Najbardziej oszczędnymi w formie są modele niejawne oparte na doświadczeniu i intuicji decydenta. Nie są one w żaden sposób formalnie zapisane, a tworzone są na bieżąco w jego umyśle. Następne w kolejności są modele, które polegają na ustnym formułowaniu zasad skutecznego działania w postaci twierdzeń opisujących relacje między podjętymi krokami a efektem tych kroków. Również G.L. Lilien, P. Kotler, K.S. Moorthy [1995] piszą o takim sposobie tworzenia modeli. Modele oparte na werbalnych stwierdzeniach nie muszą mieć charakteru naukowego i mogą wynikać z indywidualnych doświadczeń osób zajmujących się marketingiem. Granica między naukowością a praktycznym doświadczeniem nie musi być przy tym jednoznacznie określona. Naukę można postrzegać jako uporządkowaną i wytrenowaną formę zdrowego rozsądku [Huxley, 1854]2. Trzecią grupę stanowią modele sformalizowane, przedstawione w formie pisemnej. Przykładem mogą być logiczne modele przepływu będące swoistym zapisem modeli werbalnych czy modele objaśniające relacje pomiędzy zjawiskami rynkowymi za pomocą zmiennych w postaci zestawu zdań logicznych.

Najbardziej złożonym sposobem prezentacji są modele określone numerycznie na podstawie przyjętych założeń oraz zgromadzonych danych empirycznych bądź symulacyjnych. Modele budowane zgodnie z tą strategią opisują zjawiska za pomocą równań bądź nierówności matematycznych, używając symboli oznaczających zmienne marketingowe. Strategia ta jest stosowana od lat sześćdziesiątych XX wieku [Wierenga, Van der Lans, 2008]. W tym czasie w organizacjach pojawiła się możliwość wykorzystania komputerów do obliczeń matematycznych, a rozwój technologii informatycznych umożliwił gromadzenie większej niż dotychczas ilości danych marketingowych, co istotne – niepozwalającej na ich efektywną tradycyjną analizę. Naturalnym następstwem tych okoliczności stała się potrzeba formułowania modeli matematycznych. Pojawienie się modeli matematycznych w marketingu było również konsekwencją tego, że w naukach o zarządzaniu zaczęto stosować metodologię nauk przyrodniczych, w której były one powszechnie wykorzystywane.

Marketing jest interdyscyplinarną dziedziną nauki3, stosującą wiele różnorodnych podejść badawczych opartych na różnych, niejednokrotnie sprzecznych paradygmatach. W badaniach marketingowych wykorzystywane są paradygmaty nauk społecznych [Mazurek-Łopacińska, Sobocińska, 2013]:

neopozytywistyczno-funkcjonalistyczno-systemowy, interpretatywno-symboliczny,radykalnego strukturalizmu,postmodernistyczny.

Każdy z wymienionych paradygmatów bazuje na odmiennych założeniach. Pierwszy z nich zakłada, że wiedza ma charakter obiektywny. Faworyzuje on podejście analityczne, zakładające możliwość uogólniania i matematycznego modelowania wyników badań marketingowych. Modele budowane zgodnie z tym paradygmatem oparte są na podejściu ilościowym. Według pozostałych paradygmatów wnioski płynące z badań nie muszą mieć charakteru obiektywnego. Dominuje w nich metodyka jakościowa wykorzystująca różnorodne strategie i modele. Bez większego wysiłku można dostrzec analogię między paradygmatami a modelami (budowanymi niezależnie od przyjętego paradygmatu). Paradygmaty, określając ramy metodologiczne, w których porusza się badacz, w naturalny sposób tworzą pewien model, zgodnie z którym opisywana jest rzeczywistość będąca przedmiotem dociekań naukowych.

Mimo że nie można odmówić wartości żadnemu z wymienionych paradygmatów, dominujący jest paradygmat neopozytywistyczno-funkcjonalistyczno-systemowy [Mazurek-Łopacińska, Sobocińska, 2013]. Pozwala on na opis relacji między podejmowanymi działaniami marketingowymi a uzyskanymi efektami za pomocą metod ilościowych, wykorzystując zmienne oraz zależności przyczynowo-skutkowe. Paradygmat ten szczególnie mocno kładzie nacisk na budowanie modeli określonych numerycznie, tworzonych przy użyciu metod ilościowych opartych na statystyce, programowaniu liniowym czy metodach uczenia maszynowego. Modele budowane w tym obszarze są związane z opisem, wyjaśnianiem i predykcją reakcji rynkowych na ofertę marketingową przedsiębiorstw [Sagan, 2016].

Numeryczne modele marketingowe stanowią złożony i niejednorodny zbiór. Kolejna oś podziału może przebiegać na linii celu, dla jakiego budowane są modele. Rozróżniane są tutaj modele opisowe (deskryptywne), predykcyjne oraz preskrypcyjne [Leeflang i in., 2016]. Zadaniem modeli opisowych jest pomoc w zrozumieniu badanych procesów. Modele tego typu mają na przykład tłumaczyć relacje popytu i podaży na rynkach, czy też wskazywać, jakie instrumenty marketingowe mają wpływ na sprzedaż. Mają też na celu uogólnianie analizowanych zjawisk marketingowych. Głównym celem modeli predykcyjnych jest poprawne przewidywanie przyszłych obserwacji. Do ich budowy wykorzystuje się zaawansowane modele data mining, duży nacisk kładąc na zdolności generalizacyjne budowanych modeli. Modele normatywne (preskrypcyjne) mają na celu ocenę kierunków działań marketingowych i wybór najlepszego wariantu z punktu widzenia przyjętego kryterium [Sagan, 2016].

Ostatnim sposobem rozróżniania modeli marketingowych jest poziom agregacji. Budowane modele mogą opisywać zależności na poziomie rynku, sklepu czy segmentu (modele makromarketingowe) oraz gospodarstwa domowego czy pojedynczego konsumenta (modele mikromarketingowe). Modele makromarketingowe mają charakter opisowy. Jedną z głównych zalet analizy na poziomie zagregowanym są niewielkie wymagania dotyczące danych. Modele takie dają jednak mniej szczegółowy obraz wpływu przyjętych instrumentów marketingowych na zachowanie konsumentów [Fok, 2003]. Obszar wykorzystania modeli mikromarketingowych jest bardziej uniwersalny, mogą one służyć zarówno do opisu, jak i do predykcji czy preskrypcji.

Na bazie paradygmatów stosowanych w marketingu rozwinęło się wiele szkół i tradycji badawczych, których wyczerpujący przegląd można znaleźć na przykład w pracy A. Sagana [2014]. W ramach istniejących szkół można wyróżnić dwa podstawowe kierunki rozwoju modeli marketingowych [Sagan, 2016]. Pierwszy odnosi się do pomiaru i analizy zjawisk związanych z konsumentem oraz jego działaniami, skutkuje budową modeli mikromarketingowych służących zarówno do opisu, jak i predykcji oraz preskrypcji. Analizowane zmienne dotyczą głównie cech społeczno-demograficznych konsumentów, ich profilu psychograficznego i behawioralnego. Na ich podstawie są budowane modele zachowań lub modele segmentacji rynku związane między innymi z preferencjami, satysfakcją czy lojalnością klienta. Drugi kierunek wiąże się z budową modeli makromarketingowych powiązanych z funkcjonowaniem całych rynków lub sektorów. Są one najczęściej modelami eksplanacyjnymi oraz teoriopoznawczymi.

Jedną ze szkół marketingu stosujących pierwszy z wymienionych kierunków rozwoju jest szkoła marketingu relacyjnego, a w szczególności wywodząca się z niej tradycja badawcza oparta na CRM (Customer Relationship Management). Jest ona zgodna z dominującym od początku wieku podejściem skoncentrowanym na kliencie [Wierenga, Van der Lans, 2008], podkreślającym wagę jego potrzeb. Działania marketingowe są podporządkowane budowaniu relacji z klientem, zwiększaniu jego lojalności oraz satysfakcji, co docelowo ma się przekładać na zwiększenie jego dochodowości wyrażonej najczęściej za pomocą wartości życiowej klienta (CLV, Customer Lifetime Value). Strategie te są stosowane z powodzeniem w stosunku do klientów na rynkach masowych i opierają się na informacjach zawartych w bazach danych eksplorowanych za pomocą zaawansowanych technik uczenia maszynowego. Charakter relacji w tym ujęciu jest zautomatyzowany, zarządzany przez systemy informatyczne, za pomocą których realizowana jest strategia masowej indywidualizacji [Sagan, 2014].

1.2. Koncepcja marketingu relacji w budowie modeli lojalności klientów

Marketing relacji jest jedną z ważniejszych obecnie szkół marketingu. Podwaliny pod jego koncepcję położone zostały w latach sześćdziesiątych oraz siedemdziesiątych ubiegłego stulecia. Jedna z pierwszych definicji tego podejścia wskazywała na konieczność pozyskania, utrzymania i rozwoju relacji z nabywcami [Berry, 1983]4. Częścią wspólną wielu proponowanych obecnie definicji tego terminu jest akcent położony na budowanie trwałych i długotrwałych więzi z klientami w celu wzrostu wartości dla obu stron [Łapczyński, 2016]. Ważnym aspektem jest tutaj retencja klientów oraz znalezienie optymalnego balansu między zdobywaniem nowych klientów a utrzymaniem obecnych. Duży nacisk kładzie się także na optymalizację wartości życiowej klienta, która zakłada budowanie długotrwałych relacji, dbanie o jakość usług oraz wysoki poziom satysfakcji klienta. Podejście to zakłada budowanie relacji opartej na zaufaniu, korzystnej zarówno dla dostawcy, jak i odbiorcy – klienta. Marketing relacyjny przyjmuje, że w proces tworzenia relacji z otoczeniem są zaangażowani nie tylko pracownicy działu marketingu, ale wszyscy pracownicy przedsiębiorstwa.

Zasady marketingu relacyjnego mogą być stosowane zarówno na rynkach B2B, jak i B2C, a także na rynku masowym i niszowym. Oczywiście będą tutaj widoczne różnice w specyfice tych relacji, a także w narzędziach stosowanych w celu ich podtrzymania. Obszarem, w którym największe znaczenie w zarządzaniu relacjami z klientem ma wykorzystanie zaawansowanych modeli marketingowych, jest niewątpliwie masowy rynek B2C. Masowość klienta i jego relatywnie niewielki wpływ na przychód firmy ograniczają możliwość zazwyczaj kosztownej indywidualnej opieki ze strony dostawcy oraz budowania rzeczywistych relacji. Zaawansowane algorytmy analizy danych, umożliwiając masową indywidualizację, mogą zapewnić zadowalający dla obydwóch stron substytut relacji. Warunkami umożliwiającymi realizację strategii budowania więzi na rynkach masowych są [Bhattacharya, Bolton, 2000]:

zróżnicowanie oferty dostawcy umożliwiające dostosowanie jej do indywidualnych potrzeb nabywcy – im większy wybór, tym większa szansa na zaangażowanie się konsumenta w relację z dostawcą,wykorzystanie mediów masowych do budowania więzi emocjonalnych z nabywcą, na przykład przez przekaz reklamowy angażujący klientów w proces zakupowy,zapewnienie komunikacji między klientem a dostawcą, na przykład za pośrednictwem systemu obsługi reklamacji czy infolinii,zwiększenie liczby epizodów zakupowych – wpływ na to mogą mieć koszty zmiany dostawcy oraz postrzegana jakość produktu wpływająca na poziom satysfakcji oraz lojalności.

Chęć zapewnienia indywidualizacji oferty na rynku masowym spowodowała, że marketing relacji zaczął wykorzystywać potencjał technologii informacyjnej. Odpowiedzią na potrzebę zarządzania relacjami z klientami stała się metodyka CRM, będąca praktyczną realizacją filozofii marketingu relacyjnego wykorzystującą zaawansowane możliwości technologii informacyjnej. Metodyka ta jest nastawiona na optymalizację praktycznych działań nakierowanych na rozwój i pielęgnację relacji z klientami.

W CRM można wyróżnić trzy podstawowe poziomy (podsystemy): operacyjny, analityczny oraz interakcyjny [Migut, 2004]. CRM operacyjny ma na celu zbieranie danych transakcyjnych i danych o klientach, ich opinii o produktach, sprzedawcach i komunikacji. Zadaniem operacyjnego CRM jest również wsparcie telemarketingu. Do tego celu służą teleinformacyjne systemy automatycznego rozdzielania rozmów przychodzących (Automatic Call Distribution), czy też systemy inter­aktywnej obsługi głosowej (Interactive Voice Response). Zadaniem analitycznego CRM jest przetwarzanie i analiza danych w celu segmentacji klientów czy optymalizacji kampanii marketingowych. CRM interakcyjny ma na celu wspieranie bezpośrednich kontaktów z klientem z wykorzystaniem różnorodnych kanałów dystrybucji i komunikacji. Uzupełnieniem wyróżnionych podsystemów może być strategiczny CRM (Strategic CRM) związany z budowaniem strategii marketingowej oraz tworzeniem wartości dla klienta [Payne, 2005].

Z wymienionych tutaj podsystemów CRM to poziom analityczny jest najmocniej związany z budową modeli marketingowych oraz podejmowaniem na ich podstawie strategicznych decyzji co do różnego rodzaju akcji i kampanii marketingowych. Analityczny CRM jest często łączony z marketingiem opartym na bazach danych, czy też z marketingiem wspieranym danymi [Łapczyński, 2016]. Termin ten jest również ściśle związany z pojęciem CI (Customer Intelligence), który można interpretować jako analityczne przetwarzanie danych o kliencie w celach marketingowych [Surma, 2009].

Do najważniejszych obszarów analitycznych wspierających doskonalenie relacji z klientem należy zaliczyć [Migut, 2004]:

analizy związane z cyklem życia klienta,segmentację, mogącą pełnić pomocniczą rolę w stosunku do analiz cyklu życia klienta,analizę satysfakcji klientów.

Dwa pierwsze obszary mocniej się wiążą z marketingiem opartym na bazach danych, polegającym na wykorzystaniu baz konsumenckich do zwiększenia skuteczności działań marketingowych. Trzeci obszar jest z kolei bardziej łączony z marketingiem wspieranym danymi, w którym kładzie się nacisk na pomiar efektów działalności marketingowej. Obszar ten nie jest przedmiotem rozważań w niniejszej pracy5.

Analizy związane z cyklem życia klienta są kluczowymi zadaniami analitycznego CRM. Cykl życia klienta zakłada, że relacja między nabywcą a dostawcą podlega ewolucji, przechodząc z czasem przez kolejne fazy, poziomy zaangażowania. Proces nawiązywania relacji rozpoczyna się w momencie odebrania przez klienta przekazu marketingowego i pozytywnej reakcji na odebrany przekaz. Widocznym momentem nawiązania relacji jest dokonanie przez niego pierwszego zakupu. Początkowo intensywność relacji między dostawcą a klientem jest słaba, a klient dokonuje stosunkowo niewielu zakupów.

W kolejnej fazie więź staje się silniejsza, czego manifestacją są większa częstotliwość oraz wielkość zakupów. Z czasem siła relacji słabnie, a klient odchodzi do konkurencji. Na tej podstawie można wyróżnić trzy podstawowe fazy cyklu życia klienta [Wübben, 2008]:

faza pozyskiwania klienta,faza rozwoju klienta,faza utrzymania klienta.

Każda z nich stawia przed dostawcami innego rodzaju problemy i zadania. Podczas fazy pozyskiwania klienta podstawowe pytania menedżerów brzmią [Reinartz, Venkatesan, 2008]:

Jakich klientów powinno się pozyskiwać?W jaki sposób należy to robić (jaki przekaz może być skuteczny)?

Z kolei w fazie rozwoju klienta pytania mają postać:

Na rozwoju których klientów należy się koncentrować?Jak powinno się przydzielać zasoby, aby rozwój klientów był efektywny?

Znajomość odpowiedzi na powyższe pytania pozwala na osiągnięcie fundamentalnego celu, jakim jest maksymalizacja wartości życiowej klienta (Customer Lifetime Value, CLV, LTV). Na tę wartość składają się zarówno kwestie związane z wielkością zakupów w danym czasie, jak i z czasem trwania relacji. Obydwie wielkości są ze sobą powiązane, a ich wzajemny wpływ na CLV może być wyrażony za pomocą wzoru [Leeflang i in., 2016]:

,

gdzie:

AC – koszt pozyskania klienta,

T – horyzont czasu dla oszacowania CLV,

mt – marża w czasie t (przychód – koszt),

rt – wskaźnik retencji (prawdopodobieństwo, że klient będzie aktywny w czasie t)

i – stopa dyskontowa.

Według M. Wübbena [2008] na wartość klienta składa się ocena:

długości relacji definiowanej jako czas trwania relacji, głębokości relacji znajdującej odzwierciedlenie w częstotliwości korzystania z usług oraz w skłonności klientów do wyboru produktów o wyższych marżach,szerokości relacji powiązanej z liczbą różnych produktów lub usług zakupionych od firmy w danym czasie.

Koncepcją spójną z przedstawionym powyżej cyklem życia klienta jest model ACURA [Łapczyński, 2016]. Nazwa modelu to skrót angielskich terminów:

Acquisition (pozyskanie klienta),Cross-sell (sprzedaż krzyżowa),Up-sell (sprzedaż uzupełniająca),Retention (utrzymanie klientów),Advocacy (promocja klienta na stanowisko ambasadora marki).

Relację między modelem ACURA a cyklem życia klienta przedstawiono na rysunku 1.1.

Faza pozyskania klienta pokrywa się z elementem Acquisition. Faza rozwoju klienta związana jest z członami Cross-selling oraz Up-selling. Faza utrzymania klienta jest natomiast równoważna z elementem Retain. Relacja może następnie zaniknąć lub rozwinąć się, co jest po części zgodne z ostatnim elementem modelu – Advocacy.

Niezależnie od etapu cyklu życia, na którym znajduje się klient, jest on obiektem zainteresowania dostawcy pragnącego poznać jego potrzeby, dostarczyć mu wartości w postaci produktu bądź usługi, a dzięki temu zapewnić satysfakcję oraz pozyskać lojalność klienta. Niezwykle istotne jest też poszerzenie zakresu współpracy oraz wydłużenie czasu jej trwania. Modele predykcyjne budowane za pomocą technik analizy danych mogą znacząco ułatwić pogłębianie relacji, zwłaszcza na rynku masowym, gdzie masowa indywidualizacja nie pozostawia alternatywy dla innych działań.

Rysunek 1.1. Cykl życia klienta a model ACURA

Źródło: [Łapczyński, 2016].

Na każdym etapie cyklu życia klienta pożądane jest trafne przewidywanie jego potrzeb i zachowań. Niniejsza praca koncentruje się jedynie na jednym z elementów modelu ACURA, jakim jest retencja klientów. Należy jednak mieć na uwadze, że modele, choć optymalizujące różne aspekty relacji z klientem, powinny być rozpatrywane i stosowane w holistycznym kontekście wartości życiowej klienta. Jedynie wtedy mogą zapewnić rzeczywiste zwiększenie skuteczności realizowanych działań.

Analizy segmentacyjne pozwalają na wyodrębnienie z niejednorodnej zbiorowości klientów jednorodnych grup o podobnych cechach oraz podobnie reagujących na podjęte wobec nich środki marketingowego oddziaływania. Wyniki segmentacji mogą być podstawą do masowej indywidualizacji – dany sposób oddziaływania przypisywany jest do całego segmentu klientów. Wyniki segmentacji pozwalają ponadto na lepsze zrozumienie cech klientów oraz poprawiają komunikację w zespole handlowców. Same wyniki segmentacji mogą sugerować działania, jakie można podjąć w stosunku do wyróżnionych grup. Mogą być one podstawą do dalszych pogłębionych analiz, na przykład związanych z cyklem życia klienta. Szczegółowe analizy są wykonywane nie dla całego niejednorodnego zbioru klientów, lecz – co jest bardziej skuteczne i poprawne merytorycznie – dla wybranego homogenicznego segmentu6.

Do podejść często wykorzystywanych do segmentacji rynku można zaliczyć analizę według następujących zmiennych [McDonald, Dunbar, 2013; Kotler i in., 2020]:

Oferowane produkty, usługi i kanały sprzedaży – pozwala to na zrozumienie, które konkretne cechy produktów oddziałują na różnych klientów, co pociąga za sobą opracowanie propozycji opartych na różnych potrzebach klientów.Dane demograficzne, które wspomagają identyfikację charakterystycznych cech klientów należących do danego segmentu, co pomaga w określeniu optymalnego kanału komunikacji czy sposobu dotarcia do klientów.Dane geograficzne – pozwala to na podział rynku ze względu na miejsca zamieszkania klientów, bazując na różnym poziomie szczegółowości: od państwa czy regionu po pojedyncze dzielnice czy ulice. Dane geograficzne same z siebie nie mogą definiować segmentu ze względu na niewielką moc wyjaśniania postaw zakupowych klientów. Wynika to z dużej niejednorodności klientów mieszkających na danym obszarze (problem analogiczny do segmentacji demograficznej). Zmienne te mogą jednak pomóc wskazać najbardziej prawdopodobne lokalizacje klientów z wyróżnionych segmentów, ułatwiając tym samym sposób dotarcia do nich.Dane związane z kanałami dystrybucji i komunikacji – wybrane segmenty klientów mogą być powiązane z określonymi formami komunikacji czy sprzedaży, ich znajomość może pozwolić na przyjęcie adekwatnych sposobów komunikowania się. Istotną kwestią jest tutaj zrozumienie motywu wyboru określonego kanału przez klienta.Dane psychograficzne – takie zmienne umożliwiają podział kupujących na różne segmenty ze względu na styl ich życia lub cechy osobowości. Identyfikacja wewnętrznych czynników determinujących zachowanie klientów może umożliwić określenie sposobu komunikacji z nimi, zwiększając szansę przyciągnięcia ich uwagi i dotarcia do nich z odpowiednim przekazem.Dane behawioralne, które pozwalają na wyodrębnienie segmentów na podstawie zachowań zakupowych klientów, ich reakcje na produkt lub stosowane wobec nich środki marketingowego przekazu. Dane behawioralne mogą być postrzegane jako najlepszy punkt wyjścia do budowy segmentów rynku [Kotler i in., 2020], natomiast pozostałe zmienne mogą stanowić ich – cenne poznawczo – uzupełnienie.

1 Zbiór pochodzi z Duke University. Był on częścią konkursu Churn Modeling Tournament. Pierwotnie zbiór znajdował się pod adresem http://faculty.fuqua.duke.edu/teradatacenter/ (link obecnie jest już nieaktywny).

2Za [Lilien, Kotler, Moorthy, 1995].

3Formalnie rzecz ujmując, marketing to subdyscyplina nauk o zarządzaniu.

4Za [Terlutter, Weinberg, 2006].

5Szczegółowe rozróżnienie obydwóch podejść przedstawiono w [Łapczyński, 2016].

6Dyskusja związana z analizą niejednorodnego zbioru danych została przedstawiona w rozdziale 2.