Prognozuj - kto kliknie, kupi, skłamie lub umrze - Eric Siegel - ebook
Opis

Przetłumczona na 9 języków. Wykorzystywana na ponad 30 uniwersytetach.

W tej wciągającej, fascynującej i zaskakująco przystępnej książce Eric Siegel, wiodący ekspert w dziedzinie analizy prognostycznej, pokazuje, w jaki sposób to działa i jak codziennie wpływa na życie każdego z nas.

Takie kształtujące trendy organizacje jak Chase, Facebook, Google, Hillary for America, HP, IBM, Match.com, Netflix, NSA, Pfizer, Target i Uber wykorzystują potencjał wielkich zbiorów danych, by prognozować ludzkie zachowania; także i twoje.

Dlaczego? Dlatego, że analiza prognostyczna przekształca branże i w znaczący sposób wpływa na to, co dzieje się na świecie. Przeczytaj tę książkę, aby się dowiedzieć, jak ograniczać ryzyko, zwiększać sprzedaż, doskonalić opiekę zdrowotną, optymalizować media społecznościowe, walczyć z przestępczością i wygrywać wybory.


Dr Eric Siegel jest założycielem Predictive Analytics Word i redaktorem naczelnym „Predictive Analytics Times”. Były profesor Columbia University jest obecnie znanym mówcą, nauczycielem i liderem w branży.


„Odpowiednik Freakonomii w obszarze dużych zbiorów danych”. - Stein Kretsinger, założyciel i dyrektor Advertising.com

„Ekscytująca i wciągająca – czyta się ją jak thriller! Analiza prognostyczna ma swoje korzenie w codziennych ludzkich zachowaniach i jeśli jest stosowana właściwie, wpływa na ich działania. Przy pomocy przykładów Siegel opisuje zarówno szanse, jak i zagrożenia, jakie ta metodologia stwarza dla współczesnego świata”. - Marianna Dizik, statystyk, Google

„Książka Erica Siegela odnosi sukces tam, gdzie inne poniosły porażkę – objaśnia zawiłości wielkich zbiorów danych i daje przykłady z życia, jak organizacje wykorzystują potencjał analizy prognostycznej do wprowadzania wymiernych zmian”. - John Francis, starszy analityk danych, Nike

Podając fascynujące przykłady, Siegel pokazuje, jak firmy zarabiają pieniądze, prognozując, co zrobią klienci. Gdy zaczniesz czytać tę książkę, nie będziesz w stanie odłożyć jej na półkę”. - Artur Middleton Hughes, wiceprezes, Database Marketing Institute, autor Strategic Database Marketing

„Szczegółowy opis jak możemy przeciwdziałać nieprzewidywalności świata. Eric jasno wyjaśnia, dlaczego niektóre decyzje są bardziej zyskowne od innych – i ja się z nim zgadzam”. - Dennis R. Mortensen, prezes Visual Revenue, były dyrektor ds. analiz danych w Yahoo!

Ebooka przeczytasz w aplikacjach Legimi na:

Androidzie
iOS
czytnikach certyfikowanych
przez Legimi
czytnikach Kindle™
(dla wybranych pakietów)
Windows
10
Windows
Phone

Liczba stron: 392

Odsłuch ebooka (TTS) dostepny w abonamencie „ebooki+audiobooki bez limitu” w aplikacjach Legimi na:

Androidzie
iOS

Popularność

Podobne


Tytuł ‌oryginału: Predictive ‌Analytics: The Power to ‌Predict Who Will ‌Click, ‌Buy, Lie, ‌or Die. Revised ‌and Updated

Tłumaczenie: Konrad ‌Pawłowski

Redakcja: Agnieszka Al-Jawahiri

Korekta: ‌Ewa ‌Skuza

Projekt ‌okładki: Michał ‌Duława ‌| michaldulawa.pl

Koncepcja ‌grafi czna: Wladzimier Michnievič

Skład: ‌Studio Magenta, ‌Nadzieja Michnievič

Opracowanie e-wydania: ‌

Copyright © 2016 by ‌Eric Siegel. All rights ‌reserved.

Originally published by John ‌Wiley & Sons, Inc., ‌Hoboken, ‌New Jersey.

Jeopardy! O is ‌a registered trademark of ‌Jeopardy Productions, ‌Inc.

Ograniczenie odpowiedzialności/klauzula wyłączenia ‌gwarancji: wydawca ‌i autor, ‌przygotowując

tę książkę, ‌dołożyli wszelkich starań, ‌by ‌przedstawić w niej ‌rzetelne informacje, ale ‌nie udzielają ‌żadnych zapewnień ‌ani ‌gwarancji co do ‌ich ‌dokładności i ‌kompletności, jak również ‌nie składają ‌żadnej ‌gwarancji, ‌bądź to wyraźnej, ‌bądź dorozumianej, co ‌do efektów ich zastosowania ‌w ‌konkretnej sytuacji. Żadna gwarancja ‌nie ‌może też być udzielona ‌lub ‌przedłużona ‌przez przedstawicieli handlowych ‌ani w pisemnych materiałach ‌reklamowych. ‌W konkretnym przypadku zastosowania ‌należy skonsultować się z ‌ekspertem. Zarówno wydawca, ‌jak i ‌autor, ‌nie ponoszą odpowiedzialności za ‌jakiekolwiek ‌szkody związane ‌z tą publikacją.

Copyright © ‌2018 by MT ‌Biznes Sp. ‌z o.o.

This translation ‌published under licence with ‌the ‌original publisher John Wiley ‌& Sons, Inc.

All rights ‌reserved 

Warszawa 2018

Wszelkie prawa zastrzeżone. ‌Nieautoryzowane rozpowszechnianie całości lub ‌fragmentów niniejszej publikacji ‌w jakiejkolwiek ‌postaci ‌zabronione. Wykonywanie kopii ‌metodą elektroniczną, fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym, optycznym lub innym powoduje naruszenie praw autorskich niniejszej publikacji. Niniejsza publikacja została elektronicznie zabezpieczona przed nieautoryzowanym kopiowaniem, dystrybucją i użytkowaniem. Usuwanie, omijanie lub zmiana zabezpieczeń stanowi naruszenie prawa.

MT Biznes Sp. z o.o.

www.mtbiznes.pl

[email protected]

ISBN 978-83-8087-194-6 (format epub)

ISBN 978-83-8087-195-3 (format mobi)

Opinie dotyczące książki

„Przejrzyste i fascynujące wyjaśnienie potencjału analizy predykcyjnej i tego, jak może ona przekształcać firmy, a nawet całe branże”.

Anthony Goldbloom, założyciel i prezes, Kaggle.com

„Pojawiła się niezwykle ważna dla branży pozycja. Dr Siegel osiągnął to, co niewielu zaledwie próbowało zrobić: napisał dostępnym i porywającym językiem książkę dotyczącą analizy predykcyjnej, która jest obowiązkową lekturą dla wszystkich zainteresowanych jej potencjałem, a także zagrożeniami, jakie może nieść ze sobą”.

Mark Berry, wiceprezes, People Insights, ConAgra Foods

„Fascynująca lektura dotycząca najważniejszej nowej technologii przetwarzania informacji”.

Emiliano Pasqualetti, prezes, DomainsBot

„Teraz, kiedy rośnie nasza zdolność gromadzenia i analizowania informacji, eksperci, tacy jak Eric Siegel, stają się przewodnikami po pełnym tajemnic świecie i pomagają odpowiadać na pytania natury moralnej, które zaczynają się pojawiać”.

Jules Polonetsky, współprzewodniczący i dyrektor, Future of Privacy Forum, były szef do spraw ochrony prywatności AOL i DoubleClick

„Znakomita. Każdy rozdział sprawia, że to, co złożone, staje się zrozumiałe także dzięki wykresom dobrze obrazującym omawiane zagadnienia. Ta książka motywuje do myślenia, co więcej można osiągnąć, wykorzystując analizę predykcyjną”.

Edward Nazarko, doradca techniczny klienta, IBM

„Zawsze byłem pasjonatem technik eksploracji danych, jednak nigdy nie sądziłem, że jest możliwe popularyzowanie tej pasji. A tego właśnie dokonał Eric Siegel w tej książce. Przedstawiane przez niego historie inspirują i przerażają – przeczytaj je i dowiedz się, co robiliśmy, gdy nie zwracałeś na nas uwagi”.

Michael J.A. Berry, autor Data Mining Techniques

„Eric Siegel jest Kevinem Baconem świata analizy predykcyjnej; organizuje konferencje, w trakcie których eksperci dzielą się wiedzą i doświadczeniami. Teraz otworzył szeroko drzwi dla wszystkich. Przejdź przez nie i dowiedz się, jak badacze danych na nowo piszą reguły funkcjonowania biznesu”.

Kaiser Fung, wiceprezes, Vimeo, autor Numbers Rule Your World

„Ta napisana żywym językiem książka pełna wspaniałych cytatów, przykładów i studiów przypadku sprawia przy lekturze prawdziwą radość. Osoby znające tę tematykę z przyjemnością przeczytają rozdziały o efekcie zgrupowanych modeli i modelowaniu typu uplift – są to obecnie bardzo żywe trendy. Z przekonaniem polecam tę książkę”.

Gregory Piatetsky-Shapiro, redaktor naczelny KDnuggets, założyciel KDD Conferences

„Zdecydowanie rekomenduję. Jak udowadnia Siegel, rezultaty osiągane przez tych, którzy wykorzystują analizę predykcyjną do udoskonalania procesu podejmowania decyzji, zmieniają reguły gry”.

James Taylor, prezes, Decision Management Solutions

„Czym jest analiza predykcyjna? Ta książka daje praktyczną i aktualną odpowiedź na to pytanie, poszerzając to zagadnienie o nowy wymiar i służąc jako znakomite źródło odniesienia”.

Ramendra K. Sahoo, wiceprezes do spraw zarządzania ryzykiem i analiz, Citibank

„Konkurencyjność, jeśli chodzi o efektywność przetwarzania informacji, nie jest obecnie luksusem, lecz kwestią przetrwania. Pomimo swoich sukcesów analiza predykcyjna w stosunku do swojego potencjału jest mało rozpowszechniona. Dlatego też jest olbrzymie zapotrzebowanie na przykłady i studia przypadków, takie jak przedstawione w tej książce”.

Boris Evelson, wiceprezes i główny analityk, Forrester Research

„Fascynująca i wspaniale napisana. Siegel jest czołowym ekspertem w tym obszarze – obowiązkowa pozycja w twojej bibliotece”.

Sameer Chopra, wiceprezes do spraw zaawansowanych analiz, Orbitz Worldwide

„Wspaniałe przedstawienie tematu – zdecydowanie polecam każdemu, kto interesuje się analizami i tym, jaki wywierają wpływ na współczesny świat”.

Kerem Tomak, wiceprezes do spraw analiz marketingowych, Macys.com

„Eric wyjaśnia naukę stanowiącą podstawę analizy predykcyjnej; mówi zarówno o szansach, jak i ograniczeniach tej techniki. Obowiązkowa lektura dla każdego”.

Azhar Iqbal, wiceprezes i ekonometryk, Wells Fargo Securities

„W nowym świecie dużych zbiorów danych, samouczenia się maszyn i eksploracji danych Eric Siegel w przystępny sposób wyjaśnia zawiłości analizy predykcyjnej”.

Marc Parrish, wiceprezes do spraw marketingu lojalnościowego, Barnes & Noble

„Ta książka jest bezcennym wkładem do analizy predykcyjnej. Wyjaśnienia Erica, jak przewidywać przyszłe wydarzenia, są prowokującą i ciekawą lekturą dla każdego”.

Jean Paul Isson, globalny wiceprezes do spraw wywiadu biznesowego i analizy predykcyjnej, Monster Worldwide, współautor Win with Advanced Business Analytics: Creating Business Value from Your Data

„Analiza predykcyjna jest kluczem do zdobywania nowej wartości na niewyobrażalną poprzednio skalę. W tej książce Siegel wspaniale wyjaśnia, jak połączyć teorię z praktyką”.

Sergo Grigalashvili, wiceprezes do spraw informatyki, Crawford & Company

„Analiza predykcyjna była obszarem nieznanym, którego się obawiano. Eric Siegel definitywnie objaśnia ją, odziera z tajemniczości i pokazuje wiele korzyści płynących z jej zastosowania”.

Jane Kuberski, inżynier i analityk, Nationwide Insurance

„Teraz, gdy analiza predykcyjna przesuwa się z obszaru nowinek do głównego nurtu, Siegel rozkłada ją na czynniki pierwsze i pokazuje jej potencjał”.

Rajeeve Kaul, starszy wiceprezes, OfficeMax

„Dr Siegel nadaje analizie predykcyjnej rys humanistyczny. Łączy analityczny rygor z przykładami z życia z łatwością, która jest niezwykła w jego specjalizacji. Książka zawiera wiele informacji, jest przyjemna w czytaniu i łatwa do zrozumienia. Przeczytałem ją za jednym razem. Lektura obowiązkowa… i to nie tylko dla naukowców zajmujących się przetwarzaniem danych”.

Madhu Iyer, statystyk marketingowy, Intuit

„Wciągająca encyklopedia wypełniona prawdziwymi przykładami z życia, które powinny zachęcić każdego, kto stoi jeszcze z boku, by zanurzył się w świat analizy predykcyjnej”.

Jared Waxman, specjalista od marketingu internetowego, LegalZoom; wcześniej: Adobe, Amazon, Intuit

„Siegel kompleksowo opisuje analizę predykcyjną, ożywiając ją i sprawiając, że chciałbyś wiedzieć o niej jeszcze więcej”.

Brian Seeley, menedżer do spraw analizy ryzyka, Paychex

„Wspaniałe spojrzenie na świat analizy predykcyjnej z perspektywy prawdziwego praktyka”.

Shawn Hushman, wiceprezes do spraw analiz, Kelley Blue Book

„Wspaniała prezentacja kolejnej odsłony możliwości przetwarzania danych w biznesie wskazująca najnowszą drogę ludzkości do stworzenia sztucznej inteligencji”.

Christopher Hornick, przewodniczący i prezes, HSBC Strategic Services

„[Ta książka] jest wciągającym i pełnym humoru wstępem do świata przetwarzania danych. Dr Siegel pokazuje na wielu prawdziwych przykładach, w jaki sposób modelowanie nadaje wartość wielkim zbiorom danych”.

David McMichael, wiceprezes, Advanced Business Analytics

Książkę tę z całego serca dedykuję mojej mamie, Lisie Schamberg, i ojcu, Andrew Siegelowi

PRZEDMOWA

Ta książka poświęcona jest ilościowej analizie mającej na celu prognozowanie ludzkich zachowań, której początki sięgają drugiej wojny światowej. Norbert Wiener, ojciec cybernetyki, starał się przewidzieć w 1940 roku zachowanie niemieckich pilotów, co miało na celu bardziej efektywne strącanie ich samolotów. Metoda polegała na tym, by jako dane wejściowe potraktować zaobserwowaną trajektorię samolotu i, biorąc pod uwagę najbardziej prawdopodobne manewry unikające stosowane przez pilota, przewidzieć, gdzie maszyna za chwilę się znajdzie, co miało zwiększyć celność wystrzeliwanych pocisków. Niestety, Wiener potrafił przewidzieć zaledwie jedną sekundę ruchu samolotu, podczas gdy potrzeba było dwudziestu.

Dzięki książce Erica Siegela poznasz wiele działań mających na celu prognozowanie, które zakończyły się o wiele większym sukcesem. Komputery są dzisiaj znacznie szybsze niż w czasach Wienera; mamy również dużo więcej danych. W rezultacie banki, detaliści, politycy, lekarze, szpitale i wiele innych organizacji osiągają znacznie lepsze wyniki, jeśli chodzi o prognozowanie zachowań indywidualnych osób. Pomaga im to w zdobywaniu klientów, prowadzeniu kampanii wyborczych i w walce z chorobami.

Według mnie i Siegela działania mające na celu prognozowanie zachowań są dla ludzi pożyteczne. W kontekście opieki zdrowotnej, walki z przestępczością lub terroryzmem mogą ratować życie. W kontekście reklamy wykorzystanie prognoz jest jeszcze bardziej efektywne i nie można wykluczyć, że pomaga ratować drzewa (mniej niepotrzebnych folderów reklamowych i katalogów) oraz oszczędzać czas potencjalnych klientów. W sferze polityki nagradza tych kandydatów, którzy stosują metody naukowe (wielu może się z tym nie zgodzić, lecz ja uważam to za pozytywny aspekt).

Jednak, na co Siegel wskazuje już na początku książki i za co należy mu się podziw, metody te mogą być również niebezpieczne. „Wielka siła wymaga równie wielkiej odpowiedzialności”, zauważa, cytując Spider-Mana. Oznacza to, że jako społeczeństwo musimy uważać, w jaki sposób wykorzystujemy modele służące prognozowaniu zachowań, gdyż w przeciwnym wypadku mogą powstać ograniczenia w ich zastosowaniu, a co za tym idzie, w czerpaniu z nich korzyści. Podobnie jak inne dające wielką siłę technologie, prognozowanie jako takie jest ze swojej natury trudne do oceny z moralnego punktu widzenia i może być wykorzystane w dobrym lub złym celu. Aby tego drugiego uniknąć, niezwykle ważne jest zrozumienie, jakie możliwości daje analiza predykcyjna (prognostyczna) − dowiesz się tego z dalszej lektury.

Książka ta poświęcona jest analizie zachowań. Nie jest to jedyny rodzaj analizy, lecz najprawdopodobniej najbardziej interesujący i najważniejszy. Nie uważam, byśmy potrzebowali większej liczby książek koncentrujących się na analizie opisowej, mówiących o tym, co się wydarzyło, lecz nie wyjaśniających dlaczego. Często nawiązuję do własnych prac jako do trzeciego typu analizy – „dającej receptę” – mówiącej użytkownikom, co mają zrobić, dzięki kontrolowanym eksperymentom lub optymalizacji. Jednak te ilościowe metody są o wiele mniej popularne niż prognozowanie zachowań.

Ta książka i zawarte w niej idee są przeciwieństwem tego, co twierdzi Nicholas Taleb. W swoich książkach, w tym w Czarnym łabędziu, sugeruje, że wiele wysiłków związanych z prognozowaniem jest z góry skazanych na porażkę ze względu na przypadkowość stanowiącą nieodłączną część złożonych zdarzeń. Taleb niewątpliwie ma rację, że niektóre wydarzenia są czarnymi łabędziami, których nie da się przewidzieć, jednak z drugiej strony jest faktem, że większość ludzkich zachowań ma regularny i przewidywalny charakter. Siegel, przytaczając przykłady prognoz zakończonych sukcesem, przypomina nam, że większość łabędzi jest biała.

Siegel opiera się również „magii wielkich zbiorów danych”. Niektóre przytoczone przez niego przykłady można niewątpliwie zaliczyć do tej kategorii – informacji jest zbyt wiele lub nie są właściwie ustrukturalizowane, by można było nimi łatwo zarządzać za pomocą relacyjnej bazy danych. Kluczowym aspektem prognozowania nie jest rozmiar bazy, lecz to, jak te dane wykorzystasz. Zauważyłem, że często „duży zbiór danych oznacza niewiele obliczeń”; wiele osób, które takie zbiory wykorzystują, tworzy na ich podstawie ładne wizualnie prezentacje. Nie są one jednak nawet w przybliżeniu tak wartościowe, jak dobry model predykcyjny (prognostyczny).

Siegel napisał książkę, która jest skomplikowana, lecz jednocześ­nie przystępna dla czytelnika niemającego doświadczenia w analizie ilościowej. Znajdują się w niej wspaniałe historie oraz przykłady i jest napisana językiem atrakcyjnym w lekturze. Osoby, które nie zetknęły się dotychczas z tego typu analizą, powinny koniecznie przeczytać tę książkę, gdyż nie ulega wątpliwości, że ich zachowania będą w którymś momencie ich życia analizowane i prognozowane. Jest również bardzo prawdopodobne, że coraz więcej ludzi będzie musiało wykorzystywać modele analityczne w pracy zawodowej.

Mówiąc w skrócie, żyjemy w przewidywalnym społeczeństwie. Aby w nim dobrze prosperować, należy zrozumieć cele, techniki i ograniczenia modeli prognozowania zachowań. Najlepszą metodą będzie kontynuowanie lektury tej książki.

Thomas H. Davenport

Thomas H. Davenport jest profesorem wizytującym w Harvard Business School, profesorem w Babson College, współzałożycielem International Institute for Analytics i współautorem książki Competing on Analytics (Konkurowanie na podstawie analizy) oraz wielu innych książek poświęconych analizie.

Wstęp do wydania zaktualizowanegoCo nowego i dla kogo jest ta książka – najczęściej zadawane pytania dotyczące analizy predykcyjnej

Badacz danych: najseksowniejszy zawód dwudziestego pierwszego wieku

Tytuł artykułu z „Harvard Business Review” autorstwa Thomasa Davenporta i DJ Patila, który w 2015 roku jako pierwszy otrzymał stanowisko głównego specjalisty do spraw danych w United States Office of Science and Technology Policy

Prognozowanie rozkwita. Zmienia branże i nadaje światu kierunek.

W coraz większym stopniu analiza predykcyjna (AP) rządzi handlem, produkcją, opieką zdrowotną, działaniami rządu i egzekwowaniem prawa. W tych obszarach organizacje działają bardziej efektywnie, prognozując zachowania, to znaczy sposób postępowania klienta, pracownika, pacjenta, wyborcy i podejrzanego.

Każdy to robi. Takie firmy jak Accenture i Forrester piszą w raportach, że wykorzystanie AP w ostatnich latach jest ponad dwukrotnie większe niż wcześniej. Transparency Market Research prognozuje, że rynek AP w ciągu kilku lat będzie miał wartość 6,5 miliarda dolarów. Z sondażu przeprowadzonego przez Gartnera wynika, że wywiad gospodarczy i analiza predykcyjna znalazły się na pierwszym miejscu, jeśli chodzi o priorytety inwestycyjne osób odpowiedzialnych za zdobywanie informacji. Badanie przeprowadzone przez Salesforce.com wykazało, że AP ma największą stopę wzrostu, jeśli chodzi o trendy sprzedaży technologii; prognozuje się, że wykorzystanie AP podwoi się w ciągu kolejnych osiemnastu miesięcy. Zespoły sprzedażowe mające wysoką efektywność wykorzystują AP szacunkowo cztery razy częściej niż te o słabych wynikach.

Jestem świadkiem coraz większego zastosowania AP w różnych branżach. Cykl konferencji Predictive Analytics Word (PAW), który zapoczątkowałem, miał już ponad dziesięć tysięcy uczestników od 2009 roku i ich krąg coraz dynamiczniej się poszerza. Z pomocą ekspertów reprezentujących poszczególne branże organizujemy takie konferencje tematyczne, jak PAW Government (instytucje rządowe), PAW Healthcare (opieka zdrowotna), PAW Financial (finanse), PAW Workforce (rekrutacja) i PAW Manufacturing (produkcja) dla menedżerów wyższego szczebla. Uruchomiliśmy również stronę z bieżącymi informacjami The Predictive Analytics Times.

Od czasu pierwszego wydania tej książki w 2013 roku zapraszano mnie, bym wystąpił jako mówca na konferencjach dotyczących takich branż, jak marketing, badania rynku, e-handel, usługi finansowe, ubezpieczenia, opieka zdrowotna, instytucje rządowe, zasoby ludzkie, turystyka, nieruchomości, budownictwo, prawo, branża informacyjna, branża farmaceutyczna oraz na konferencjach dyrektorów najwyższego szczebla i konferencjach naukowych.

Jesteś zainteresowany karierą w futurologii? Popyt wzrasta. McKinsey prognozuje, że w Stanach Zjednoczonych w najbliższym czasie zabraknie stu czterdziestu tysięcy ekspertów od analiz i półtora miliona menedżerów „potrafiących podejmować decyzje na podstawie wielkich zbiorów danych”. Na portalu LinkedIn numer jeden w zakładce Najbardziej pożądane zawody to analiza statystyczna i eksploracja danych.

AP można porównać do filmu Moneyball, tylko że celem są… pieniądze.

NAJCZĘŚCIEJ ZADAWANE PYTANIA DOTYCZĄCE ANALIZY PREDYKCYJNEJ

Komu jest potrzebna ta książka?

Każdemu. Łatwo jest ją zrozumieć każdemu czytelnikowi. Nie ma ona charakteru technicznego i służy osobom, które chcą poznać tę dziedzinę, entuzjastom technologii i menedżerom, lecz również analitykom, gdyż zawiera nowe studia przypadku i opisuje najnowocześniejsze techniki analizy predykcyjnej.

Czy idea analizy predykcyjnej jest trudna do zrozumienia?

Absolutnie nie. Termin predykcja (prognozowanie) na podstawie danych może wydawać się trudny, lecz jeśli przebrniesz przez krótkie Wprowadzenie, przekonasz się, że jest to jasna, dostępna i niewątpliwie sięgająca daleko w przyszłość idea.

Czy ta książka jest podręcznikiem metodologii?

Nie. Jest ona wprowadzeniem do tej tematyki i opisem branży.

Jeśli to nie jest podręcznik metodologii, to dlaczego eksperci mieliby ją czytać?

Chociaż jest to wprowadzenie do tematu pozbawione matematyki i zrozumiałe dla każdego czytelnika, także niemającego wykształcenia technicznego, ma ono wartość dla praktyków. Oto dlaczego:

Znakomity sposób, by zacząć

– ta książka daje wiedzę tym, którzy chcą przejść do praktyki lub jako menedżerowie chcą stosować AP.

Szczegółowe studia przypadku

– pokazane są tu wdrożenia AP przez takich gigantów, jak Chase, IBM, HP, Netflix, NSA, Target, U.S. Bank i wielu innych.

Kompilacja 182 ministudiów przypadku

– przykłady zastosowań analizy predykcyjnej podzielone na dziewięć branż i dotyczące między innymi takich firm, jak BBC, Citibank, ConEd, Facebook, Ford, Google, IRS, Match.com, MTV, PayPal, Pfizer, Spotify, Uber, UPS, Wikipedia.

Przykłady zaawansowanych zastosowań

– przedstawione w ostatnich trzech rozdziałach przykłady są nowe nawet dla doświadczonych ekspertów.

Modele zgrupowane

,

odpowiedzi udzielane przez komputer Watson firmy IBM

modelowanie uplift

. Bez względu na to, jaką wiedzę techniczną posiadasz, korzyści z lektury mogą być większe, niż oczekujesz, szczególnie w obszarze

modelowania typu uplift

. W przypisach do tych trzech rozdziałów znajdują się wyczerpujące odniesienia do źródeł technicznych (dostępne na

www.PredictiveNotes.com

).

Prywatność i prawa obywatelskie

– w rozdziale drugim poruszone są zagadnienia dotyczące kwestii etycznych związanych z zastosowaniem analizy predykcyjnej.

Przegląd branży

– tematyka tej książki jest szersza niż jedynie technologia – wszystko, co zostało napisane powyżej, ma związek z takimi obszarami, jak społeczeństwo, gospodarka i etyka.

W związku z powyższym praktycy, którzy są zainteresowani poradami krok po kroku dotyczącymi tego tematu, powinni otrzymać ostrzeżenie: Nie jest to książka, jakiej szukacie (jednak jest ona pożyteczna, gdyż każdy z waszych krewnych może się z niej dowiedzieć, co was interesuje).

Jeśli chodzi o inne obszary nauki, jeśli jesteś zainteresowany karierą w tej dziedzinie, ta książka może stanowić podstawę i wywołać głód wiedzy. Na samym jej końcu znajdują się wskazówki, jak można zgłębić wiedzę techniczną oraz stanowiące jej fundament teorię i matematykę.

Jaki jest cel tej książki?

Napisałem ją, by zademonstrować, dlaczego AP jest intuicyjna, ma potencjał i inspiruje. Jest to książka dotycząca najbardziej wpływowych i cennych osiągnięć skomputeryzowanej predykcji oraz dwóch rzeczy, które sprawiły, że stała się możliwa: ludzi oraz fascynującej nauki.

Chociaż istnieje wiele pozycji mówiących szczegółowo o metodologii AP, ta książka postawiła sobie inny cel (który okazał się wyzwaniem dla autora). Chodzi mianowicie o podzielenie się z większą liczbą osób całościowym obrazem tematyki AP, włączając w to ideę modelowania predykcyjnego, która daje coraz większe korzyści organizacjom.

Biorąc pod uwagę to, jak szybko zmienia się świat, nadszedł najwyższy czas, by predykcyjny potencjał danych i to, jakie znajduje on zastosowanie w nauce, został pozbawiony tajemniczej otoczki. Prognozowanie ludzkich zachowań na podstawie danych nie może być dłużej wiedzą tajemną.

Jak bardzo ta książka wkracza w szczegóły techniczne?

Jeśli temat nie jest trudny do przedstawienia nowicjuszom znającym podstawy, pokazuję zasady działania drzew decyzyjnych (rozdział czwarty), które są przykładem modelu predykcyjnego służącego zaznajomieniu się z tematem, jak również podstawowym modelem do wdrożenia AP w organizacji.

Staram się drążyć temat tak głęboko, jak tylko jest to możliwe, by był interesujący nie tylko dla nowych osób w branży, lecz również dla profesjonalistów zainteresowanych jego głębszymi aspektami i tym, jak zmieniają one świat.

Czy jest to podręcznik akademicki

Ta książka służy jako podręcznik w ponad trzydziestu college’ach i uniwersytetach. Jako były profesor informatyki napisałem ten wstęp, aby zachować spójność pod względem koncepcji. W spisie treści słowa znajdujące się w nawiasach przed numerem strony podkreślają to, co znajduje się w każdym rozdziale: 1 Rozpoczęcie, 2 Etyka, 3 Dane, 4 Modelowanie predykcyjne, 5 Modele zgrupowane, 6 Maszynowe odpowiedzi na pytania i 7 Modelowanie uplift. W celu znalezienia źródeł, zapoznaj się z diagramem zamieszczonym pod kolejnym pytaniem.

Chciałbym jednak dodać, że ta książka nie jest napisana jak typowy podręcznik. Chodziło mi raczej o stworzenie łatwego w lekturze tekstu, który za pomocą anegdot obrazowałby całe zagadnienie.

Jeśli chodzi o osoby, które chciałyby wykorzystać niniejszy materiał dla celów instruktażowych, to dodatkowe informacje znajdują się na stronie www.teachPA.com.

Jak powinienem czytać tę książkę?

Kolejne rozdziały powiązane są z poprzednimi. Niektóre odwołują się jedynie do wstępu, lecz inne stanowią kumulację wiedzy z poprzednich rozdziałów. Zamieszczony na następnej stronie rysunek pokazuje te zależności. Czytaj kolejny rozdział, gdy zapoznałeś się z poprzednimi. Na przykład rozdział trzeci wymaga wiedzy z rozdziału pierwszego, który z kolei będzie zrozumiały po przeczytaniu Wprowadzenia.

Co nowego znajduje się w zaktualizowanej wersji KSIĄŻKI?

Prawdziwy powód, dla którego NSA zbiera twoje dane: automatyczne wykrywanie podejrzanych.

W przykładzie w rozdziale drugim (dotyczącym etyki w zastosowaniu analizy predykcyjnej) przyjęto założenie, na którego poparcie istnieje wiele dowodów, że w NSA analiza predykcyjna ma status priorytetu strategicznego. Czy agencja może wykorzystywać AP bez stwarzania zagrożenia dla swobód obywatelskich?

Dziesiątki nowych przykładów dotyczących Facebooka, Hoppera, Shella, Ubera, UPS, rządu Stanów Zjednoczonych i innych organizacji.

W przykładach zastosowań analizy predykcyjnej są już 182 studia przypadków, w tym także takie, które mają przełomowe znaczenie.

Niezwykle potrzebne ostrzeżenie dotyczące niewłaściwego wykorzystania nauki.

Rozdział trzeci, Efekt danych, zawiera dodatkowo szczegółowy fragment dotyczący bardzo typowego zagrożenia, czyli tego, jak wykorzystywać potencjał danych, lecz nie wpaść w pułapkę polegającą na koncentracji na szumie informacyjnym.

Jeszcze bardziej obszerne przypisy, uaktualnione, rozszerzone do 120 stron i przeniesione do internetu

. Przypisy znajdują się na stronie

www.PredictiveNotes.com

i zawierają cytaty oraz komentarze odnoszące się do dodanej zawartości książki, jak również uaktualnione źródła dotyczące poszczególnych rozdziałów.

Gdzie po przeczytaniu tej książki mogę zdobyć dodatkową praktyczną wiedzę?

Informacje zamieszczone na końcu tej książki

– podaję tam źródła wiedzy, od których można rozpocząć naukę.

Strona internetowa książki

– filmy, artykuły i inne informacje:

www.thepredictionbook.com

.

Predictive Analytics Word

– cykl konferencji odbywających się w Ameryce Północnej i Europie, w trakcie których prowadzone są również warsztaty i spotkania branżowe, takie jak PAW Business, PAW Government, PAW Healthcare, PAW Financial, PAW Workforce i PAW Manufacturing. Strona:

www.pawcon.com

.

Przewodnik po świecie analizy predykcyjnej

– artykuły, portale branżowe i inne źródła:

www.pawcon.com/guide

.

Praktyczne zastosowania analizy predykcyjnej

– warsztaty online, które w odróżnieniu od tej książki uczą, jak stosować analizę predykcyjną. Dostępne w każdej chwili pod adresem:

www.businessprediction.com

.

The Predictive Analytics Times

– główne źródło wiedzy na temat analizy predykcyjnej: informacje branżowe, artykuły techniczne, filmy i wydarzenia:

www.predictiveanalyticstimes.com

.

WSTĘP do wydania pierwszego

Dzień wczorajszy jest historią, jutrzejszy tajemnicą, dzisiejszy darem. Dlatego nosi nazwę teraźniejszości[1].

Powiedzenie przypisywane A.A. Milne’owi, Billowi Keane’owi i Oogway’owi, mądremu żółwiowi z filmu Kung Fu Panda

Ludzie patrzą na mnie z rozbawieniem, gdy mówię im, czym się zajmuję. Ryzyko zawodowe.

W wieku informacji, w którym żyjemy, zdarzają się zadziwiające przeoczenia. To stwierdzenie może wielu zaskoczyć, zważywszy, że aktywnie nagrywamy wszystko, co się na świecie dzieje. Odeszliśmy daleko od czasu książek historycznych, które dokumentowały jedynie ważne wydarzenia. Nasze systemy zapisują obecnie każde kliknięcie, płatność, połączenie telefoniczne, zderzenie samochodów, przestępstwo i chorobę. Można oczekiwać, że miłośnicy danych są zachwyceni, jeśli nie zepsuci ich obfitością.

Jednak ta olbrzymia ilość danych nie obejmuje zdarzeń, o których wiedza byłaby najbardziej wartościowa – takich, które jeszcze nie nastąpiły.

Każdy pragnąłby znać przyszłość; jako zbiorowość jesteśmy owładnięci obsesją przepowiedni. Chylimy czoła przed wróżbitami. Wydajemy pieniądze na czytanie z dłoni, dowiadujemy się, co mówią horoskopy, uwielbiamy astrologię i kupujemy ciasteczka z wróżbą.

Jednak wiele osób wierzących w moce nadprzyrodzone odrzuca jednocześnie naukę. Wewnętrznie tłumaczą to sobie tym, że jest ona zbyt niezrozumiała lub zbyt nudna. Wielu uważa również, że przepowiedzenie przyszłości nie jest możliwe bez nadnaturalnego wsparcia.

W telewizji można zobaczyć rozrywkowy serial, który lubię, zatytułowany Świry (ang. Psych). Jego bohater, bystrooki detektyw – hipster, współczesny zafascynowany informacją Sherlock Holmes, doprowadził sztukę obserwacji do takiej perfekcji, że policjanci uważają, iż szczegóły, które zauważa na miejscu przestępstwa, mogą być znane tylko sprawcy. Bohater wydobywa się z opresji, stwierdzając, iż ma zdolności parapsychiczne, dzięki temu unika więzienia i może dalej walczyć z przestępcami. Komedia trwa nadal.

Doświadczam czegoś podobnego, gdy na przykład ktoś pyta, spod jakiego znaku jestem. Zamiast jednak udawać wiarę w znaki zodiaku, żartobliwie odpowiadam: „Jestem skorpionem, a skorpiony nie wierzą w astrologię”.

Często na przyjęciach ludzie pytają mnie, kim jestem z zawodu. Zbieram wówczas siły, widząc świdrujący wzrok rozmówcy, i oznajmiam: „Zajmuję się prognozowaniem zachowań”. Większość osób ma ten luksus, że może określić swój zawód jednym słowem: lekarz, prawnik, pisarz, księgowy czy aktor. Jednak w moim przypadku odpowiedź odnosząca się do tej nieznanej większości dyscypliny jest za każdym razem początkiem dłuższej rozmowy, a wszelkie wysiłki, by szybko ją zakończyć, są z góry skazane na niepowodzenie:

„Jestem konsultantem biznesowym w obszarze technologii”. To jednak nie wystarcza rozmówcom, więc pytają: „Jakiego rodzaju technologii?”.

Za pomocą komputera przewiduję, co ludzie zrobią”. Efektem jest konsternacja połączona z niedowierzaniem i domieszką strachu.

„Uczę komputer, by na podstawie danych prognozował zachowania poszczególnych osób”. Kolejna konsternacja, poza tym nikt nie chce na przyjęciu rozmawiać o danych.

„Analizuję dane, by znaleźć prawidłowości”. Pytający patrzą się na mnie jeszcze bardziej podejrzliwie; efektem tak abstrakcyjnego stwierdzenia jest niezręczna cisza.

„Pomagam marketingowcom dowiedzieć się, którzy klienci kupią produkty”. Jest to już bardziej zrozumiałe, lecz jednocześnie obniża rangę i szufladkuje moją dziedzinę wiedzy.

„Przewiduję zachowania klientów tak, jak na przykład sieć handlowa Target przewidywała ciążę klientek”. Efektem jest

moonwalk

.

Napisałem więc tę książkę, by pokazać, dlaczego prognozowanie zachowań jest intuicyjne, wartościowe i budzące respekt.

Dobra wiadomość jest następująca: nawet skromne przewidywanie ma swoją wartość. Nazywam to efektem prognozowania; jest to zagadnienie, które będzie przewijało się przez całą książkę. Potencjał prognozowania jest na tyle istotny, na ile jest ono lepsze od zgadywania. Efekt sprawia, że prognozowanie zachowań jest wiarygodne. Nie musimy dokonywać rzeczy niemożliwych i być jasnowidzami. Rezultaty naszej pracy są ekscytujące i jednocześnie wiarygodne. Zaryzykowanie, by rozjaśnić nieco mglistą przyszłość, nie jest wygórowaną ceną. Prognozowanie obniża ryzyko finansowe, wzmacnia ochronę zdrowia, walczy ze spamem, wspomaga walkę z przestępczością i zwiększa sprzedaż.

Czy w twojej piersi bije serce naukowca lub biznesmena? Czy czujesz ekscytację, myśląc o przewidywaniu przyszłości i wynikających z tego korzyściach?

Mnie urzekła idea odkrywania niepoznanego. Prognozowanie wydaje się sprzeczne z prawami natury. Nie możesz znać przyszłości, gdyż ona jeszcze nie istnieje. Za coś wykonalnego uważamy budowanie maszyn na podstawie doświadczenia. Prognozowanie zachowań jest ścisłą wiedzą wykorzystującą w formie danych to, co już poznaliśmy, by określić z większym prawdopodobieństwem to, co się dopiero wydarzy. Łączymy to, co najlepsze, w matematyce i technologii, systematycznie ulepszając posiadaną wiedzę; w efekcie nasze naukowe serca mogą czerpać radość z opracowania systemów, które przenikają nieprzekraczalną barierę między dniem dzisiejszym a jutrem.

Mówię o śmiałym wkraczaniu na niespenetrowane dotychczas terytorium!

Niektórzy ludzie pracują w sprzedaży, inni są politykami. Ja zajmuję się prognozowaniem zachowań i jest to wspaniałe.

WprowadzenieEfekt prognozowania

Jestem podobny do ciebie. Czasem osiągam sukcesy, kiedy indziej ponoszę porażki. Są dni, kiedy spotyka mnie coś dobrego, i takie, w których dzieją się same złe rzeczy. Zawsze zastanawiamy się, czy coś mogłoby potoczyć się inaczej. Rozpocznę od sześciu krótkich historii poświęconych niefortunnym zdarzeniom dnia codziennego:

W 2009 roku uszkodziłem kolano podczas jazdy na nartach w stanie Utah. Skok był fajny, jednak po nim nastąpiło twarde lądowanie. Czekała mnie

operacja kolana

i musiałem wybrać źródło przeszczepu, z którego miało zostać zrekonstruowane wiązadło kolanowe. Wybór był trudny i miał wpływ na to, jak kolano będzie funkcjonowało. Wybrałem ścięgno stawu podkolanowego.

Czy szpital w moim przypadku mógł przedstawić lepszą z medycznego punktu widzenia opcję?

Choć się nacierpiałem, największe wydatki poniosła

firma

ubezpieczeniowa

, która za wszystko zapłaciła – operacja kolana jest kosztowna

. Czy ubezpieczyciel mógł lepiej przewidzieć ryzyko akceptacji durnia, któremu zachciewa się wykonywania skoków na nartach, jako klienta i odpowiednio dopasować składkę?

Wcześniej w roku 1995 przydarzyła mi się inna nieprzyjemna, choć mniej bolesna, historia. Padłem ofiarą

kradzieży tożsamości

, co kosztowało mnie wiele godzin biurokratycznej mordęgi i papierkowej roboty, by odzyskać pozytywny standing kredytowy.

Czy kredytodawcy mogli zauważyć, że oszuści podszywali się pode mnie, gdy w moim imieniu wypełniali dokumenty?

Gdy już udało mi się oczyścić własne imię, wziąłem

kredyt

na kupno mieszkania. Czy to było dobre posunięcie,

czy też doradca powinien mnie ostrzec, że wkrótce zobowiązanie przekroczy wartość nieruchomości?

Moje życie zawodowe również jest podatne na różnego rodzaju wydarzenia.

Interesy

idą dobrze, jednak firma zawsze jest narażona na ryzyko zmian gospodarczych i rosnącej konkurencji.

Czy można chronić wynik finansowy dzięki przewidywaniu, które działania i inwestycje będą opłacalne, a które zaczną pożerać kapitał?

Niewielkie wzloty i upadki determinują twoje i moje przeznaczenie każdego dnia. Dobry filtr

antyspamowy

ma znaczący wpływ na czas poświęcany realnej pracy. Dobra wyszukiwarka internetowa może wpłynąć na efektywność poszukiwania informacji na temat pracy, zdrowia (na przykład znajdowania opcji rekonstrukcji kolana), modernizacji domu i wielu innych dziedzin. Wierzymy w indywidualne

oceny muzyki i filmów

zamieszczane w takich serwisach, jak Spotify czy Netflix. Często zastanawiam się, dlaczego firmy wysyłkowe nie znają mnie na tyle dobrze, by nie zadawać sobie trudu przepełniania skrzynki pocztowej

śmieciową

korespondencją

, która mnie w ogóle nie interesuje (i przy okazji oszczędzić kilka drzew).

Tego typu zdarzenia mają znaczenie. Mogą zniszczyć ci dzień, rok lub nawet życie. Co jednak mają one ze sobą wspólnego?

Z takimi i innymi wyzwaniami najlepiej jest radzić sobie za pomocą prognozowania. Czy stan pacjenta po operacji będzie dobry? Czy osoba ubiegająca się o kredyt nie okaże się oszustem? Czy hipoteka nie przewyższy wartości nieruchomości? Czy klient odpowie, gdy wyśle się mu broszurę reklamową? Dzięki umiejętności prognozowania można udoskonalić opiekę medyczną, zmniejszyć ryzyko, walczyć ze spamem, lepiej zwalczać przestępczość i ciąć koszty.

PROGNOZOWANIE W DUŻYM BIZNESIE ― PRZYSZŁOŚĆ AKTYWÓW

Jest to kolejny obszar, na którym sprawdza się prognozowanie. Służy ono nie tylko konsumentom, takim jak ty czy ja, lecz również organizacjom, wyposażając je w zupełnie nową broń pomagającą konkurować na rynku. Korporacje pozytywnie podchodzą do możliwości stwarzanych przez prognozowanie.

W połowie lat dziewięćdziesiątych przedsiębiorczy naukowiec, Dan Steinberg, udostępnił metodologię prognozowania największemu bankowi, Chase, by mógł on sprawniej zarządzać milionami kredytów hipotecznych. Ta olbrzymia organizacja zaufała technologii zaproponowanej przez Dana i wykorzystała ją do wspomagania decyzji dotyczących portfela kredytowego. Czy jednak ten facet miał w swoim życiorysie jakieś spektakularne osiągnięcia?

Prognozowanie ma w sobie wielki potencjał. Duże organizacje budują silną przewagę konkurencyjną dzięki prognozowaniu przyszłej wartości indywidualnych aktywów. W opisywanym przypadku Chase dzięki podejmowaniu decyzji na podstawie prognoz dotyczących przyszłych zachowań kredytobiorców ograniczył ryzyko oraz zwiększył zyski i płynność.

PRZEDSTAWIAM… JASNOWIDZĄCY KOMPUTER

Technologia prognozowania stała się w naszych czasach powszechnie obecna i oddziałuje codziennie na każdego z nas. Wpływa na ciebie w niewidoczny sposób, gdy prowadzisz samochód, robisz zakupy, uczysz się, idziesz do lekarza, komunikujesz się z innymi, oglądasz telewizję, pożyczasz lub nawet kradniesz.

Ta książka opisuje najważniejsze i najbardziej wartościowe osiąg­nięcia komputerowego prognozowania oraz to, co je umożliwia: ludzi i fascynującą naukę.

Opracowywanie prognoz jest poważnym wyzwaniem. Każda z nich powstaje na podstawie wielu zmiennych. Trzeba wziąć pod uwagę zróżnicowane charakterystyki każdego pacjenta, właściciela domu czy e-maila, który może być spamem. Jak poradzić sobie ze złożonym problemem połączenia tego wszystkiego w całość, by stworzyć prognozę?

Idea jest prosta, lecz jej realizacja już nie. Z wyzwaniem można sobie poradzić dzięki systematycznemu rozwojowi prognozowania za pomocą naukowych metod, by mówiąc dosłownie, uczyć się prognozowania.

Rozwiązaniem jest samouczący się system – komputery, które automatycznie rozwijają nową wiedzę i umiejętności, karmione najobfitszym i mającym największy potencjał nienaturalnym surowcem współczesnego społeczeństwa – danymi.

„NAKARM MNIE!” ― DOSTARCZ POKARM, BY MASZYNA MOGŁA MYŚLEĆ

Informacja jest nową ropą naftową.

Meglena Kuneva, komisarz Unii Europejskiej do spraw ochrony konsumenta

Jedynym źródłem wiedzy jest doświadczenie.

Albert Einstein

Bogu ufamy. Wszyscy inni muszą dostarczyć dane.

William Edwards Deming, profesor biznesu sławny dzięki dokonaniom w dziedzinie efektywności produkcji

Większość ludzi nie jest zainteresowana danymi. Z ich punktu widzenia są one suche i nudne. Składa się na nie nieskończona liczba zapisanych cyfr i zdarzeń, z których każde jest tak prozaiczne, jak banalny zapis: „Właśnie kupiłem parę tenisówek”. Jest to mdła pozostałość wydalana masowo przez organizacje.

Nie daj się jednak zwieść pozorom! Prawda jest taka, że dane ucieleśniają bezcenną kolekcję doświadczeń, z których możemy się uczyć. Każda procedura medyczna, wniosek kredytowy, wpis na Face­booku, rekomendacja filmowa, oszustwo, otrzymany spam i każdego rodzaju zakup, a także każdy pozytywny lub negatywny rezultat działań, zakończony sukcesem bądź porażką telefon sprzedażowy, każde zdarzenie czy transakcja, są zapisywane pod postacią danych i przechowywane. Ta masa danych rośnie, jak się szacuje, w tempie dwóch i pół tryliona bajtów dziennie (trylion to jedynka z osiemnastoma zerami). Podobnie jak w przypadku Wielkiego Wybuchu, który zrodził olbrzymią ilość pozostałości, nieskończona liczba danych oznacza, że tylko maszyna może sobie z nią poradzić i może się z niej uczyć. Jeśli wykorzysta się komputery we właściwy sposób, wycisną ten bezmiar informacji jak gąbkę.

W miarę jak danych przybywa, zaczyna wśród nas panować coś na kształt gorączki złota. Jednak dane nie są bryłkami kruszcu, lecz jedynie nieciekawie wyglądającym surowcem. Złoto jest tym, co można z niego wydobyć.

Proces uczenia się maszyn (machine learning) uwalnia potencjał tego zasobu. Dzięki temu dowiadujemy się, co motywuje ludzi do działania i w jaki sposób funkcjonuje świat. Tego typu wiedza umożliwia prognozowanie.

Proces nauki ujawnia takie wartościowe informacje, jak[2]:

Wczesne przejście na emeryturę skraca prognozowaną długość życia.

Osoby uczestniczące w internetowym flircie, które stale oceniane są jako atrakcyjne, otrzymują

mniej

odpowiedzi.

Fani Rihanny to w większości demokraci.

Wegetarianie rzadziej nie korzystają z zarezerwowanego lotu.

Lokalna przestępczość wzrasta po wydarzeniach sportowych.

Ucząca się maszyna na podstawie tego typu informacji rozwija umiejętność prognozowania, przechodząc drogę analizy danych oraz prób i błędów dzięki statystyce i informatyce.

WIEM, ŻE MIAŁEŚ ZAMIAR TO ZROBIĆ

Co możemy prognozować, mając taki potencjał? Każda ważna rzecz, którą człowiek robi, warta jest prognozowania: konsumpcja, myślenie, praca, rezygnacja, głosowanie, miłość, prokreacja, rozwód, stwarzanie problemów, kłamstwo, oszukiwanie, kradzież, zabójstwo, śmierć. Przyjrzyjmy się niektórym przykładom[3].

LUDZIE KONSUMUJĄ

Hollywoodzkie studia filmowe starają się zaprognozować, czy scenariusz ma szansę na odniesienie sukcesu.

Netflix nagrodził milionem dolarów zespół naukowców, który najlepiej udoskonalił system rekomendacji prognozujący, które filmy widzowie będą najbardziej lubili.

Australijski koncern energetyczny Energex prognozuje zapotrzebowanie na energię elektryczną, by podejmować decyzje o rozbudowie sieci. Con Edison prognozuje możliwość występowania awarii w sytuacjach wysokiego zapotrzebowania na prąd.

Wall Street przewiduje ceny akcji na podstawie obserwacji wzrostów i spadków ich cen. Firmy takie jak AlphaGenius i Derwent Capital zarządzają funduszami hedgingowymi, obserwując trendy aktywności na Twitterze.

Organizacje, począwszy od U.S. Bank, a skończywszy na małych firmach takich jak Harbor Sweets (słodycze) czy Vermont Country Store („najwyższej jakości, trudnodostępne klasyczne wyroby”), starają się przewidzieć, jakie grupy klientów kupią ich produkty, by właściwie kierować aktywnością marketingową. Te prognozy wpływają na alokację cennych budżetów. Niektóre firmy w sensie dosłownym przewidują, jak najlepiej wpłynąć na ciebie, byś więcej kupował (więcej na ten temat w rozdziale siódmym).

Prognozy są podstawą decyzji o emisji kuponów, które dostajemy przy kasie. Brytyjski gigant spożywczy Tesco, trzeci na świecie pod względem wielkości detalista, prognozuje, jakie rabaty będą najkorzystniejsze, by dokonać dystrybucji ponad stu milionów personalizowanych kuponów w trzynastu krajach. To właś­nie dzięki prognozowaniu wykorzystanie kuponów wzrosło 3,6 razy w porównaniu z wcześniej stosowanymi metodami. Podobnie postępują takie sieci, jak Kmart, Kroger, Ralph’s, Safeway, Stop & Shop, Target oraz Winn-Dixie.

Bardzo opłacalne jest prognozowanie kliknięć myszą. Ze względu na to, że właściciele stron internetowych często są wynagradzani od liczby kliknięć na wyświetlane banery reklamowe, starają się przewidzieć, które będą najbardziej popularne, byś jak najszybciej mógł je zobaczyć. Dzięki temu dobór ogłoszeń jest lepszy, czego efektem są dodatkowe miliony przychodu.

LUDZIE KOCHAJĄ, PRACUJĄ, ROZMNAŻAJĄ SIĘ I ROZWODZĄ

LinkedIn, czołowy portal społecznościowy specjalizujący się w kontaktach zawodowo-biznesowych, prognozuje twoje umiejętności zawodowe.

Portale randkowe, takie jak Match.com, OkCupid i eHarmony, prognozują, która z osób zobaczonych na ekranie będzie do ciebie najlepiej dopasowana.

Sieć handlowa Target przewiduje, jaki procent klientek jest w ciąży, co pozwala lepiej dopasować reklamy produktów. Nic nie mówi o potrzebach lepiej niż informacja, że na świat przyjdzie nowy konsument.

Badacze prognozują również niewierność i rozwody. Istnieje nawet narzędzie internetowe, dzięki któremu możesz zbadać szanse na przetrwanie swojego małżeństwa (www.divorce360.com); plotki głoszą, że firmy emitujące karty kredytowe robią to samo.

LUDZIE MYŚLĄ I PODEJMUJĄ DECYZJE

Obama został w 2012 roku ponownie wybrany dzięki pomocy prognozowania zachowań głosujących. W trakcie kampanii Obama for America przewidziano, których wyborców da się zachęcić dzięki rozmowie telefonicznej, osobistej wizycie, ulotce czy reklamie telewizyjnej, a których takie formy kontaktu mogą zniechęcić. Taka metoda okazała się skuteczniejsza niż tradycyjnie prowadzona kampania w stanach, w których wynik nie był pewny.

„Co przez to rozumiesz?” – systemy nauczyły się rozpoznawać intencje kryjące się za słowami. Citibank i PayPal rozpoznają stosunek klientów do ich produktów; komputer pewnego badacza potrafi powiedzieć, które z recenzji książek zamieszczanych na Amazon.com są sarkastyczne.

Stworzono system automatycznego oceniania prac studentów. Jest on tak samo trafny jak oceny dokonywane przez ludzi.

Istnieje komputer mogący z sukcesem uczestniczyć w najbardziej popularnym w Stanach Zjednoczonych programie, w którym liczy się wiedza, a szczególnie wiedza literacka. W teleturnieju

Jeopardy!

(polski odpowiednik to

Va banque

) zwycięstwo odniósł superkomputer firmy IBM Watson. Maszyna stała się tak biegła w języku angielskim, że potrafiła odpowiedzieć na dowolne w formie pytania dotyczące bardzo szerokiego zakresu zagadnień i pokonała dwóch dotychczasowych zwycięzców.

Komputery mogą dosłownie czytać w twoim umyśle. Badacze opracowali systemy dekodujące skan mózgu i określające, o jakim rodzaju przedmiotu myślisz – na przykład o narzędziach, budynkach czy jedzeniu, w przypadku niektórych osób aż z osiemdziesięcioprocentową dokładnością. W 2011 roku IBM przepowiedział, że technologia odczytywania myśli stanie się jedną z najważniejszych w ciągu pięciu lat.

LUDZIE REZYGNUJĄ

Hewlett Packard (HP) przypisuje każdemu z trzystu trzydziestu tysięcy pracowników na całym świecie „ryzyko odejścia”, czyli prawdopodobieństwo zmiany pracy. Dzięki temu przełożeni mogą z wyprzedzeniem odpowiednio interweniować.

Czy byłeś kiedykolwiek sfrustrowany sposobem świadczenia usług przez operatora komórkowego? Dostawcy tych usług starają się o tym dowiedzieć. Wszyscy z nich prognozują, jakie jest prawdopodobieństwo, że przejdziesz do konkurencji − zanim nawet jeszcze zaczniesz o tym myśleć − na podstawie takich czynników, jak nieudane połączenia, zanik sieci, rachunki lub to, że twoi znajomi zmienili operatora.

FedEx jest w czołówce tego typu działań, prognozując z prawdopodobieństwem od sześćdziesięciu pięciu do dziewięćdziesięciu procent, którzy klienci mogą ewentualnie przejść do konkurencji.

System American Public University przewidział rezygnacje studentów i wykorzystał tę prognozę do skutecznego przeciwdziałania im; podobnie postępują University of Alabama, Arizona State University, Iowa State University, Oklahoma State University i Eindhoven University of Technology w Holandii.

Wikipedia prognozuje, który z edytorów pracujących za darmo dla tego cennego serwisu ma zamiar zrezygnować.

Badacze z Harvard Medical School prognozują, że jeśli twoi znajomi rzucili palenie, jest bardzo prawdopodobne, że postąpisz tak samo. Rezygnacja z palenia jest zaraźliwa.

LUDZIE STWARZAJą PROBLEMY

Firmy ubezpieczeniowe przewidują, kto może spowodować wypadek samochodowy lub odnieść obrażenia podczas jazdy na nartach. Firma Allstate prognozuje wysokość odszkodowań za obrażenia ciała powstałe podczas wypadków samochodowych na podstawie charakterystyki ubezpieczonych pojazdów. Szacuje się, że zyski z tego tytułu wynoszą około czterdziestu milionów dolarów rocznie. Inny czołowy ubezpieczyciel zanotował oszczędności rzędu pięćdziesięciu milionów dolarów rocznie dzięki uzupełnieniu metod aktuarialnych zaawansowanymi technikami prognozowania.

Ford wykorzystuje dane w pracach nad samochodowymi systemami, które mają rozpoznawać, czy kierowca nie jest rozkojarzony, zmęczony lub odurzony, i reagować w takich przypadkach na przykład włączeniem alarmu.

Na podstawie danych z National Transportation Safety Board (Narodowa Rada Bezpieczeństwa Transportu) badacze zidentyfikowali czynniki, które sprawiają, że katastrofa lotnicza jest pięciokrotnie bardziej prawdopodobna.

Wszystkie duże banki i firmy oferujące karty kredytowe prognozują, którzy z dłużników z największym prawdopodobieństwem stracą płynność i przestaną spłacać pożyczki lub zaległości na kartach. Firmy windykacyjne, opierając się na prognozowaniu, dobierają metody najskuteczniejsze w poszczególnych przypadkach.

LUDZIE CHORUJĄ I UMIERAJĄ

Nie boję się śmierci. Nie chciałbym tylko przy tym być, gdy mnie się to przydarzy.

Woody Allen

W 2013 roku sieć Heritage Provider zaoferowała ponad trzy miliony dolarów temu z konkurujących ze sobą zespołów naukowych, który najlepiej zaprognozuje indywidualne przypadki przyjęć do szpitali. Dzięki tym przewidywaniom można lepiej zaplanować działania profilaktyczne i oszczędzić dziesiątki milionów dolarów marnowanych rokrocznie na niepotrzebną hospitalizację. University of Pittsburgh Medical Center prognozuje ponowne szybkie powroty do szpitala, by przeciwdziałać zbyt pospiesznemu, w niektórych przypadkach, wypisywaniu pacjentów przez lekarzy.

Na Stanford University komputer nauczył się lepiej diagnozować raka piersi niż lekarze dzięki odkryciu innowacyjnej metody analizowania większej liczby czynników w pobranych próbkach tkanek.

Badacze z Brigham Young University oraz University of Utah trafnie prognozują około osiemdziesięciu procent przedwczes­nych porodów (i około osiemdziesięciu procent porodów w prawidłowym terminie), korzystając z biomarkerów peptydowych w próbkach krwi pobranej już w dwudziestym czwartym tygodniu ciąży.

Badacze uniwersyteccy opracowali metodę wykrywania schizofrenii u pacjenta, analizując wypowiadane przez niego słowa.

Coraz większa liczba firm ubezpieczeniowych oprócz konwencjonalnych metod aktuarialnych wykorzystuje prognozowanie do określania ryzyka śmierci. Nie nazywa się tego

ubezpieczeniem od śmierci

, lecz firmy te kalkulują, kiedy umrzesz.

Jeden z pięciu czołowych ubezpieczycieli na życie prognozuje na podstawie informacji zawartych w wywiadach medycznych, jakie jest prawdopodobieństwo, że starszy posiadacz polisy umrze w ciągu najbliższych osiemnastu miesięcy. Nie obawiaj się jednak – oczywiście cele tych badań są szczytne.

Badacze na podstawie informacji dotyczących twojego stanu zdrowia prognozują ryzyko śmierci podczas operacji, by pomóc lekarzom w podejmowaniu decyzji.

Lekarze często, lecz niezamierzenie, poświęcają jednych pacjentów, by ocalić innych i nie wzbudza to kontrowersji. Jednak to zjawisko może być ograniczone dzięki prognozowaniu opartemu na czymś więcej niż tylko wyniki diagnozy, a mianowicie na

wpływie

opieki zdrowotnej (prognozowanie wpływu jest tematem rozdziału siódmego).

LUDZIE KŁAMIĄ, OSZUKUJĄ, KRADNĄ I ZABIJAJĄ

Większość średnich i dużych banków wykorzystuje prognozowanie do przeciwdziałania nieustannie pojawiającym się fałszerstwom czeków czy oszustwom związanym z kartami kredytowymi lub innymi transakcjami finansowymi. Citizens Bank opracował metody zmniejszania o dwadzieścia procent strat wynikających z fałszowania czeków. Hewlett-Packard oszczędził sześćdziesiąt sześć milionów dolarów dzięki metodzie wykrywania fałszywych roszczeń gwarancyjnych.

Komputery prognostyczne obliczają, komu nie należy przyznawać zwolnienia warunkowego. Urzędnicy, między innymi w stanach Oregon i Pensylwania, korzystają z komputerów, by ocenić, jakie jest ryzyko, że dana osoba ponownie popełni przestępstwo.

Uważa się, że nie jest możliwe przewidzenie ze znaczącym prawdopodobieństwem morderstwa. Jednak w populacji o wysokim współczynniku ryzyka popełnienia przestępstwa metody prognostyczne mogą być efektywne. W stanie Maryland przygotowuje się prognozy, kto spośród osób będących pod nadzorem może popełnić zabójstwo i kto może zostać zabity. Badacze uniwersyteccy oraz badacze związani z organami ścigania opracowali system, który prognozuje ryzyko popełnienia kolejnego morderstwa przez tych, którzy już zostali skazani za zabójstwo.

Pewien ekspert od oszustw w dużym banku w Wielkiej Brytanii odkrył grupę terrorystyczną na podstawie jej aktywności bankowej.

Policja w Chicago, Memphis oraz w Richmond w Wirginii patroluje obszary, które zgodnie z prognozami są szczególnie zagrożone przestępczością.

Naukowcy z Uniwersytetu Buffalo zainspirowani serialem

Magia kłamstwa

(

Lie to me

) o specjaliście od odczytywania mimiki i mowy ciała opracowali system wykrywający kłamstwo z dokładnością 82 procent tylko na podstawie ruchu gałek ocznych.

Gdy byłem profesorem na Columbia University, w późnych latach dziewięćdziesiątych, miałem zespół asystentów, którzy wykorzystywali oprogramowanie tropiące oszustwa, by analizować pod kątem plagiatu setki prac domowych studentów.

Urząd podatkowy prognozuje, z jakim prawdopodobieństwem możesz popełnić przestępstwo skarbowe.

OGRANICZENIA I POTENCJAŁ PROGNOZOWANIA

Ekonomista to taki ekspert, który jutro będzie wiedział, dlaczego nie wydarzyło się to, co wczoraj przewidział.

Earl Wilson

Dlaczego nigdy nie można zobaczyć nagłówka: „Jasnowidz wygrał na loterii”?

Jay Leno

We wszystkich wymienionych przykładach wykorzystano prognozowanie, które z kolei było efektem uczenia maszynowego (machine learning). Między różnorodnymi możliwościami, jakie dają prognozowanie i uczenie maszynowe, a science fiction jest olbrzymia różnica – one nie są fikcją. Mogę w tej chwili przewidzieć, że nie będziesz zaskoczony, jeśli się dowiesz, że jest to tylko drobna próbka możliwości prognostycznych. Możesz bezpiecznie założyć, że ta metodologia ma przyszłość.

Czy jednak te stwierdzenia nie są zbyt śmiałe? Jak powiedział duński fizyk Niels Bohr: „Prognozowanie jest bardzo trudne, szczególnie jeśli dotyczy przyszłości”. Czy jednak w takim razie nie należałoby uznać, że w ogóle nie jest ono możliwe? Jedyne, co możemy z całą pewnością powiedzieć o przyszłości to to, że jest ona nieznana.

Chcę bardzo wyraźnie powiedzieć: przyszłość jest rozmyta. Precyzyjna prognoza nie jest możliwa. Pogodę można przewidywać jedynie z pięćdziesięcioprocentową dokładnością. Prognozowanie zachowań ludzi − pacjentów, klientów czy kryminalistów − wcale nie jest łatwiejsze.

Są jednak i dobre wiadomości! Prognozowanie, by było pożyteczne, wcale nie musi być bardzo dokładne. Na przykład jednym z najprostszych zastosowań prognozowania w obszarze komercyjnym jest pomoc w decydowaniu, do kogo wysyłać materiały reklamowe. Jeśli zidentyfikowana zostaje grupa klientów, którzy, powiedzmy, są trzy razy bardziej skłonni odpowiedzieć pozytywnie niż przeciętny odbiorca, to firma i tak bardzo zyskuje, usuwając z listy wysyłkowej osoby, które najprawdopodobniej nic nie kupią. Te osoby z kolei odnoszą korzyść w postaci mniejszej ilości śmieciowej korespondencji.

Prognoza: osoba dziś otrzymująca broszurę reklamową, jutro kupi produkt.

Dzięki temu firma, wysyłająca dziś w ramach masowego marketingu informacje trochę na chybił trafił, przechyla delikatnie szale na swoją stronę – i robi to bez bardzo dokładnych prognoz. Użyteczność narzędzia przeważa nad jego niewielką dokładnością. Jeśli typowy odzew to jeden procent adresatów, prognozowanie może zwiększyć ich liczbę do trzech procent. W tym przypadku nie możemy przewidzieć postępowania każdego adresata. Wartość narzędzia polega na tym, że identyfikuje grupę ludzi, którzy łącznie wykazują tendencję do określonych zachowań.

Właśnie to, krótko mówiąc, pokazuje tak zwany efekt prognozowania. Prognozowanie, nawet niedokładne, jest lepsze od zgadywania. Zamglony obraz tego, co nadejdzie, jest wielokrotnie lepszy od kompletnej ciemności.

Jest to pierwszy z pięciu efektów przedstawionych w tej książce. Na pewno słyszałeś o efekcie motyla, efekcie Dopplera czy efekcie placebo. Kolejne to: efekt danych, efekt uogólnienia, efekt zgrupowanego modelu i efekt perswazji. Każdy z tych efektów obejmuje ciekawą część nauki i technologii oraz stanowi intuicyjną wskazówkę „jak to działa” i „dlaczego się udaje”.

POLE MARZEŃ

Ludzie działają na podstawie przekonań i uprzedzeń. Na ile jesteś w stanie je wyeliminować i zastąpić danymi, na tyle uzyskasz przewagę.

Michael Lewis, Moneyball: The Art of Winning an Unfair Game[4]

O jakich badaniach lub gałęzi nauki mówię? Nauka, jak prognozować na podstawie danych, czasem jest nazywana uczeniem maszynowym (machine learning), jednak jak się okazuje, jest to termin akademicki, z którym możesz się spotkać w laboratoriach badawczych, materiałach z konferencji lub na kursach uniwersyteckich (sam byłem wykładowcą na magisterskim kursie „Uczenie maszynowe” na Columbia University pod koniec lat dziewięćdziesiątych). To wszystko jest bardzo ważne, lecz nie odzwierciedla sedna zagadnienia. W zastosowaniach komercyjnych, przemysłowych i urzędowych, w prawdziwym świecie, to, o czym mówimy, jest nazywane zgodnie z przewodnim tematem tej książki:

Analizą predykcyjną (inaczej prognostyczną, AP) – technologią uczącą się na doświadczeniu (danych), by prognozować przyszłe zachowania jednostek w celu podejmowania lepszych decyzji.

AP przekształciła się dzięki informatyce, statystyce, specjalistycznym konferencjom oraz programom uniwersyteckim w oddzielną dyscyplinę. Jednak również poza obszarem nauki AP jest ruchem, który ma duże znaczenie. Każdego dnia podejmuje się miliony decyzji dotyczących kontaktu telefonicznego, wysyłania poczty, akceptowania, testowania, diagnozowania, ostrzegania, przeprowadzenia śledztwa, uwięzienia, przygotowania czegoś na określony dzień czy leczenia. AP jest narzędziem wspomagającym podejmowanie decyzji dotyczących poszczególnych osób na podstawie doświadczeń (danych). Odpowiadając na wiele szczegółowych pytań, AP stara się tak naprawdę odpowiedzieć na pytanie najważniejsze: Jak możemy zwiększyć efektywność wszystkich masowych działań w instytucjach rządowych, opiece zdrowotnej, biznesie, organizacjach non profit i organach ścigania?

Prognozy wspomagają decyzje dotyczące indywidualnych osób w najważniejszych obszarach funkcjonowania społeczeństwa.

Właśnie dlatego AP jest czymś zupełnie innym niż przewidywanie. Przewidywanie jest dokonywaniem zbiorczej prognozy na poziomie makroskopowym. Jak będzie sobie radziła gospodarka? Który z kandydatów na prezydenta zdobędzie więcej głosów w Ohio? Przewidywanie szacuje na przykład, ile wafli do lodów zostanie kupionych w Nebrasce w przyszłym miesiącu. Dzięki analizie predykcyjnej wiemy natomiast, którzy mieszkańcy Nebraski najprawdopodobniej kupią lody w wafelku.

AP stoi na czele coraz silniejszego trendu, by podejmować decyzje na podstawie danych i mocnych empirycznych dowodów, a nie „przeczuć”. Dla tej tendencji nakazującej bazowanie na faktach charakterystyczna jest nowomowa w rodzaju analiza wielkich zbiorów danych, inteligencja biznesowa, nauka oparta na danych itp. I choć AP można podciągnąć pod każdy z tych terminów, odnoszą się one bardziej do kultury i ogólnych umiejętności specjalistów, którzy posługując się danymi, wykonują kreatywne i innowacyjne zadania, niż do konkretnej technologii lub metody. Dziedzina ta jest bardzo szeroka; w niektórych przypadkach chodzi po prostu o standardowe raporty w Excelu, czyli o kwestie, które są wprawdzie ważne i wymagają wyspecjalizowanych umiejętności, lecz nie muszą bazować na nauce ani skomplikowanej matematyce. Dlatego też definicja ma charakter subiektywny. Jak powiedział Mike Loukides, wiceprezes kompanii mediowej O’Reilly specjalizującej się w innowacyjnych technologiach: „Nauka o danych jest jak pornografia – poznasz ją, gdy ją zobaczysz”. Inny popularny termin, często używany jako synonim AP, to eksploracja danych − sugestywna metafora obrazująca „drążenie, wydobywanie” danych w taki czy inny sposób.

UCZENIE SIĘ ORGANIZACJI

Organizacje będące siłą napędową ery internetu, do których można zaliczyć Google i Amazon, stosują rozwiązania biznesowe wspierające się na modelach predykcyjnych korzystających z uczenia maszynowego.

Profesor Vasant Dhar, Stern School of Business, New York University

Organizacja jest czymś na kształt „megaosoby”; dlaczego nie miałaby więc podlegać procesowi „megauczenia”? Tego typu grupa powstaje dla wspólnej korzyści członków, którym świadczy usługi: firm, rządów, szpitali, uniwersytetów czy organizacji charytatywnych. Gdy już została stworzona, odnosi korzyści z podziału pracy, dopełniających się umiejętności czy efektywności produkcji na skalę masową. Rezultatem jest całość większa niż suma części składowych. Kolektywna nauka jest kolejnym logicznym krokiem, jaki powinna zrobić organizacja, by wzmocnić swój potencjał. Podobnie jak w przypadku przedstawiciela handlowego, który nabywa doświadczenie w wyniku pozytywnych i negatywnych kontaktów z potencjalnymi klientami, sukcesów i porażek − AP jest procesem, dzięki któremu organizacja uczy się na podstawie doświadczeń zebranych przez jej poszczególnych członków i przez systemy komputerowe. W rzeczywistości organizacja, która nie analizuje danych, przypomina osobę z pamięcią fotograficzną, która nie zaprząta sobie głowy myśleniem.

Z doświadczenia wynika, że (z kilkoma wyjątkami) to raczej organizacje, a nie osoby indywidualne odnoszą korzyści ze stosowania AP. To właśnie organizacje podejmują wiele decyzji operacyjnych dotyczących obszarów, które mogą być usprawnione; to organizacje są ze swej istoty nieefektywne i to w nich zachodzi marnotrawstwo na dużą skalę. Marketing oznacza zarzucanie bardzo dużej sieci – wydawane są olbrzymie pieniądze na śmieciową korespondencję i ścinanie drzew, które zamienia się na nieczytane broszury reklamowe. Szacuje się, że około osiemdziesięciu procent wszystkich e-maili to spam. Udziela się zbyt wysokich kredytów ryzykownym kredytobiorcom. Podania o wsparcie rządowe grzęzną w biurokratycznych procedurach. Z drugiej jednak strony to właś­nie organizacje mają dane do tworzenia prognoz, dzięki którym wszystkie te działania mogą być o wiele bardziej efektywne.

W sektorze komercyjnym siłą napędową jest zysk. Można bardzo dobrze sobie wyobrazić udoskonalenia prowadzące do tego, że codzienna rutyna będzie bardziej efektywna, marketing precyzyjniej dotrze do potencjalnych klientów, więcej oszustw zostanie zdemaskowanych, uniknie się większej liczby ryzykownych kredytobiorców i pozyska więcej kupujących przez internet. Dzięki zmianie sposobu działania AP skokowo zwiększa efektywność organizacji i optymalizuje działania tam, gdzie jest to najbardziej potrzebne.

NOWY SUPERNERD: NAUKOWIEC ANALIZUJĄCY DANE

Statystyk stanie się najbardziej seksownym zawodem w ciągu najbliższych dziesięciu lat.

Hal Varian, główny ekonomista Google, profesor University of California w Berkeley, 2009

Alternatywą dla myślenia w przód może być myślenie w tył, czyli po prostu pamiętanie.

Sheldon Cooper, fizyk teoretyk, jeden z bohaterów serialu Teoria wielkiego podrywu (The Big Bang Theory)

Zysk nie jest jedyną siłą napędową. Energią, która wszystko wprawia w ruch, jest Moc Nerdów. Chodzi mi o entuzjazm, który motywuje praktyków technologii. Jeśli mam być szczery, moja pasja do AP nie wynika z jej wartości dla organizacji. Zajmuję się tym zagadnieniem, bo sprawia mi to przyjemność. Idea maszyny, która może się uczyć, jest dla mnie tak pociągająca, że interesuję się bardziej tym, co dzieje się w jej wnętrzu, niż potencjalnymi zastosowaniami komercyjnymi. Właśnie chyba takie podejście definiuje nerda. Kochamy technologię, podziwiamy ją. Jedna uwaga: kluczowe oprogramowanie do AP typu open source o nazwie R (jednoliterowa nerdowa nazwa) ma szybko rosnący krąg użytkowników oraz entuzjastów, którzy rozwijają jego funkcjonalność. Wielu profesjonalistów i zawodowców bierze udział we współzawodnictwie w duchu „konkurowania w kooperacji”. Działamy w ramach organizacji i często się konsultujemy. Na nasze usługi jest popyt, więc często podróżujemy. Jednak gdy lecimy, by doradzać, najczęściej wybieramy klasę o standardzie Economy Plus.

SZTUKA UCZENIA SIĘ

Co chcesz zrobić z procesorem, by jego potencjał wykorzystać?

Użyj mózgu, gdy się logujesz, by działał jak artysta.

Zagnaj go do roboty, gdy tępak jest już na chodzie:

Niech się sam doskonali dzięki prób i błędów metodzie.

„Learn This!”

Dawno, dawno temu ludzkość postanowiła stworzyć Maszynę Ostateczną i w ogólnym niezrozumieniu nazwała ją „komputerem” (co wcześniej po prostu oznaczało osobę, która ręcznie wykonywała obliczenia). Automat ten potrafił bezbłędnie i bez narzekania przebrnąć przez zestaw niekończących się instrukcji; w ciągu kilku dziesięcioleci osiągnął taką szybkość działania, że ludzie mogli tylko wykrzyknąć: „Do licha, naprawdę nieźle go podkręciliśmy!”. Niewątpliwie znacznie lepszą nazwą dla tego urządzenia byłoby po prostu le machine, jednak kilkadziesiąt lat później nazwę tę nadano robotowi kuchennemu (wcale nie żartuję). Quel dommage! „Co powinniśmy zrobić z komputerem? Jaki jest jego prawdziwy potencjał i jak możemy go wykorzystać?”, zadawali sobie ludzie pytania.

Komputer i umysł mają ze sobą coś wspólnego, coś tajemniczego, co jednocześnie sprawia, że uznajemy to za oczywiste. Jeśli chwilę się zastanowisz, dlaczego mogłeś usłyszeć upadającą na podłogę szpilkę, będziesz miał odpowiedź. Zarówno umysł, jak i komputer są ciche. Nie wydają dźwięku. Oczywiście, komputer może mieć chłodzący wiatrak, który wydaje dźwięki, podobnie jak ktoś może wzdychać, kichać czy chrapać. Jednak większość pracy wykonywana jest przez „nieruchome części”, przez coś, czego nie widzimy. Pojawienie się rozwiązania na ekranie czy w umyśle może czasem wydać się cudem[5].

Zarówno twój umysł, jak i komputer mają olbrzymi potencjał. Czy więc komputery można tak zaprogramować, by myślały, czuły i były naprawdę inteligentne? Kto wie? W najlepszym przypadku skłaniają one do zadawania pytań filozoficznych, na które trudno jest odpowiedzieć, a w najgorszym − są subiektywnym benchmarkiem, w wypadku którego trudno jest stwierdzić, czy sukces został odniesiony. Na szczęście jedno jest pewne: jeśli chodzi o komputery, ludzie osiągnęli niezaprzeczalne zwycięstwo − mogą się one uczyć.

Jak? Okazuje się, że nauka, bez względu na to, czy lista pozycji jest krótka, czy długa, jest czymś więcej niż tylko wyzwaniem. Jest to dylemat natury filozoficznej. Uczenie maszynowe oznacza, że należy znaleźć nie tylko prawidłowości w danych, będących odzwierciedleniem przeszłych sytuacji, lecz także wzorce ogólne, które znajdą zastosowanie w przyszłości. Właśnie na tym polega magia AP. Tworzenie nowych modeli wymaga duszy artysty. Będę pisał o tym w dalszej części książki, teraz dam jedynie wskazówkę. Maszyna więcej uczy się na twój temat, studiując zachowania innych niż twoje.

Dając ci do przemyślenia tego typu zagadnienia, przedstawiam jeszcze jedno − ostatnie rozdziały tej książki rozwiązują zagadkę: Co ci się często zdarza, czego nie byłeś świadomy, lecz co można było przewidzieć i zaprognozować.

Uczenie się danych w celu prognozowania jest tylko pierwszym krokiem. Kolejny, jeśli chcesz działać zgodnie z prognozą, wymaga odwagi. Przejdźmy teraz do rozdziału pierwszego, w którym znajduje się przerażająca historia udowadniająca, dlaczego uruchomienie AP przypomina pierwszy lot rakietą w kosmos.

Rozdział 1Startujemy! Prognozowanie wymaga działania

Ile odwagi potrzeba, by wykorzystać model predykcyjny w praktyce, i czego możesz oczekiwać? Co się dzieje, gdy ktoś zainwestuje oszczędności całego życia, wykorzystując własny system prognozowania cen akcji na rynku?

W połowie lat dziewięćdziesiątych ambitny badacz po studiach doktoranckich poczuł, że nie może już dłużej czekać. Po konsultacji z żoną zainwestował oszczędności całego życia na giełdzie zgodnie ze wskazaniami systemu prognostycznego, który stworzył, ślęcząc po nocach. Podobnie jak dr Henry Jekyll upajający się swoją siłą w blasku księżyca, tak młody dr John Elder z niezachwianą pewnością siebie powiedział: „Zaczynam”.

Pierwsza próba nowego wynalazku zawsze budzi obawy. Start rakiety kosmicznej przedstawia się zwykle jako technologiczne osiągnięcie i powód do narodowej dumy, mniej natomiast mówi się w takiej sytuacji o przerażonej do granic możliwości grupie żon. Astronauci to tak naprawdę piloci kaskaderzy, dobrowolnie godzący się na rolę królików doświadczalnych w olbrzymim eksperymencie; to ludzie gotowi poświęcić siebie, by stać się częścią historii.

Wielkie wyzwania rodzą wielkie osiągnięcia. Spacerowaliśmy po Księżycu; w ostatnich latach ufundowano nagrodę w wysokości dziesięciu milionów dolarów dla pierwszej komercyjnej organizacji, która opracuje załogowy statek kosmiczny do wielokrotnego wykorzystania. Na ulicach pojawiły się samochody bez kierowcy – „Popatrz mamusiu, nie trzymam kierownicy!” − wsparte wielomilionową nagrodą autonomicznie poruszają się po kampusach Google i BMW.

Gdy ryk startującej rakiety zastąpi się przetwarzaniem danych, ambicje nie będą mniej dalekosiężne: będziemy „śmiało podążać” nie w kosmos, lecz w kierunku nowej ostatecznej granicy − ku przewidywaniu przyszłości. Eksploracja tej sfery jest równie ekscytująca, jednak nieco mniej niebezpieczna (w kosmosie panuje całkowita, wysysająca próżnia). Miliony dolarów nagrody przeznaczono na opracowanie systemu pozwalającego unikać niepotrzebnej hospitalizacji czy badającego preferencje indywidualnych konsumentów.

W teleturnieju Jeopardy! przeznaczono półtora miliona dolarów na pojedynek między człowiekiem i maszyną, który pokazał olbrzymi postęp w prognozowaniu odpowiedzi na pytania (IBM zainwestowało o wiele więcej, by było to możliwe, o czym piszę w rozdziale szóstym). Dzięki analizie predykcyjnej organizacje zmniejszają absencję dzieci w szkołach oraz obniżają przestępczość. Nagrodą jest sukces, gdy prognozowanie pomaga wygrać wybory, zdobyć mistrzostwo w baseballu lub… czy wspomniałem już o zarządzaniu portfelem finansowym?

Gra na giełdzie na zasadzie „czarnej skrzynki” (black box trading) − system automatycznie podejmujący decyzje o kupnie czy sprzedaży papierów wartościowych – to święty Graal specjalistów od dokonywania wyborów na podstawie danych. Taką „czarną skrzynkę” karmi się informacjami o obecnym środowisku finansowym, a na wyjściu pojawiają się konkretne decyzje: kup/trzymaj/sprzedaj. Skrzynka jest „czarna” (nieprzejrzysta), bo nie dbasz o to, co dzieje się w jej środku, dopóki podejmuje dobre decyzje. Gdy tak jest, to „czarna skrzynka” przebija pod względem zwrotu z inwestycji wszelkie inne biznesowe możliwości na świecie. Twój komputer staje się cudownym urządzeniem zamieniającym elektryczność na pieniądze.

Wraz z wdrożeniem własnego systemu gry na giełdzie John Elder osobiście podjął wielkie wyzwanie. I nawet jeśli taki system oznaczał wielki skok dla ludzkości, to i dla Johna Eldera nie był to mały krok. Jest to okazja, by połączyć ze sobą metafory. Ryzykując bankructwo na skutek włożenia wszystkich jaj, jakie miał, do jednego analitycznego koszyka, John przyjmował sporą dawkę stworzonego przez siebie lekarstwa.

Zanim będę kontynuował historię Johna, chciałbym opisać, jak wygląda wdrażanie systemu prognozowania, i to nie tylko jeśli chodzi o grę na giełdzie, lecz również w wielu innych zastosowaniach.

REALNY ŚWIAT

Uczenie się na podstawie danych ma dosłownie uniwersalne zastosowanie. Doskonal je, a będziesz prawie wszędzie mile widziany!

John Elder

Słyszy się obecnie o coraz większej liczbie przełomowych wydarzeń związanych z analizą predykcyjną. Złożyło się na to kilka czynników. Oto one:

Wzrost ilości dostępnych danych.

Zmiana kulturowa: organizacje uczą się doceniać, wprowadzać i integrować technologię prognozowania.

Udoskonalone oprogramowanie pozwalające efektywniej wykorzystywać AP w organizacjach.

Ten potencjał powstaje przede wszystkim dlatego, że technologia prognozowania ma uniwersalne zastosowanie – istnieje bardzo dużo obszarów, w których można ją wykorzystać. Chcesz zaproponować własne, innowacyjne wykorzystanie AP? Jeśli tak, to potrzebujesz tylko dwóch rzeczy.

Każde zastosowanie AP jest definiowane przez:

Co jest prognozowane:

rodzaj zachowania (na przykład wydarzenie, działanie), które prognozujemy dla indywidualnych jednostek, akcji lub innych składowych większej całości.

Co należy zrobić:

decyzja będąca efektem prognozowania; działanie podejmowane przez organizację na podstawie prognozy.

Ze względu na uniwersalną naturę AP lista obszarów zastosowań jest tak długa, podobnie jak lista przykładów, że jej poznanie samo w sobie stanowi wyzwanie pod względem zarządzania informacją. Zamieściłem taką listę (w sumie 182 przykłady) w dalszej części książki. Zerknij na nią, by zorientować się, jak wiele się dzieje. Jest to najbardziej seksowna rozkładówka tej książki. Tabele na końcu książki pokazują między innymi przykłady prognozowania: cen akcji, ryzyka, wykroczeń, wypadków, sprzedaży, dotacji, kliknięć na baner, rezygnacji, problemów zdrowotnych, przyjęć do szpitala, oszustw, przestępstw podatkowych, przestępstw, wadliwego działania, wydobycia ropy, przerw w dostawie prądu, akceptacji, przyznania dotacji rządowych, myśli, intencji, odpowiedzi, opinii, kłamstw, stopni, porzuceń szkoły, przyjaźni, romansów, ciąży, rozwodów, zdobywania pracy, rezygnacji z pracy, zwycięstw czy wyników głosowania. Liczba obszarów zastosowań rośnie z zapierającą dech w piersiach szybkością.

Na tej długiej liście najważniejszym zastosowaniem jest to dotyczące marketingu, o którym pisałem we wprowadzeniu:

Zastosowanie AP: ukierunkowanie marketingu bezpośredniego

Co jest prognozowane:

którzy klienci odpowiedzą na kontakt.

Co należy zrobić:

kontaktować się z klientami bardziej skłonnymi do odpowiedzi.

Jak już wiemy, takie wykorzystanie AP ilustruje efekt prognozowania.

Poświęćmy chwilę, by zobaczyć, jak łatwo jest obliczyć wartość efektu prognozowania. Wyobraź sobie, że masz firmę dysponującą milionem adresów potencjalnych klientów. Wysłanie informacji do każdego z nich kosztuje dwa dolary i zauważyłeś, że jedna osoba na sto kupi twój produkt (czyli jest dziesięć tysięcy odpowiedzi). Wysyłasz więc reklamę do całego miliona.

Jeśli każda pozytywna odpowiedź oznacza dwieście dwadzieścia dolarów przychodu, to otrzymujesz następujący wynik:

Łatwo na kalkulatorze obliczyć, że daje to dwieście tysięcy dolarów zysku. Czy jesteś zadowolony? Nie sądzę. Jeśli jesteś nowy w obszarze bezpośredniego marketingu (witamy!), to zauważysz, że jest to gra oparta na wielkich liczbach, w której króluje marnotrawstwo. Sam marketing tego rodzaju można porównać do miliona małp rzucających strzałkami nad przepaścią mniej więcej w kierunku tarczy. Jak powiedział pionier marketingu z przełomu wieków John Wanamaker: „Połowa pieniędzy, które wydaję na marketing, jest marnowana. Problem w tym, że nie wiem która”. Zła wiadomość jest taka, że w rzeczywistości marnowana jest ponad połowa pieniędzy, dobra zaś taka, że można to zmienić za pomocą AP.

BŁĘDNA PRZEPOWIEDNIA, KTÓRĄ WSZYSCY KOCHAJĄ

Pierwszym krokiem do przewidywania przyszłości jest uświadomienie sobie, że nie da się jej przewidzieć.

Stephen Dubner, Freakonomics Radio, 30 marca 2011 roku

Paradoks przewidywania: Im większą mamy pokorę w związku z umiejętnością przewidywania, tym większy sukces możemy odnieść w planowaniu.

Nate Silver, Sygnał i szum. Sztuka prognozowania w erze technologii

Połowa tego, czego cię nauczymy na studiach medycznych, okaże się nieprawdziwa do czasu, gdy rozpoczniesz praktykę.

dr Mehmet Oz

Twoja dyżurna „wróżka”, czyli AP, informuje cię, którzy klienci z największym prawdopodobieństwem odpowiedzą na kontakt. Wskazuje na jedną czwartą listy i mówi: „Prawdopodobieństwo, że ci ludzie kupią produkt, jest trzykrotnie większe od średniej”. Dysponujesz teraz krótką listą dwustu pięćdziesięciu tysięcy klientów, z których odpowie trzy procent, co daje siedem i pół tysiąca odpowiedzi.

Do kitu z taką przepowiednią! Jest bardzo niedokładna – wciąż nie mamy pewności, jaka będzie reakcja poszczególnych klientów przy założeniu tych mizernych trzech procent. Jednak… średnie IQ małp rzucających strzałkami wzrosło. Jeśli wyślesz broszury do ludzi z krótkiej listy, otrzymasz następujący wynik:

Daje to zysk w wysokości miliona stu pięćdziesięciu tysięcy dolarów, co oznacza, że zwiększył się on 5,75 razy dzięki wysłaniu reklamy do mniejszej liczby ludzi (potrzebujemy również mniej drzew na papier). Dzięki prognozowaniu dowiedziałeś się, do kogo nie warto wysyłać reklamy. Zmniejszyło to o trzy czwarte koszty w zamian za utratę zaledwie jednej czwartej sprzedaży. Taki interes mógłbym robić każdego dnia.

Nie jest trudno ocenić korzyść możliwą do uzyskania dzięki prognozie. Jak widać, nawet jeśli same prognozy tworzone są przy użyciu zaawansowanej matematyki, to wystarczą proste obliczenia, by ocenić ich wyniki bez względu na to, czy są mniej czy bardziej dokładne. I nie jest to jakiś teoretyczny wynik. Efekt prognozowania oznacza zysk.

PROGNOSTYCZNE ZABEZPIECZENIE

Jak widzimy, wartość została wykreowana dzięki skromnej prognozie sugerującej z grubsza właściwy kierunek. Łatwo jest tu o analogię do fantastyki naukowej, w której nawet skromne wykorzystanie postrzegania pozazmysłowego może przynosić spektakularne efekty. Nicolas Cage skopał tyłki prawdziwie czarnym charakterom w filmie Next nawiązującym do opowiadania Philipa K. Dicka. Jaką broń miał do dyspozycji? Tylko umiejętność prognozowania przyszłości. Widział przyszłość, lecz jedynie na dwie minuty naprzód. To wystarczy, żeby nieźle nabroić. Był nieuzbrojonym cywilem o miękkim sercu i mającym najlepsze intencje, jednak znalazł się w środku czegoś przypominającego strefę wojny, otoczony przez pancernie uzbrojonych agentów FBI, którzy zachowywali się zgodnie z jego przewidywaniami. Potrafił dostrzec każdą pułapkę, snajpera i niebezpieczne zachowanie, zanim stało się rzeczywistością; dzięki temu unikał kolejnych zagrożeń, wiedząc, co zrobi polujący na niego zespół do spraw minimalizacji ryzyka.

Wykorzystanie AP powoduje, że w organizacji powstaje podobny zespół do spraw minimalizacji ryzyka. Wszelkie decyzje i działania podejmowane przez organizację oznaczają ryzyko. Wyobraź sobie korzyści płynące z umiejętności przewidzenia każdej pułapki − tak by można jej było uniknąć: każdego przestępstwa, spadku wartości akcji, pobytu w szpitalu, kredytu na niekorzystnych warunkach, korka ulicznego, wysokiego współczynnika porzucania szkoły… i każdej niepotrzebnie wysłanej broszury reklamowej. Zarządzanie ryzykiem organizacyjnym, które tradycyjnie oznaczało obronę przed pojedynczymi zdarzeniami na poziomie makro, takimi na przykład jak katastrofa lotnicza lub załamanie się gospodarki, obecnie rozszerza się na walkę z miriadami ryzyk na poziomie mikro.

Nie chodzi jedynie o nieszczęścia. Odnosimy również korzyści, przewidując pozytywne wydarzenia, gdyż często oznaczają one możliwość zysku. Gra nazywa się „Prognozuj i działaj”. Trzeba przejąć inicjatywę, gdy okaże się, że: klient jest skłonny kupić produkt, wartość akcji pójdzie w górę, wyborca prawdopodobnie zmieni preferencje lub propozycja internetowego flirtu zostanie odwzajemniona.

Nawet skromny wgląd w przyszłość daje ci broń do ręki, gdyż pokazuje możliwości. W niektórych przypadkach oczywistą decyzją będzie działanie, by zmienić to, co nie jest nieuniknione: zapobiec przestępstwu, utracie czegoś czy chorobie. Dysponując prognozą, możesz wykorzystać szansę, o której wiesz; możesz również wesprzeć proces podejmowania decyzji.

Przedstawię teraz przykład wart milion dolarów.

CICHA REWOLUCJA WARTA MILION

Gdy organizacja zaczyna wykorzystywać AP, wysyła do boju olbrzymią armię, lecz jest to armia mrówek. Mrówki te maszerują na frontową linię operacji firmy, gdzie mają kontakt z preferencjami klientów, studentów czy pacjentów – ludzi, którym organizacja świadczy usługi. Dzięki temu armia wyposażona w umiejętność prognozowania udoskonala miliony drobnych decyzji. Proces ten przebiega w niezauważalny sposób… dopóki ktoś nie zainteresuje się, jak wszystkie drobne części składają się w całość. Udoskonalone jednostkowe decyzje mogą być, proporcjonalnie, rozmiarów mrówek, lecz razem dają olbrzymi efekt.