75,00 zł
Arvind Narayanan jest profesorem informatyki na Uniwersytecie Princeton oraz dyrektorem tamtejszego Center for Information Technology Policy (Ośrodka Regulacji Technik Informatycznych). Nadzorował również prowadzony na tym uniwersytecie Web Transparency and Accountability Project (Program Przejrzystości i Odpowiedzialności Internetowej), badający, w jaki sposób firmy gromadzą oraz wykorzystują dane osobowe. Jako jeden z pierwszych wykazał obecność stereotypów kulturowych w uczeniu maszynowym. Narayanan jest laureatem Presidential Early Career Award for Scientists and Engineers (PECASE).
Sayash Kapoor jest doktorantem Center for Information Technology Policy (Ośrodka Regulacji Technik Informatycznych) Uniwersytetu Princeton, gdzie bada wpływ AI na społeczeństwo. Wcześniej zajmował się sztuczną inteligencją zarówno komercyjnie, jak i naukowo – w Facebooku, na Uniwersytecie Columbia oraz na Politechnice Federalnej w Lozannie. Jest laureatem nagrody ACM FAccT za najlepszy artykuł naukowy i zdobywcą specjalnego wyróżnienia na konferencji ACM CSCW.
Ebooka przeczytasz w aplikacjach Legimi lub dowolnej aplikacji obsługującej format:
Liczba stron: 485
Rok wydania: 2026
Marka wydawnicza Bo.wiem
Seria #nauka
Projekt serii i logotypuMarta Jaszczuk
KONSULTACJA MERYTORYCZNAdr hab. Kamil Filipek
PROJEKTokładkiKatarzyna Bućko
NA OKŁADCELogin / Adobe Stock
Tytuł oryginałuAI Snake Oil: What Artificial Intelligence Can Do, What It Can’t, and How to Tell the DifferenceCopyright ©2024 by Princeton University PressCopyright ©for the Polish translation by Grzegorz Ciecieląg, 2026Copyright © for the Polish edition by Wydawnictwo Uniwersytetu Jagiellońskiego, 2026
Wydanie I, Kraków 2026All rights reserved
Niniejsza książka stanowi utwór chroniony na podstawie ustawy o prawie autorskim i prawach pokrewnych. Prawami do tego utworu dysponuje Wydawca – Wydawnictwo Uniwersytetu Jagiellońskiego. Bez zgody Wydawcy niedopuszczalne jest kopiowanie, rozpowszechnianie lub inne korzystanie z niniejszej książki w całości lub z jej fragmentów z wyjątkiem dozwolonego użytku osobistego lub publicznego.
ISBN 978-83-233-5644-8 (druk)ISBN 978-83-233-7785-6 (epub, mobi)
Wydawnictwo Uniwersytetu JagiellońskiegoRedakcja: ul. Michałowskiego 9/2, 31-126 Krakówtel. 12-663-23-80Dystrybucja: tel. 12-631-01-97tel. kom. 506-006-674, e-mail: [email protected] internetowy: www.bowiem.wuj.pl
Mojej żonie Veenie
– Arvind
Vineecie i Raviemu Kapoorom – moim pierwszym mentorom, nauczycielom pisania, redaktorom i nie tylko
– Sayash
Wyobraźmy sobie alternatywną rzeczywistość, w której w celu opisania dowolnych środków transportu stosuje się tylko zbiorcze pojęcie „pojazd”. Jest ono na tyle pojemne, że obejmuje samochody, autobusy, rowery, statki kosmiczne oraz wszelkie inne metody przemieszczania się z punktu A do punktu B. W takim świecie zwyczajna rozmowa może przyprawić o ból głowy. Ludzie toczą burzliwe dyskusje na temat wpływu pojazdów na środowisko naturalne, ale jedni mówią o rowerach, a drudzy o ciężarówkach. Na polu techniki rakietowej właśnie doszło do przełomu i media informują, że pojawiły się nowe, szybsze pojazdy, więc widzowie dzwonią do salonów samochodowych (ups, oczywiście chodzi o salony pojazdowe), żeby spytać o dostępność tych modeli. Klienci, zagubieni w świecie pełnym pojazdów, łatwo padają ofiarami wszechobecnych oszustów.
Jeśli w powyższym scenariuszu zastąpimy słowo „pojazd” wyrażeniem „sztuczna inteligencja”, otrzymamy całkiem dokładny opis sytuacji, z którą mamy obecnie do czynienia.
Sztuczna inteligencja (Artificial Intelligence, czyli w skrócie AI) stała się terminem zbiorczym obejmującym luźno powiązane ze sobą rozwiązania technologiczne. Taki ChatGPT niewiele ma wspólnego z – powiedzmy – oprogramowaniem bankowym oceniającym zdolność kredytową klientów ubiegających się o pożyczkę. Choć i jedno, i drugie klasyfikujemy jako AI, w kluczowych kwestiach – opisujących ich zasadę działania, zastosowanie, użytkowników oraz ograniczenia – nie mogłyby się bardziej od siebie różnić.
Zarówno chatboty, jak i generatory obrazów, takie jak Dall-E, Stable Diffusion czy Midjourney, określamy mianem generatywnej sztucznej inteligencji. Ten rodzaj AI pozwala w ciągu kilku sekund uzyskać różnorakie treści; w przypadku chatbotów będą to odpowiedzi na zapytania (prompty), nierzadko sformułowane w całkiem naturalny sposób, a generatory obrazów tworzą materiały wizualne na podstawie niemal dowolnego opisu, ot, choćby takiego: „ubrana w różowy sweterek krowa stoi w kuchni”. Jeszcze inne specjalizują się w generowaniu mowy czy nawet muzyki.
Technologie generatywnej AI rozwijają się w zawrotnym tempie, a mówimy tu o imponujących i namacalnych zmianach. Musimy jednak jeszcze trochę poczekać, zanim uda się je przekuć w pełnoprawny, niezawodny produkt, którego nikt nie zdoła wykorzystać w celach niezgodnych z jego przeznaczeniem. Nie zmienia to faktu, że popularyzacji technologii tego typu towarzyszą entuzjazm, lęk i dezinformacja.
Czymś innym jest predykcyjna AI tworząca prognozy wykorzystywane przy podejmowaniu decyzji. W dziedzinie utrzymania porządku publicznego AI może spróbować odpowiedzieć na pytanie: „Do ilu przestępstw dojdzie jutro w danej okolicy?”. W zarządzaniu zasobami: „Jak wysokie jest prawdopodobieństwo, że konkretne urządzenie ulegnie w przyszłym miesiącu awarii?”. A przy zatrudnianiu pracowników: „Jak określony kandydat poradzi sobie na tym stanowisku?”.
Aktualnie zarówno sektor prywatny, jak i rządowy korzystają z predykcyjnej AI, choć z jej efektywnością bywa różnie. Bardzo trudno jest zgadnąć, co przyniesie przyszłość, a sztuczna inteligencja nijak nam w tym nie pomoże. Jasne, możemy oddelegować ją do analizy dostępnych danych, aby wyłowiła prawidłowości statystyczne – na przykład jeśli pożyczkobiorca ma stałe zatrudnienie, to prawdopodobnie spłaci pożyczkę – co samo w sobie może być użyteczne. Ale problem polega na tym, że predykcyjnej AI często przypisuje się funkcje, którymi ta nie dysponuje, i wykorzystuje się ją do podejmowania decyzji wpływających na życie i karierę konkretnych osób. To na tym polu najczęściej spotykamy się z nieuczciwym promowaniem cudownych właściwości AI.
Kiedy piszemy o „cudownych właściwościach”, mamy na myśli zastosowania, do których AI nie została zaprojektowana i którym nie podoła. Jako że termin „sztuczna inteligencja” obejmuje obszerny katalog technologii i zastosowań, większość z nas nie potrafi z marszu rozróżnić, które rodzaje AI zapewniają efekty zgodne z opisem, a które obiecują użytkownikom gruszki na wierzbie. I jest to poważny problem społeczny, bo umiejętność oddzielenia ziarna od plew ma kluczowe znaczenie, jeśli chcemy w pełni wykorzystać potencjał AI, a jednocześnie uniknąć ewentualnych zagrożeń – często manifestujących się na naszych oczach.
Niniejsza książka ma charakter poradnika ułatwiającego zorientowanie się, które rozwiązania algorytmiczne to pic na wodę oraz kiedy szum wokół sztucznej inteligencji jest nieuzasadniony. Wyposażymy czytelników w zestaw podstawowych pojęć umożliwiających rozróżnienie generatywnej i predykcyjnej sztucznej inteligencji oraz wszelkich innych rodzajów AI. Dostarczymy wam zdroworozsądkowych kryteriów, dzięki którym zdołacie ocenić, czy twierdzenia o domniemanych postępach na polu AI są prawdą, czy bujdą. Dzięki temu będziecie z większym dystansem podchodzić do wiadomości traktujących o sztucznej inteligencji i zwracać uwagę na niuanse, które częstokroć trudno dostrzec na pierwszy rzut oka. Lepsze zrozumienie natury sztucznej inteligencji zaspokoi waszą ciekawość naukową i będzie miało przełożenie na umiejętność wykorzystania – lub powstrzymania się od wykorzystania – AI w życiu codziennym oraz pracy. Spróbujemy też przekonać czytelników i czytelniczki, że predykcyjna AI nie tylko obecnie nie działa zgodnie z opisem, ale także najprawdopodobniej nigdy nie będzie tak działać, gdyż przewidywanie ludzkiego zachowania jest co do zasady problematyczne. I wreszcie liczymy, że czytelnicy i czytelniczki rozważą kwestię osobistej odpowiedzialności – oraz możliwości odmiany stanu rzeczy – w odniesieniu do szkodliwych zastosowań wszystkich takich narzędzi.
Generatywna AI objawiła się światu w listopadzie 2022 roku wraz z premierą bota ChatGPT. Na ironię zakrawa fakt, że ów chatbot zadebiutował bez większego szumu, a twórcy programu – firma OpenAI – potraktowali udostępnioną wersję jako „wstępny model rozwojowy”1. Kiedy jednak użytkownicy zaczęli publikować zabawne i zaskakujące efekty jego pracy, program z dnia na dzień zyskał szaloną popularność. Na przykład programista Thomas Ptacek poprosił bota ChatGPT o pomoc w wyjęciu z magnetowidu kanapki posmarowanej masłem orzechowym, zaznaczając przy tym, że oczekuje odpowiedzi w duchu Biblii Króla Jakuba2. Oto, jak ona brzmiała:
Człek pewien doświadczył wielkiej troski z winy kromki posmarowanej masłem orzechowym, gdyż ta wsunięta została do magnetowidu jego i nijak nie potrafił jej wydobyć.
Wzniósł zatem błaganie do Boga: „Panie mój, kanapka utknęła w magnetowidzie na dobre i nijak nie potrafię jej wydłubać. Cóż mam uczynić?”.
Odrzekł Pan: „Nie lękaj się, dziecię me, gdyż poprowadzę dłoń twą i wskażę sposób. Chwyć nóż do masła, ostrożnie wsuń ostrze między kanapkę a krawędź magnetowidu i nieśpiesznie rozdziel jedno od drugiego. Wykaż się cierpliwością i wytrwałością, a wydobędziesz kromkę, a magnetowid odzyska dawną sprawność”.
Człek uczynił, jak mu kazano, i oto kromka wydobyta została z magnetowidu, on zaś doświadczył ratunku.
Rzekł Pan: „Zaprawdę, powiadam ci, nie wkładaj więcej kanapek z masłem orzechowym do magnetowidu, gdyż nie tam ich miejsce. Trzymaj je w lodówce bądź na talerzu”.
Człek usłuchał rady Pana swego i zawsze już odkładał kanapki tam, gdzie przynależą, oszczędzając sobie trosk i niedoli. Amen.
Dwa miesiące później z bota ChatGPT korzystało już podobno ponad sto milionów użytkowników3. OpenAI nie spodziewało się tak ogromnego zainteresowania programem i nie zdołało zabezpieczyć wystarczającej mocy obliczeniowej wymaganej do obsługi tak wielu zapytań.
Nie trzeba było długo czekać, żeby po bota ChatGPT sięgnęli również programiści – okazało się bowiem, że chatbotowi wystarczy dostarczyć opis oczekiwanej funkcji, aby ten wygenerował adekwatny fragment kodu. Dotychczas analogiczną funkcjonalność oferował starszy program GitHub Copilot, ale po premierze bota ChatGPT zainteresowanie wykorzystaniem AI wzrosło. Raz, że pozwalało to skrócić czas potrzebny do napisania aplikacji, a dwa, że nawet laicy mogli teraz stworzyć własny prosty program.
Wkrótce Microsoft wykupił od OpenAI licencję na korzystanie z tej technologii i zaimplementował w swojej wyszukiwarce Bing chatbota udzielającego użytkownikom odpowiedzi bazujących na wynikach wyszukiwania. W 2021 roku Google dysponował już własnym chatbotem, ale firma nie udostępniła go użytkownikom ani nie zintegrowała ze swoimi produktami4. Decyzja Microsoftu dotycząca Binga została odczytana przez szefostwo Google’a jako realne zagrożenie, czego konsekwencją była rychła zapowiedź zintegrowanego chatbota – Barda (później przemianowanego na Gemini).
To wtedy wszystko zaczęło się sypać. W nagraniu promującym Barda chatbot stwierdził, że Kosmiczny Teleskop Jamesa Webba jako pierwszy wykonał zdjęcie planety spoza Układu Słonecznego. Pewien astrofizyk wytknął mu jednak, że to nieprawda5. I wyszło na to, że chatbot Google’a nie poradził sobie nawet ze specjalnie wybranym dla niego wyzwaniem. Wystarczyła doba, aby wycena firmy spadła o 100 miliardów dolarów. Inwestorzy wystraszyli się, że jeśli Google zgodnie z zapowiedzią połączy Barda ze swoją wyszukiwarką, ta zacznie udzielać błędnych odpowiedzi na banalne pytania6.
Wpadka Google’a, choć bolesna, była raptem zapowiedzią potężnej fali problemów chatbotów na polu weryfikowania faktów. Ich słabość wynika bezpośrednio ze sposobu działania tego typu programów. Chatboty przyswajają wzorce statystyczne pozyskane z materiału źródłowego – w przeważającej mierze treści internetowych – aby wygenerować zmodyfikowaną odpowiedź bazującą na wspomnianych prawidłowościach. Z tym że niekoniecznie pamiętają treść materiałów, na których je szkolono (więcej na ten temat w rozdziale czwartym).
AI jest na potęgę wykorzystywana niezgodnie z przeznaczeniem. Zdarzało się, że serwisy informacyjne publikowały na swoich łamach artykuły poświęcone ważnym kwestiom – chociażby porady finansowe – w których aż roiło się od błędów, gdyż zostały wygenerowane przez AI, i kontynuowano ten proceder, nawet kiedy prawda wyszła na jaw7. Na platformie sprzedażowej Amazon aż roi się od książek „napisanych” przez sztuczną inteligencję, w tym poradników dla grzybiarzy – w takich przypadkach bezkrytyczna wiara w treść danej publikacji może skutkować śmiertelnie niebezpiecznymi konsekwencjami8.
Sytuację chatbotów – ich wad i wszelkiego rodzaju zastosowań – najłatwiej byłoby podsumować stwierdzeniem, że świat zwariował na punkcie tak zawodnej technologii. Ale byłoby to nadmierne uproszczenie.
Jesteśmy zdania, że w sektorach opartych na wiedzy wykorzystanie chatbotów może się wiązać z licznymi korzyściami. My sami używamy ich na etapie zbierania informacji, i to w najprzeróżniejszy sposób: poczynając od tak prozaicznych zadań, jak poprawne formatowanie cytatów, a kończąc na celach, których nie udałoby się zrealizować bez wsparcia, jak rozczytywanie napisanych naukowym żargonem prac naukowych z zupełnie obcych nam dziedzin.
Jest jeden haczyk: korzystanie z chatbotów tak, aby uniknąć wszechobecnych pułapek, wymaga wysiłku i praktyki. Jednocześnie znacznie łatwiej jest wykorzystać tę technologię niewłaściwie: osoba, która chce szybko zarobić parę groszy, powiedzmy, dzięki książce wygenerowanej przez AI, nie będzie zawracała sobie głowy jej treścią. To dlatego chatboty tak łatwo stają się narzędziem nadużyć.
Przy tej okazji należałoby zadać drażliwe pytania dotyczące władzy. Wyobraźmy sobie, że firmy stojące za wyszukiwarkami zdecydują, aby zastąpić dziesięć pierwszych odnośników odpowiedziami wygenerowanymi przez AI. Nawet przy założeniu, że chatbot zacznie uważniej dobierać fakty, nadal będzie to co do zasady narzędzie do przepisywania treści znalezionych w Internecie, które udaje, że do wszystkiego doszło samo, nie przekierowuje ruchu na stronę z materiałem źródłowym ani nie przysparza jej zysków. Podszywanie się wyszukiwarek pod autorów treści internetowych groziłoby naruszeniem praw autorskich. Wydaje się, że odpowiedzi wygenerowane przez AI omijają tę pułapkę, choć liczne pozwy (piszemy o stanie na rok 2024) mogą odmienić ten stan rzeczy9.
Kolejną technologią z kategorii generatywnej AI, która oczarowała użytkowników, jest tworzenie obrazów na podstawie opisu tekstowego. Według szacunków do połowy 2023 roku użytkownicy wygenerowali ponad miliard grafik za pomocą narzędzi Dall-E 2 od OpenAI, Firefly od Adobe oraz Midjourney (od firmy o tej samej nazwie)10. Kolejnym szeroko rozpowszechnionym generatorem obrazów jest Stable Diffusion od Stability AI; twórcy programu udostępnili jego kod źródłowy, co oznacza, że każdy może dostosować go do swoich potrzeb. Narzędzia oparte na kodzie Stable Diffusion pobranoponad dwieście milionów razy. Jako że użytkownicy korzystają z programu na własnych komputerach, nie sposób powiedzieć, ile obrazów wygenerowano przy jego pomocy, ale możemy śmiało założyć, że nawet kilka miliardów.
Za sprawą generatorów obrazów rynek rozrywkowy ogromnie się powiększył11. W odróżnieniu od treści tworzonych dotychczas te wykreowane przez sztuczną inteligencję można w nieskończoność modyfikować. Jedni zachwycają się fantastycznymi krajobrazami lub pejzażami miejskimi. Ktoś inny woli obrazki przedstawiające postacie historyczne we współczesnym świecie lub słynnych ludzi w nietypowych dla nich sytuacjach, na przykład papieża w kurtce puchówce, zwanego Balenciaga Pope. Dużą popularnością cieszą się sztucznie wygenerowane zwiastuny filmów, choćby produkcji ze świata Gwiezdnych wojen, ale zrealizowanych w stylu Wesa Andersona – z symetrycznymi kadrami i dziwacznymi sceneriami w pastelowej palecie barw.
Generowanie obrazów nie jest jednak wyłącznie domeną hobbystów – również w przedsięwzięciach komercyjnych znalazło się miejsce dla aplikacji rozrywkowych. Pewna firma zajmująca się produkcją gier komputerowych stworzyła w swojej grze postać, z którą gracz może przeprowadzić realistycznie brzmiącą rozmowę12. Wiele aplikacji do edycji zdjęć wyposażono w funkcje generatywnej AI. Chcesz, żeby na zdjęciach z twojego przyjęcia urodzinowego pojawiły się balony? Wystarczy poprosić.
Kwestia sztucznej inteligencji była jednym z głównych punktów spornych podczas hollywoodzkich protestów z 2023 roku13. Aktorzy obawiali się, że studia filmowe wykorzystają produkcje z ich udziałem do trenowania narzędzi AI pozwalających generować na podstawie scenariusza nowych materiałów wideo „z udziałem” postaci niczym się nieróżniących od aktorów ze zdjęć i nagrań, na których przeszkolono sztuczną inteligencję. Innymi słowy, studia mogłyby w nieskończoność zarabiać na wizerunku aktorów oraz ich wcześniejszych dokonaniach, nie dzieląc się zarobionymi pieniędzmi z artystami.
I choć protesty dobiegły końca, napięcia między pracownikami a tymi, którzy dzierżą kapitał, na pewno jeszcze powrócą, tym bardziej że technologia nie stoi w miejscu14. Wiele firm pracuje nad programami generującymi materiały wideo na podstawie tekstu, nie brakuje też takich, które skupiły swoje wysiłki na automatyzacji scenariopisarstwa. Efekty ich pracy mogą pozostawiać nieco do życzenia od strony artystycznej, ale to raczej nie powstrzyma studiów taśmowo produkujących kolejne letnie przeboje.
Jesteśmy zdania, że w dłuższej perspektywie odpowiednia technologia i dopasowane do niej przepisy powinny położyć kres większości problemów i zwielokrotnić korzyści. Na przykład już teraz pojawia się wiele obiecujących rozwiązań, które ograniczyłyby ryzyko konfabulacji u chatbotów, a przypadki zamierzonej dezinformacji byłyby zwalczane za pośrednictwem rozwiązań prawnych. Póki co odnalezienie się w świecie generatywnej AI jest jednak drogą przez mękę – mówimy bowiem o narzędziach cechujących się ogromnym potencjałem i wysoką zawodnością. To trochę tak, jakby każdemu człowiekowi na świecie wręczyć za darmo piłę tarczową.
Sensowne włączenie AI do naszego życia potrwa. Przyjrzyjmy się sytuacji w szkołach i na uczelniach, gdzie sztuczna inteligencja generuje wypracowania i „zdaje” egzaminy. Postawmy sprawę jasno – AI nie zagraża sektorowi edukacji, nie bardziej niż dopuszczenie do użytku kalkulatorów15. Przy odpowiednim poziomie nadzoru stanie się wręcz cennym narzędziem wspomagającym naukę. Lecz aby tak się stało, konieczna będzie reforma obejmująca programy nauczania, stosowane metody przekazywania wiedzy oraz egzaminowania. W hojnie finansowanych ośrodkach edukacyjnych, takich jak Princeton – gdzie obaj wykładamy – AI jawi się jako szansa, a nie wyzwanie. Powiemy więcej – my zachęcamy studentów do korzystania ze sztucznej inteligencji. Kiedy jednak w ręce milionów studentów trafiło narzędzie, którym można się posłużyć w niecnym celu – ChatGPT – na wielu innych uczelniach zapanował chaos.
Czy społeczeństwo jest skazane na reaktywny odbiór kolejnych osiągnięć na polu generatywnej AI? A może mamy w sobie dość silnej woli, aby wspólnie przeprowadzić strukturalne zmiany, które pozwoliłyby sprawiedliwiej rozłożyć korzyści i koszty innowacji, niezależnie od ich charakteru?
Generatywnej AI towarzyszą, zwłaszcza w krótszej perspektywie, liczne społeczne koszty i ryzyka. Niemniej jesteśmy zdania, że na dłuższą metę tego rodzaju sztuczna inteligencja powinna w pozytywny sposób wpłynąć na nasze życie. Inaczej sprawy się mają z predykcyjną AI.
Od kilku lat obserwujemy znaczący przyrost aplikacji służących do określania społecznych skutków poszczególnych decyzji. Rzekomo – przynajmniej według deklaracji ich twórców – umożliwiają one przewidzenie konkretnego zachowania, na przykład czy osoba stająca przed sądem dopuści się w przyszłości kolejnych przestępstw lub czy kandydat ubiegający się o pracę sprawdzi się na danym stanowisku. Predykcyjna AI, w odróżnieniu od generatywnej, często w ogóle nie działa16.
Obywatele Stanów Zjednoczonych, którzy ukończyli sześćdziesiąty piąty rok życia, mogą korzystać z Medicare, programu ubezpieczenia zdrowotnego dotowanego z budżetu państwa. W celu obniżenia kosztów usługi świadczeniodawcy Medicare wykorzystali do pracy sztuczną inteligencję, która przewiduje czas hospitalizacji pacjenta17. Z tym że jej szacunki niejednokrotnie okazują się błędne. Dobrze ilustruje to przypadek pewnej osiemdziesięciopięciolatki, której przewidywany okres pobytu w szpitalu oszacowano na siedemnaście dni. Ale po upływie tego terminu pacjentka nadal skarżyła się na silny ból i potrzebowała asysty przy korzystaniu z balkonika. Mimo tego ubezpieczyciel wstrzymał płatności. W takich sytuacjach wdrożeniu sztucznej inteligencji towarzyszą jak najlepsze intencje. Na przykład gdyby nie predykcyjna AI, w interesie domów opieki społecznej byłoby przetrzymywać kuracjuszy w szpitalu jak najdłużej. Często jednak z upływem czasu zmienia się zarówno cel, jak i sposób wdrażania AI. Nietrudno sobie wyobrazić, że podmioty współpracujące z Medicare sięgnęły po te rozwiązania, aby przenieść na domy opieki choćby ułamek odpowiedzialności, ale koniec końców AI posłużyła do wyciskania pieniędzy z systemu – bez względu na koszty społeczne.
Analogiczne historie pomału stają się normą. Przedsiębiorcy oferujący narzędzia AI asystujące przy zatrudnianiu przekonują, że ich produkty na podstawie mowy ciała, stylu komunikacji oraz innych powierzchownych cech widocznych na trzydziestosekundowym nagraniu potrafią ocenić, czy ktoś jest osobą serdeczną, otwartą i dobrą. Ale czy mają ku temu podstawy? I czy AI naprawdę potrafi przewidzieć efektywność pracownika? Niestety, firmy wysuwające te twierdzenia nie zdołały wiarygodnie potwierdzić skuteczności swoich rozwiązań. Nie brakuje za to dowodów na to, że jest na odwrót – próby przewidzenia przyszłości jednostki nastręczają ogromnych problemów, o czym więcej w rozdziale trzecim.
W 2013 roku amerykańska firma ubezpieczeniowa Allstate powierzyła sztucznej inteligencji oszacowanie stawek ubezpieczeniowych w stanie Maryland, co miało służyć zwiększeniu przychodów przy jednoczesnej minimalizacji utraty klientów. Efektem była „lista naiwniaków” obejmująca osoby, których stawki za ubezpieczenie wzrosły niewspółmiernie do poprzednich lat18. Dominującą grupą na liście były osoby powyżej sześćdziesiątego drugiego roku życia, co było jasnym dowodem na stronniczość algorytmu. Sztuczna inteligencja mogła wyczytać z dostępnych danych, że osoby starsze będą w mniejszym stopniu zmotywowane, aby szukać ubezpieczyciela z lepszą ofertą. Podniesienie stawek zapewne oznaczało większy zarobek dla ubezpieczyciela, ale było naganne z moralnego punktu widzenia. Stan Maryland odrzucił wysuniętą przez Allstate propozycję wdrożenia AI. Tłumaczył, że byłoby to działanie o charakterze dyskryminacyjnym, firma korzysta jednak z tego modelu w co najmniej dziesięciu innych stanach*.
Jeśli komuś się nie podoba, że jego/jej CV będzie oceniane przez sztuczną inteligencję, może po prostu nie aplikować na stanowiska, w których do oceny aplikacji używa się AI. Ale kiedy z predykcyjnej sztucznej inteligencji korzysta rząd, zwykły obywatel zostaje pozbawiony pola manewru. (To samo można powiedzieć, gdy w kolejnych firmach o zatrudnieniu zaczyna decydować ta sama AI). Wiele krajów korzysta z narzędzi szacujących ryzyko popełnienia przestępstwa, aby ocenić, czy oskarżony kwalifikuje się do zwolnienia za kaucją. Mamy dowody na to, że tego typu systemy cechuje nieobiektywność – są w nie wpisane uprzedzenia związane z rasą, płcią oraz wiekiem. A problem okazuje się jeszcze większy, jeśli chodzi o ocenę ryzyka recydywy – tu AI okazuje się zaledwie nieco skuteczniejsza od rzutu monetą.
Możliwe, że jednym z powodów niskiej efektywności tego rodzaju narzędzi jest niedobór kluczowych informacji. Wyobraźmy sobie AI oceniającą określony katalog cech – wiek, liczbę wykroczeń oraz historię łamania prawa wśród krewnych – i trójkę podsądnych, którzy w oczach sztucznej inteligencji wpadają w te same widełki. Każdy uzyskałby tę samą ocenę ryzyka recydywy. W naszej hipotetycznej sytuacji jeden z oskarżonych głęboko żałuje swojego czynu, drugi został bezpodstawnie aresztowany, a trzeci nie może się doczekać, żeby dokończyć to, co zaczął. AI nie potrafi uwzględnić tych różnic w swoich prognozach.
Na niekorzyść predykcyjnej sztucznej inteligencji przemawia również fakt, że w interesie osób, o których losie decyduje sztuczna inteligencja, jest oszukanie systemu. W jednym z przypadków AI użyto, aby oszacować długość życia pacjenta po przeszczepie nerki19. Decydenci kierowali się założeniem, że do zabiegu powinni zostać dopuszczeni pacjenci, którym prawdopodobnie zostało najwięcej czasu. Sęk w tym, że taka polityka działa demobilizująco na osoby cierpiące na schorzenia nerek, gdyż zniechęca je do zadbania o swoje zdrowie. Dlaczego? Ponieważ jeśli ich problemy z nerkami staną się wystarczająco poważne w młodszym wieku, mają większą szansę na przeszczep! Całe szczęście, że podczas prac nad tym systemem uwzględniono ścieżkę proceduralną z udziałem pacjentów, lekarzy oraz innych zainteresowanych podmiotów. Dzięki temu problem demotywacji pacjentów wyszedł na światło dzienne i porzucono pomysł wykorzystania predykcyjnej AI w procesie selekcji biorców kwalifikujących się do przeszczepu.
W kolejnych dwóch rozdziałach przytoczymy liczne przykłady sytuacji, w których predykcyjna AI zawiodła. Czy z czasem jej efektywność może się poprawić? Naszym zdaniem odpowiedź jest, niestety, negatywna. Wady tego typu sztucznej inteligencji mają charakter immanentny. Wizje roztaczane przez twórców predykcyjnej AI są tak atrakcyjne, gdyż automatyzacja poprawia efektywność podejmowania decyzji, tyle że w tym przypadku ceną jest rozproszenie odpowiedzialności. Dopóki firmy z sektora AI nie dostarczą przekonujących dowodów na skuteczność swoich rozwiązań, powinniśmy traktować ich deklaracje z dużym dystansem.
Sztuczną inteligencję dzielimy na dwie główne kategorie: generatywną oraz predykcyjną. Ale ile jeszcze jej rodzajów rozróżniamy? Nie sposób powiedzieć, ponieważ nie ma zgody w kwestii tego, co jest sztuczną inteligencją, a co nią nie jest.
W identyfikacji AI mogą pomóc trzy pytania dotykające kwestii realizacji zadania przez komputer. Wszystkie one dotykają istoty sztucznej inteligencji, ale żadne jej w pełni nie definiuje. Pytanie numer jeden: czy dane zadanie wymaga od człowieka kreatywności lub specjalnego przeszkolenia? Jeśli odpowiedź brzmi „tak”, a komputer zdoła je wykonać, możemy mieć do czynienia z AI. Właśnie z tego powodu na przykład programy generujące treści wizualne klasyfikujemy jako AI. Człowiek, któremu powierzylibyśmy stworzenie obrazu czy zdjęcia, musiałby dysponować określonymi umiejętnościami i doświadczeniem, choćby w dziedzinie sztuk wizualnych lub grafiki. Choć jeszcze w drugiej dekadzie XXI wieku sztuczna inteligencja nie radziła sobie z zadaniem, które dla człowieka jest zupełnie proste, czyli z rozpoznawaniem obiektów na zdjęciach, obrazach i rysunkach – nieważne, czy byłby to mały kotek, czy dzbanek do herbaty – to taką działalność zwykle klasyfikowano jako funkcję AI. Wygląda na to, że porównanie z ludzką inteligencją nie jest jedynym istotnym kryterium.
Pytanie numer dwa: czy twórca kodu dookreślił w nim możliwości programu, czy też rozwinęły się one pośrednio, choćby przez analizę przykładów lub przeszukiwanie bazy danych? Jeśli zachowanie systemu pojawiło się pośrednio, to można je uznać za przejaw sztucznej inteligencji. Proces analizy przykładowych treści nazywamy uczeniem maszynowym, klasyfikowanym jako sztuczna inteligencja. Specyfika tego kryterium tłumaczy, dlaczego ustalanie stawek ubezpieczeniowych na podstawie komputerowej analizy danych moglibyśmy uznać za funkcję AI, ale gdyby komputer przedstawił wyniki na podstawie wkładu eksperckiego – nawet jeśli w obu przypadkach obliczenia przebiegałyby analogicznie – już nie mielibyśmy do czynienia ze sztuczną inteligencją. Nie zmienia to faktu, że wiele ręcznie programowanych systemów, jak niektóre roboty sprzątające rozpoznające przeszkody i zapamiętujące układ ścian, uznawanych jest za AI.
Trzecie kryterium dotyczy kwestii podejmowania decyzji w sposób mniej lub bardziej autonomiczny i tego, czy system dysponuje elastycznością pozwalającą mu przynajmniej w ograniczonym stopniu zaadaptować się do środowiska, w którym funkcjonuje. Jeśli odpowiedź brzmi „tak”, możemy uznać go za sztuczną inteligencję. Dobrym przykładem są tutaj samochody autonomiczne, które klasyfikujemy jako AI. Ale podobnie jak w przypadku drugiego kryterium, to również samo w sobie nie wyczerpuje definicji sztucznej inteligencji – typowy, pozbawiony elektroniki termostat nie potrzebuje AI. Jego działanie bazuje na zasadzie wywołanego wzrostem lub spadkiem temperatury rozszerzania się i kurczenia metalu, co skutkuje otwieraniem lub blokowaniem zaworu.
W ostatecznym rozrachunku przyklejenie danemu produktowi etykiety AI jest w przeważającej mierze kwestią jego dotychczasowego zastosowania, działań marketingowych oraz innych czynników. My nie będziemy zawracać sobie głowy brakiem spójnej definicji. W przypadku książki poświęconej sztucznej inteligencji może się to wydawać dziwne. Mimo to powtarzamy: nie da się ująć istoty sztucznej inteligencji w jednym zdaniu. Dlatego skupimy się głównie na różnych rodzajach AI, a dopóki każdy z nich będzie dobrze określony, powinniśmy uniknąć wszelkich niejasności.
Warto wspomnieć o jeszcze jednej, humorystycznej definicji sztucznej inteligencji, która dotyka istotnej kwestii: „AI jest tym wszystkim, czego jeszcze nie zrobiono”. Innymi słowy, kiedy dana aplikacja czy program przestają popełniać błędy, użytkownicy oswajają się z nimi i traktują je tak, jakby zawsze były niezawodne – nie dostrzegają już w nich komponentu AI. Przykładów takich sytuacji jest bez liku: roboty odkurzające, takie jak Roomba; autopilot w samolotach; funkcja autouzupełniania na telefonach; rozpoznawanie odręcznego pisma; rozpoznawanie mowy; filtry blokujące niechcianą korespondencję; autokorekta – tak, dobrze przeczytaliście; były takie czasy, kiedy automatyczne sprawdzanie pisowni stanowiło nie lada wyzwanie!
To wspaniałe narzędzia. W bezinwazyjny sposób czynią nasze życie łatwiejszym. Właśnie takiej AI chcemy więcej. Ale jako że nikomu nie chciałoby się czytać kilkusetstronicowej książki o zaletach programów służących wyszukiwaniu literówek, skupiliśmy się na tych zastosowaniach sztucznej inteligencji, którym sporo brakuje do doskonałości. Niemniej pragniemy podkreślić, że nie powinniśmy wrzucać wszystkich rodzajów AI do jednego worka – wręcz przeciwnie.
Przy odrobinie szczęścia w przyszłości niektóre technologie oparte na sztucznej inteligencji będziemy traktować jako naszą codzienność. Obecnie media informują o samochodach autonomicznych głównie w kontekście wypadków i ofiar śmiertelnych20. Problem bezpieczeństwa był wielokrotnie niedoszacowywany, ale koniec końców nie jest przeszkodą nie do pokonania. Znacznie większym wyzwaniem dla społeczeństwa będą masowe zwolnienia towarzyszące powszechnemu wdrażaniu tej technologii – a mówimy o milionach kierowców samochodów ciężarowych i taksówek, jak również osób świadczących usługę wspólnych przejazdów. Nie zmienia to faktu, że jeśli zdołamy uporać się z zagrożeniami dla pasażerów oraz zadbamy o należne reformy społeczne i polityczne, w przyszłości samochody autonomiczne mogą się stać kolejnym elementem codzienności – takim jak obecnie są windy.
Niemniej jesteśmy zdania, że inne typy AI – ze szczególnym naciskiem na predykcyjną sztuczną inteligencję – raczej nie będą prędko uznane za coś normalnego. Umiejętność przewidywania zachowań społecznych nie jest kwestią technologiczną, a decydowanie o przyszłości człowieka na podstawie szacunków trwale obarczonych wadliwością zawsze będzie budziło wątpliwości natury moralnej.
Aby bardziej dobitnie wytłumaczyć, dlaczego nie należy mierzyć wszystkich przejawów sztucznej inteligencji jedną miarą, posłużymy się przykładem technologii rozpoznawania twarzy, która tak mocno niepokoi obrońców praw obywatelskich. W Stanach Zjednoczonych jej wykorzystanie skutkowało wieloma błędnymi aresztowaniami – do momentu napisania tych słów stwierdzono ich już sześć i zawsze chodziło o Afroamerykanów. Czy zatem policja powinna zaprzestać korzystania z technologii, która nie radzi sobie z rozpoznawaniem rysów twarzy u przedstawicieli mniejszości etnicznych?
We wszystkich przypadkach błędnych aresztowań powtarza się ten sam, łatwy do przeoczenia schemat – zatrzymaniom towarzyszyły nawarstwiające się potknięcia po stronie policji, w większości wynikające z błędu człowieka, a nie technologii. Do aresztowania Roberta Williamsa, oskarżonego o kradzież sklepową, przyczyniły się zeznania pracownika ochrony, którego w momencie kradzieży nie było w sklepie21. Randall Reid został zatrzymany w stanie Georgia za kradzież, do której doszło w Luizjanie – choć nigdy nie odwiedził tego stanu22. Podstawą do aresztowania Porchy Woodruff było jej zdjęcie z 2015 roku, choć służby dysponowały prawem jazdy Porchy z roku 2021 z aktualnym zdjęciem23. Ten motyw nieustannie się powtarza.
Błędy skutkujące aresztowaniem niewłaściwych osób zdarzają się codziennie i wdrożenie systemów rozpoznawania twarzy raczej nie zmieni tego stanu rzeczy.
Poza tym policja wykorzystuje systemy rozpoznawania twarzy setki tysięcy razy, co oznacza, że liczba błędów jest mimo wszystko znikoma24. Tak po prawdzie według National Institute of Standards and Technology (Amerykańskiego Narodowego Instytutu Norm i Technologii) odsetek błędnych dopasowań wyniósł w 2020 roku 0,08 procent – pięćdziesięciokrotnie mniej niż w 2014 roku25.
AI wykorzystana w rozpoznawaniu twarzy – o ile została poprawnie wdrożona – zwykle cechuje się wysoką skutecznością, gdyż informacje poddawane analizie nie pozostawiają pola do domysłów i dwuznaczności. Sztuczną inteligencję tego typu szkoli się na ogromnych bazach danych zdjęć opatrzonych etykietami, dzięki którym AI wie, które zdjęcia pokazują tę samą osobę. Przy wystarczającej ilości danych i adekwatnej mocy obliczeniowej system w końcu przyswoi wzorce i nauczy się rozpoznawać twarze. Rozpoznawanie twarzy wyróżnia się na tle innych, zbliżonych narzędzi analitycznych, jak identyfikacja płci czy stanu emocjonalnego, które znacznie częściej zwracają błędne wyniki26,27. Zasadnicza różnica między nimi sprowadza się do faktu, że wszystkie informacje niezbędne do identyfikacji twarzy znajdują się na zdjęciu. W przypadku innych zadań program próbuje zgadnąć płeć czy emocje na podstawie mimiki, co w naturalny sposób ogranicza jego efektywność.
Obrońcy praw obywatelskich często wrzucają do jednego wora rozpoznawanie twarzy oraz inne omylne technologie wykorzystywane przez system sądownictwa karnego, jak choćby systemy przewidujące ryzyko popełnienia przestępstwa – choć to pierwsze nie ma nic wspólnego z tym drugim i cechuje się wielokrotnie niższym odsetkiem błędów. (Większość osób, którym AI przyznała etykietę „wysokiego ryzyka”, nie dopuściło się aktu recydywy).
Tym, co czyni technologię rozpoznawania twarzy tak groźną, jest fakt, że naprawdę świetnie działa i w niewłaściwych rękach może poczynić ogromne szkody. W książce Your Face Belongs to Us Kashmir Hill przytacza wiele przykładów takich sytuacji28. Jeden z nich dotyczy autorytarnych rządów, które mogą wykorzystać tę technologię do identyfikacji osób biorących udział w protestach i późniejszego ich represjonowania29.
Do nadużyć może równie dobrze dojść w sektorze prywatnym. Nowojorska hala Madison Square Garden słynie z organizowanych tam imprez sportowych i koncertów. W 2022 roku prawniczka Nicolette Landi nie została wpuszczona na odbywający się tam koncert Mariah Carey30. Bilety zostały zakupione za 400 dolarów przez jej partnera jako prezent urodzinowy. Nicolette nie była jedyną prawniczką, której wówczas odmówiono udziału w imprezie. Dlaczego tak się stało? Otóż operator hali wydał zakaz wstępu wszystkim prawnikom pracującym dla firm, które go pozywały – również tym, którzy nie byli zaangażowani w pozew, regularnie odwiedzali MSG czy mieli wykupione karnety na cały sezon. Technologia rozpoznawania twarzy była w tym przypadku narzędziem mającym zagwarantować skuteczność w egzekwowaniu zakazów.
Celem osób, które przekonują o znikomej skuteczności tej technologii, może być chęć zablokowania takich inicjatyw lub zawstydzenia badaczy zaangażowanych w ich rozwój. Nie powinniśmy jednak zapominać, że rozpoznawanie twarzy ma także pewne zalety. Na przykład Departament Bezpieczeństwa Krajowego Stanów Zjednoczonych posłużył się tym narzędziem podczas trzytygodniowej operacji dotyczącej przedawnionych spraw molestowania dzieci, aby przeanalizować zdjęcia i nagrania upublicznione przez sprawców w mediach społecznościowych31. Jeśli wierzyć doniesieniom, dzięki oprogramowaniu ustalono tożsamość setek dzieci i ich oprawców. Oczywiście rozpoznawanie twarzy ma również mniej spektakularne zastosowania, jak odblokowywanie smartfonów czy łatwe segregowanie zdjęć z konkretnymi osobami.
Dla jasności: choć oprogramowanie do rozpoznawania twarzy może – o ile zostanie wykorzystane we właściwy sposób – cechować wysoka skuteczność, łatwo o sytuację, gdy zwróci błędny wynik. Prawdopodobieństwo pomyłki rośnie, jeśli wykorzystamy ziarniste nagranie lub zdjęcie. Kiedy amerykańska sieć aptek Rite Aid próbowała wyśledzić złodziei przez podsuwanie AI nieczytelnych materiałów, system zwrócił tysiące błędnych wyników. Firma dwoiła się i troiła, aby ukryć fakt, że korzysta z tego typu rozwiązań. Na szczęście sprawą zainteresowały się organy nadzoru. Federalna Komisja Handlu nałożyła na sieć Rite Aid pięcioletni zakaz korzystania z takiego narzędzia32.
Podsumowując: dwoista natura systemów rozpoznawania twarzy wymaga bardziej złożonego podejścia i pogłębionej dyskusji na temat dopuszczalnych zastosowań technologii, sprzeciwu wobec zastosowań niewłaściwych, jak również ustalenia ram prawnych uniemożliwiających nadużycia czy błędne zastosowania zarówno ze strony rządu, jak i sektora prywatnego.
Pod koniec 2019 roku ni z tego, ni z owego z Arvindem skontaktowała się osoba swego czasu zatrudniona w firmie z sektora AI działającego w szczególnie dochodowej niszy automatyzacji procedur zatrudniania – o którym napisaliśmy już, że zwykle obiecuje gruszki na wierzbie. Według informatora większość pracowników zdawała sobie sprawę z ograniczonej efektywności produktu, ale władze firmy, wszem wobec deklarujące jego skuteczność, tłamsiły wszelkie próby przeprowadzenia wewnętrznej analizy systemu.
Tak się złożyło, że mniej więcej w tym samym czasie Arvind został poproszony o wygłoszenie otwartego wykładu na MIT**. Mając w pamięci niedawne spotkanie ze wspomnianym pracownikiem naukowym, Arvind skupił się na pustych deklaracjach sektora AI w kontekście automatyzacji zatrudnienia. Wykład spotkał się z ciepłym przyjęciem i Arvind postanowił udostępnić swoją prezentację w sieci, uznawszy, że może się okazać pomocna dla garstki badaczy i aktywistów. Tymczasem slajdy szturmem wzięły Internet. Ściągnięto je dziesiątki tysięcy razy, a dotyczące ich wpisy na Twitterze (obecnie X) dobiły do dwóch milionów wyświetleń.
Kiedy Arvind doszedł do siebie, zrozumiał, że dotknął czułego tematu – i wiedział dlaczego. Większość z nas instynktownie czuje, że AI, z którą stykamy się na co dzień, nie ma wiele wspólnego z prawdziwą sztuczną inteligencją, ale nie dysponujemy adekwatnym słownictwem czy przygotowaniem, aby zakwestionować wiarygodność tych deklaracji33. Koniec końców za takim określeniem stoją domniemani geniusze i firmy o kapitale sięgającym bilionów dolarów. Inaczej byłoby, gdyby podobne podejrzenia wyraził profesor informatyki. Dla wielu osób był to impuls, który skłonił je do wyartykułowania swoich wątpliwości.
Przez dwa dni Arvind otrzymał około pięćdziesięciu mejlowych propozycji przerobienia wykładu na artykuł, a może nawet książkę – ale nie uważał siebie za osobę wystarczająco kompetentną w tej dziedzinie. Sytuacja uległaby zmianie, gdyby zgromadził dość materiału, a tymczasem nie zamierzał odcinać kuponów od sławy, która spłynęła na niego za sprawą jednego wystąpienia.
Jeśli mowa o uczelniach wyższych, drugim najlepszym sposobem, aby poszerzyć swoją wiedzę, jest zapisanie się na interesujące nas zajęcia. A jeszcze lepiej, jeśli się je prowadzi. Tak też uczynił Arvind – połączył siły z profesorem socjologii z Uniwersytetu Princeton Matthew Salganikiem. Matt miał na koncie wiele kluczowych tekstów naukowych, w których tłumaczył, dlaczego przyszłość AI jest tak trudna do przewidzenia. Dwoma z nich zajmiemy się w rozdziale trzecim. W trakcie wspólnie poprowadzonych zajęć na temat granic przewidywania Matt i Arvind zachęcali studentów do samodzielnych poszukiwań. Jednym ze studentów był Sayash.
Sayash porzucił pracę dla Facebooka, aby zrobić doktorat na Uniwersytecie Princeton i z dala od firm technologicznych współtworzyć technologie służące interesowi publicznemu. Dostał się na kilka kursów doktoranckich z zakresu informatyki. Zaakceptowani studenci mogą odwiedzić wydziały i porozmawiać z potencjalnymi współpracownikami, aby się upewnić, czy ich wkład byłby istotny dla danego programu.
Zwiedzających wydziały przyszłych doktorantów zachęca się, aby zadawali następujące pytania: jakie są metody ukierunkowania studentów? Ile mają czasu wolnego? Co z kwestią równowagi między pracą a życiem osobistym? Odpowiedzi na te ważne kwestie pozwalają kandydatowi zorientować się, jaką metodę pracy propaguje dany promotor, ale już niekoniecznie, jakie wyznaje wartości ani w jaki sposób myśli. Dużo więcej informacji dostarczy nam odpowiedź na pytanie: „Co byś zrobił/zrobiła, gdybyś dostał/dostała pozew od firmy technologicznej?”. Tak oto dowiemy się, co promotor czy też nasz rozmówca / nasza rozmówczyni sądzą o Big Techach, wadze swoich badań oraz jak się zachowają, kiedy przyjdzie co do czego. To niekonwencjonalne pytania, na które promotor raczej nie będzie przygotowany.
Sayash zadawał je wszystkim promotorom, z którymi miał okazję porozmawiać. Bez wątpienia czuli się zaskoczeni jego pytaniami, ale scenariusz, który malował, wcale nie wydawał się tak niedorzeczny. Kiedy Arvind odpowiedział: „Gdyby jakaś firma zagroziła mi pozwem, to w sumie bym się ucieszył, bo to by znaczyło, że moja praca ma znaczenie”, Sayash zrozumiał, że znalazł to, czego szukał.
Studentów uczestniczących w kursie o ograniczeniach w przewidywaniu interesowała predykcyjna AI: wszystkie techniki odgadywania przyszłości oparte na dostępnych danych, w szczególności w kontekście społecznym, poczynając od cywilizacji, a kończąc na mediach społecznościowych. Oto kilka frapujących pytań, które wzięliśmy na tapet: czy możliwe jest przewidzenie zdarzeń geopolitycznych, jak wyniki wyborów, recesja lub ruchy społeczne? Albo które filmiki podbiją Internet?
Tym sposobem odkryliśmy istne cmentarzysko ambitnych prób zgadnięcia, co przyniesie przyszłość. Raz za razem na przeszkodzie stawały dokładnie te same problemy, ale jako że badacze rzadko konsultują się z kolegami i koleżankami zajmującymi się innymi dyscyplinami naukowymi, wielu prędzej czy później niezależnie od pozostałych zderzało się z tą samą ścianą. Tym, co wzbudziło nasz niepokój, był kontrast między potwierdzonymi dowodami a powszechnym przekonaniem, że uczenie maszynowe świetnie się nadaje do przewidywania przyszłości.
Jednym z licznych przykładów poruszonych w trakcie zajęć był przypadek Google Flu Trends. Mowa o zainicjowanym w 2008 roku projekcie firmy Google, który miał umożliwić przewidzenie epidemii grypy przez analizę milionów codziennych zapytań użytkowników. Wzrost liczby zapytań dotyczących grypy mógł wskazywać na rychły wybuch epidemii. Google promował Flu Trends jako przykład systemu, w którym sztuczna inteligencja, korzystająca z ogromnej bazy danych, realizuje społecznie ważny cel. W ciągu kolejnych kilku lat celność prognoz jednak znacząco spadła. Po części dlatego, że trudno jest odróżnić wyszukiwania będące skutkiem paniki wywołanej doniesieniami medialnymi od tych motywowanych faktycznymi zachorowaniami. Niemniej sam Google zmodyfikował aplikację, co odbiło się na charakterystyce zapytań wpisywanych w wyszukiwarkę, sztuczna inteligencja nie uwzględniła jednak tej zmiany. Koniec końców Google Flu Trends należy potraktować jako przestrogę34. Z historii aplikacji możemy wysnuć następujący wniosek: nawet w scenariuszach umożliwiających wysnucie względnie trafnych wniosków diabeł tkwi w szczegółach.
W trakcie kursu Sayash utwierdził się w przekonaniu, że w ramach pracy dla Facebooka trafnie zdiagnozował problemy AI – mianowicie podczas pracy nad sztuczną inteligencją łatwo o potknięcia i nadmiernie optymistyczne ocenianie jej możliwości. Źródłem problemów mogą być niuanse, których często nie udało się wyłapać w testach, a stały się widoczne, kiedy AI trafiła w ręce użytkowników35. Sayash postanowił zgłębić problematykę ograniczeń sztucznej inteligencji.
Po czterech latach badań – wspólnych oraz indywidualnych – jesteśmy gotowi, aby podzielić się naszymi ustaleniami. Niniejsza książka nie jest jednak tylko o tym. Wykorzystujemy AI do podejmowania wielu ważnych decyzji, zatem jeśli nie działa, rezultaty na płaszczyźnie osobistej i zawodowej mogą być opłakane – i tak się dzieje. Oczywiście nie każdy przejaw sztucznej inteligencji to ściema – przeciwnie – dlatego umiejętność odróżnienia rzeczywistego postępu od sztucznie rozdmuchanego entuzjazmu ma tak wielkie znaczenie. Liczymy, że i na tym polu nasza książka okaże się pomocna.
Z perspektywy czasu widzimy, że współpraca pomogła nam zrozumieć przyczyny powszechnego niezrozumienia sztucznej inteligencji, jej mitologizacji oraz towarzyszącej wszelkim dyskusjom na ten temat wszechobecnej dezinformacji. Co do zasady za winnych takiego stanu rzeczy należy uznać naukowców, firmy i media.
Zaczniemy od przykładu ze świata nauki. W 2023 roku opublikowano artykuł, którego autorzy twierdzili, że dzięki uczeniu maszynowemu możliwe jest wytypowanie przebojów muzycznych z dziewięćdziesięciosiedmioprocentową pewnością36. Producenci z branży nadstawili uszu, bo kto jak kto, ale oni nieustannie wypatrują kolejnych hitów. Serwisy informacyjne, jak „Scientific American” oraz „Axios”, wypuszczały kolejne teksty o rewolucji, jaka czeka rynek muzyczny w obliczu „przerażającej dokładności” AI37,38. Wcześniejsze badania wykazywały, że trudno przewidzieć, czy dana piosenka odniesie sukces, dlatego ów artykuł naukowy zdawał się opisywać wręcz spektakularne osiągnięcie.
Przeanalizowaliśmy temat i nasze wnioski raczej nie ucieszą producentów muzycznych.
Opisaną w artykule metodę predykcji cechuje klasyczny problem uczenia maszynowego – tak zwany data leakage, czyli wyciek danych. Mowa o sytuacji, gdy narzędzie oceniane jest na podstawie tych samych lub zbliżonych danych, na których je szkolono, co skutkuje zawyżeniem szacunków dotyczących dokładności. To trochę jak z uczeniem się pod dany typ testu – albo nawet gorzej, to jak zapamiętywanie konkretnych poprawnych odpowiedzi. Po usunięciu problemu okazało się, że trafność AI na tym polu była porównywalna ze strzelaniem podczas egzaminu.
I nie mówimy o odosobnionym przypadku. Gdy mowa o uczeniu maszynowym, zaskakująco często natykamy się na podręcznikowe błędy – zwykle gdy sięgają po nie badacze bez przygotowania informatycznego. Na przykład naukowcy operujący na polu medycyny posługują się nim, aby przewidzieć u pacjenta potencjalne choroby, specjaliści w dziedzinie nauk społecznych chcą wiedzieć, jak potoczy się czyjeś życie, a politolodzy – gdzie i kiedy wybuchnie kolejna wojna domowa.
Systemowa, szeroko zakrojona analiza wykazała, że większość badań, w których posłużono się narzędziami opartymi na uczeniu maszynowym, dała wyniki obarczone błędem39. Nie zawsze jest to działanie motywowane złymi intencjami; uczenie maszynowe co do zasady cechuje pewna złożoność, a badacze często oszukują samych siebie. Zespoły badaczy reprezentujących kilkanaście dziedzin nauki zgromadziły dowody na szeroko rozpowszechnioną niedoskonałość badań koleżanek i kolegów po fachu, nieświadomych faktu, że przykładają rękę do spotęgowania pogłębiającego się kryzysu wiarygodności na polu uczenia maszynowego.
Można odnieść wrażenie, że im bardziej nośne medialnie jest dane badanie, tym niższa jakość opracowania. Opublikowano tysiące badań, których autorzy przekonywali, że udało im się zdiagnozować COVID-19 na podstawie prześwietlenia klatki piersiowej oraz innych metod obrazowania. Przegląd systematyczny*** ponad czterystu artykułów wykazał, że ze względu na błędną metodologię żaden z nich nie ma zastosowania w praktyce40. W przypadku kilkunastu tekstów ich autorzy szkolili sztuczną inteligencję na zdjęciach chorych na COVID-19 dorosłych, a zdjęcia zdrowych pacjentów wykonano dzieciom. W konsekwencji ich AI co najwyżej nauczyła się odróżniać dzieci od dorosłych, podczas gdy twórcy algorytmu błędnie założyli, że udało im się stworzyć wykrywacz wirusa COVID-19.
Autorzy niniejszej książki odkryli niedoskonałości w wielu badaniach, głównie dotyczących przewidywania wojen domowych (krótko i zwięźle: to niewykonalne). Kiedy szukaliśmy platformy do publikacji artykułu poświęconego błędnej metodologii badań z jednej konkretnej dziedziny, żadne czasopismo naukowe nie wykazało zainteresowania. Nie od dziś wiadomo, że korygowanie potknięć w dorobku naukowym nastręcza poważnych problemów. Koniec końców opublikowaliśmy nasz artykuł w formie przystępnego poradnika dla przyszłych badaczy narażonych na powtórzenie błędów kolegów i koleżanek po fachu.
Obecnie, kiedy natkniemy się na oparty na uczeniu maszynowym artykuł o wątpliwej wiarygodności, nie próbujemy już korygować pojawiających się w nim błędów. System nie działa. Tak po prawdzie, to w wielu dziedzinach badania, których efektów nie zdołali powtórzyć inni naukowcy, są cytowane częściej od tych, których prawdziwość zweryfikowano41. W środowisku naukowym panuje przekonanie, że nauka „sama się koryguje”, co miałoby oznaczać, że trzymanie się przyjętych procedur wystarczy, aby wyłowić badania o błędnej metodologii – jednak z naszego punktu widzenia dowody zaprzeczają tej tezie.
Dla jasności: głoszone w artykułach naukowych twierdzenia wywiedzione na podstawie błędnej implementacji uczenia maszynowego nie znajdują przełożenia na wadliwą sztuczną inteligencję oddaną w ręce konsumentów. Jeśli producent muzyczny sięgnie po narzędzie o wątpliwej skuteczności, aby odkryć kolejny przebój, bardzo szybko się przekona, że popełnił błąd. (Firmy, których sztuczna inteligencja okazała się picem na wodę, zwykle bardzo dobrze wiedzą, co sprzedają). Nie zmienia to faktu, że media mają w zwyczaju nagłaśniać każdy rzekomy przełom na polu AI, co pogłębia problem naukowej dezinformacji na temat sztucznej inteligencji i w negatywny sposób odbija się na naszym wyobrażeniu na jej temat.
Na szczęście można dostrzec promyk nadziei. Latem 2022 roku zorganizowaliśmy internetowe warsztaty, których tematem przewodnim była skala badań naukowych podpartych błędnie zaimplementowanym uczeniem maszynowym. Ku naszemu zaskoczeniu pomysł skusił setki badaczy. Kolejnym krokiem było zorganizowanie grupy około dwudziestu osób – specjalistów i specjalistek z najróżniejszych dziedzin – które miały przejść od słów do czynów i opracować prostą listę wytycznych ułatwiających środowisku naukowemu dokumentowanie implementacji uczenia maszynowego, co z kolei miało się przełożyć na ograniczenie liczby błędów lub – jeśli już jakiś się zdarzy – łatwiejsze ich wyłapywanie42. Jeszcze zbyt wcześnie, aby stwierdzić, czy nasza propozycja zostanie wdrożona. Tak czy inaczej – zmiana nawyków naukowych nigdy nie dokonuje się szybko i nie wykluczamy, że zanim sytuacja ulegnie poprawie, przez jakiś czas problem będzie się pogłębiał.
Wróćmy jednak do firm. Jest prawdą, że zbyt optymistyczne wnioski wyciągane z badań wprowadzają w błąd opinię publiczną, za to przereklamowane produkty mogą realnie szkodzić konsumentom. Aby się bliżej przyjrzeć temu zjawisku, połączyliśmy siły z koleżanką i kolegą po fachu – Angeliną Wang i Solonem Barocasem. Skupiliśmy się na implementacji predykcyjnej AI w przemyśle i agencjach rządowych43. Udokumentowaliśmy około pięćdziesięciu takich przypadków na polu sądownictwa, ochrony zdrowia, pomocy społecznej, finansów, edukacji, zarządzania personelem i marketingu. Do większości z nich doszło w nieodległej przeszłości. W drugiej dekadzie XXI wieku macki predykcyjnej AI sięgnęły wielu dziedzin życia, gdzie wykorzystywano ją do oceny ludzkiego potencjału i szacowania szans na odniesienie sukcesu na podstawie potajemnie zgromadzonych danych.
Odkryliśmy, że choć sprzedawcy tego typu narzędzi agresywnie poszukują nowych klientów, zwykle nie ujawniają całej prawdy o efektywności produktu, który niekiedy po prostu nie działa. Warto podkreślić, że według naszej najlepszej wiedzy żadna firma zajmująca się automatyzacją rekrutacji nie opublikowała artykułu dostarczającego dowodów na skuteczność zastosowanego modelu predykcyjnej AI i poddanego krytycznej analizie środowiska ani nie zezwoliła niezależnym ekspertom na zbadanie danego rozwiązania. Dwie najważniejsze firmy z tego sektora uczyniły z zatrudnienia audytorów widowisko: Pymetrics nawiązało współpracę z czołową grupą badawczą z Northeastern University, a HireVue wynajęła słynnego specjalistę. W obu przypadkach audytorzy badali jednak tylko to, czy AI nie ma jakichś preferencji w kwestii pochodzenia oraz płci, a nie – czy spełnia swoje zadanie. Obie firmy przebiegle wykorzystały na swoją korzyść lęk przed „uprzedzoną” AI. Łatwo przeciwdziałać takim uprzedzeniom, kiedy nasz produkt jest co do zasady generatorem liczb losowych!
Na tym polu również dostrzegamy pierwsze zmiany na lepsze. Organy nadzorujące zaczynają dostrzegać, że wiele produktów opartych na predykcyjnej AI zwyczajnie nie działa. W 2023 roku FTC (amerykańska Federalna Komisja Handlu) przestrzegła firmy:
Nie żyjemy w świecie rodem z science fiction, gdzie komputery potrafiłyby przedstawić wiarygodne prognozy dotyczące ludzkiego zachowania. Wasze deklaracje dotyczące skuteczności wprowadzają w błąd, gdy deklarowana efektywność waszych produktów nie znajduje poparcia w nauce lub dotyczy wyłącznie konkretnego typu użytkownika bądź specyficznych warunków użytkowania.
Kluczowe jest tutaj słowo „błąd”; decyzją Kongresu Stanów Zjednoczonych FTC ściga oszustwa dokonywane przez przedsiębiorców. Liczymy, że firmy wezmą sobie to ostrzeżenie do serca.
Naukowcy i przedsiębiorstwa rozniecają iskrę zainteresowania, ale to media dolewają oliwy do ognia. Dzień w dzień jesteśmy bombardowani opowieściami o kolejnych domniemanych przełomach na polu sztucznej inteligencji. Często bywa i tak, że treść artykułu mało się różni od oryginalnego komunikatu prasowego.
Oczywiście to nie dziwi, kiedy od liczby odsłon uzależnione jest „być albo nie być” mediów, a redakcje informacyjne są wiecznie niedofinansowane. Nie zmienia to faktu, że media borykają się z systemowymi problemami – i nie mówimy tu wyłącznie o lecących na łeb na szyję dochodach. Wśród dziennikarzy zajmujących się tematyką AI nie brakuje osób uprawiających „dziennikarstwo dostępowe”. Dzięki utrzymywaniu dobrych relacji z firmami z sektora sztucznej inteligencji mogą oni liczyć na wywiady ze specjalistami oraz wczesny dostęp do najnowszych funkcji. To zaś oznacza, że nie zadają zbyt wielu zdroworozsądkowych pytań.
Temat samoświadomej sztucznej inteligencji działa na media jak magnes. Kiedy w czerwcu 2022 roku pewien inżynier pracujący dla Google’a oznajmił, że używany w firmie chatbot zaczął samodzielnie myśleć (i stał się ofiarą uprzedzeń), rozpisywały się o tym niemal wszystkie media44. Sytuacja powtórzyła się na początku roku 2023, gdy chatbot dostępny w wyszukiwarce Bing oznajmił, że zyskał samoświadomość. W opinii większości badaczy AI taka deklaracja nie znajduje poparcia w faktach.
Nie brakuje też dziennikarzy, którzy potrafią zachować dystans i wykonać pracę śledczą na najwyższym poziomie. Są jednak w mniejszości i stoją w opozycji do obowiązujących trendów. Mieliśmy okazję podyskutować o problemie szumu medialnego towarzyszącego AI i przemawiać na kilku konferencjach organizowanych przez środowisko dziennikarskie. Usłyszeliśmy o licznych inicjatywach zmierzających do poprawy jakości dziennikarstwa technologicznego.
Oto przykład jednej z nich: Pulitzer Center finansuje sieć dziennikarzy pracujących nad „pogłębioną analizą odpowiedzialności agencji rządowych oraz korporacji wykorzystujących technologie predykcyjne oraz obserwacyjne wspomagane AI przy podejmowaniu decyzji dotyczących porządku publicznego, świata medycyny, systemów pomocy społecznej i sądownictwa karnego, zatrudniania, jak również na innych polach”45. Skutkiem inicjatywy było wiele ważnych śledztw dziennikarskich, w tym jedno autorstwa Ariego Sena i Derêki K. Bennett dla „Dallas Morning News”. Sen i Bennett zainteresowali się narzędziem AI Social Sentinel, powszechnie wykorzystywanym przez szkoły w Stanach Zjednoczonych do analizy aktywności uczniów w mediach społecznościowych, w domyśle w celu wykrywania potencjalnych zagrożeń, lecz często – do identyfikacji osób angażujących się w protesty46.
Pulitzer Center finansuje pracę raptem dziesięciorga dziennikarzy rocznie. W ostatecznym rozrachunku pytanie o to, czy przedstawiciele tego zawodu są w stanie weryfikować działania Big Techów, sprowadza się do kwestii rozszerzenia modelu pracy nieopartego na liczbie odsłon.
Specjaliści w dziedzinie sztucznej inteligencji mają obowiązek przeciwstawiać się szumowi medialnemu niezależnie od tego, kto go rozpętuje: badacze, firmy czy media. My również staramy się robić, co w naszej mocy. W kolejnych odcinkach newslettera dostępnego na AISnakeOil.com omawiamy najnowsze informacje ze świata AI i pomagamy odbiorcom oddzielić ziarno od plew47.
Na przełomie XIX i XX wieku w Stanach Zjednoczonych roiło się od sprzedawców substancji reklamowanych jako panaceum na wszelkie dolegliwości. Na grafice 1.1 pokazujemy typową reklamę takiego specyfiku. Handlarze żerowali na niepopartym wiedzą naukową powszechnym przekonaniu, że „olej z węża” ma właściwości prozdrowotne, oraz na niezdolności do odróżnienia terapii skutecznej od pozornej. Ponadto większość specyfików należących do tej grupy nie zawierała wspomnianego oleju. Były wśród nich takie, które co prawda nie pomagały, ale też nie szkodziły. Inne powodowały uszczerbek na zdrowiu lub skutkowały śmiercią. Do 1906 roku, kiedy to powołano do życia Agencję Żywności i Leków (Food and Drug Administration, FDA), nie istniała możliwość udowodnienia sprzedawcom „oleju z węża”, że handlują produktem o przekłamanym składzie i skuteczności, do tego zagrażającym zdrowiu konsumentów.
Ilustracja 1.1. Reklama cudownego leku z 1905 roku. Źródło: https://www.nlm.nih.gov/exhibition/ephemera/medshow.html. Grafika „Clark Stanley’s Snake Oil Liniment” pochodzi najprawdopodobniej z dwustustronicowej ilustrowanej broszury True Life in the Far West wydanej w Worcester w stanie Massachusetts około 1905 roku, format 23 × 14,8 cm, https://commons.wikimedia.org/w/index.php?curid=47338529/****
Odpowiednikiem panaceum reklamowanego jako „olej z węża” bywa sztuczna inteligencja, bo ona również nie działa zgodnie z deklaracjami – ponieważ nie ma szans zadziałać w taki sposób. Jako przykład niech posłuży wykorzystywane w procesie rekrutacji oprogramowanie do analizy materiału wideo, które zainspirowało nas do zgłębienia tematu, a koniec końców – do napisania niniejszej książki. Naszym celem jest rozróżnienie, co na polu sztucznej inteligencji jest takim rzekomo cudownym eliksirem, a co – jeśli zostanie wykorzystane zgodnie ze swoim przeznaczeniem – może przynieść wymierne rezultaty. Niekiedy oszustwo jest widoczne na pierwszy rzut oka, ale granica między produktem przekłamanym a autentycznym czasem jest dość cienka. Często bywa i tak, że aspekt AI jest do pewnego stopnia funkcjonalny, ale wyolbrzymiony przez marketingową otoczkę. To zaś prowadzi do obdarzania sztucznej inteligencji nadmiernym zaufaniem i chociażby zastępowania doświadczonych pracowników narzędziami, które powinny tylko wspomagać ich pracę.
Jeszcze jedna równie ważna kwestia: także AI działająca zgodnie z intencjami swoich twórców może stanowić zagrożenie, czego dowodzi przypadek technologii rozpoznawania twarzy wykorzystywanej w celu masowej inwigilacji. Abyśmy mogli zidentyfikować potencjalne zagrożenia oraz dobrać odpowiednie środki zapobiegawcze, musimy wpierw ustalić, czy kłopot wziął się z niedoskonałości AI i szumu medialnego, czy też z tego, że problematyczna funkcja została świadomie zaimplementowana. Kwestie szkodliwości oraz zgodności z prawdą definiują osie wykresu widocznego na ilustracji 1.2. Autorów niniejszej pracy interesuje wszystko z wyjątkiem sytuacji przedstawionej w lewym dolnym rogu wykresu, kiedy AI działa zgodnie z intencjami twórców i jest niegroźna.
Potraktujmy wykres jako punkt wyjścia do przedstawienia listy zagadnień, którymi zajmiemy się w książce.
Rozdział drugi poświęcamy zautomatyzowanemu podejmowaniu decyzji, a zatem obszarowi, na którym AI – a dokładniej mówiąc: predykcyjna AI – znajduje coraz szersze zastosowanie w takich kwestiach, jak przewidywanie przypadków recydywy, nieukończenia szkoły i tym podobnych. Przyjrzymy się systemom, które zawiodły i doprowadziły do wielkiej krzywdy. W trakcie naszych badań zdołaliśmy wyodrębnić przyczyny usterek – i wszystkie są nierozerwalnie związane z logiką predykcyjną stosowaną w systemach wysokiego wpływu*****. Na koniec zadamy sobie pytanie, czy możliwe jest wykluczenie predykcyjnej AI z procesów decyzyjnych oraz jakie zmiany na poziomie organizacyjnym oraz kulturowym będą konieczne, aby poradzić sobie z nieprzewidywalnością nieodłącznie towarzyszącą podejmowaniu ważkich decyzji.
Ilustracja 1.2. Złudne obietnice AI, szum medialny oraz płynące z nich zagrożenia w kontekście przykładowych zastosowań.
W rozdziale trzecim cofniemy się o krok i spróbujemy wytłumaczyć, dlaczego tak trudno jest przewidzieć, co przyniesie przyszłość. W naszej opinii problem leży nie po stronie AI, ale przyrodzonej natury procesów społecznych; próba przewidzenia ludzkiego zachowania nastręcza ogromnych problemów, i to z licznych powodów. Przyjrzymy się wielu takim inicjatywom, w tym próbom prognozowania liczby przestępstw czy przewidywania dorosłych życiorysów obecnych dzieci. W naszej analizie podeprzemy się badaniami naukowymi oraz nielicznymi sytuacjami, kiedy usługi o charakterze komercyjnym zostały poddane niezależnej kontroli. Przeanalizujemy oba możliwe scenariusze: pozytywny, kiedy AI poprawnie przewidziała kwalifikacje aplikanta lub potencjał hitu literackiego, oraz negatywny, gdy dłużnik nie zdołał spłacić pożyczki; we wszystkich tych przypadkach efekt końcowy jest trudny do przewidzenia. Przyjrzymy się również scenariuszom o mniej dalekosiężnych skutkach i łatwiej poddającym się analizie, jak choćby kwestii tego, które wpisy w mediach społecznościowych mają szansę szturmem wziąć Internet. I wreszcie, po przewidywaniu losów jednostek, zajmiemy się prognozami w skali makro, ot, choćby tymi dotyczącymi rozwoju pandemii. Analiza tych treści – niezależnie od ich specyfiki – pozwoliła wyodrębnić jednolite wzorce, co doprowadziło nas do refleksji, że w najbliższej przyszłości predykcyjna AI nie przeskoczy swoich naturalnych ograniczeń.
Wskazanie kluczowego problemu, przed jakim stoi sztuczna inteligencja, nie jest szczególnym wyzwaniem: przewidywanie przyszłości jest trudne. Inaczej sprawy się mają z generatywną AI, którą zajmiemy się w następnej kolejności. Z jednej strony tego rodzaju technologię cechuje wyjątkowy potencjał, a z drugiej nie radzi sobie ona z zadaniami, którym podołałoby kilkuletnie dziecko48. Ale AI zmienia się na naszych oczach. Aby zrozumieć, na czym polegają ograniczenia tego rodzaju sztucznej inteligencji oraz jak może wyglądać jej przyszłość, musimy lepiej poznać to narzędzie. W rozdziale czwartym wytłumaczymy zasadę działania generatywnej AI.
Omówimy również zagrożenia towarzyszące korzystaniu z generatywnej sztucznej inteligencji. Niekiedy winę ponosi wadliwy produkt: wyobraźmy sobie, że oprogramowanie do wykrywania tekstów wygenerowanych przez AI nie działa zgodnie z opisem, co może skutkować bezpodstawnymi oskarżeniami o wykorzystanie sztucznej inteligencji. Kiedy indziej źródłem problemu jest poprawnie działający produkt. Generatory szeroko dostępnych treści wizualnych – zdjęć „stockowych” – mogą wysłać fotografów na bezrobocie, choć to na ich pracy firmy z sektora AI bezpłatnie szkolą swoją technologię. Nie ulega wątpliwości, że generatywna AI jest częstokroć wykorzystywana w sposób skuteczny i efektywny – za przykład może posłużyć automatyzacja pewnych elementów programowania (programiści także powinni być świadomi istnienia zagrożeń, choćby potencjalnych błędów – furtek dla hakerów – w kodzie wygenerowanym przez AI). Nie poświęcimy jednak wiele miejsca korzystnym zastosowaniom AI – koniec końców nasza książka traktuje o czym innym. Nie zmienia to faktu, że budzą nasz entuzjazm, podobnie jak potencjał szeroko pojętej generatywnej AI.
Rozdział piąty poświęcimy kwestii globalnych zagrożeń, rozpalających wyobraźnię opinii publicznej. Pojawiają się obawy, że kiedy AI osiągnie wysoki poziom rozwoju, ludzkość straci nad nią kontrolę. W naszej opinii u podstaw tych lęków leży uproszczone przekonanie, że istnieje punkt krytyczny, po którego przekroczeniu AI zyska pełną autonomię lub inteligencję nieosiągalną dla człowieka. Tyle że historia sztucznej inteligencji przeczy tej hipotezie. Z czasem elastyczność oraz potencjał technologii rosną, co nazywamy „drabiną ogólności”. Technologia, którą obecnie dysponujemy, osiągnęła siódmy szczebel na drabinie, na której każdy kolejny poziom cechuje wyższa elastyczność i większe możliwości.
Wszelkie dowody wskazują na to, że sztuczna inteligencja nadal będzie się rozwijać w sposób stopniowy. To zaś oznacza, że zamiast snuć przypuszczenia dotyczące tego, co przyniesie przyszłość, powinniśmy wyciągnąć naukę z przeszłości. Solidna analiza wyraźnie pokazuje, że koncepcja zbuntowanej AI bazuje na błędnych założeniach. Nie znaczy to, że mamy zignorować potencjalne ryzyko towarzyszące istnieniu sztucznej inteligencji o wyjątkowym potencjale. Ale pokażemy wam, że już dzisiaj dysponujemy narzędziami umożliwiającymi rozbrojenie zagrożenia wspólnymi siłami i bez nerwów.
Rozdział szósty poświęcimy mediom społecznościowym, które wykorzystują tak zwane algorytmy polecające do tworzenia przewijanych spersonalizowanych „feedów” z proponowanymi materiałami. To również AI wychwytuje łamiącą regulamin zawartość, która następnie jest usuwana; ten proces nazywamy moderacją treści. My skupimy się głównie na oddelegowanej do tego zadania sztucznej inteligencji i pokrótce omówimy temat algorytmów polecających. Postaramy się odpowiedzieć na zasadnicze pytanie, czy AI naprawdę może (jak częstokroć przekonują firmy technologiczne) oczyścić media społecznościowe ze szkodliwych treści – jak mowa nienawiści – bez szkody dla wolności słowa.
W dyskusji dotyczącej tego zagadnienia zwykle podnoszona jest kwestia nieuchronnych pomyłek, jak choćby sytuacji, gdy dana treść zostanie omyłkowo uznana za niedopuszczalną i niesłusznie usunięta. Ale nawet jeśli takie błędy zostaną wyeliminowane, pozostaje jeszcze fundamentalny problem platform społecznościowych regulujących we własnym zakresie zasady dyskursu przy minimalnej odpowiedzialności własnej. Nie wypracowaliśmy demokratycznej procedury regulacji treści dostępnych w Internecie i nie znaleźliśmy złotego środka między wolnością słowa a bezpieczeństwem. I dlatego AI pozostanie bezradna wobec naszej frustracji związanej z treściami dostępnymi w mediach społecznościowych.
Na ilustracji 1.2 moderację w wykonaniu AI umieściliśmy w samym środku wykresu. Sztuczna inteligencja sprawdziła się na tym polu wystarczająco dobrze, aby dostawcy mediów społecznościowych na stałe włączyli ją do katalogu swoich narzędzi, lecz nader często i niezgodnie z prawdą przedstawiają AI jako opcję pozwalającą uniknąć wszechobecnych dylematów moralnych i politycznych. A to nie jest prawda. Co się tyczy szkodliwości takiego rozwiązania, to nikt nie podważa stwierdzenia, że moderacja treści wielokrotnie zawodziła, wskutek czego przyczyniła się do wybuchów aktów przemocy. Będziemy się jednak upierać, że problem nie leży po stronie technologii, ale faktu przekazania kontroli nad cyfrową wersją agory podmiotom prywatnym nijak nieponoszącym odpowiedzialności za swoje działania.
Trzy główne rodzaje sztucznej inteligencji, którymi zajmiemy się w naszej książce, to: predykcyjna AI, generatywna AI oraz AI moderująca treści. Ale jest ich więcej. Jak już wspomnieliśmy, AI ma wiele innych zastosowań – w tym również działających w sposób efektywny i powszechnie niedoceniany, jak autouzupełnianie czy sprawdzanie pisowni. Dodajmy do tego robotykę i samochody autonomiczne, dwa tematy warte szerszej dyskusji, które zdecydowaliśmy się pominąć, ponieważ nie oddziałują na społeczeństwo w równym stopniu, co zastosowania, na których skupiliśmy naszą uwagę. Niemniej zapoznawszy się z przedstawionymi w książce definicjami, czytelnik będzie mógł samodzielnie ocenić, która AI raczej zadziała, a która składa złudne obietnice.
W rozdziale siódmym zastanowimy się, dlaczego w przestrzeni publicznej funkcjonuje tak wiele mitów dotyczących sztucznej inteligencji. Firmy nie dość, że robią dużo zamieszania wokół swoich produktów, to jeszcze wykorzystują niebotyczne zasoby i wpływy, aby osłabić skuteczność środowiska naukowego i mediów jako przeciwwagi dla tez skrojonych pod korporacyjny interes. Uczciwie mówiąc, naukowcy równie często występują w charakterze głosu rozsądku, co windują nierealistyczne oczekiwania AI. Specjaliści z wielu dziedzin bazujący na wadliwych badaniach, których rezultatów nie udało się powtórzyć, doszli do tego samego błędnego wniosku: że na ich polu zainteresowań sztuczna inteligencja osiągnęła wysoki poziom precyzji. Jednym z przykładów, któremu poświęcimy więcej uwagi, będzie sztuka przewidywania wojen domowych. Choć prawdą jest, że obarczone błędem badania z użyciem AI nie skutkują wprowadzeniem niedziałających produktów na rynek – i dlatego na ilustracji 1.2 ta kategoria przewidywania wojen domowych znalazła się w lewym górnym rogu – takie zastosowanie AI cechują szkodliwość i marnotrawstwo, gdyż opinia publiczna jest wiedziona na manowce. Przyjrzymy się również mediom i sposobom, na jakie świat dziennikarski – świadomie lub nie – przyczynia się do sztucznego podsycania entuzjazmu wobec AI, oraz nauczymy czytelników sztuki dystansowania się od wiadomości prasowych.
W ostatnim rozdziale zastanowimy się, co należy zmienić, i wskażemy trzy główne ścieżki dalszego rozwoju. Po pierwsze należy ustanowić zasady, którymi firmy będą się kierować w trakcie prac nad swoimi produktami, a także w ich marketingu. Uważamy, że ciężar przygotowania tych regulacji powinien spocząć w przeważającej mierze na państwie, przy jednoczesnym zastrzeżeniu, że przepisy nie mogą być przesadnie restrykcyjne. Po drugie musimy odpowiedzieć sobie na pytanie, w jaki sposób zintegrujemy AI z codziennym funkcjonowaniem społecznym. Na przykład jaką rolę sztuczna inteligencja ma odgrywać w edukacji oraz w życiu dzieci? W kwestii rynku pracy: czy AI zastąpi pracowników, czy zostanie wykorzystana wyłącznie w charakterze pomocnego narzędzia? Z naszej perspektywy wiele pytań o AI dotyczy kwestii społecznych i politycznych, nie zaś nieuchronnych konsekwencji wprowadzenia nowych technologii.
Trzecia sugerowana przez nas ścieżka postępowania dotyczy nie tyle istnienia gruszek na wierzbie obiecywanych przez AI, ile zapotrzebowania na nie. Wykażemy, że historia lubi się powtarzać, a złudne obietnice nadal brzmią kusząco dla ludzi, którzy z racji poważnych problemów zawodowych desperacko szukają na nie szybkiego remedium. Na przykład nauczyciele, już wcześniej uskarżający się na nadmiar obowiązków, z oburzeniem zareagowali na korzystanie przez uczniów z AI przy pisaniu prac domowych. Kiedy wyszło na jaw, że kadra nauczycielska nie zdoła zmodyfikować metod nauczania oraz oceniania na potrzeby nowej rzeczywistości, sięgnięto po oprogramowanie sprawdzające oryginalność treści. Problem polega na tym, że wyszukiwarki plagiatów nie spełniają swojego zadania, a posiłkowanie się nimi skutkowało falą błędnych oskarżeń o stosowanie nieuczciwych praktyk, co nierzadko miało katastrofalne konsekwencje dla uczniów.
Lepsza sztuczna inteligencja w niczym tu nie pomoże. Paradoksalnie obietnice bez pokrycia dotyczące AI działają tu na naszą korzyść, bo wydobywają na światło dzienne fundamentalne problemy dotychczas ukryte przed naszym wzrokiem. Udowodnimy również, że lęk przed AI, zwłaszcza przed jej implementacją na rynku pracy, wynika z realiów kapitalizmu. Dlatego musimy się czym prędzej porozumieć na płaszczyźnie wzmocnienia istniejących mechanizmów ochronnych pracowników i wprowadzić dodatkowe środki, które uchronią rynek przed wstrząsem towarzyszącym błyskawicznemu postępowi technologicznemu, a zarazem pozwolą nam się cieszyć jego owocami.
Liczymy, że uda nam się trafić w gusta trzech grup czytelników. Pierwsza to osoby, które chcą zrozumieć, co się wokół nich dzieje. Zastanawiają się, czy nagłówki gazet mówią prawdę i AI faktycznie potrafi przewidzieć trzęsienie ziemi albo zdać egzamin adwokacki. A jeśli tak, to jak jest to możliwe? Które zawody przetrwają najbliższe dwie dekady? Jak będzie wyglądać życie naszych dzieci?
Nie będziemy próbować zaspokoić głodu wiedzy filozoficznymi dywagacjami nad istotą człowieczeństwa w epoce AI. Każda rozsądna osoba znajdzie własną odpowiedź na pytanie, czy żyjemy w przełomowym momencie historii, czy raczej obserwujemy kolejny etap automatyzacji. My wyposażymy czytelników w praktyczną wiedzę na temat tego, co się dzieje za kulisami.
Do drugiej grupy zaliczają się ludzie, których zainteresowanie AI wzięło się z konieczności wdrożenia sztucznej inteligencji w miejscu pracy. Liczymy, że z naszej książki te osoby dowiedzą się, które rodzaje AI działają, a które nie – oraz gdzie tkwi haczyk. Od zarania badań nad sztuczną inteligencją informatycy próbowali sklasyfikować zadania, które dla AI są „łatwe” bądź „trudne”. Wraz z rozwojem technologii okazywało się jednak, że daleko idące uogólnienia nie mają racji bytu. My zdecydowaliśmy się potraktować każdy rodzaj AI w sposób indywidualny.
I wreszcie trzecia grupa odbiorców to osoby, które chcą lepiej poznać AI, aby stawić opór niesprawiedliwości czynionej pod sztandarem sztucznej inteligencji. Aktywiści walczący o interes publiczny sformowali sprawnie działające struktury przeciwstawiające się szkodliwemu wpływowi predykcyjnej AI. Ale w przypadku generatywnej sztucznej inteligencji fronty sporu dopiero się formują. Jeśli firmy rozwijające tę technologię zrealizują swój cel i dojdzie do transformacji gospodarki, to najprawdopodobniej ucierpią na tym pracownicy – i nie musi się to wiązać z masowymi zwolnieniami. Rozwój generatywnej sztucznej inteligencji jest uzależniony od harówki marnie opłacanych, niewidocznych dla nas pracowników tworzących bazy danych do szkolenia AI oraz od pozyskiwanych bezpośrednio z Internetu treści tworzonych przez pisarzy, artystów i fotografów, o których wkładzie firmy z sektora AI nawet się nie zająkną – nie wspominając o rekompensacie.
U zarania rewolucji przemysłowej w fabrykach i kopalniach w koszmarnych warunkach pracowały miliony ludzi. Musiało minąć kilkadziesiąt lat, zanim doczekali się oni ochrony prawnej – także w zakresie bezpieczeństwa pracy – i godziwego wynagrodzenia. Również dzisiaj funkcjonuje ruch, który w obliczu postępującej automatyzacji dąży do zapewnienia odpowiednich praw pracowniczych, ochrony ludzkiej kreatywności i godności49. Nie sposób powiedzieć, czy odniesie sukces. To już zależy od nas wszystkich.
Na sam koniec krótka uwaga do wykładowców i studentów sięgających po naszą książkę w ramach zajęć: na stronie AISnakeOil.com udostępniamy pomysły na eksperymenty oraz materiały pedagogiczne50.
* Ten przykład, jak wiele innych, do których odwołujemy się w książce, dotyczy Stanów Zjednoczonych, gdzie żyjemy i pracujemy. Wnioski z nich wywiedzione mają jednak charakter globalny.
*** Massachusetts Institute of Technology – amerykańska uczelnia niepubliczna, politechnika o statusie uniwersyteckim (przyp. tłum.).
*** Zbiór i synteza badań dotyczących konkretnego zagadnienia (przyp. tłum.).
**** Widoczne na grafice określenie snake oil, którego autorzy książki używają w odniesieniu do AI, oznacza „olej z węża”. Do powiązania go ze sprzedawcami panaceów na wszelkie dolegliwości przyczynił się widoczny na reklamie Clark Stanley, któremu sekrety „oleju z węża” miał przekazać szaman z plemienia Hopi. Analiza składu specyfiku sprzedawanego przez Stanleya wykazała, że zawiera on olej mineralny, tłuszcz z wołowiny, kapsaicynę z chili oraz terpentynę (przyp. tłum.).
***** System wysokiego wpływu to taki system, który w znaczącym stopniu oddziałuje na sfery życia, jak prawo, zdrowie i samopoczucie (zarówno indywidualne, jak i zbiorowe) czy gospodarka (przyp. tłum.).
