Spark Zaawansowana analiza danych - Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills - książka

Spark Zaawansowana analiza danych książka papierowa

Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

0,0

Dostawa: od 6,99 zł (darmowa dostawa z abonamentem Legimi dla zakupu od 50,00 zł)

Czas wysyłki: 1-2 dni robocze + czas dostawy

Z uwagi na problemy techniczne po stronie dystrybutora, niemożliwe jest zamawianie obecnie książek papierowych. Za utrudnienia przepraszamy.


-50%
Zbieraj punkty w Klubie Mola Książkowego i kupuj ebooki, audiobooki oraz książki papierowe do 50% taniej.
Dowiedz się więcej.
Opis

Analiza ogromnych zbiorów danych nie musi być wolna!
Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

Przykłady prezetnowane w książce obejmują:

Rekomendowanie muzyki i dane Audioscrobbler
Prognozowanie zalesienia za pomocą drzewa decyzyjnego
Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
Wikipedia i ukryta analiza semantyczna
Analiza sieci współwystępowań za pomocą biblioteki GraphX
Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
Analiza danych genomicznych i projekt BDG
Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

Poznaj potencjał i wydajność Apache Spark!

Liczba stron: 240

Rok wydania: 2015

Format (wymiary): 23.8x16.9

ISBN: 9788328314610

Oceny
0,0
0
0
0
0
0
Więcej informacji
Więcej informacji
Legimi nie weryfikuje, czy opinie pochodzą od konsumentów, którzy nabyli lub czytali/słuchali daną pozycję, ale usuwa fałszywe opinie, jeśli je wykryje.