-
nowość
-
promocja
Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę - ebook
Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę - ebook
Dla większości z nas statystyka jest poddziedziną matematyki związaną z opracowywaniem teoretycznych podstaw prawdopodobieństwa i wnioskowania statystycznego. Analitycy danych podchodzą do tego inaczej: dla nich statystyka jest niezbędnym zestawem narzędzi i praktyk, które służą do pracy z danymi, odpowiadania na pytania i ułatwiają podejmowanie najlepszych decyzji.
To trzecie wydanie przewodnika cenionego przez analityków danych, inżynierów oprogramowania i pasjonatów danologii. Dzięki niemu szybko nauczysz się korzystać z bibliotek NumPy, SciPy i Pandas. Poznasz różne metody eksploracji i wizualizacji danych, odkrywania zależności i trendów, a także prezentowania wyników. Struktura książki odpowiada rzeczywistemu procesowi pracy ze zbiorem danych: od importowania i oczyszczenia, przez analizę wieloczynnikową, aż po wizualizację uzyskanych wyników. Wszystkie rozdziały są dostępne w formie notatników Jupytera, dzięki czemu możesz jednocześnie czytać tekst, uruchamiać kod i pracować nad ćwiczeniami.
W książce znajdziesz również takie zagadnienia jak:
- analiza rozkładów danych i wizualizacja wzorców za pomocą bibliotek Pythona
- korzystanie z modeli regresji
- analiza szeregów czasowych i analiza przeżycia
- tworzenie zrozumiałych wizualizacji danych
- rozwiązywanie typowych problemów związanych z analizą danych
Jeśli chcesz się szybko nauczyć statystyki i stosowania jej w praktyce, to ta książka jest dla Ciebie!
Zachary del Rosario, adiunkt w Olin College of Engineering
Spis treści
Przedmowa
1. Eksploracyjna analiza danych
- Dowody
- Badania NSFG
- Wczytywanie danych
- Sprawdzanie poprawności
- Transformacja
- Statystyki podsumowujące
- Interpretacja
- Słowniczek
- Ćwiczenia
2. Rozkłady
- Tabele częstości
- Rozkłady danych z badań NSFG
- Wartości odstające
- Pierwsze dzieci
- Wielkość efektu
- Prezentacja wyników
- Słowniczek
- Ćwiczenia
3. Funkcje masy prawdopodobieństwa
- Funkcje masy prawdopodobieństwa
- Generowanie podsumowań dotyczących obiektu Pmf
- Paradoks wielkości grup
- Dane z badań NSFG
- Inne formy wizualizacji
- Słowniczek
- Ćwiczenia
4. Dystrybuanta
- Percentyle i wyniki centylowe
- Dystrybuanty
- Porównywanie dystrybuant
- Statystyki oparte na percentylach
- Liczby losowe
- Słowniczek
- Ćwiczenia
5. Modelowanie rozkładów prawdopodobieństwa
- Rozkład dwumianowy
- Rozkład Poissona
- Rozkład wykładniczy
- Rozkład normalny
- Rozkład logarytmicznie normalny
- Po co tworzyć modele?
- Słowniczek
- Ćwiczenia
6. Funkcje gęstości prawdopodobieństwa
- Porównywanie rozkładów
- Funkcja gęstości prawdopodobieństwa
- Funkcja gęstości prawdopodobieństwa dla rozkładu wykładniczego
- Porównanie funkcji masy prawdopodobieństwa i funkcji gęstości prawdopodobieństwa
- Estymacja jądrowa gęstości
- Model reprezentacji rozkładów
- Słowniczek
- Ćwiczenia
7. Zależności między zmiennymi
- Wykresy punktowe
- Wykresy decylowe
- Korelacja
- Siła korelacji
- Korelacja rangowa
- Korelacja i przyczynowość
- Słowniczek
- Ćwiczenia
8. Szacowanie
- Ważenie pingwinów
- Odporność
- Szacowanie wariancji
- Rozkłady próbkowania
- Błąd standardowy
- Przedziały ufności
- Źródła błędów
- Słowniczek
- Ćwiczenia
9. Testowanie hipotez
- Rzuty monetą
- Testowanie różnicy średnich
- Inne statystyki testowe
- Badanie korelacji
- Testy proporcji
- Słowniczek
- Ćwiczenia
10. Metoda najmniejszych kwadratów
- Metoda najmniejszych kwadratów
- Współczynnik determinacji
- Minimalizowanie błędu średniokwadratowego
- Szacowanie
- Wizualizowanie niepewności
- Przekształcenia
- Słowniczek
- Ćwiczenia
11. Regresja wieloraka
- StatsModels
- Regresja wieloraka
- Zmienne kontrolne
- Zależności nieliniowe
- Regresja logistyczna
- Słowniczek
- Ćwiczenia
12. Analiza szeregów czasowych
- Energia elektryczna
- Dekompozycja danych
- Predykcje
- Model multiplikatywny
- Autoregresja
- Średnia ruchoma
- Retrodykcje z wykorzystaniem autoregresji
- ARIMA
- Generowanie predykcji z wykorzystaniem funkcji ARIMA
- Słowniczek
- Ćwiczenia
13. Analiza przeżycia
- Funkcje przeżycia
- Funkcja hazardu
- Dane o stanie cywilnym
- Bootstrapping z wagami
- Szacowanie funkcji hazardu
- Szacowanie funkcji przeżycia
- Pakiet lifelines
- Przedziały ufności
- Przewidywany pozostały czas do zdarzenia
- Słowniczek
- Ćwiczenia
14. Metody analityczne
- Wykresy prawdopodobieństwa normalnego
- Rozkłady normalne
- Rozkład średnich z prób
- Rozkład różnic
- Centralne twierdzenie graniczne
- Ograniczenia centralnego twierdzenia granicznego
- Zastosowanie centralnego twierdzenia granicznego
- Test korelacji
- Test chi-kwadrat
- Informatyka i analiza algorytmów
- Słowniczek
- Ćwiczenia
| Kategoria: | Bazy danych |
| Zabezpieczenie: |
Watermark
|
| ISBN: | 978-83-289-3114-5 |
| Rozmiar pliku: | 14 MB |