Facebook - konwersja
Darmowy fragment

  • nowość
  • promocja

Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę - ebook

Wydawnictwo:
Tłumacz:
Format:
PDF
Data wydania:
10 listopada 2025
7565 pkt
punktów Virtualo

Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę - ebook

Dla większości z nas statystyka jest poddziedziną matematyki związaną z opracowywaniem teoretycznych podstaw prawdopodobieństwa i wnioskowania statystycznego. Analitycy danych podchodzą do tego inaczej: dla nich statystyka jest niezbędnym zestawem narzędzi i praktyk, które służą do pracy z danymi, odpowiadania na pytania i ułatwiają podejmowanie najlepszych decyzji.

To trzecie wydanie przewodnika cenionego przez analityków danych, inżynierów oprogramowania i pasjonatów danologii. Dzięki niemu szybko nauczysz się korzystać z bibliotek NumPy, SciPy i Pandas. Poznasz różne metody eksploracji i wizualizacji danych, odkrywania zależności i trendów, a także prezentowania wyników. Struktura książki odpowiada rzeczywistemu procesowi pracy ze zbiorem danych: od importowania i oczyszczenia, przez analizę wieloczynnikową, aż po wizualizację uzyskanych wyników. Wszystkie rozdziały są dostępne w formie notatników Jupytera, dzięki czemu możesz jednocześnie czytać tekst, uruchamiać kod i pracować nad ćwiczeniami.

W książce znajdziesz również takie zagadnienia jak:

  • analiza rozkładów danych i wizualizacja wzorców za pomocą bibliotek Pythona
  • korzystanie z modeli regresji
  • analiza szeregów czasowych i analiza przeżycia
  • tworzenie zrozumiałych wizualizacji danych
  • rozwiązywanie typowych problemów związanych z analizą danych

Jeśli chcesz się szybko nauczyć statystyki i stosowania jej w praktyce, to ta książka jest dla Ciebie!

Zachary del Rosario, adiunkt w Olin College of Engineering

Spis treści

Przedmowa

1. Eksploracyjna analiza danych

  • Dowody
  • Badania NSFG
  • Wczytywanie danych
  • Sprawdzanie poprawności
  • Transformacja
  • Statystyki podsumowujące
  • Interpretacja
  • Słowniczek
  • Ćwiczenia

2. Rozkłady

  • Tabele częstości
  • Rozkłady danych z badań NSFG
  • Wartości odstające
  • Pierwsze dzieci
  • Wielkość efektu
  • Prezentacja wyników
  • Słowniczek
  • Ćwiczenia

3. Funkcje masy prawdopodobieństwa

  • Funkcje masy prawdopodobieństwa
  • Generowanie podsumowań dotyczących obiektu Pmf
  • Paradoks wielkości grup
  • Dane z badań NSFG
  • Inne formy wizualizacji
  • Słowniczek
  • Ćwiczenia

4. Dystrybuanta

  • Percentyle i wyniki centylowe
  • Dystrybuanty
  • Porównywanie dystrybuant
  • Statystyki oparte na percentylach
  • Liczby losowe
  • Słowniczek
  • Ćwiczenia

5. Modelowanie rozkładów prawdopodobieństwa

  • Rozkład dwumianowy
  • Rozkład Poissona
  • Rozkład wykładniczy
  • Rozkład normalny
  • Rozkład logarytmicznie normalny
  • Po co tworzyć modele?
  • Słowniczek
  • Ćwiczenia

6. Funkcje gęstości prawdopodobieństwa

  • Porównywanie rozkładów
  • Funkcja gęstości prawdopodobieństwa
  • Funkcja gęstości prawdopodobieństwa dla rozkładu wykładniczego
  • Porównanie funkcji masy prawdopodobieństwa i funkcji gęstości prawdopodobieństwa
  • Estymacja jądrowa gęstości
  • Model reprezentacji rozkładów
  • Słowniczek
  • Ćwiczenia

7. Zależności między zmiennymi

  • Wykresy punktowe
  • Wykresy decylowe
  • Korelacja
  • Siła korelacji
  • Korelacja rangowa
  • Korelacja i przyczynowość
  • Słowniczek
  • Ćwiczenia

8. Szacowanie

  • Ważenie pingwinów
  • Odporność
  • Szacowanie wariancji
  • Rozkłady próbkowania
  • Błąd standardowy
  • Przedziały ufności
  • Źródła błędów
  • Słowniczek
  • Ćwiczenia

9. Testowanie hipotez

  • Rzuty monetą
  • Testowanie różnicy średnich
  • Inne statystyki testowe
  • Badanie korelacji
  • Testy proporcji
  • Słowniczek
  • Ćwiczenia

10. Metoda najmniejszych kwadratów

  • Metoda najmniejszych kwadratów
  • Współczynnik determinacji
  • Minimalizowanie błędu średniokwadratowego
  • Szacowanie
  • Wizualizowanie niepewności
  • Przekształcenia
  • Słowniczek
  • Ćwiczenia

11. Regresja wieloraka

  • StatsModels
  • Regresja wieloraka
  • Zmienne kontrolne
  • Zależności nieliniowe
  • Regresja logistyczna
  • Słowniczek
  • Ćwiczenia

12. Analiza szeregów czasowych

  • Energia elektryczna
  • Dekompozycja danych
  • Predykcje
  • Model multiplikatywny
  • Autoregresja
  • Średnia ruchoma
  • Retrodykcje z wykorzystaniem autoregresji
  • ARIMA
  • Generowanie predykcji z wykorzystaniem funkcji ARIMA
  • Słowniczek
  • Ćwiczenia

13. Analiza przeżycia

  • Funkcje przeżycia
  • Funkcja hazardu
  • Dane o stanie cywilnym
  • Bootstrapping z wagami
  • Szacowanie funkcji hazardu
  • Szacowanie funkcji przeżycia
  • Pakiet lifelines
  • Przedziały ufności
  • Przewidywany pozostały czas do zdarzenia
  • Słowniczek
  • Ćwiczenia

14. Metody analityczne

  • Wykresy prawdopodobieństwa normalnego
  • Rozkłady normalne
  • Rozkład średnich z prób
  • Rozkład różnic
  • Centralne twierdzenie graniczne
  • Ograniczenia centralnego twierdzenia granicznego
  • Zastosowanie centralnego twierdzenia granicznego
  • Test korelacji
  • Test chi-kwadrat
  • Informatyka i analiza algorytmów
  • Słowniczek
  • Ćwiczenia
Kategoria: Bazy danych
Zabezpieczenie: Watermark
Watermark
Watermarkowanie polega na znakowaniu plików wewnątrz treści, dzięki czemu możliwe jest rozpoznanie unikatowej licencji transakcyjnej Użytkownika. E-książki zabezpieczone watermarkiem można odczytywać na wszystkich urządzeniach odtwarzających wybrany format (czytniki, tablety, smartfony). Nie ma również ograniczeń liczby licencji oraz istnieje możliwość swobodnego przenoszenia plików między urządzeniami. Pliki z watermarkiem są kompatybilne z popularnymi programami do odczytywania ebooków, jak np. Calibre oraz aplikacjami na urządzenia mobilne na takie platformy jak iOS oraz Android.
ISBN: 978-83-289-3114-5
Rozmiar pliku: 14 MB

BESTSELLERY

Menu

Zamknij