-
nowość
Analiza bayesowska w Pythonie. Praktyczny przewodnik po modelowaniu probabilistycznym - ebook
Analiza bayesowska w Pythonie. Praktyczny przewodnik po modelowaniu probabilistycznym - ebook
W ostatnich dekadach statystyka bayesowska zyskała ogromne znaczenie w nauce i inżynierii. Współczesna analiza bayesowska to w dużej mierze statystyka obliczeniowa elastyczna, przejrzysta i umożliwiająca intuicyjną interpretację wyników. Dzięki rozwojowi bibliotek języka Python koncepcje bayesowskie stały się praktycznym narzędziem do realizacji zaawansowanych scenariuszy analitycznych.
Książka stanowi kompleksowe wprowadzenie do stosowanego wnioskowania bayesowskiego i jego implementacji w Pythonie. Autor używa nowoczesnej biblioteki PyMC do programowania probabilistycznego, a ArviZ do analizy i diagnostyki modeli. Omawia także inne narzędzia ekosystemu bayesowskiego, takie jak Bambi, PreliZ i Kulprit. Zapoznasz się z zagadnieniami bayesowskich addytywnych drzew regresyjnych (BART), selekcji zmiennych, konstrukcji rozkładów a priori i porównywania modeli. Ponadto dowiesz się, jak budować, analizować i interpretować modele probabilistyczne w projektach z zakresu data science.
W książce między innymi:
- budowa modeli probabilistycznych z użyciem PyMC
- analiza i diagnostyka modeli w ArviZ
- modele hierarchiczne zalety i ograniczenia
- porównywanie modeli i wybór najlepszych rozwiązań
- interpretacja wyników w kontekście rzeczywistych problemów
- myślenie probabilistyczne w ujęciu bayesowskim
Książka stanowi kompleksowe, jasne i zwięzłe wprowadzenie do metod bayesowskich i biblioteki PyMC.
Christopher Fonnesbeck i Thomas Wiecki
Spis treści
Słowo wstępne
O autorze
O korektorze merytorycznym
Przedmowa
Rozdział 1. Myślenie probabilistyczne
- Statystyki, modele i podejście zastosowane w książce
- Praca z danymi
- Modelowanie bayesowskie
- Wprowadzenie do prawdopodobieństwa dla praktyków metod bayesowskich
- Przestrzeń prób i zdarzenia
- Zmienne losowe
- Dyskretne zmienne losowe i ich rozkłady
- Ciągłe zmienne losowe i ich rozkłady
- Dystrybuanta
- Prawdopodobieństwo warunkowe
- Wartości oczekiwane
- Twierdzenie Bayesa
- Interpretacja prawdopodobieństwa
- Prawdopodobieństwo, niepewność i logika
- Wnioskowanie dotyczącejednego parametru
- Problem rzutu monetą
- Wybór funkcji wiarygodności
- Wybór rozkładu a priori
- Wyznaczanie rozkładu a posteriori
- Wpływ rozkładu a priori
- Sposób wyboru rozkładów a priori
- Informowanie o wynikach analizy bayesowskiej
- Notacja modeli i wizualizacja
- Podsumowanie rozkładu a posteriori
- Podsumowanie
- Ćwiczenia
Rozdział 2. Programowanie probabilistyczne
- Programowanie probabilistyczne
- Rzucanie monetą w wariancie biblioteki PyMC
- Podsumowanie rozkładu a posteriori
- Decyzje oparte na rozkładzie a posteriori
- Stosunek gęstości Savage'a-Dickeya
- Przedział praktycznej równoważności
- Funkcje straty
- Rozkłady gaussowskie na każdym poziomie
- Wnioskowanie gaussowskie
- Kontrole predykcyjne rozkładu a posteriori
- Odporne wnioskowanie
- Stopnie normalności
- Wersja odporna modelu normalnego
- Kontener InferenceData
- Porównywanie grup
- Zbiór danych tips
- Współczynnik d Cohena
- Prawdopodobieństwo przewagi
- Analiza różnic średnich w rozkładzie a posteriori
- Podsumowanie
- Ćwiczenia
Rozdział 3. Modele hierarchiczne
- Udostępnianie informacji i rozkładów a priori
- Przesunięcia hierarchiczne
- Jakość wody
- Kurczenie
- Hierarchie na każdym poziomie
- Podsumowanie
- Ćwiczenia
Rozdział 4. Modelowanie za pomocą linii
- Prosta regresja liniowa
- Rowery w ujęciu liniowym
- Interpretacja średniej rozkładu a posteriori
- Interpretacja predykcji z rozkładu a posteriori
- Uogólnianie modelu liniowego
- Liczenie rowerów
- Regresja odporna
- Regresja logistyczna
- Model logistyczny
- Klasyfikacja z użyciem regresji logistycznej
- Interpretacja współczynników regresji logistycznej
- Wariancja zmiennej
- Hierarchiczna regresja liniowa
- Modele hierarchiczne scentrowane i niescentrowane
- Wieloraka regresja liniowa
- Podsumowanie
- Ćwiczenia
Rozdział 5. Porównywanie modeli
- Kontrole predykcyjne a posteriori
- Równowaga między prostotą a dokładnością
- Wiele parametrów może prowadzić do nadmiernego dopasowania
- Zbyt mała liczba parametrów prowadzi do niedopasowania
- Miary dokładności predykcyjnej
- Kryteria informacyjne
- Walidacja krzyżowa
- Obliczanie dokładności predykcyjnej za pomocą biblioteki ArviZ
- Uśrednianie modeli
- Współczynniki Bayesa
- Kilka spostrzeżeń
- Obliczanie współczynników Bayesa
- Współczynniki Bayesa i wnioskowanie
- Regularyzacja rozkładów a priori
- Podsumowanie
- Ćwiczenia
Rozdział 6. Modelowanie za pomocą interfejsu Bambi
- Jedna składnia, by wszystkim zarządzać
- Model rowerów w wersji opartej na interfejsie Bambi
- Regresja wielomianowa
- Funkcje sklejane
- Modele rozkładowe
- Predyktory kategoryczne
- Pingwiny kategoryczne
- Związek z modelami hierarchicznymi
- Interakcje
- Interpretacja modeli za pomocą interfejsu Bambi
- Selekcja zmiennych
- Wnioskowanie predykcyjne metodą projekcji
- Predykcja projekcyjna z użyciem pakietu Kulprit
- Podsumowanie
- Ćwiczenia
Rozdział 7. Modele mieszanin
- Modele mieszanin
- Skończone modele mieszanin
- Rozkład kategoryczny
- Rozkład Dirichleta
- Mieszanina chemiczna
- Nieidentyfikowalność modeli mieszanin
- Metoda wyboru liczby rozkładów K
- Modele z nadmiarem zer i modele progowe
- Regresja Poissona z nadmiarem zer
- Modele progowe
- Modele mieszanin i grupowanie
- Nieskończony model mieszaniny
- Proces Dirichleta
- Mieszaniny ciągłe
- Niektóre popularne rozkłady to mieszaniny
- Podsumowanie
- Ćwiczenia
Rozdział 8. Procesy gaussowskie
- Modele liniowe i dane nieliniowe
- Modelowanie funkcji
- Wielowymiarowe rozkłady Gaussa i funkcje
- Funkcje kowariancji i jądra
- Procesy gaussowskie
- Regresja procesów gaussowskich
- Regresja procesów gaussowskich z użyciem biblioteki PyMC
- Ustalanie rozkładów a priori dla skali długości
- Klasyfikacja z użyciem procesów gaussowskich
- Procesy gaussowskie w przypadku kosmicznej grypy
- Procesy Coxa
- Katastrofy w kopalniach węgla
- Sekwoje
- Regresja z autokorelacją przestrzenną
- Procesy gaussowskie w przestrzeniach Hilberta
- Proces HSGP w przypadku interfejsu Bambi
- Podsumowanie
- Ćwiczenia
Rozdział 9. Bayesowskie addytywne drzewa regresyjne
- Drzewa decyzyjne
- Modele BART
- Pingwiny bartiańskie
- Wykresy zależności cząstkowej
- Wykresy indywidualnej warunkowej wartości oczekiwanej
- Selekcja zmiennych z użyciem modelu BART
- Modele BART oparte na rozkładach
- Odpowiedź stała i liniowa
- Wybór liczby drzew
- Podsumowanie
- Ćwiczenia
Rozdział 10. Silniki wnioskowania
- Silniki wnioskowania
- Metoda siatki
- Metoda kwadratowa
- Metody oparte na procesach Markowa
- Monte Carlo
- Łańcuch Markowa
- Algorytm Metropolisa-Hastingsa
- Hamiltonowska metoda Monte Carlo
- Sekwencyjna metoda Monte Carlo
- Diagnozowanie próbek
- Zbieżność
- Wykres śladu
- Wykres rang
- R (statystyka R-hat)
- Efektywny rozmiar próby
- Błąd standardowy Monte Carlo
- Dywergencje
- Zachowaj spokój i nie poddawaj się
- Podsumowanie
- Ćwiczenia
Rozdział 11. Dalsze kierunki
Bibliografia
| Kategoria: | Programowanie |
| Zabezpieczenie: |
Watermark
|
| ISBN: | 978-83-289-3667-6 |
| Rozmiar pliku: | 14 MB |