Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej - ebook
Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej - ebook
Wnioskowanie przyczynowe przydaje się w sytuacji, gdy trzeba określić wpływ decyzji biznesowej na konkretny wynik, na przykład wielkość sprzedaży. Działania te są dobrze znane nauce, ale dopiero od niedawna świat poznaje korzyści z ich zastosowania w branży technologicznej. Przyczyniły się do tego postępy w uczeniu maszynowym, automatyzacji procesów i danologii. Teraz, aby uzyskać wymierne korzyści, wystarczy kilka wierszy kodu w Pythonie.
Poznaj narzędzia najbardziej znanych analityków danych korzystających z Pythona!
prof. Nick Huntington-Klein, autor The Effect: An Introduction to Research Design and Causality
Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej.
W książce między innymi:
- podstawy wnioskowania przyczynowego
- problemy biznesowe jako zagadnienia z obszaru wnioskowania przyczynowego
- eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania
- badanie błędu systematycznego
- modele graficzne i wizualizacja związków przyczynowych
Najlepsza książka poświęcona najnowocześniejszym metodom, działaniu na rzeczywistych danych i rozwiązywaniu praktycznych problemów!
Sean J. Taylor, główny badacz w Motif Analytics
Spis treści
Przedmowa
Część I. Podstawy
- 1. Wprowadzenie do wnioskowania przyczynowego
- Czym jest wnioskowanie przyczynowe?
- Po co stosować wnioskowanie przyczynowe?
- Uczenie maszynowe i wnioskowanie przyczynowe
- Asocjacja a związek przyczynowy
- Oddziaływanie i wynik
- Podstawowy problem z wnioskowaniem przyczynowym
- Modele przyczynowe
- Interwencje
- Indywidualny efekt oddziaływania
- Wyniki potencjalne
- Spójność i stabilna wartość oddziaływania jednostkowego
- Interesujące wartości przyczynowe
- Wartości przyczynowe - przykład
- Błąd systematyczny
- Wzór na błąd systematyczny
- Wizualny przewodnik po błędzie systematycznym
- Identyfikowanie efektu oddziaływania
- Założenie o niezależności
- Identyfikacja przy randomizacji
- Najważniejsze zagadnienia
- 2. Eksperymenty z randomizacją i przegląd elementów statystyki
- "Siłowe" zapewnianie niezależności za pomocą randomizacji
- Przykładowy test A/B
- Idealny eksperyment
- Najbardziej niebezpieczne równanie
- Błąd standardowy szacunków
- Przedziały ufności
- Testowanie hipotez
- Hipoteza zerowa
- Statystyki testowe
- Wartości p
- Moc testu
- Obliczanie wielkości próby
- Najważniejsze zagadnienia
- 3. Graficzne modele przyczynowe
- Myślenie o przyczynowości
- Wizualizacja związków przyczynowych
- Czy konsultanci są warci swojej ceny?
- Błyskawiczny kurs z zakresu modeli graficznych
- Łańcuchy
- Rozgałęzienia
- Kolider
- Ściąga dotycząca przepływu asocjacji
- Tworzenie zapytań dotyczących grafu w Pythonie
- Jeszcze o identyfikacji
- Założenie o warunkowej niezależności i formuła korygująca
- Założenie o dodatniości prawdopodobieństwa
- Przykład identyfikacji na podstawie danych
- Błąd spowodowany zmiennymi zakłócającymi
- Zastępcze zmienne zakłócające
- Jeszcze o randomizacji
- Błąd doboru
- Warunki dotyczące kolidera
- Korygowanie błędu doboru
- Warunek dotyczący mediatora
- Najważniejsze zagadnienia
- Myślenie o przyczynowości
Część II. Uwzględnianie błędu systematycznego
- 4. Zaskakująca skuteczność regresji liniowej
- Potrzebujesz tylko regresji liniowej
- Dlaczego potrzebujemy modeli?
- Regresja w testach A/B
- Korygowanie za pomocą regresji
- Teoria regresji
- Regresja liniowa pojedynczej zmiennej
- Wielozmiennowa regresja liniowa
- Twierdzenie Frischa-Waugha-Lovella i ortogonalizacja
- Etap eliminowania błędu systematycznego
- Etap eliminowania szumu
- Błąd standardowy estymatora regresji
- Ostateczny model wyników
- Podsumowanie na temat twierdzenia FWL
- Regresja jako model wyników
- Dodatniość prawdopodobieństwa i ekstrapolacja
- Nieliniowość w regresji liniowej
- Linearyzacja oddziaływania
- Nieliniowe twierdzenie FWL i eliminowanie błędu systematycznego
- Regresja z użyciem zmiennych zastępczych
- Eksperymenty warunkowo losowe
- Zmienne zastępcze
- Nasycony model regresji
- Regresja jako średnia ważona wariancją
- Odejmowanie średniej i efekty stałe
- Błąd systematyczny spowodowany pominiętą zmienną - zmienne zakłócające w kontekście regresji
- Neutralne zmienne kontrolne
- Zmienne kontrolne powodujące szum
- Dobór cech: kompromis między błędem systematycznym a wariancją
- Najważniejsze zagadnienia
- Potrzebujesz tylko regresji liniowej
- 5. Wskaźnik skłonności
- Wpływ szkoleń menedżerskich
- Uwzględnianie zmiennych za pomocą regresji
- Wskaźnik skłonności
- Szacowanie wskaźnika skłonności
- Wynik skłonności i ortogonalizacja
- Technika PSM
- Wagi będące odwrotnością wskaźnika skłonności
- Wariancja w metodzie IPW
- Stabilizowane wagi oparte na wskaźniku skłonności
- Pseudopopulacje
- Błąd doboru
- Kompromis między błędem systematycznym a wariancją
- Dodatniość prawdopodobieństwa
- Identyfikacja oparta na projekcie a identyfikacja oparta na modelu
- Podwójnie odporna estymacja
- Oddziaływanie łatwe do modelowania
- Wynik łatwy do modelowania
- Uogólniony wskaźnik skłonności dla oddziaływania ciągłego
- Najważniejsze zagadnienia
Część III. Niejednorodność efektu i personalizacja
- 6. Niejednorodność efektu
- Od ATE do CATE
- Dlaczego predykcje nie są rozwiązaniem
- Obliczanie wartości CATE za pomocą regresji
- Ocena predykcji wartości CATE
- Ocena efektu na podstawie kwantyla z modelu
- Skumulowany efekt
- Skumulowany wzrost
- Transformacja celu
- Kiedy modele predykcyjne są dobre w porządkowaniu efektów?
- Krańcowo malejące zwroty
- Wyniki binarne
- Wykorzystanie wartości CATE do podejmowania decyzji
- Najważniejsze zagadnienia
- 7. Systemy metauczące
- Systemy metauczące dla oddziaływania dyskretnego
- T-learner
- X-learner
- Systemy metauczące dla oddziaływania ciągłego
- S-learner
- Podejście DDML
- Najważniejsze zagadnienia
- Systemy metauczące dla oddziaływania dyskretnego
Część IV. Dane panelowe
- 8. Metoda różnicy w różnicach
- Dane panelowe
- Kanoniczna postać metody różnicy w różnicach
- Różnica w różnicach ze wzrostem wyniku
- Obliczanie różnicy w różnicach na podstawie błędu średniokwadratowego
- Różnica w różnicach z efektami stałymi
- Wiele przedziałów czasowych
- Wnioskowanie
- Założenia związane z identyfikacją
- Trendy równoległe
- Założenie o braku antycypacji i założenie o stabilnej wartości jednostki oddziaływania
- Ścisła egzogeniczność
- Brak czynników zakłócających zmiennych w czasie
- Brak sprzężenia zwrotnego
- Brak efektu przeniesienia i brak przesuniętej w czasie zmiennej zależnej
- Dynamika efektu w czasie
- Metoda różnicy w różnicach ze zmiennymi towarzyszącymi
- Podwójnie odporna wersja metody różnicy w różnicach
- Model oparty na wskaźniku skłonności
- Model zmiany wyników
- Łączenie wszystkich elementów
- Stopniowe wprowadzanie oddziaływania
- Niejednorodność efektu w czasie
- Zmienne towarzyszące
- Najważniejsze zagadnienia
- 9. Metoda syntetycznej kontroli
- Zestaw danych dotyczących marketingu internetowego
- Reprezentacja macierzowa
- Metoda kontroli syntetycznej jako regresja pozioma
- Kanoniczna wersja metody kontroli syntetycznej
- Metoda kontroli syntetycznej ze zmiennymi towarzyszącymi
- Eliminowanie błędu systematycznego w metodzie kontroli syntetycznej
- Wnioskowanie
- Metoda syntetycznej różnicy w różnicach
- Jeszcze o metodzie różnicy w różnicach
- Jeszcze o metodzie syntetycznej kontroli
- Szacowanie wag związanych z czasem
- Metoda syntetycznej kontroli i metoda różnicy w różnicach
- Najważniejsze zagadnienia
Część V. Inne projekty eksperymentów
- 10. Eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania
- Eksperymenty geograficzne
- Projektowanie z syntetyczną grupą kontrolną
- Próba z losową grupą jednostek poddanych oddziaływaniu
- Wyszukiwanie losowe
- Eksperyment z przełączaniem oddziaływania
- Potencjalne wyniki dla sekwencji
- Szacowanie stopnia efektu przeniesienia
- Szacowanie oparte na projekcie
- Optymalny projekt eksperymentów z przełączaniem oddziaływania
- Odporna wariancja
- Najważniejsze zagadnienia
- 11. Niezgodność ze schematem przydziału oddziaływania i zmienne instrumentalne
- Niezgodność
- Rozszerzanie notacji potencjalnych wyników
- Założenia związane z identyfikacją zmiennych instrumentalnych
- Pierwszy etap
- Postać zredukowana
- Dwuetapowa metoda najmniejszych kwadratów
- Błąd standardowy
- Dodatkowe zmienne kontrolne i instrumentalne
- Ręczne stosowanie dwuetapowej metody najmniejszych kwadratów
- Implementacja macierzowa
- Projekt z nieciągłością
- Założenia w projekcie z nieciągłością
- Efekt zamiaru oddziaływania
- Oszacowanie zmiennej instrumentalnej
- Skupiska wartości
- Najważniejsze zagadnienia
- 12. Dalsze kroki
- Odkrywanie relacji przyczynowych
- Sekwencyjne podejmowanie decyzji
- Przyczynowe uczenie ze wzmacnianiem
- Prognozowanie przyczynowe
- Adaptacja domeny
- Uwagi końcowe
Skorowidz
Kategoria: | Programowanie |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-289-0882-6 |
Rozmiar pliku: | 24 MB |