Facebook - konwersja
Czytaj fragment
Pobierz fragment

Statystyka Bayesowska na wesoło - ebook

Data wydania:
1 stycznia 2020
Format ebooka:
EPUB
Format EPUB
czytaj
na czytniku
czytaj
na tablecie
czytaj
na smartfonie
Jeden z najpopularniejszych formatów e-booków na świecie. Niezwykle wygodny i przyjazny czytelnikom - w przeciwieństwie do formatu PDF umożliwia skalowanie czcionki, dzięki czemu możliwe jest dopasowanie jej wielkości do kroju i rozmiarów ekranu. Więcej informacji znajdziesz w dziale Pomoc.
Multiformat
E-booki w Virtualo.pl dostępne są w opcji multiformatu. Oznacza to, że po dokonaniu zakupu, e-book pojawi się na Twoim koncie we wszystkich formatach dostępnych aktualnie dla danego tytułu. Informacja o dostępności poszczególnych formatów znajduje się na karcie produktu.
, MOBI
Format MOBI
czytaj
na czytniku
czytaj
na tablecie
czytaj
na smartfonie
Jeden z najczęściej wybieranych formatów wśród czytelników e-booków. Możesz go odczytać na czytniku Kindle oraz na smartfonach i tabletach po zainstalowaniu specjalnej aplikacji. Więcej informacji znajdziesz w dziale Pomoc.
Multiformat
E-booki w Virtualo.pl dostępne są w opcji multiformatu. Oznacza to, że po dokonaniu zakupu, e-book pojawi się na Twoim koncie we wszystkich formatach dostępnych aktualnie dla danego tytułu. Informacja o dostępności poszczególnych formatów znajduje się na karcie produktu.
(2w1)
Multiformat
E-booki sprzedawane w księgarni Virtualo.pl dostępne są w opcji multiformatu - kupujesz treść, nie format. Po dodaniu e-booka do koszyka i dokonaniu płatności, e-book pojawi się na Twoim koncie w Mojej Bibliotece we wszystkich formatach dostępnych aktualnie dla danego tytułu. Informacja o dostępności poszczególnych formatów znajduje się na karcie produktu przy okładce. Uwaga: audiobooki nie są objęte opcją multiformatu.
czytaj
na tablecie
Aby odczytywać e-booki na swoim tablecie musisz zainstalować specjalną aplikację. W zależności od formatu e-booka oraz systemu operacyjnego, który jest zainstalowany na Twoim urządzeniu może to być np. Bluefire dla EPUBa lub aplikacja Kindle dla formatu MOBI.
Informacje na temat zabezpieczenia e-booka znajdziesz na karcie produktu w "Szczegółach na temat e-booka". Więcej informacji znajdziesz w dziale Pomoc.
czytaj
na czytniku
Czytanie na e-czytniku z ekranem e-ink jest bardzo wygodne i nie męczy wzroku. Pliki przystosowane do odczytywania na czytnikach to przede wszystkim EPUB (ten format możesz odczytać m.in. na czytnikach PocketBook) i MOBI (ten fromat możesz odczytać m.in. na czytnikach Kindle).
Informacje na temat zabezpieczenia e-booka znajdziesz na karcie produktu w "Szczegółach na temat e-booka". Więcej informacji znajdziesz w dziale Pomoc.
czytaj
na smartfonie
Aby odczytywać e-booki na swoim smartfonie musisz zainstalować specjalną aplikację. W zależności od formatu e-booka oraz systemu operacyjnego, który jest zainstalowany na Twoim urządzeniu może to być np. iBooks dla EPUBa lub aplikacja Kindle dla formatu MOBI.
Informacje na temat zabezpieczenia e-booka znajdziesz na karcie produktu w "Szczegółach na temat e-booka". Więcej informacji znajdziesz w dziale Pomoc.
Czytaj fragment
Pobierz fragment
74,00

Statystyka Bayesowska na wesoło - ebook

Ten zrozumiały elementarz pomoże Ci zrozumieć, jak używać metod Bayesowskich poprzez jasne wyjaśnienia i zabawne przykłady. Będziesz polował na UFO, aby zbadać codzienne rozumowanie, a także obliczysz czy Han Solo przeżyje podróż przez pole asteroid używając rozkładów prawdopodobieństwa.
Te zróżnicowane ćwiczenia pomogą Ci stworzyć elastyczny i rzetelny sposób myślenia, który przyda ci się w szerokim zakresie wyzwań, od prawdziwego i intuicyjnego zrozumienia aktualnych zdarzeń do radzenia sobie z codziennymi niespodziankami świata biznesu.
Nauczysz się jak:
• Obliczać rozkłady aby zobaczyć zakres swoich przekonań
• Porównywać hipotezy i wyciągać rzetelne wnioski
• Używać twierdzenia Bayesa i zrozumieć do czego może się ono przydać
• Znaleźć a posteriori, wiarogodność i a priori, aby sprawdzić dokładność swoich wniosków
• Używać języka programowania R do przeprowadzania analizy danych
Dokonuj lepszych wyborów z większą pewnością – i baw się przy tym dobrze! Przeczytaj Statystykę Bayesowską na wesoło, aby uzyskać jak największą wartość ze swoich danych.

Kategoria: Informatyka
Zabezpieczenie: Watermark
Watermark
Watermarkowanie polega na znakowaniu plików wewnątrz treści, dzięki czemu możliwe jest rozpoznanie unikatowej licencji transakcyjnej Użytkownika. E-książki zabezpieczone watermarkiem można odczytywać na wszystkich urządzeniach odtwarzających wybrany format (czytniki, tablety, smartfony). Nie ma również ograniczeń liczby licencji oraz istnieje możliwość swobodnego przenoszenia plików między urządzeniami. Pliki z watermarkiem są kompatybilne z popularnymi programami do odczytywania ebooków, jak np. Calibre oraz aplikacjami na urządzenia mobilne na takie platformy jak iOS oraz Android.
ISBN: 978-83-01-21353-4
Rozmiar pliku: 2,9 MB

FRAGMENT KSIĄŻKI

O autorze

Will Kurt pracuje aktualnie jako analityk danych w Wayfair, a samą statystykę bayesowską stosuje od ponad połowy dekady, aby rozwiązywać realne problemy biznesu. Regularnie zamieszcza wpisy o prawdopodobieństwie na swojej stronie internetowej, CountBayesie.com. Kurt jest autorem książki Get Programming with Haskell (Manning Publications) i mieszka w Bostonie, w Massachusetts.

O recenzencie technicznym

Chelsea Parlett-Pelleriti doktoryzuje się z informatyki i analizy danych i od dawna lubi wszystko, co wesołe i statystyczne. Pisze na zamówienie także artykuły dotyczące statystyki, wnosząc wkład w takie projekty, jak seria Crash Course Statistics na YouTube oraz Cracking the AP Statistics Exam wydany przez The Princeton Review. Aktualnie mieszka w Południowej Kalifornii.PODZIĘKOWANIA

Pisanie książki jest naprawdę niezwykłym wysiłkiem, który wymaga pracy wielu ludzi. Mimo że poniżej wymieniam wielu nazwisk, jest to tylko niewielka część spośród wszystkich osób, dzięki którym ta książka mogła powstać. Chciałbym zacząć od podziękowania mojemu synowi Archerowi za to, że zawsze mnie, inspirował i rozbudzał moją ciekawość.

Książki publikowane przez No Starch od dawna należały od moich ulubionych lektur i to prawdziwy zaszczyt pracować z tak fantastycznym zespołem nad tą książką. Składam ogromne podziękowania moim wydawcom, recenzentom i niesamowitemu zespołowi No Starch. Liz Chadwick jako pierwsza zaproponowała mi napisanie tej książki i zapewniła doskonałe wsparcie redakcyjne oraz kierowała całym procesem powstawania książki. Laurel Chun sprawiła, że cały proces, od paru bałaganiarskich skoroszytów w R począwszy, aż do pełnej książki, przebiegł niesamowicie gładko. Chelsea Parlett-Pelleriti dała z siebie o wiele więcej niż wymaga się od recenzenta technicznego i naprawdę pomogła sprawić, że ta książka jest najlepsza, jaka może być. Frances Saux dodał wiele wnikliwych komentarzy do późniejszych rozdziałów książki. I oczywiście dziękuję Billowi Pollockowi za stworzenie tak wspaniałej firmy wydawniczej.

Jako osoba robiąca licencjat z literatury angielskiej nigdy nie wyobrażałem sobie napisania książki na jakikolwiek temat matematyczny. Jest parę osób, które naprawdę pomogły mi zobaczyć cuda matematyki. Zawsze będę wdzięczny mojemu koledze ze studiów, z którym dzieliłem pokój, Gregowi Mullerowi – pokazał mi on, jak interesujący i ekscytujący może być świat matematyki. Profesor Anatoly Temkin z Uniwersytetu w Bostonie otworzył dla mnie drzwi do myślenia matematycznego poprzez nauczenie mnie, aby zawsze odpowiadać na pytanie „Co to znaczy?”. I oczywiście ogromne podziękowania dla Richarda Kelleya, który, gdy byłem na pustyni przez wiele lat, zapewniał oazę matematycznych wskazówek i rozmów. Nie mógłbym także zapomnieć o zespole data science w Bomborze, w szczególności o Patricku Kelleyu, który zadał tak wiele cudownych pytań i prowadził ze mną rozmowy, z których niektóre znalazły się w tej książce. Będę także dozgonnie wdzięczny czytelnikom mojego bloga Count Bayesie, którzy zawsze zadawali wspaniałe pytania i dzielili się ciekawymi spostrzeżeniami. Wśród tych czytelników, chciałbym specjalnie podziękować Nevinowi, który poprawił moje wstępne błędy myślowe.

Na koniec chcę przekazać moje podziękowania kilku naprawdę wspaniałym autorom książek w dziedzinie statystyki bayesowskiej, które pozwoliły mi zyskać wiedzę na ten temat. Doing Bayesian Data Analysis Johna Kruschka oraz Bayesian Data Analysis autorstwa Andrew Gelmana i in. są wielkimi książkami, które każdy powinien przeczytać. Największy wpływ na mój sposób myślenia miała fenomenalna książka E.T. Jaynesa, Probability Theory: The Logic of Science. Poza tym chciałbym dodać podziękowania Aubrey Clayton za stworzenie serii wykładów na temat tej wymagającej książki, które naprawdę pozwoliły mi jaśniej zrozumieć pewne rzeczy.WSTĘP

Praktycznie wszystko w życiu jest do pewnego stopnia niepewne. Może się to wydawać przesadą, ale aby zobaczyć prawdziwość tego stwierdzenia, możesz przeprowadzić szybki eksperyment. Na początku dnia napisz, co według ciebie się wydarzy w ciągu następnych trzydziestu minut, godziny, trzech oraz sześciu godzin. Następnie zobacz, jak wiele z tych rzeczy wydarzy się dokładnie tak, jak to sobie wyobraziłeś. Wtedy szybko zdasz sobie sprawę z tego, że twój dzień jest pełen niepewności. Nawet coś tak przewidywalnego jak „umyję zęby” czy „wypiję kawę” może, z takiego lub innego powodu, nie pójść tak, jak się spodziewałeś.

Z większością niepewności w życiu potrafimy całkiem nieźle sobie poradzić poprzez planowanie naszego dnia. Na przykład, mimo że z powodu porannych korków dojazd do pracy może będzie dłuższy niż zazwyczaj, jesteś w stanie całkiem dobrze oszacować, o której godzinie musisz wyjść z domu, aby dotrzeć na czas. Jeśli rano masz naprawdę ważne spotkanie, możesz wyjść wcześniej, aby pozwolić sobie na opóźnienia. Wszyscy mamy wrodzoną intuicję, jak radzić sobie z niepewnymi sytuacjami i jak rozumować w odniesieniu do niepewności. Gdy myślimy w ten sposób, zaczynamy myśleć probabilistycznie.

Po co uczyć się statystyki?

Temat tej książki, statystyka bayesowska, pomaga nam lepiej rozumować o niepewności, tak jak nauka logiki w szkole pozwala nam dostrzec błędy w codziennym rozumowaniu. Biorąc pod uwagę, że jak już wspomnieliśmy, praktycznie każdy spotyka się z niepewnością w swoim codziennym życiu, grupa potencjalnych czytelników tej książki jest całkiem szeroka. Analitycy danych i badacze, którzy już używają statystyki, skorzystają z głębszego zrozumienia i intuicji, jak te narzędzia działają. Inżynierowie i programiści nauczą się wiele o tym, jak używać metod ilościowych przy podejmowaniu decyzji zawodowych (zdarzyło mi się używać analizy bayesowskiej do znajdowania przyczyn błędów w oprogramowaniu!). Marketingowcy i sprzedawcy mogą stosować idee z tej książki podczas przeprowadzania testów A/B dla lepszego rozumienia swoich odbiorców i lepszej oceny wartości różnych okazji. Każdy, kto podejmuje decyzje na wysokim szczeblu, powinien mieć przynajmniej podstawowe poczucie, czym jest prawdopodobieństwo, aby móc szybko szacować koszty i zyski z różnych niepewnych decyzji. Chciałem, aby ta książka mogła być czymś, co prezesi zarządów mogą czytać podczas lotu i do czasu wylądowania zyskać dość solidne podstawy, by lepiej oceniać decyzje, które wiążą się z prawdopodobieństwem i niepewnością.

Szczerze wierzę, że każdy skorzysta z myślenia o problemach w sposób bayesowski. Korzystając ze statystyki bayesowskiej, możesz matematycznie modelować niepewność, aby podejmować lepsze decyzje przy ograniczonej ilości informacji. Załóżmy na przykład, że musisz być na czas na ważnym spotkaniu w pracy. Masz do wyboru dwie różne trasy. Pierwsza jest zazwyczaj szybsza, ale regularnie zdarzają się na niej korki, które powodują duże opóźnienia. Druga ogólnie zajmuje więcej czasu, ale jest mniej podatna na zakorkowanie. Którą trasę powinieneś wybrać? Jakiego typu informacje są ci potrzebne, aby podjąć decyzję? Jak pewny możesz być swojego wyboru? Nawet niewielka dodatkowa komplikacja wymaga dodatkowego namysłu i odpowiedniej techniki.

Zazwyczaj gdy ludzie myślą o statystyce, myślą o naukowcach pracujących nad nowymi lekami, ekonomistach obserwujących trendy na rynku, analitykach przewidujących wyniki następnych wyborów, menedżerach baseballu próbujących skompletować najlepszy zespół dzięki wyższej matematyce itd. Oczywiście są to wszystko wyjątkowo fascynujące zastosowania statystyki, ale rozumienie podstaw rozumowania bayesowskiego może pomóc w wielu innych, bardziej codziennych obszarach. Jeśli kiedykolwiek kwestionowałeś jakieś nowe odkrycia podawane w wiadomościach, siedziałeś w nocy, przeglądając Internet w poszukiwaniu odpowiedzi, czy masz rzadką chorobę, albo kłóciłeś się z krewnym o irracjonalne przekonania na temat świata, to statystyka bayesowska pozwoli ci lepiej rozumować.

Co to jest statystyka „bayesowska”?

Możesz się zastanawiać, co to znaczy, że coś jest „bayesowskie”. Jeśli kiedykolwiek uczyłeś się statystyki, prawdopodobnie była to statystyka częstościowa. Statystyka częstościowa opiera się na pomyśle, że prawdopodobieństwo reprezentuje częstość, z jaką coś się wydarza. Jeśli prawdopodobieństwo wypadnięcia orła w pojedynczym rzucie monetą wynosi 0,5, to znaczy, że po pojedynczym rzucie monetą możemy oczekiwać, że dostaniemy pół orła (a po dwóch rzutach możemy oczekiwać jednego orła, co ma więcej sensu).

Statystyka bayesowska dotyczy natomiast tego, jak prawdopodobieństwo reprezentuje naszą niepewność o danej informacji. W rozumieniu bayesowskim, jeśli prawdopodobieństwo wyrzucenia orła jest równe 0,5, to znaczy, że jesteśmy równie niepewni, czy wyrzucimy orła, czy reszkę. Dla problemów takich jak rzut monetą, zarówno podejście częstościowe, jak i bayesowskie wydaje się rozsądne, ale gdy zaczynasz określać ilościowo swoje przekonanie, że twój ulubiony kandydat wygra następne wybory, interpretacja bayesowska jest o wiele sensowniejsza. W końcu są tylko jedne wybory, więc mówienie o tym, jak często twój ulubiony kandydat wygrywa, nie ma większego sensu. Robiąc statystyki bayesowskie, staramy się dokładnie opisać to, w co wierzymy, posiadając dane informacje.

Szczególnie miłą rzeczą w statystyce bayesowskiej jest to, że ponieważ możemy postrzegać ją po prostu jako rozumowanie o niepewnych rzeczach, wszystkie narzędzia i techniki statystyki bayesowskiej mają intuicyjny sens.

Statystyka bayesowska mówi o tym, jak patrzeć na problem, z którym się mierzymy, jak go opisać matematycznie, a następnie, jak rozumować, aby go rozwiązać. Nie ma żadnych tajemniczych testów dających wyniki, których nie jesteśmy pewni, żadnych rozkładów do zapamiętania ani żadnych tradycyjnych projektów eksperymentów, które musisz idealnie powtórzyć. Niezależnie od tego, czy chcesz oszacować prawdopodobieństwo, że nowy wygląd strony internetowej przyniesie ci więcej klientów, czy tego, że twoja ulubiona drużyna sportowa wygra następny mecz, albo czy rzeczywiście jesteśmy samotni we wszechświecie, statystyka bayesowska pozwoli ci rozumować o tych rzeczach w sposób matematyczny przy użyciu zaledwie kilku prostych reguł i nowego spojrzenia na problemy.

Co jest w tej książce

Oto krótki przegląd tego, co znajdziesz w tej książce.

Część I: Wprowadzenie do prawdopodobieństwa

Rozdział 1: Myślenie bayesowskie i codzienne rozumowanie. Pierwszy rozdział wprowadza do myślenia bayesowskiego i pokazuje, jak jest ono podobne do codziennych metod krytycznego myślenia o danej sytuacji. Zgłębimy prawdopodobieństwo tego, że jasne światło za oknem w nocy to UFO, na podstawie tego, co już wiesz o świecie i w co wierzysz.

Rozdział 2: Mierzenie niepewności. W tym rozdziale wykorzystamy rzuty monetą, aby przypisywać konkretne wartości niepewności w formie prawdopodobieństw: liczb od 0 do 1, które reprezentują pewność w odniesieniu do swoich przekonań na zadany temat.

Rozdział 3: Logika niepewności. W logice używamy operatorów I, NIE oraz LUB, aby łączyć fakty, które są prawdziwe lub fałszywe. Okazuje się, że prawdopodobieństwo ma podobne ujęcie operatorów. Zbadamy, jak wnioskować o najlepszej metodzie transportu, aby dostać się na spotkanie, a także o szansach dostania mandatu.

Rozdział 4: Tworzenie dwumianowego rozkładu prawdopodobieństwa. Użycie zasad prawdopodobieństwa jako logiki w tym rozdziale pozwoli nam na zbudowanie naszego własnego rozkładu prawdopodobieństwa, rozkładu dwumianowego, który możemy zastosować do wielu problemów probabilistycznych o podobnej strukturze. Spróbujemy przewidzieć prawdopodobieństwo dostania konkretnej, słynnej karty kolekcjonerskiej ze znanym statystykiem w grze karcianej Gacha.

Rozdział 5: Rozkład beta. Tutaj nauczysz się swojego pierwszego ciągłego rozkładu prawdopodobieństwa, a także poznasz podstawy tego, czym różni się statystyka od prawdopodobieństwa. Statystyka obejmuje odgadywanie nieznanych prawdopodobieństw na podstawie dostępnych danych. W przykładzie z tego rozdziału zbadamy tajemniczy automat do wydawania monet oraz szanse na zarobienie większych pieniędzy, niż stracimy.

Część II: Prawdopodobieństwo bayesowskie i prawdopodobieństwa a priori

Rozdział 6: Prawdopodobieństwo warunkowe. W tym rozdziale będziemy warunkować prawdopodobieństwo na podstawie istniejących informacji. Na przykład znajomość faktu, czy dana osoba jest mężczyzną, czy kobietą, mówi nam, jaka jest szansa, że ta osoba jest daltonistą. Poznasz także twierdzenie Bayesa, które pozwoli nam na odwracanie prawdopodobieństw warunkowych.

Rozdział 7: Twierdzenie Bayesa z klockami LEGO. Tutaj zyskasz lepszą intuicję dotyczącą twierdzenia Bayesa dzięki przykładom dotyczącym klocków LEGO! Ten rozdział da ci lepsze przestrzenne wyobrażenie o tym, co robi twierdzenie Bayesa.

Rozdział 8: A priori, wiarogodność i a posteriori w twierdzeniu Bayesa. Twierdzenie Bayesa jest zazwyczaj rozbijane na trzy części, a każda z nich odgrywa inną rolę we wnioskowaniu bayesowskim. W tym rozdziale dowiesz się, jak się nazywają, oraz jak ich używać, aby zbadać, czy ewidentne włamanie było rzeczywiście przestępstwem, czy tylko serią nieszczęśliwych zbiegów okoliczności.

Rozdział 9: Bayesowskie prawdopodobieństwa a priori i praca z rozkładami prawdopodobieństw. Ten rozdział pokazuje, jak możemy używać twierdzenia Bayesa, aby lepiej zrozumieć klasyczną scenę z filmu Gwiezdne wojny: część V – Imperium kontratakuje, a przez to także uzyskać lepsze zrozumienie prawdopodobieństw a priori w statystyce bayesowskiej. Zobaczysz także, jak korzystać z całych rozkładów prawdopodobieństw a priori.

Część III: Estymacja parametrów

Rozdział 10: Wprowadzenie do uśredniania i estymacji parametrów. Estymacja parametrów jest metodą, której używamy, aby jak najlepiej odgadnąć nieznane wartości. Najbardziej podstawowym narzędziem w estymacji parametrów jest zwykła średnia z obserwacji. W tym rozdziale zobaczysz, dlaczego ta metoda działa, poprzez analizę wysokości opadu śniegu.

Rozdział 11: Mierzenie rozproszenia naszych danych. Znajdowanie średniej jest przydatnym pierwszym krokiem w estymacji parametrów, ale potrzebujemy także sposobu, aby zbadać, jak rozproszone są nasze obserwacje. Dowiesz się, czym są średnie odchylenie bezwzględne, wariancja oraz odchylenie standardowe jako sposoby pomiaru rozproszenia danych.

Rozdział 12: Rozkład normalny. Poprzez połączenie średniej i odchylenia standardowego dostajemy bardzo użyteczny rozkład do estymowania: rozkład normalny. W tym rozdziale dowiesz się, jak używać rozkładu normalnego nie tylko do estymacji nieznanych wartości, ale także, aby określić pewność swoich oszacowań. Swoje nowe umiejętności wykorzystasz do zmierzenia czasu ucieczki podczas napadu na bank.

Rozdział 13: Narzędzia estymacji parametrów: funkcja gęstości, dystrybuanta i odwrotna dystrybuanta. Poznasz tutaj funkcję gęstości, dystrybuantę i odwrotną dystrybuantę, które pozwolą ci lepiej zrozumieć estymacje parametrów, których dokonujesz. Przy użyciu tych funkcji będziesz szacować współczynniki konwersji e-maili, jednocześnie ucząc się, jakie informacje możesz uzyskać z każdego z nich.

Rozdział 14: Estymacja parametrów z prawdopodobieństwami a priori. Najlepszym sposobem, aby polepszyć nasze estymacje parametrów, jest uwzględnienie w rozważaniach prawdopodobieństwa a priori. W tym rozdziale zobaczysz, jak dodawanie informacji a priori o poprzednich sukcesach w konwersji e-maili pozwala nam lepiej szacować prawdziwy współczynnik sukcesów dla nowych wiadomości.

Część IV: Testowanie hipotez: serce statystyki

Rozdział 15: Od estymacji parametrów do testowania hipotez – konstrukcja bayesowskiego testu A/B. Kiedy już umiemy szacować nieznane wartości, potrzebujemy sposobu na porównanie dwóch nieznanych wartości, aby przetestować hipotezę. Utworzysz test A/B, aby określić pewność nowej metody e-mail marketingu.

Rozdział 16: Wstęp do czynnika Bayesa i szanse a posteriori rywalizacja poglądów. Czy kiedykolwiek siedziałeś późno w nocy, przeglądając Internet i zastanawiając się, czy masz naprawdę rzadką chorobę? Ten rozdział wprowadzi inne podejście do testowania poglądów, które pomoże ci ustalić, jak bardzo powinieneś być zaniepokojony!

Rozdział 17: Wnioskowanie bayesowskie w „Strefie mroku”. Jak bardzo wierzysz w swoje zdolności paranormalne? W tym rozdziale wyrobisz w sobie zdolność do czytania w umysłach dzięki analizie sytuacji w klasycznym epizodzie Strefy mroku.

Rozdział 18: Kiedy dane cię nie przekonują. Czasami dane nie wystarczają, aby ktoś zmienił swoje przekonania lub aby wygrać kłótnię. Zobacz, jak przekonać znajomego w kwestii, co do której macie inne poglądy, i dlaczego nie warto kłócić się ze swoim wojowniczym wujkiem!

Rozdział 19: Od testowania hipotez do estymacji parametrów. Tutaj zataczamy pełne koło i wracamy do estymacji parametrów poprzez porównanie zakresu hipotez. Uzyskasz swój pierwszy przykład ze statystyki, rozkład beta, używając narzędzi, które poznaliśmy przy prostym testowaniu hipotez do analizy uczciwości w pewnej grze jarmarcznej.

Dodatek A: Szybkie wprowadzenie do języka R. Ten krótki dodatek nauczy cię podstaw języka programowania R.

Dodatek B: Tyle analizy matematycznej, aby czytać tę książkę. W tym rozdziale przedstawiamy tylko tyle analizy matematycznej, abyś nie miał problemów z matematyką stosowaną do lektury tej książki.

Wiedza potrzebna przy czytaniu książki

Do czytania tej książki wymagana jest jedynie podstawowa matematyka na poziomie liceum. Jeśli przewrócisz parę stron do przodu, zobaczysz kilka przykładów równań matematycznych, ale nic szczególnie uciążliwego. Będziemy używać trochę kodu napisanego w języku programowania R, który będzie przeze mnie podany i omówiony, więc nie ma potrzeby uczyć się tego języka wcześniej. Będą elementy analizy matematycznej, ale znów nie wymagane jest wcześniejsze doświadczenie z tą gałęzią matematyki. W dodatkach na końcu są umieszczone wszystkie informacje potrzebne, aby czytać tę książkę.

Innymi słowy, ta książka ma na celu pomóc ci zacząć myśleć o problemach w sposób matematyczny, nie wymagając jednocześnie znacznej wiedzy matematycznej. Kiedy skończysz ją czytać, może się okazać, że przypadkiem piszesz równania opisujące problemy, które napotykasz w codziennym życiu!

Jeśli tak się składa, że masz solidną wiedzę o statystyce (a nawet statystyce bayesowskiej), to wierzę, że nadal będziesz z przyjemnością czytać tę książkę. Zawsze uważałem, że najlepszym sposobem na dobre zrozumienie danej dziedziny jest wielokrotne powtarzanie sobie podstaw, za każdym razem w innym kontekście. Nawet ja jako autor tej książki byłem wielokrotnie zaskoczony wieloma rzeczami, jakie odkryłem podczas jej pisania!

Wyruszmy ku przygodzie!

Jak wkrótce zobaczysz, statystyka bayesowska, poza byciem bardzo użyteczną, jest też źródłem wielkiej radości i zabawy! Aby pomóc ci zrozumieć wnioskowanie bayesowskie, będziemy przyglądać się klockom LEGO, Strefie mroku, Gwiezdnym wojnom i nie tylko. Zobaczysz, że gdy zaczniesz myśleć w kategorii prawdopodobieństw o problemach, zaczniesz wszędzie używać statystyki bayesowskiej. Ta książka została tak zaprojektowana, aby można ją było czytać szybko i z przyjemnością, więc odwróć stronę i zacznijmy naszą przygodę ze statystyką bayesowską!1. MYŚLENIE BAYESOWSKIEI CODZIENNE ROZUMOWANIE

W pierwszym rozdziale przedstawię przegląd wnioskowania bayesowskiego. Jest to formalny sposób rozumowania, w którym uaktualniamy nasze przekonania o świecie na podstawie zaobserwowanych danych. Przyjrzymy się pewnej sytuacji i zobaczymy, jak możemy odwzorować codzienne doświadczenie na myślenie bayesowskie.

Dobra wiadomość jest taka, że byłeś statystykiem bayesowskim, jeszcze zanim sięgnąłeś po tę książkę! Statystyka bayesowska jest mocno związana z tym, jak ludzie w sposób naturalny wykorzystują napotkane przesłanki do tworzenia nowych przekonań i wnioskowania o codziennych sytuacjach. Trudną częścią jest rozłożenie tego naturalnego procesu na czynniki pierwsze, aby móc go przetworzyć na ścisły proces matematyczny.

Aby dokładniej obliczać prawdopodobieństwo, używamy w statystyce pewnych szczególnych obliczeń i modeli. Na razie nie będziemy jednak korzystać z żadnej matematyki ani modeli – zapoznamy się z podstawowymi konceptami i użyjemy naszej intuicji, aby określać prawdopodobieństwa. W następnym rozdziale zaczniemy posługiwać się liczbami w odniesieniu do prawdopodobieństw. Przez resztę książki nauczysz się, jak używać ścisłych matematycznych technik, aby formalnie modelować i myśleć o konceptach przedstawionych w tym rozdziale.

Wnioskowanie o dziwnych doświadczeniach

Pewnej nocy budzi cię niespodziewanie jasne światło bijące od okna. Wyskakujesz z łóżka i widzisz na niebie wielki obiekt w kształcie spodka. Generalnie jesteś sceptyczny i nigdy nie wierzyłeś w spotkania z obcymi, ale kompletnie zdumiony sceną na zewnątrz zaczynasz myśleć Czy to może być UFO?!

We wnioskowaniu bayesowskim musimy przyjrzeć się procesowi myślowemu, jaki zachodzi w danej sytuacji, aby rozróżnić, kiedy robimy założenia dotyczące prawdopodobieństw, a kiedy używamy tych założeń, aby aktualizować nasze przekonania o otaczającym nas świecie. W sytuacji z UFO już przeszedłeś przez całą analizę bayesowską, ponieważ:

1. Zaobserwowałeś dane.
2. Sformułowałeś hipotezę.
3. Zaktualizowałeś swoje przekonania na podstawie danych.

To rozumowanie przebiega tak szybko, że nie masz nawet czasu, aby przeanalizować swój sposób myślenia. Stworzyłeś nowe przekonanie bez żadnych zastrzeżeń: o ile wcześniej nie wierzyłeś w istnienie UFO, o tyle po opisanym wydarzeniu zaktualizowałeś swoje przekonania i teraz myślisz, że widziałeś UFO.

W tym rozdziale skoncentrujemy się na strukturyzowaniu naszych przekonań i na procesie ich tworzenia, co pozwoli je badać bardziej formalnie, a w następnych rozdziałach dowiemy się, jak opisywać ilościowo ten proces.

Przyjrzyjmy się każdemu po kolei etapowi naszego rozumowania, zaczynając od obserwowania danych.

Obserwowanie danych

Określanie swoich przekonań na podstawie danych jest kluczowym składnikiem rozumowania bayesowskiego. Zanim będziesz mógł wyciągnąć jakiś wniosek na temat opisanej sceny (takiej jak twierdzenie, że to, co widzisz, to UFO), najpierw musisz zrozumieć dane, które w tym wypadku obserwujesz:

● wyjątkowo jasne światło za oknem,

● obiekt w kształcie spodka unoszący się w powietrzu.

Opierając się na twoim poprzednim doświadczeniu, opisałbyś to, co widzisz za oknem, jako „zaskakujące”. W terminologii probabilistycznej możemy to zapisać jako:

P(jasne światło za oknem, obiekt w kształcie spodka na niebie) = bardzo małe

gdzie P oznacza prawdopodobieństwo, a dwie informacje są wymienione w nawiasach. Czytamy to równanie jako: „Prawdopodobieństwo zaobserwowania jasnego światła za oknem i obiektu o kształcie spodka na niebie jest bardzo małe”. W teorii prawdopodobieństwa używamy przecinka do oddzielenia zdarzeń, gdy mówimy o połączonym prawdopodobieństwie wielu zdarzeń. Zauważmy, że te dane nie zawierają niczego konkretnego o UFO, lecz po prostu spisane obserwacje – będzie to ważne później.

Możemy także badać prawdopodobieństwo pojedynczych zdarzeń, które zapisujemy tak:

P(deszcz) = wysokie

To równanie czytamy jako: „prawdopodobieństwo deszczu jest wysokie”.

W naszym przykładzie z UFO wyznaczamy prawdopodobieństwo wystąpienia obu zdarzeń jednocześnie. Prawdopodobieństwo wystąpienia jednego z tych dwóch zdarzeń byłoby zupełnie inne. Na przykład jasne światła same w sobie mogą świadczyć o przejeżdżającym samochodzie, tak więc prawdopodobieństwo ich wystąpienia jest większe niż prawdopodobieństwo ich wystąpienia przy jednoczesnym zaobserwowaniu obiektu w kształcie spodka (oczywiście warto wspomnieć, że sam obiekt w kształcie spodka byłby zaskakujący).

Jak więc wyznaczamy to prawdopodobieństwo? Na razie używamy naszej intuicji – to znaczy naszego ogólnego poczucia prawdopodobieństwa występowania pewnych zdarzeń. W następnym rozdziale zobaczymy, jak możemy uzyskać konkretne liczby opisujące prawdopodobieństwo.

Przekonania a priori a prawdopodobieństwa warunkowe

Jesteśmy w stanie obudzić się o poranku, zrobić sobie kawę, pojechać do pracy i przez cały ten czas nie dokonywać większej analizy, ponieważ mamy pewne przekonania a priori o tym, jak działa świat. Nasze przekonania a priori są zbiorem przekonań, które zbudowaliśmy przez całe życie na podstawie naszych doświadczeń (to znaczy obserwowania danych). Wierzysz w to, że słońce wstanie, ponieważ słońce wstawało każdego dnia, od kiedy się urodziłeś. Na tej samej zasadzie możesz mieć przekonanie a priori, że kiedy światło na skrzyżowaniu dla ruchu w prostopadłym kierunku jest czerwone, a twoje jest zielone, to znaczy że bezpiecznie można przejechać przez skrzyżowanie. Bez przekonań a priori każdej nocy kładlibyśmy się do łóżka przerażeni, że słońce może nie wzejść następnego ranka, a na każdym skrzyżowaniu zatrzymalibyśmy się, aby dokładnie przyjrzeć się nadjeżdżającym pojazdom.

Nasze przekonania a priori mówią nam. że ujrzenie jasnego światła za oknem w tym samym czasie, gdy widzimy obiekt w kształcie spodka, jest rzadkim zdarzeniem na Ziemi. Warto dodać, że gdybyś żył na odległej planecie pełnej latających spodków i z wieloma międzygwiezdnymi przybyszami, to prawdopodobieństwo zobaczenia świateł i obiektów w kształcie spodka na niebie byłoby znacznie wyższe.

Nasze przekonania a priori po zaobserwowaniu danych zapisujemy we wzorze, oddzielone za pomocą znaku |, tak jak poniżej:

Czytamy to równanie jako: „prawdopodobieństwo zaobserwowania jasnego światła i obiektu w kształcie spodka na niebie, pod warunkiem naszego doświadczenia na Ziemi, jest bardzo małe”.

Wynikowe prawdopodobieństwo nazywamy prawdopodobieństwem warunkowym, ponieważ warunkujemy prawdopodobieństwo wystąpienia jednego zdarzenia istnieniem czegoś innego. W tym przypadku warunkujemy prawdopodobieństwo naszej obserwacji naszym poprzednim życiowym doświadczeniem.

Tak jak używamy litery P, żeby oznaczyć prawdopodobieństwo, tak zazwyczaj używamy krótszych nazw zmiennych dla zdarzeń i warunków. Jeśli nie znasz się na czytaniu równań, mogą się one początkowo wydawać się zbyt lakoniczne. Ale gdy już się przyzwyczaisz, okaże się, że krótsze nazwy zmiennych zwiększają czytelność i lepiej widać, jak równania generalizują większe klasy problemów. Przypiszemy wszystkie nasze dane do pojedynczej zmiennej D:

D = jasne światło za oknem, obiekt w kształcie spodka na niebie

Od tej pory, gdy będziemy mieli na myśli prawdopodobieństwo zbioru danych, po prostu napiszemy P(D).

Podobnie użyjemy zmiennej X do reprezentowania naszych wszystkich przekonań a priori:

X = doświadczenie na Ziemi

Tak więc możemy teraz zapisać wspomniane wcześniej równanie jako P(D|X). Ten zapis jest dużo prostszy, a jednocześnie nie zmienia znaczenia.

Warunkowanie na podstawie wielu przekonań

Możemy dodać więcej niż jedno przekonanie a priori, jeśli więcej niż jedna zmienna ma znaczący wpływ na prawdopodobieństwo. Załóżmy, że jest czwarty lipca i mieszkasz w Stanach Zjednoczonych. Ze swojego doświadczenia a priori wiesz, że fajerwerki są powszechne tego dnia. Biorąc pod uwagę twoje doświadczenie na Ziemi oraz fakt, że jest czwarty lipca, prawdopodobieństwo widzenia świateł na niebie jest mniej nieprawdopodobne, a nawet obiekt w kształcie spodka może mieć jakiś związek z pokazem fajerwerków. Możemy więc przepisać nasze równanie jako:

Gdy weźmiemy pod uwagę oba fakty, nasze doświadczenie warunkowe zmienia się z „bardzo małego” na „małe”.

Zakładanie przekonań a priori w praktyce

W statystyce zazwyczaj nie warunkujemy, używając jawnie wszystkich naszych dotychczasowych doświadczeń, ponieważ możemy to po prostu założyć. Z tego powodu w tej książce nie włączamy osobnej zmiennej reprezentującej wszystkie nasze dotychczasowe doświadczenia. Jednak należy cały czas pamiętać, że w analizie bayesowskiej kluczowe jest, że nasze rozumienie świata jest zawsze warunkowane naszym wcześniejszym doświadczeniem. W pozostałej części rozdziału zachowamy zmienną „doświadczenie na Ziemi”, aby cały czas o tym przypominać.

Formułowanie hipotezy

Jak na razie mamy nasze dane D (widzieliśmy jasne światło i obiekt w kształcie spodka) i nasze dotychczasowe doświadczenie (doświadczenie a priori) X. W celu wyjaśnienia tego, co widziałeś, musisz sformułować swego rodzajuhipotezę – model dotyczący tego, jak świat działa, który dokonuje przewidywań. Hipotezy mogą przybierać wiele form. Wszystkie nasze podstawowe przekonania o świecie są hipotezami:

● Jeśli wierzysz w to, że Ziemia się obraca, to przewidujesz, że słońce wzejdzie i zajdzie o ustalonych porach.

● Jeśli wierzysz, że twój ulubiony zespół baseballowy jest najlepszy, to przewidujesz, że wygra on więcej meczy niż inne zespoły.

● Jeśli wierzysz w astrologię, to przewidujesz, że układ gwiazd opisuje ludzi i wydarzenia.

Hipotezy mogą być również bardziej formalne lub wyrafinowane:

● Naukowiec może mieć hipotezę, że określony sposób leczenia spowolni rozwój raka.

● Analityk finansowy może mieć model, jak rynek będzie się zachowywał.

● Głęboka sieć neuronowa może przewidywać, które obrazki przedstawiają zwierzęta, a które rośliny.

Wszystkie te przykłady są hipotezami, ponieważ zawierają one pewien sposób rozumienia świata i używają tego sposobu, aby dokonywać przewidywań, jak świat się zachowa. Kiedy rozważamy hipotezy w statystyce bayesowskiej, jesteśmy zazwyczaj zainteresowani tym, jak dobrze będą one przewidywać dane, które obserwujemy.

Kiedy widzisz przesłanki i myślisz „to UFO!”, tak naprawdę formułujesz hipotezę. Hipoteza dotycząca UFO jest prawdopodobnie oparta na niezliczonych filmach i serialach telewizyjnych, które widziałeś w przeszłości. Zdefiniujemy naszą pierwszą hipotezę jako:

H₁ = UFO wylądowało w moim ogródku!

Ale co ta hipoteza przewiduje? Możemy przeprowadzić odwrotne rozumowanie: „Jeśli UFO wylądowałoby w moim ogródku, to co spodziewałbym się zobaczyć?”. Wtedy możesz odpowiedzieć „jasne światła i obiekt w kształcie spodka”. Ponieważ H₁ przewiduje dane D, gdy obserwujemy nasze dane pod warunkiem naszej hipotezy, prawdopodobieństwo danych wzrasta. Formalnie zapiszemy to jako:

P(D| H₁, X) >> P(D| X)

To równanie mówi: „prawdopodobieństwo zobaczenia jasnych świateł i obiektu w kształcie spodka na niebie, biorąc pod uwagę moje przekonanie, że to UFO, oraz moje poprzednie doświadczenia, jest znacznie większe niż po prostu widzenie jasnych świateł i obiektu w kształcie spodka na niebie bez wyjaśnienia”. Użyliśmy tutaj języka prawdopodobieństwa, aby zademonstrować, jak nasza hipoteza wyjaśnia dane.

Napotykanie hipotez w codziennej mowie

Łatwo jest dostrzec związek między naszym codziennym językiem a prawdopodobieństwem. Przykładowo, gdy mówimy, że coś jest „zaskakujące”, to tak naprawdę mamy na myśli, że to coś jest mało prawdopodobne, biorąc pod uwagę nasze poprzednie doświadczenie. Gdy mówimy, że coś jest „sensowne” może oznaczać, że mamy wysoce prawdopodobne dane wynikające z naszych poprzednich doświadczeń. Może się to wydawać oczywiste po wskazaniu tych przykładów, ale kluczem do rozumowania probabilistycznego jest uważne zastanowienie się nad tym, jak interpretujemy dane, tworzymy hipotezy i zmieniamy nasze przekonania, nawet w zwyczajnej, codziennej sytuacji. Bez H₁ byłbyś mocno zakłopotany, gdyż nie miałbyś wyjaśnienia dla danych, które obserwujesz.

Zdobywanie większej liczby przesłanek i aktualizacja przekonań

Masz więc już swoje dane i hipotezę. Ponieważ jednak twoje poprzednie doświadczenie ukształtowało cię na sceptyka, hipoteza nadal wydaje się dość dziwaczna. W celu poprawienia stanu swojej wiedzy i wyciągnięcia bardziej wiarygodnych wniosków, musisz zdobyć więcej danych. To kolejny krok w rozumowaniu statystycznym, taki sam jak podczas intuicyjnej analizy sytuacji.

Aby zdobyć więcej danych, potrzebujemy więcej obserwacji. W naszym przykładzie patrzysz za okno i obserwujesz:

Gdy patrzysz w kierunku jasnego światła na zewnątrz, zauważasz więcej świateł w okolicy. Widzisz również, że obiekt w kształcie spodka jest trzymany przez kable, a po chwili zauważasz ekipę filmową. Słyszysz głośny klaps i kogoś krzyczącego „cięcie!”.

Bardzo prawdopodobne, że w jednej chwili zmieniasz zdanie na temat całej sytuacji. Twój dotychczasowy wniosek był taki, że możesz być świadkiem lądowania UFO. Teraz, z nowymi przesłankami, zdajesz sobie sprawę, że to wszystko wskazuje raczej na kręcenie filmu w pobliżu.

Przeprowadzając ten proces myślowy, twój umysł tak naprawdę raz jeszcze wykonał w jednej chwili wyrafinowaną analizę bayesowską! Rozłóżmy na czynniki pierwsze, co stało się w twojej głowie, aby lepiej prześledzić nasze wnioskowanie o zdarzeniach.

Zacząłeś od początkowej hipotezy:

H₁ = UFO wylądowało!

Ta oderwana hipoteza, pod warunkiem twojego doświadczenia, jest doprawdy nieprawdopodobna:

P(H₁ | X) = bardzo, bardzo niskie

Jednak było to jedyne sensowne wyjaśnienie, które mogłeś zaproponować, biorąc pod uwagę zaobserwowane dane. Gdy jednak zaobserwowałeś dodatkowe dane, natychmiast zorientowałeś się, że jest jeszcze jedna możliwe hipoteza – mówiąca o kręconym nieopodal filmie:

H₂ = film jest kręcony za oknem

Intuicyjnie czujemy, że ta hipoteza, w oderwaniu, także ma bardzo niskie prawdopodobieństwo (chyba, że akurat mieszkasz koło studia filmowego):

P(H₂ | X) = bardzo niskie

Zauważmy, że ustaliliśmy prawdopodobieństwo H₁ na „bardzo, bardzo niskie”, a prawdopodobieństwo hipotezy H₂ tylko na „bardzo niskie”. To odpowiada naszej intuicji: gdyby ktoś do ciebie podszedł i zapytał, nie podając żadnych danych, „co wydaje ci się bardziej prawdopodobne, UFO pojawiające się w nocy w twoim sąsiedztwie, czy film kręcony w twojej okolicy?” odpowiedziałbyś, że sytuacja z filmem wydaje ci się bardziej prawdopodobna niż pojawienie się UFO.

Teraz potrzebujemy tylko sposobu, aby wziąć pod uwagę nowe dane, gdy będziemy zmieniać nasze przekonania.
mniej..

BESTSELLERY

Kategorie: