Uczenie maszynowe dla programistów - ebook
Uczenie maszynowe dla programistów - ebook
Wyciągnij najlepsze wnioski z dostępnych danych!
Maszyna myśląca jak człowiek to marzenie ludzkości. Dzięki dzisiejszej wiedzy i dostępnym narzędziom wciąż przybliżamy się do jego spełnienia. Zastanawiasz się, jak nauczyć maszynę myślenia? Jak sprawić, żeby podejmowała trafne decyzje oraz przewidywała najbliższą przyszłość na podstawie przygotowanych modeli? Na to i wiele innych pytań odpowiada ta wspaniała książka.Dzięki niej poznasz język R, nauczysz się eksplorować dostępne dane, określać wartość mediany i odchylenia standardowego oraz wizualizować powiązania między kolumnami. Gdy opanujesz już solidne podstawy teoretyczne, możesz śmiało przejść do kolejnych rozdziałów i zapoznać się z klasyfikacją binarną, tworzeniem rankingów oraz modelowaniem przyszłości przy użyciu regresji. Ponadto zrozumiesz, jak tworzyć systemy rekomendacyjne, analizować sieci społeczne oraz łamać szyfry. Książka ta jest doskonałą lekturą dla pasjonatów analizy danych i wyciągania z nich wniosków.
Każdy rozdział książki jest poświęcony konkretnemu zagadnieniu uczenia maszynowego: klasyfikacji, predykcji, regresji, optymalizacji i wreszcie rekomendacji. Czytelnik nauczy się konstruować proste algorytmy uczenia maszynowego (i przepuszczać przez nie próbki danych) za pomocą języka programowania R. Uczenie maszynowe dla programistów jest więc znakomitą lekturą dla programistów parających się czy to projektami komercyjnymi, czy to rządowymi, czy wreszcie akademickimi.
- Skonstruuj prosty klasyfikator bayesowski odróżniający wiadomości treściwe od niechcianych na podstawie ich zawartości.
- Używaj regresji liniowej do przewidywania liczby odwiedzin najpopularniejszych stron WWW.
- Naucz się optymalizacji, próbując złamać prosty szyfr literowy.
- Statystycznie skonfrontuj poglądy polityków, używając rejestru głosowań.
- Zbuduj system rekomendacji wartościowych twitterowców.
Naucz się czytać i analizować dane!
Książka ta stanowi świetny przegląd przypadków i tuzina różnych technik uczenia maszynowego. Jest ukierunkowana na proces dochodzenia do rozwiązania, a nie gotowe recepty ani abstrakcyjne teorie; dzięki temu jej materiał jest dostępny dla wszystkich programistów, ale też przysłowiowych „umysłów ścisłych”
— Max Shron, OkCupid
Spis treści
Wstęp (7)
1. Język R (13)
- Język R w uczeniu maszynowym (14)
- Pobieranie i instalowanie R (16)
- Edytory plików tekstowych i środowiska programistyczne (19)
- Ładowanie i instalowanie pakietów R (20)
- Podstawy R w uczeniu maszynowym (23)
- Dodatkowe materiały o R (36)
2. Eksplorowanie danych (39)
- Analiza eksploracyjna i analiza potwierdzająca (39)
- Czym są dane? (40)
- Wnioskowanie o typach danych w kolumnach (43)
- Wnioskowanie o znaczeniu wartości (45)
- Podsumowania liczbowe (46)
- Średnie, mediany i dominanty (46)
- Kwantyle (48)
- Odchylenia standardowe i wariancje (49)
- Eksploracyjne wizualizacje danych (52)
- Wizualizowanie powiązań pomiędzy kolumnami (67)
3. Klasyfikacja - odsiewanie spamu (73)
- To czy nie to? Klasyfikacja binarna (73)
- Płynne przejście do prawdopodobieństwa warunkowego (77)
- Nasz pierwszy bayesowski klasyfikator spamu (78)
- Definiowanie i testowanie klasyfikatora na wątpliwych wiadomościach treściwych (84)
- Testowanie klasyfikatora na wiadomościach wszystkich typów (88)
- Polepszanie wyników klasyfikacji (91)
4. Układanie rankingu - priorytetowa skrzynka pocztowa (93)
- Jak uporządkować, nie znając kryterium? (93)
- Układanie wiadomości e-mail według ważności (94)
- Cechy istotności wiadomości e-mail (95)
- Implementacja skrzynki priorytetowej (99)
- Funkcje wyłuskujące wartości cech (99)
- Tworzenie mechanizmu nadawania wag (106)
- Nadawanie wag na podstawie aktywności w wątku (110)
- Uczenie i testowanie algorytmu układającego ranking (115)
5. Regresja - przewidywanie odsłon stron (123)
- Wprowadzenie do regresji (123)
- Model wyjściowy (123)
- Regresja z użyciem zmiennych sztucznych (126)
- Podstawy regresji liniowej (128)
- Przewidywanie odwiedzin stron WWW (135)
- Definiowanie korelacji (145)
6. Regularyzacja - regresja tekstu (149)
- Nieliniowe zależności pomiędzy kolumnami - świat krzywych (149)
- Wstęp do regresji wielomianowej (152)
- Metody zapobiegania nadmiernemu dopasowaniu (158)
- Zapobieganie nadmiernemu dopasowaniu przez regularyzację (162)
- Regresja tekstu (166)
- Pociecha w regresji logistycznej (170)
7. Optymalizacja - łamanie szyfrów (175)
- Wprowadzenie do optymalizacji (175)
- Regresja grzbietowa (181)
- Łamanie szyfrów jako problem optymalizacji (185)
8. Analiza głównych składowych - budowanie indeksu rynku (195)
- Uczenie nienadzorowane (195)
9. Skalowanie wielowymiarowe - uwidocznianie podobieństwa polityków (203)
- Grupowanie na podstawie podobieństwa (203)
- Wprowadzenie do miar odległości i skalowania wielowymiarowego (204)
- Jak się grupują amerykańscy senatorzy? (209)
- Analiza rejestrów głosowań w Senacie (kongresy 101. - 111.) (210)
10. kNN - systemy rekomendacyjne (219)
- Algorytm kNN (219)
- Dane o instalacjach pakietów języka R (224)
11. Analiza grafów społecznych (229)
- Analiza sieci społecznych (229)
- Myślenie grafowe (231)
- Pozyskiwanie danych do grafu społecznego Twittera (233)
- Praca z API usługi SocialGraph (236)
- Analiza sieci Twittera (241)
- Lokalna struktura społeczna (242)
- Wizualizacja pogrupowanej sieci społecznej Twittera w programie Gephi (246)
- Własny mechanizm rekomendacji wartościowych twitterowiczów (251)
12. Porównanie modeli (259)
- SVM - maszyna wektorów nośnych (259)
- Porównanie algorytmów (269)
Bibliografia (274)
Skorowidz (276)
Kategoria: | Programowanie |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-246-9819-6 |
Rozmiar pliku: | 21 MB |