Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook
Data science to nieocenione wsparcie w rozwoju biznesu i działaniach mających na celu poprawę wyników finansowych firmy. Pomaga naukowcom lepiej obserwować i rozumieć otaczający ich świat. Bywa też źródłem świetnej zabawy. Jako analityk danych staniesz się częścią branży, która ciągle rośnie i się rozwija, a to znaczy, że wyzwania, jakie napotkasz, będą coraz ciekawsze i bardziej ekscytujące. Musisz się tylko nauczyć pracować z danymi.
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych i zrozumiałych przykładów: od usprawniania działalności wypożyczalni rowerów, poprzez wyodrębnianie danych z witryn internetowych, po budowę systemów rekomendacyjnych. Poznasz rozwiązania oparte na danych, przydatne w podejmowaniu decyzji biznesowych. Nauczysz się korzystać z eksploracyjnej analizy danych, przeprowadzać testy A/B i klasyfikację binarną, a także używać algorytmów uczenia maszynowego.
Sprawdź, jak w prosty sposób:
- prognozować popyt
- optymalizować kampanie marketingowe
- ograniczać odpływ klientów
- przewidywać ruch w witrynie internetowej
- budować systemy rekomendacyjne
Data science dla biznesu: czarna magia? Nie z Pythonem!
Spis treści
Podziękowania
Wprowadzenie
1. Eksploracyjna analiza danych
- Twój pierwszy dzień na stanowisku prezesa
- Znajdowanie wzorców w zbiorach danych
- Używanie plików .csv do przeglądania i przechowywania danych
- Wyświetlanie danych w Pythonie
- Obliczanie statystyk zbiorczych
- Analizowanie podzbiorów danych
- Dane nocne
- Dane sezonowe
- Wizualizacja danych za pomocą Matplotlib
- Rysowanie i wyświetlanie prostego wykresu
- Tytuły i etykiety na wykresach
- Kreślenie podzbiorów danych
- Testowanie różnych typów wykresów
- Eksplorowanie korelacji
- Obliczanie korelacji
- Silna i słaba korelacja
- Znajdowanie korelacji między zmiennymi
- Tworzenie map cieplnych
- Dalsza eksploracja
- Podsumowanie
2. Prognozowanie
- Przewidywanie popytu
- Oczyszczanie błędnych danych
- Kreślenie danych w celu odkrywania trendów
- Przeprowadzanie regresji liniowej
- Algebraiczne podstawy linii regresji
- Obliczanie miar błędu
- Używanie regresji do prognozowania przyszłych trendów
- Wypróbowywanie innych modeli regresji
- Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
- Oddawanie zmienności z wykorzystaniem trygonometrii
- Wybieranie najlepszej regresji na potrzeby prognozowania
- Dalsza eksploracja
- Podsumowanie
3. Porównywanie grup
- Dane dotyczące populacji
- Statystyki zbiorcze
- Próby losowe
- Różnice między próbami
- Testowanie hipotez
- Test t
- Niuanse testowania hipotez
- Porównywanie grup w kontekście praktycznym
- Podsumowanie
4. Testy A/B
- Potrzeba eksperymentowania
- Przeprowadzanie eksperymentów w celu testowania nowych hipotez
- Matematyka testów A/B
- Przekładanie matematyki na praktykę
- Optymalizacja z wykorzystaniem modelu mistrz - pretendent
- Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
- Wielkości efektu
- Obliczanie istotności danych
- Zastosowania i kwestie zaawansowane
- Etyka testów A/B
- Podsumowanie
5. Klasyfikacja binarna
- Minimalizowanie odpływu klientów
- Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
- Wykres ryzyka odpływu
- Potwierdzanie zależności za pomocą regresji liniowej
- Przewidywanie przyszłości
- Dokonywanie rekomendacji biznesowych
- Mierzenie dokładności prognoz
- Multiwariantne modele LPM
- Tworzenie nowych miar
- Wady modeli LPM
- Przewidywanie binarnych wyników za pomocą regresji logistycznej
- Rysowanie krzywych logistycznych
- Dopasowywanie krzywej logistycznej do danych
- Zastosowania klasyfikacji binarnej
- Podsumowanie
6. Uczenie nadzorowane
- Przewidywanie ruchu w witrynie internetowej
- Wczytywanie i wykreślanie danych dotyczących artykułów
- Używanie regresji liniowej jako metody przewidywania
- Uczenie nadzorowane
- Metoda k najbliższych sąsiadów
- Implementowanie metody k-NN
- Analiza k-NN z wykorzystaniem pakietu sklearn
- Używanie innych algorytmów uczenia nadzorowanego
- Drzewa decyzyjne
- Lasy losowe
- Sieci neuronowe
- Mierzenie dokładności prognoz
- Praca z modelami multiwariantnymi
- Używanie klasyfikacji zamiast regresji
- Podsumowanie
7. Uczenie nienadzorowane
- Uczenie nadzorowane a uczenie nienadzorowane
- Generowanie i eksplorowanie danych
- Rzucanie kością
- Używanie innego typu kości
- Określanie źródła obserwacji przez klasteryzację
- Klasteryzacja w zastosowaniach biznesowych
- Analizowanie wielu wymiarów
- Klasteryzacja E-M
- Etap zgadywania
- Etap oczekiwań
- Etap maksymalizacji
- Etap konwergencji
- Inne metody klasteryzacji
- Inne metody uczenia nienadzorowanego
- Podsumowanie
8. Web scraping
- Jak działają witryny internetowe?
- Twój pierwszy scraper
- Parsowanie kodu HTML
- Scraping adresów e-mail
- Bezpośrednie wyszukiwanie adresów
- Wyrażenia regularne
- Używanie metaznaków do elastycznych wyszukiwań
- Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
- Łączenie metaznaków w wyszukiwaniach zaawansowanych
- Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
- Przekształcanie wyników w użyteczne dane
- Używanie biblioteki Beautiful Soup
- Parsowanie elementów etykiety HTML
- Scraping i parsowanie tabel HTML
- Zaawansowany scraping
- Podsumowanie
9. Systemy rekomendacyjne
- Rekomendacje oparte na popularności
- Filtrowanie kolaboratywne oparte na artykułach
- Mierzenie podobieństwa wektorów
- Obliczanie podobieństwa kosinusowego
- Implementowanie filtrowania kolaboratywnego opartego na artykułach
- Filtrowanie kolaboratywne oparte na użytkownikach
- Studium przypadku: rekomendacje muzyczne
- Generowanie rekomendacji za pomocą zaawansowanych systemów
- Podsumowanie
10. Przetwarzanie języka naturalnego
- Używanie NLP do wykrywania plagiatów
- Model NLP word2vec
- Ocenianie podobieństw między słowami
- Tworzenie układu równań
- Analizowanie wektorów liczbowych w word2vec
- Manipulowanie wektorami poprzez obliczenia matematyczne
- Wykrywanie plagiatów z wykorzystaniem word2vec
- Model skip-thoughts
- Modelowanie tematyczne
- Inne zastosowania NLP
- Podsumowanie
11. Data science w innych językach
- Wygrywanie meczów piłkarskich z pomocą SQL-a
- Wczytywanie i analizowanie danych
- Podstawy SQL-a
- Tworzenie bazy danych SQL
- Wykonywanie kwerend SQL
- Łączenie danych poprzez łączenie tabel
- Wygrywanie meczów piłkarskich z pomocą języka R
- Podstawy języka R
- Stosowanie regresji liniowej w języku R
- Kreślenie danych w R
- Inne przydatne umiejętności
- Podsumowanie
Skorowidz
Kategoria: | Programowanie |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-289-1015-7 |
Rozmiar pliku: | 7,9 MB |