Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook

Bradford Tuckfield

Wydawnictwo:

Helion

Tłumacz:

Grzegorz Werner

Format:

MOBI

Data wydania:

25 czerwca 2024

6900 pkt

punktów Virtualo

Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook

Data science to nieocenione wsparcie w rozwoju biznesu i działaniach mających na celu poprawę wyników finansowych firmy. Pomaga naukowcom lepiej obserwować i rozumieć otaczający ich świat. Bywa też źródłem świetnej zabawy. Jako analityk danych staniesz się częścią branży, która ciągle rośnie i się rozwija, a to znaczy, że wyzwania, jakie napotkasz, będą coraz ciekawsze i bardziej ekscytujące. Musisz się tylko nauczyć pracować z danymi.

Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych i zrozumiałych przykładów: od usprawniania działalności wypożyczalni rowerów, poprzez wyodrębnianie danych z witryn internetowych, po budowę systemów rekomendacyjnych. Poznasz rozwiązania oparte na danych, przydatne w podejmowaniu decyzji biznesowych. Nauczysz się korzystać z eksploracyjnej analizy danych, przeprowadzać testy A/B i klasyfikację binarną, a także używać algorytmów uczenia maszynowego.

Sprawdź, jak w prosty sposób:

prognozować popyt
optymalizować kampanie marketingowe
ograniczać odpływ klientów
przewidywać ruch w witrynie internetowej
budować systemy rekomendacyjne

Data science dla biznesu: czarna magia? Nie z Pythonem!

Spis treści

Podziękowania

Wprowadzenie

1. Eksploracyjna analiza danych

Twój pierwszy dzień na stanowisku prezesa
- Znajdowanie wzorców w zbiorach danych
- Używanie plików .csv do przeglądania i przechowywania danych
Wyświetlanie danych w Pythonie
Obliczanie statystyk zbiorczych
Analizowanie podzbiorów danych
- Dane nocne
- Dane sezonowe
Wizualizacja danych za pomocą Matplotlib
- Rysowanie i wyświetlanie prostego wykresu
- Tytuły i etykiety na wykresach
- Kreślenie podzbiorów danych
- Testowanie różnych typów wykresów
Eksplorowanie korelacji
- Obliczanie korelacji
- Silna i słaba korelacja
- Znajdowanie korelacji między zmiennymi
Tworzenie map cieplnych
Dalsza eksploracja
Podsumowanie

2. Prognozowanie

Przewidywanie popytu
Oczyszczanie błędnych danych
Kreślenie danych w celu odkrywania trendów
Przeprowadzanie regresji liniowej
- Algebraiczne podstawy linii regresji
- Obliczanie miar błędu
Używanie regresji do prognozowania przyszłych trendów
Wypróbowywanie innych modeli regresji
- Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
- Oddawanie zmienności z wykorzystaniem trygonometrii
Wybieranie najlepszej regresji na potrzeby prognozowania
Dalsza eksploracja
Podsumowanie

3. Porównywanie grup

Dane dotyczące populacji
- Statystyki zbiorcze
- Próby losowe
- Różnice między próbami
Testowanie hipotez
- Test t
- Niuanse testowania hipotez
Porównywanie grup w kontekście praktycznym
Podsumowanie

4. Testy A/B

Potrzeba eksperymentowania
Przeprowadzanie eksperymentów w celu testowania nowych hipotez
- Matematyka testów A/B
- Przekładanie matematyki na praktykę
Optymalizacja z wykorzystaniem modelu mistrz - pretendent
Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
Wielkości efektu
Obliczanie istotności danych
Zastosowania i kwestie zaawansowane
Etyka testów A/B
Podsumowanie

5. Klasyfikacja binarna

Minimalizowanie odpływu klientów
Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
- Wykres ryzyka odpływu
- Potwierdzanie zależności za pomocą regresji liniowej
- Przewidywanie przyszłości
- Dokonywanie rekomendacji biznesowych
- Mierzenie dokładności prognoz
- Multiwariantne modele LPM
- Tworzenie nowych miar
- Wady modeli LPM
Przewidywanie binarnych wyników za pomocą regresji logistycznej
- Rysowanie krzywych logistycznych
- Dopasowywanie krzywej logistycznej do danych
Zastosowania klasyfikacji binarnej
Podsumowanie

6. Uczenie nadzorowane

Przewidywanie ruchu w witrynie internetowej
Wczytywanie i wykreślanie danych dotyczących artykułów
Używanie regresji liniowej jako metody przewidywania
Uczenie nadzorowane
Metoda k najbliższych sąsiadów
- Implementowanie metody k-NN
- Analiza k-NN z wykorzystaniem pakietu sklearn
Używanie innych algorytmów uczenia nadzorowanego
- Drzewa decyzyjne
- Lasy losowe
- Sieci neuronowe
Mierzenie dokładności prognoz
Praca z modelami multiwariantnymi
Używanie klasyfikacji zamiast regresji
Podsumowanie

7. Uczenie nienadzorowane

Uczenie nadzorowane a uczenie nienadzorowane
Generowanie i eksplorowanie danych
- Rzucanie kością
- Używanie innego typu kości
Określanie źródła obserwacji przez klasteryzację
Klasteryzacja w zastosowaniach biznesowych
Analizowanie wielu wymiarów
Klasteryzacja E-M
- Etap zgadywania
- Etap oczekiwań
- Etap maksymalizacji
- Etap konwergencji
Inne metody klasteryzacji
Inne metody uczenia nienadzorowanego
Podsumowanie

8. Web scraping

Jak działają witryny internetowe?
Twój pierwszy scraper
Parsowanie kodu HTML
- Scraping adresów e-mail
- Bezpośrednie wyszukiwanie adresów
Wyrażenia regularne
- Używanie metaznaków do elastycznych wyszukiwań
- Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
- Łączenie metaznaków w wyszukiwaniach zaawansowanych
Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
Przekształcanie wyników w użyteczne dane
Używanie biblioteki Beautiful Soup
- Parsowanie elementów etykiety HTML
- Scraping i parsowanie tabel HTML
Zaawansowany scraping
Podsumowanie

9. Systemy rekomendacyjne

Rekomendacje oparte na popularności
Filtrowanie kolaboratywne oparte na artykułach
- Mierzenie podobieństwa wektorów
- Obliczanie podobieństwa kosinusowego
- Implementowanie filtrowania kolaboratywnego opartego na artykułach
Filtrowanie kolaboratywne oparte na użytkownikach
Studium przypadku: rekomendacje muzyczne
Generowanie rekomendacji za pomocą zaawansowanych systemów
Podsumowanie

10. Przetwarzanie języka naturalnego

Używanie NLP do wykrywania plagiatów
Model NLP word2vec
- Ocenianie podobieństw między słowami
- Tworzenie układu równań
Analizowanie wektorów liczbowych w word2vec
- Manipulowanie wektorami poprzez obliczenia matematyczne
- Wykrywanie plagiatów z wykorzystaniem word2vec
Model skip-thoughts
Modelowanie tematyczne
Inne zastosowania NLP
Podsumowanie

11. Data science w innych językach

Wygrywanie meczów piłkarskich z pomocą SQL-a
- Wczytywanie i analizowanie danych
- Podstawy SQL-a
- Tworzenie bazy danych SQL
- Wykonywanie kwerend SQL
- Łączenie danych poprzez łączenie tabel
Wygrywanie meczów piłkarskich z pomocą języka R
- Podstawy języka R
- Stosowanie regresji liniowej w języku R
- Kreślenie danych w R
Inne przydatne umiejętności
Podsumowanie

Skorowidz

Kategoria:	Programowanie
Język:	Polski
Zabezpieczenie:	Watermark Watermark Watermarkowanie polega na znakowaniu plików wewnątrz treści, dzięki czemu możliwe jest rozpoznanie unikatowej licencji transakcyjnej Użytkownika. E-książki zabezpieczone watermarkiem można odczytywać na wszystkich urządzeniach odtwarzających wybrany format (czytniki, tablety, smartfony). Nie ma również ograniczeń liczby licencji oraz istnieje możliwość swobodnego przenoszenia plików między urządzeniami. Pliki z watermarkiem są kompatybilne z popularnymi programami do odczytywania ebooków, jak np. Calibre oraz aplikacjami na urządzenia mobilne na takie platformy jak iOS oraz Android.
ISBN:	978-83-289-1015-7
Rozmiar pliku:	7,9 MB
Użytkowanie:	w granicach licencji Informacje na temat użytkowania Kopia przeznaczona jest wyłącznie do własnego użytku osobistego w granicach udzielonej licencji. Wszelkie prawa są zastrzeżone chyba, że właściciel praw autorskich udzieli wyraźnej licencji. Z wyjątkiem sytuacji dopuszczalnych przez prawo lub uzyskania zgody uprawnionego z tytułu praw autorskich, jakiekolwiek powielanie, montaż, wyświetlanie, wypożyczanie, publiczne pokazy czy inne rozpowszechnianie zawartości tej kopii lub jej fragmentów czy części jest bezwzględnie zabronione. Niniejsza kopia nie może być przedmiotem odsprzedaży czy dystrybucji i sprzedaży handlowej bez uzyskania odpowiedniej licencji udzielonej przez Virtualo sp. z o.o.
Drukowanie:	w granicach licencji Informacje na temat użytkowania Kopia przeznaczona jest wyłącznie do własnego użytku osobistego w granicach udzielonej licencji. Wszelkie prawa są zastrzeżone chyba, że właściciel praw autorskich udzieli wyraźnej licencji. Z wyjątkiem sytuacji dopuszczalnych przez prawo lub uzyskania zgody uprawnionego z tytułu praw autorskich, jakiekolwiek powielanie, montaż, wyświetlanie, wypożyczanie, publiczne pokazy czy inne rozpowszechnianie zawartości tej kopii lub jej fragmentów czy części jest bezwzględnie zabronione. Niniejsza kopia nie może być przedmiotem odsprzedaży czy dystrybucji i sprzedaży handlowej bez uzyskania odpowiedniej licencji udzielonej przez Virtualo sp. z o.o.
Kopiowanie:	w granicach licencji Informacje na temat użytkowania Kopia przeznaczona jest wyłącznie do własnego użytku osobistego w granicach udzielonej licencji. Wszelkie prawa są zastrzeżone chyba, że właściciel praw autorskich udzieli wyraźnej licencji. Z wyjątkiem sytuacji dopuszczalnych przez prawo lub uzyskania zgody uprawnionego z tytułu praw autorskich, jakiekolwiek powielanie, montaż, wyświetlanie, wypożyczanie, publiczne pokazy czy inne rozpowszechnianie zawartości tej kopii lub jej fragmentów czy części jest bezwzględnie zabronione. Niniejsza kopia nie może być przedmiotem odsprzedaży czy dystrybucji i sprzedaży handlowej bez uzyskania odpowiedniej licencji udzielonej przez Virtualo sp. z o.o.

Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook

Spis treści

BESTSELLERY