Facebook - konwersja
Darmowy fragment

Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook

Wydawnictwo:
Tłumacz:
Format:
PDF
Data wydania:
25 czerwca 2024
69,00
6900 pkt
punktów Virtualo

Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym - ebook

Data science to nieocenione wsparcie w rozwoju biznesu i działaniach mających na celu poprawę wyników finansowych firmy. Pomaga naukowcom lepiej obserwować i rozumieć otaczający ich świat. Bywa też źródłem świetnej zabawy. Jako analityk danych staniesz się częścią branży, która ciągle rośnie i się rozwija, a to znaczy, że wyzwania, jakie napotkasz, będą coraz ciekawsze i bardziej ekscytujące. Musisz się tylko nauczyć pracować z danymi.

Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych i zrozumiałych przykładów: od usprawniania działalności wypożyczalni rowerów, poprzez wyodrębnianie danych z witryn internetowych, po budowę systemów rekomendacyjnych. Poznasz rozwiązania oparte na danych, przydatne w podejmowaniu decyzji biznesowych. Nauczysz się korzystać z eksploracyjnej analizy danych, przeprowadzać testy A/B i klasyfikację binarną, a także używać algorytmów uczenia maszynowego.

Sprawdź, jak w prosty sposób:

  • prognozować popyt
  • optymalizować kampanie marketingowe
  • ograniczać odpływ klientów
  • przewidywać ruch w witrynie internetowej
  • budować systemy rekomendacyjne

Data science dla biznesu: czarna magia? Nie z Pythonem!

Spis treści

Podziękowania

Wprowadzenie

1. Eksploracyjna analiza danych

  • Twój pierwszy dzień na stanowisku prezesa
    • Znajdowanie wzorców w zbiorach danych
    • Używanie plików .csv do przeglądania i przechowywania danych
  • Wyświetlanie danych w Pythonie
  • Obliczanie statystyk zbiorczych
  • Analizowanie podzbiorów danych
    • Dane nocne
    • Dane sezonowe
  • Wizualizacja danych za pomocą Matplotlib
    • Rysowanie i wyświetlanie prostego wykresu
    • Tytuły i etykiety na wykresach
    • Kreślenie podzbiorów danych
    • Testowanie różnych typów wykresów
  • Eksplorowanie korelacji
    • Obliczanie korelacji
    • Silna i słaba korelacja
    • Znajdowanie korelacji między zmiennymi
  • Tworzenie map cieplnych
  • Dalsza eksploracja
  • Podsumowanie

2. Prognozowanie

  • Przewidywanie popytu
  • Oczyszczanie błędnych danych
  • Kreślenie danych w celu odkrywania trendów
  • Przeprowadzanie regresji liniowej
    • Algebraiczne podstawy linii regresji
    • Obliczanie miar błędu
  • Używanie regresji do prognozowania przyszłych trendów
  • Wypróbowywanie innych modeli regresji
    • Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
    • Oddawanie zmienności z wykorzystaniem trygonometrii
  • Wybieranie najlepszej regresji na potrzeby prognozowania
  • Dalsza eksploracja
  • Podsumowanie

3. Porównywanie grup

  • Dane dotyczące populacji
    • Statystyki zbiorcze
    • Próby losowe
    • Różnice między próbami
  • Testowanie hipotez
    • Test t
    • Niuanse testowania hipotez
  • Porównywanie grup w kontekście praktycznym
  • Podsumowanie

4. Testy A/B

  • Potrzeba eksperymentowania
  • Przeprowadzanie eksperymentów w celu testowania nowych hipotez
    • Matematyka testów A/B
    • Przekładanie matematyki na praktykę
  • Optymalizacja z wykorzystaniem modelu mistrz - pretendent
  • Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
  • Wielkości efektu
  • Obliczanie istotności danych
  • Zastosowania i kwestie zaawansowane
  • Etyka testów A/B
  • Podsumowanie

5. Klasyfikacja binarna

  • Minimalizowanie odpływu klientów
  • Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
    • Wykres ryzyka odpływu
    • Potwierdzanie zależności za pomocą regresji liniowej
    • Przewidywanie przyszłości
    • Dokonywanie rekomendacji biznesowych
    • Mierzenie dokładności prognoz
    • Multiwariantne modele LPM
    • Tworzenie nowych miar
    • Wady modeli LPM
  • Przewidywanie binarnych wyników za pomocą regresji logistycznej
    • Rysowanie krzywych logistycznych
    • Dopasowywanie krzywej logistycznej do danych
  • Zastosowania klasyfikacji binarnej
  • Podsumowanie

6. Uczenie nadzorowane

  • Przewidywanie ruchu w witrynie internetowej
  • Wczytywanie i wykreślanie danych dotyczących artykułów
  • Używanie regresji liniowej jako metody przewidywania
  • Uczenie nadzorowane
  • Metoda k najbliższych sąsiadów
    • Implementowanie metody k-NN
    • Analiza k-NN z wykorzystaniem pakietu sklearn
  • Używanie innych algorytmów uczenia nadzorowanego
    • Drzewa decyzyjne
    • Lasy losowe
    • Sieci neuronowe
  • Mierzenie dokładności prognoz
  • Praca z modelami multiwariantnymi
  • Używanie klasyfikacji zamiast regresji
  • Podsumowanie

7. Uczenie nienadzorowane

  • Uczenie nadzorowane a uczenie nienadzorowane
  • Generowanie i eksplorowanie danych
    • Rzucanie kością
    • Używanie innego typu kości
  • Określanie źródła obserwacji przez klasteryzację
  • Klasteryzacja w zastosowaniach biznesowych
  • Analizowanie wielu wymiarów
  • Klasteryzacja E-M
    • Etap zgadywania
    • Etap oczekiwań
    • Etap maksymalizacji
    • Etap konwergencji
  • Inne metody klasteryzacji
  • Inne metody uczenia nienadzorowanego
  • Podsumowanie

8. Web scraping

  • Jak działają witryny internetowe?
  • Twój pierwszy scraper
  • Parsowanie kodu HTML
    • Scraping adresów e-mail
    • Bezpośrednie wyszukiwanie adresów
  • Wyrażenia regularne
    • Używanie metaznaków do elastycznych wyszukiwań
    • Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
    • Łączenie metaznaków w wyszukiwaniach zaawansowanych
  • Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
  • Przekształcanie wyników w użyteczne dane
  • Używanie biblioteki Beautiful Soup
    • Parsowanie elementów etykiety HTML
    • Scraping i parsowanie tabel HTML
  • Zaawansowany scraping
  • Podsumowanie

9. Systemy rekomendacyjne

  • Rekomendacje oparte na popularności
  • Filtrowanie kolaboratywne oparte na artykułach
    • Mierzenie podobieństwa wektorów
    • Obliczanie podobieństwa kosinusowego
    • Implementowanie filtrowania kolaboratywnego opartego na artykułach
  • Filtrowanie kolaboratywne oparte na użytkownikach
  • Studium przypadku: rekomendacje muzyczne
  • Generowanie rekomendacji za pomocą zaawansowanych systemów
  • Podsumowanie

10. Przetwarzanie języka naturalnego

  • Używanie NLP do wykrywania plagiatów
  • Model NLP word2vec
    • Ocenianie podobieństw między słowami
    • Tworzenie układu równań
  • Analizowanie wektorów liczbowych w word2vec
    • Manipulowanie wektorami poprzez obliczenia matematyczne
    • Wykrywanie plagiatów z wykorzystaniem word2vec
  • Model skip-thoughts
  • Modelowanie tematyczne
  • Inne zastosowania NLP
  • Podsumowanie

11. Data science w innych językach

  • Wygrywanie meczów piłkarskich z pomocą SQL-a
    • Wczytywanie i analizowanie danych
    • Podstawy SQL-a
    • Tworzenie bazy danych SQL
    • Wykonywanie kwerend SQL
    • Łączenie danych poprzez łączenie tabel
  • Wygrywanie meczów piłkarskich z pomocą języka R
    • Podstawy języka R
    • Stosowanie regresji liniowej w języku R
    • Kreślenie danych w R
  • Inne przydatne umiejętności
  • Podsumowanie

Skorowidz

Kategoria: Programowanie
Zabezpieczenie: Watermark
Watermark
Watermarkowanie polega na znakowaniu plików wewnątrz treści, dzięki czemu możliwe jest rozpoznanie unikatowej licencji transakcyjnej Użytkownika. E-książki zabezpieczone watermarkiem można odczytywać na wszystkich urządzeniach odtwarzających wybrany format (czytniki, tablety, smartfony). Nie ma również ograniczeń liczby licencji oraz istnieje możliwość swobodnego przenoszenia plików między urządzeniami. Pliki z watermarkiem są kompatybilne z popularnymi programami do odczytywania ebooków, jak np. Calibre oraz aplikacjami na urządzenia mobilne na takie platformy jak iOS oraz Android.
ISBN: 978-83-289-1015-7
Rozmiar pliku: 17 MB

BESTSELLERY

Menu

Zamknij