Facebook - konwersja
Darmowy fragment

  • nowość

Jak ogarnąć trudne dane? Praktyczne podejście profesjonalnego analityka - ebook

Wydawnictwo:
Tłumacz:
Format:
PDF
Data wydania:
5 maja 2026
119,00
11900 pkt
punktów Virtualo

Jak ogarnąć trudne dane? Praktyczne podejście profesjonalnego analityka - ebook

Analiza trudnych danych w rzeczywistym świecie? Cóż to skomplikowane. Trzeba sobie poradzić z takimi wyzwaniami jak niewiarygodne źródła danych, niejednoznaczne zapytania i niekompatybilne formaty. Rzeczywistość wykracza poza czyste, ustrukturyzowane przykłady z podręczników. Jak więc z trudnymi danymi radzą sobie zawodowcy?

Dobrze napisana książka, pokazująca podejścia do rozwiązywania wielu rodzajów problemów w analizie danych.

Naomi Ceder, członkini Python Software Foundation

Za sprawą tej książki poznasz metodologię rozwiązywania różnorodnych problemów związanych z pracą na danych. Poszczególne techniki zostały tu wyjaśnione krok po kroku, tak by odzwierciedlić tok myślenia i sposób działania profesjonalnego analityka. Znajdziesz tu osiem często spotykanych scenariuszy, z którymi można się zetknąć w tej dziedzinie.

Stosując zorientowane na wyniki podejście autora, nauczysz się modelować dane poprzez odnajdywanie rekordów klientów, pracę ze słabo zdefiniowanymi wskaźnikami, wydobywanie informacji z plików PDF i wiele więcej! Dowiesz się również, jak przejmować niedokończone projekty i tworzyć szybkie prototypy z rzeczywistymi danymi.

Możesz podglądać pracę wytrawnego analityka danych, który wyjaśnia, jak radzić sobie ze wszystkimi nieprzyjemnymi pułapkami!

Randy Au, Google

W książce:

  • rozkładanie problemów na części pierwsze
  • praca z niejasnymi wskaźnikami
  • modelowanie danych
  • manipulacja danymi kategorycznymi

Jasna i powtarzalna metodologia ułatwi Ci pewne i szybkie dochodzenie do odpowiedzi!

Shaun McGirr, DevOn Software Services

Doskonałe źródło dla każdego aspirującego analityka danych!

Andrew R. Freed, IBM

Spis treści

Przedmowa

Wstęp

Podziękowania

O książce

O autorze

1. Łączenie teorii z praktyką w nauce o danych

  • 1.1. Zestaw narzędzi analityka danych
  • 1.2. Podejście zorientowane na wyniki
    • 1.2.1. Zrozum problem
    • 1.2.2. Zacznij od końca
    • 1.2.3. Poszukaj dodatkowych źródeł
    • 1.2.4. Pozyskaj dane
    • 1.2.5. Wykonaj pracę
    • 1.2.6. Przedstaw minimalną satysfakcjonującą odpowiedź
    • 1.2.7. W razie potrzeby iteruj
  • 1.3. Struktura projektu
  • Podsumowanie

2. Praca z danymi geograficznymi

  • 2.1. Projekt 1. Określenie lokalizacji klientów
    • 2.1.1. Słownik danych
  • 2.2. Przykładowe rozwiązanie: odnajdywanie Londynu
    • 2.2.1. Przygotowanie do sukcesu
    • 2.2.2. Tworzenie pierwszej wersji rozwiązania
    • 2.2.3. Podsumowanie i kolejne kroki
  • 2.3. Jak czytać pozostałą część książki?
  • Podsumowanie

3. Modelowanie danych

  • 3.1. Znaczenie modelowania danych
    • 3.1.1. Typowe zadania w modelowaniu danych
  • 3.2. Projekt 2. Kim są Twoi klienci?
    • 3.2.1. Założenia projektu
    • 3.2.2. Słownik danych
    • 3.2.3. Oczekiwane rezultaty
    • 3.2.4. Niezbędne narzędzia
  • 3.3. Planowanie podejścia do modelowania danych klientów
    • 3.3.1. Zastosowanie procesu zorientowanego na wyniki do modelowania danych
    • 3.3.2. Pytania warte uwagi
  • 3.4. Przykładowe rozwiązanie: identyfikacja klientów na podstawie danych transakcyjnych
    • 3.4.1. Opracowanie planu działania
    • 3.4.2. Odkrywanie, pozyskiwanie i łączenie danych z wielu źródeł
    • 3.4.3. Rozwiązywanie problemu encji w celu usunięcia duplikatów
    • 3.4.4. Wnioski i zalecenia
  • 3.5. Podsumowanie modelowania danych
    • 3.5.1. Umiejętności modelowania danych przydatne w każdym projekcie
  • Podsumowanie

4. Wskaźniki

  • 4.1. Znaczenie dobrze zdefiniowanych wskaźników
  • 4.2. Projekt 3. Definiowanie precyzyjnych wskaźników po to, by podejmować lepsze decyzje
    • 4.2.1. Opis problemu
    • 4.2.2. Słownik danych
    • 4.2.3. Oczekiwane rezultaty
    • 4.2.4. Wymagane narzędzia
  • 4.3. Zastosowanie metody zorientowanej na wyniki do różnych definicji wskaźników
    • 4.3.1. Pytania warte uwagi
  • 4.4. Przykładowe rozwiązanie: identyfikacja najlepiej sprzedających się produktów
    • 4.4.1. Łączenie i analiza danych o produktach
    • 4.4.2. Obliczanie wskaźników na poziomie produktu
    • 4.4.3. Znajdowanie najlepszych produktów z użyciem zdefiniowanych wskaźników
  • 4.5. Podsumowanie rozdziału o wskaźnikach
    • 4.5.1. Umiejętności definiowania lepszych wskaźników dla dowolnego projektu
  • Podsumowanie

5. Nietypowe źródła danych

  • 5.1. Szukanie nowych źródeł danych
    • 5.1.1. Kwestie do rozważenia przy korzystaniu z nowych zbiorów danych
  • 5.2. Projekt 4. Analiza trendów w branży filmowej z użyciem danych z plików PDF
    • 5.2.1. Opis problemu
    • 5.2.2. Słownik danych
    • 5.2.3. Oczekiwane rezultaty
    • 5.2.4. Wymagane narzędzia
  • 5.3. Zastosowanie metody zorientowanej na wyniki do ekstrakcji danych z plików PDF
  • 5.4. Przykładowe rozwiązanie: wpływ ograniczeń związanych z COVID-19 na przemysł filmowy
    • 5.4.1. Analiza dostępnych danych
    • 5.4.2. Wyodrębnianie danych z plików PDF
    • 5.4.3. Analiza danych wyodrębnionych z plików PDF
    • 5.4.4. Wnioski i zalecenia dotyczące projektu
  • 5.5. Podsumowanie rozważań na temat eksploracji nowych źródeł danych
    • 5.5.1. Umiejętności badania nietypowych źródeł danych dla dowolnego projektu
  • Podsumowanie

6. Dane kategoryczne

  • 6.1. Praca z danymi kategorycznymi
    • 6.1.1. Metody obsługi danych kategorycznych
    • 6.1.2. Praca z danymi z ankiet
  • 6.2. Projekt 5. Analiza ankiety badającej nastawienie programistów do narzędzi AI
    • 6.2.1. Założenia projektu
    • 6.2.2. Słownik danych
    • 6.2.3. Oczekiwane rezultaty
    • 6.2.4. Wymagane narzędzia
  • 6.3. Zastosowanie metody zorientowanej na wyniki do analizy ankiety dla programistów
  • 6.4. Przykładowe rozwiązanie: Jak programiści wykorzystują sztuczną inteligencję?
    • 6.4.1. Analiza danych kategorycznych
    • 6.4.2. Analiza danych kategorycznych z ankiet
    • 6.4.3. Dotychczasowy postęp projektu
  • Podsumowanie

7. Dane kategoryczne - metody zaawansowane

  • 7.1. Powrót do Projektu 5. Analiza ankiety badającej nastawienie programistów do narzędzi AI
    • 7.1.1. Słownik danych
    • 7.1.2. Oczekiwane rezultaty
    • 7.1.3. Podsumowanie dotychczasowych prac nad projektem
  • 7.2. Zaawansowane metody analizy danych kategorycznych
    • 7.2.1. Grupowanie wartości ciągłych w kategorie dyskretne
    • 7.2.2. Stosowanie testów statystycznych do danych kategorycznych
    • 7.2.3. Odpowiadanie na nowe pytanie od początku do końca
    • 7.2.4. Wyniki projektu
  • 7.3. Podsumowanie na temat danych kategorycznych
    • 7.3.1. Umiejętności potrzebne do pracy z danymi kategorycznymi w dowolnym projekcie
  • Podsumowanie

8. Szeregi czasowe - przygotowanie danych

  • 8.1. Praca z szeregami czasowymi
    • 8.1.1. Ukryta głębia szeregów czasowych
    • 8.1.2. Jak pracować z szeregami czasowymi?
  • 8.2. Projekt 6. Analiza szeregów czasowych w celu poprawy infrastruktury rowerowej
    • 8.2.1. Problem
    • 8.2.2. Słownik danych
    • 8.2.3. Oczekiwane rezultaty
    • 8.2.4. Wymagane narzędzia
  • 8.3. Zastosowanie metody zorientowanej na wyniki do analizy danych o ruchu drogowym
  • 8.4. Przykładowe rozwiązanie: Gdzie należy skupić się na ulepszeniach infrastruktury rowerowej?
    • 8.4.1. Badanie dostępnych danych i wyodrębnianie szeregów czasowych
    • 8.4.2. Dotychczasowy postęp projektu
  • Podsumowanie

9. Szeregi czasowe - analiza danych

  • 9.1. Powrót do projektu 6. Analiza szeregów czasowych w celu poprawy infrastruktury rowerowej
    • 9.1.1. Opis problemu
    • 9.1.2. Słownik danych
    • 9.1.3. Oczekiwane rezultaty
  • 9.2. Gdzie należy skupić się na poprawie infrastruktury rowerowej?
    • 9.2.1. Analiza szeregów czasowych
    • 9.2.2. Wnioski i zalecenia wynikłe z projektu
  • 9.3. Podsumowanie: szeregi czasowe
    • 9.3.1. Umiejętności potrzebne do pracy z danymi szeregów czasowych w dowolnym projekcie
  • Podsumowanie

10. Szybkie prototypowanie - analiza danych

  • 10.1. Proces szybkiego prototypowania
    • 10.1.1. Przykład szybkiego prototypowania
  • 10.2. Projekt 7. Stworzenie prototypu do analizy cen nieruchomości w Walii
    • 10.2.1. Sformułowanie problemu
    • 10.2.2. Słownik danych
    • 10.2.3. Oczekiwane rezultaty
    • 10.2.4. Wymagane narzędzia
  • 10.3. Zastosowanie metody zorientowanej na wyniki w analizie danych dotyczących nieruchomości w Walii
  • 10.4. Przykładowe rozwiązanie: budowa prototypu do analizy danych o cenach nieruchomości
    • 10.4.1. Analiza danych przed prototypowaniem
    • 10.4.2. Analiza aspektów geograficznych zbioru danych
    • 10.4.3. Określanie sposobu prezentacji danych w prototypie
    • 10.4.4. Dotychczasowy postęp projektu
  • Podsumowanie

11. Szybkie prototypowanie - tworzenie dowodu koncepcji

  • 11.1. Powrót do projektu 7. Budowa prototypu do analizy cen nieruchomości w Walii
    • 11.1.1. Słownik danych
    • 11.1.2. Oczekiwane rezultaty
    • 11.1.3. Podsumowanie dotychczasowych prac nad projektem
  • 11.2. Tworzenie dowodu koncepcji
    • 11.2.1. Przygotowanie do budowy dowodu koncepcji
    • 11.2.2. Wykorzystanie biblioteki streamlit do stworzenia dowodu koncepcji
    • 11.2.3. Wyniki projektu i dalsze działania
  • 11.3. Podsumowanie na temat szybkiego prototypowania pomysłów
    • 11.3.1. Umiejętności szybkiego prototypowania w dowolnym projekcie
  • Podsumowanie

12. Rozbudowa rozwiązania innego analityka - przygotowanie danych

  • 12.1. Wyszukiwanie podobnych obiektów
  • 12.2. Kontynuowanie pracy rozpoczętej przez kogoś innego
  • 12.3. Projekt 8. Identyfikacja segmentów klientów na podstawie aktywności mobilnej
    • 12.3.1. Opis problemu
    • 12.3.2. Słownik danych
    • 12.3.3. Pożądane rezultaty
    • 12.3.4. Wymagane narzędzia
  • 12.4. Zastosowanie metody zorientowanej na wyniki do stworzenia drugiej iteracji segmentacji klientów
  • 12.5. Przykładowe rozwiązanie: tworzenie segmentów klientów
    • 12.5.1. Odtwarzanie analizy innej osoby
    • 12.5.2. Analiza danych o zdarzeniach w celu poznania zachowań klientów
    • 12.5.3. Dotychczasowy postęp projektu
  • Podsumowanie

13. Rozbudowa rozwiązania innego analityka - segmentacja użytkowników

  • 13.1. Powrót do projektu 8. Identyfikacja segmentów klientów na podstawie aktywności mobilnej
    • 13.1.1. Słownik danych
    • 13.1.2. Oczekiwane wyniki
    • 13.1.3. Podsumowanie dotychczasowych prac nad projektem
    • 13.1.4. Segmentacja użytkowników mobilnych z użyciem grupowania
    • 13.1.5. Wnioski i dalsze działania
  • 13.2. Podsumowanie: segmentacja i grupowanie
    • 13.2.1. Podsumowanie umiejętności przydatnych w każdym projekcie
  • Podsumowanie

Dodatek. Instrukcje instalacji Pythona

  • A.1. Instalacja Pythona
  • A.2. Instalacja poetry
  • A.3. Tworzenie środowiska wirtualnego
Kategoria: Raporty i Analizy
Zabezpieczenie: Watermark
Watermark
Watermarkowanie polega na znakowaniu plików wewnątrz treści, dzięki czemu możliwe jest rozpoznanie unikatowej licencji transakcyjnej Użytkownika. E-książki zabezpieczone watermarkiem można odczytywać na wszystkich urządzeniach odtwarzających wybrany format (czytniki, tablety, smartfony). Nie ma również ograniczeń liczby licencji oraz istnieje możliwość swobodnego przenoszenia plików między urządzeniami. Pliki z watermarkiem są kompatybilne z popularnymi programami do odczytywania ebooków, jak np. Calibre oraz aplikacjami na urządzenia mobilne na takie platformy jak iOS oraz Android.
ISBN: 978-83-289-3309-5
Rozmiar pliku: 37 MB

BESTSELLERY

Menu

Zamknij