-
nowość
SQL dla analityków danych. Skutecznie analizuj dane, wyciągaj wartościowe wnioski i opanuj zaawansowany SQL na potrzeby praktycznych zastosowań - ebook
SQL dla analityków danych. Skutecznie analizuj dane, wyciągaj wartościowe wnioski i opanuj zaawansowany SQL na potrzeby praktycznych zastosowań - ebook
SQL pozostaje fundamentalnym narzędziem w nowoczesnej analityce danych, a jego znajomość należy do najbardziej pożądanych na rynku IT. W erze big data i podejmowania decyzji opartych na danych ważna jest umiejętność efektywnego wydobywania informacji z relacyjnych baz danych. Czwarte wydanie tej książki, zaktualizowane o najnowsze funkcje PostgreSQL i dostosowane do współczesnych przepływów pracy, łączy tradycyjne podejście SQL-owe z nowoczesnymi narzędziami, jak Python, i technikami uczenia maszynowego.
Książka prowadzi czytelnika przez kompletną ścieżkę od podstaw tworzenia i zarządzania bazami danych, przez zaawansowane techniki agregacji i funkcje okna, aż po analizy statystyczne i przetwarzanie złożonych typów danych. Autorzy kładą nacisk na praktyczne zastosowania, prezentując nie tylko składnię SQL-a, ale przede wszystkim kontekst biznesowy i rzeczywiste scenariusze analityczne. Każdy rozdział zawiera praktyczne ćwiczenia i studia przypadku, które pozwalają natychmiast zastosować zdobytą wiedzę. Czwarte wydanie wprowadza ulepszoną strukturę dydaktyczną z ćwiczeniami bezpośrednio po wykładach i zadaniami sprawdzającymi na końcu rozdziałów.
Najważniejsze zagadnienia:
- Tworzenie i zarządzanie strukturami baz danych PostgreSQL z wykorzystaniem operacji CRUD
- Zaawansowane techniki pobierania danych: złączenia, podkwerendy, widoki i wyrażenia WITH
- Funkcje okna do identyfikowania wzorców, trendów i pozycji w zbiorach danych
- Analiza statystyczna i testowanie hipotez bezpośrednio w SQL-u
- Przetwarzanie JSON, tablic, danych geoprzestrzennych i szeregów czasowych
- Optymalizacja wydajności SQL-a przez indeksy i plany wykonywania kwerend
- Integracja SQL-a z Pythonem do automatyzacji procesów analitycznych
Od podstaw SQL-a do zaawansowanej analityki danych z PostgreSQL
Spis treści
O autorach
O korektorach merytorycznych
Przedmowa
Część 1. Systemy zarządzania danymi
- Rozdział 1. Wprowadzenie do systemów zarządzania danymi
- Wymogi techniczne
- Świat danych
- Modelowanie danych
- Relacyjne bazy danych i SQL
- Klucze główne i klucze obce
- Normalizacja
- Wady i zalety baz SQL-owych
- Konfigurowanie relacyjnej bazy danych PostgreSQL
- Ćwiczenie 1.1. Instalowanie systemu PostgreSQL na lokalnym komputerze
- Ćwiczenie 1.2. Dostęp do systemu PostgreSQL i podstawy jego użytkowania
- Ćwiczenie 1.3. Stosowanie narzędzia do przetwarzania kwerend w PostgreSQL
- Ćwiczenie 1.4. Importowanie przykładowej bazy danych sqlda
- Omówienie bazy danych sqlda
- Zadanie 1.
- Podsumowanie
- Rozdział 2. Tworzenie tabel o właściwej strukturze
- Wymogi techniczne
- Wykonywanie operacji CRUD w SQL-u
- Tworzenie
- Odczytywanie
- Aktualizowanie
- Usuwanie
- Tworzenie tabeli na podstawie istniejącego zbioru danych
- Wyświetlanie opisów kolumn
- Podstawowe typy danych w SQL-u
- Typy liczbowe i typy dla wartości pieniężnych
- Typy znakowe
- Typ logiczny
- Daty i godziny
- Inne typy danych
- Tworzenie tabeli za pomocą bezpośrednio podanej definicji
- Ograniczenia kolumn i tabel
- Ćwiczenie 2.1. Tworzenie i zapełnianie tabel
- Wstawianie danych do tabeli
- Ćwiczenie 2.2. Zapełnianie tabeli
- Usuwanie tabel
- Ćwiczenie 2.3. Usuwanie niepotrzebnej tabeli
- Zadanie 2.
- Podsumowanie
- Rozdział 3. Przenoszenie danych za pomocą operacji COPY
- Wymogi techniczne
- Eksportowanie danych z bazy PostgreSQL
- Instrukcja COPY w narzędziu psql
- Konfigurowanie poleceń COPY i COPY
- Importowanie danych do bazy PostgreSQL
- Ćwiczenie 3.1. Eksportowanie danych do pliku w celu dalszego przetwarzania ich w Excelu
- Zadanie 3.
- Podsumowanie
- Rozdział 4. Operowanie danymi za pomocą Pythona
- Wymogi techniczne
- Wprowadzenie do Pythona
- Ćwiczenie 4.1. Konfigurowanie Pythona na komputerze
- Zarządzanie danymi za pomocą Pythona
- Czym jest SQLAlchemy?
- Używanie Pythona z wykorzystaniem pakietów SQLAlchemy i pandas
- Pobieranie danych z bazy i ich zapisywanie w bazie za pomocą pakietu pandas
- Zapisywanie danych w bazie za pomocą Pythona
- Ćwiczenie 4.2. Wczytywanie, wizualizowanie i zapisywanie danych za pomocą Pythona
- Zadanie 4.
- Podsumowanie
Część 2. Prezentacja danych i operowanie nimi
- Rozdział 5. Wyświetlanie danych z użyciem instrukcji SELECT
- Wymogi techniczne
- Stosowanie wyrażeń SELECT
- Aliasy wyrażeń
- Klauzula LIMIT
- Klauzula ORDER BY
- Funkcje DISTINCT i DISTINCT ON
- Filtrowanie wyników kwerend
- Klauzule AND i OR
- Klauzule IN i NOT IN
- Klauzule IS NULL i IS NOT NULL
- Ćwiczenie 5.1. Wczytywanie danych z bazy
- Zadanie 5.
- Podsumowanie
- Rozdział 6. Przekształcanie i aktualizowanie danych
- Wymogi techniczne
- Aktualizowanie danych w tabelach
- Usuwanie danych
- Ćwiczenie 6.1. Aktualizowanie i usuwanie danych
- Stosowanie funkcji do przekształcania danych
- Funkcja CASE WHEN
- Funkcje dla różnych typów danych
- Ćwiczenie 6.2. Operowanie danymi przy użyciu funkcji
- Tworzenie funkcji zdefiniowanych przez użytkownika
- Polecenia df i sf
- Ćwiczenie 6.3. Tworzenie funkcji przyjmujących argumenty
- Wyzwalacze
- Modyfikowanie definicji tabeli
- Zadanie 6.
- Podsumowanie
- Rozdział 7. Definiowanie nowych zbiorów danych na podstawie istniejących
- Wymogi techniczne
- Tworzenie przekształconych zbiorów danych
- Wyrażenia WITH
- Ćwiczenie 7.1. Korzystanie z podkwerend
- Złączanie tabel
- Złączenia wewnętrzne
- Złączenia zewnętrzne
- Ćwiczenie 7.2. Używanie złączeń do analizy sprzedaży w salonach
- Wykonywanie operacji na zbiorach
- Ćwiczenie 7.3. Generowanie listy gości na przyjęcie dla klientów VIP za pomocą klauzuli UNION
- Zadanie 7.
- Podsumowanie
- Rozdział 8. Agregowanie danych za pomocą klauzuli GROUP BY
- Wymogi techniczne
- Agregowanie danych
- Ćwiczenie 8.1. Używanie funkcji agregujących do analizowania danych
- Funkcje agregujące z klauzulą GROUP BY
- Klauzula GROUP BY
- Ćwiczenie 8.2. Obliczanie cen dla typów produktów za pomocą klauzuli GROUP BY
- Funkcje agregujące dla zbiorów uporządkowanych
- Funkcje agregujące z klauzulą HAVING
- Ćwiczenie 8.3. Obliczanie wyników i wyświetlanie danych z użyciem klauzuli HAVING
- Zadanie 8.
- Podsumowanie
- Rozdział 9. Operacje na różnych wierszach z wykorzystaniem funkcji okna
- Wymogi techniczne
- Definiowanie funkcji okna
- Podstawy funkcji okna
- Ćwiczenie 9.1. Analizowanie zmian współczynnika podawania danych przez klientów w czasie
- Stosowanie zaawansowanych definicji okien
- Często używane funkcje okna
- Słowo kluczowe WINDOW
- Ramka okna
- Ćwiczenie 9.2. Motywowanie pracowników lunchem
- Zadanie 9.
- Podsumowanie
Część 3. Zaawansowane zagadnienia z obszaru analizy
- Rozdział 10. Wydajny SQL
- Wymogi techniczne
- Skanowanie baz danych
- Plany wykonywania kwerend
- Skanowanie indeksu
- Indeks w postaci B-drzewa
- Indeks z haszowaniem
- Skuteczne korzystanie z indeksów
- Zadanie 10.
- Podsumowanie
- Rozdział 11. Przetwarzanie danych w formacie JSON i tablic
- Wymogi techniczne
- Typy danych
- Stosowanie formatu JSON
- JSONB - wstępnie przetworzone dane w formacie JSON
- Dostęp do danych z pól w formacie JSON lub JSONB
- Tworzenie i modyfikowanie danych w polu w formacie JSONB
- Ćwiczenie 11.1. Przeszukiwanie obiektów JSONB
- Stosowanie tablic do przetwarzania elementów kolekcji
- Ćwiczenie 11.2. Analizowanie sekwencji z użyciem tablic
- Zadanie 11.
- Podsumowanie
- Rozdział 12. Zaawansowane typy danych: daty, tekst i dane geoprzestrzenne
- Wymogi techniczne
- Wykorzystywanie typów danych z datami i czasem do analiz
- Wprowadzenie do typu DATE
- Przekształcanie typów danych związanych z datą
- Przedziały
- Ćwiczenie 12.1. Analiza danych z szeregów czasowych
- Przetwarzanie tekstu
- Charakterystyka łańcuchów znaków i operowanie nimi
- Identyfikowanie wzorców w łańcuchach znaków
- Ćwiczenie 12.2. Przetwarzanie tekstu
- Stosowanie danych geoprzestrzennych
- Długość i szerokość geograficzna
- Ćwiczenie 12.3. Analizy geoprzestrzenne
- Zadanie 12.
- Podsumowanie
- Rozdział 13. Wnioskowanie statystyczne z wykorzystaniem SQL-a
- Wymogi techniczne
- Przejście od analityki do statystyki
- Podstawowe pojęcia: populacja i próby, parametry i statystyki
- Szacowanie: estymatory punktowe i przedziały ufności
- Testowanie hipotez
- Analiza korelacji i przeprowadzanie regresji
- Interpretacja wyników regresji
- Przykład prostej regresji liniowej
- Zadanie 13.
- Podsumowanie
- Rozdział 14. Studium przypadku: analiza z wykorzystaniem SQL-a
- Wymogi techniczne
- System analityki danych
- Modele wymiarowe
- Architektura hurtowni danych
- Analiza danych przy użyciu SQL-a
- Ćwiczenie 14.1. Kopiowanie danych z pliku do tabeli w strefie pośredniej
- Ćwiczenie 14.2. Sprawdzanie jakości danych surowych
- Ćwiczenie 14.3. Wczytywanie danych do schematu gwiazdy
- Ćwiczenie 14.4. Udostępnianie danych do analizy
- Podsumowanie
| Kategoria: | Bazy danych |
| Zabezpieczenie: |
Watermark
|
| ISBN: | 978-83-289-9981-7 |
| Rozmiar pliku: | 4,1 MB |