Przenoszenie danych z i do Excela - ebook
Przenoszenie danych z i do Excela - ebook
Excel jest niezastąpionym narzędziem do analizy danych – prostym w użyciu, szybkim i oferującym ogromne możliwości. Nie tylko oferuje wiele wbudowanych funkcji, ale również umożliwia skomplikowane analizy statystyczne. Do przeprowadzenia analiz potrzebne są dane, te jednak często znajdują się w zewnętrznych źródłach: plikach tekstowych, bazach danych czy stronach WWW. W tej książce przeczytasz, jak je pozyskać, aby móc pracować z nimi w Excelu.
Spis treści
1. Przegląd metod importowania danych do Excela
2. Szybkie importowanie danych z bazy MS Access
3. Importowanie danych z plików tekstowych za pomocą kreatora
4. Importowanie danych do tabeli przestawnej
5. Power Query – zaawansowane możliwości importu danych
6. Pobieranie danych ze stron WWW 7. Konsolidowanie danych z wielu arkuszy
8. Szybkie modyfikowanie zaimportowanych danych
9. Formatowanie zaimportowanych danych
10. Porządkowanie danych o niestandardowym układzie
11. Wymiana danych między Excelem i Wordem
Kategoria: | Bazy danych |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-269-6512-8 |
Rozmiar pliku: | 5,6 MB |
FRAGMENT KSIĄŻKI
Excel jest niezastąpionym narzędziem do analizy danych – prostym w użyciu, szybkim i oferującym ogromne możliwości. Nie tylko oferuje wiele wbudowanych funkcji, ale również umożliwia skomplikowane analizy statystyczne. Do przeprowadzenia analiz potrzebne są dane, te jednak często znajdują się w zewnętrznych źródłach: plikach tekstowych, bazach danych czy stronach WWW. W tej książce przeczytasz, jak je pozyskać, aby móc pracować z nimi w Excelu.
Zaawansowanych użytkowników z pewnością zainteresuje rozdział na temat dodatku Power Query. Jest to bezpłatne rozszerzenie Excela, które pozwala użytkownikom wyszukiwać, dostosowywać do własnych potrzeb i pobierać dane z różnych źródeł zewnętrznych, w tym z Internetu.
Zaimportowanie danych to jednak nie koniec pracy związanej z przygotowaniem danych do analizy. Typowym problemem w tej sytuacji jest „zaśmiecenie” danych zbędnymi ciągami znaków czy też występowanie kropek zamiast przecinków w liczbach. Excel oferuje kilka przydatnych funkcji i narzędzi, dzięki którym błyskawicznie pozbędziesz się ich z arkusza. Ważnym etapem porządkowania zestawienia jest również formatowanie. W książce pokazujemy, jak można tę operację szybciej, a także w jaki sposób radzić sobie z formatowaniem komórek zawierających informacje o czasie i dacie.
Dane przechowywane w programie Access można przetwarzać w skoroszycie programu Excel, co umożliwia korzystanie z funkcji analizy danych i tworzenia wykresów, elastyczne rozmieszczanie i tworzenie układów danych oraz stosowanie wielu innych funkcji, które są niedostępne w programie Access. W tym rozdziale przeczytasz, w jaki sposób zaimportować całą bazę danych oraz wybrane rekordy.
Innym wyzwaniem jest przenoszenie danych z Excela do innych aplikacji. Zestawienia wklejane do dokumentów Worda zwykle mają niepoprawny układ, co zmusza do ich ponownego formatowania. Okazuje się, że wcale nie musisz tracić na to czasu. Pełne możliwości Excela i Worda wykorzystasz, jeśli nauczysz się wymieniać dane między skoroszytami i dokumentami.1. Przegląd metod importowania danych do Excela
Excel jest niezastąpionym narzędziem do analizy danych – prostym w użyciu, szybkim i oferującym ogromne możliwości. Nie tylko możemy korzystać z wielu wbudowanych funkcji, ale również przeprowadzać za jego pomocą skomplikowane analizy statystyczne. Nie powinien być jednak używany w roli źródła danych, szczególnie jeżeli z tymi samymi danymi pracuje więcej niż jedna osoba.
Przechowywanie danych źródłowych bezpośrednio w skoroszytach Excela ma dwie poważne wady:
1. Arkusze te z reguły są zapisane w komputerach użytkowników, a więc poza bezpośrednią kontrolą administratorów. W rezultacie są narażone na utratę, np. w wyniku uszkodzenia komputera czy przypadkowego skasowania pliku i udostępnienia niepowołanym osobom (stacje robocze z reguły są gorzej zabezpieczone niż serwery, często też fizyczny dostęp do nich mają różne osoby).
2. Skoroszyty mogą zawierać rozbieżne kopie tych samych danych. Ponieważ najczęściej sami użytkownicy są odpowiedzialni za synchronizację (aktualizację) zapisanych w nich danych, zdarza się, że poszczególne skoroszyty zawierają kopie danych z różnych dni, w konsekwencji ta sama analiza przeprowadzona przez poszczególnych użytkowników daje odmienne wyniki.
Rozwiązaniem obu tych problemów (gwarantującym bezpieczeństwo danych i spójność wyników ich analiz) jest pobieranie danych do analizy z zewnętrznych źródeł. Od wersji 2007 można to zrobić za pośrednictwem połączeń danych pakietu Office.
1.1. Pliki typu ODC
Połączenia danych to pliki w formacie XML, w których zapisane są informacje potrzebne do połączenia się z zewnętrznym źródłem danych i pobrania z niego wybranych danych. Bez obaw, żeby pobrać dane, nie będziemy jednak musieli samodzielnie tworzyć i edytować pokazanego na rysunku 1.1 dokumentu XML – zrobi to za nas arkusz Excel.
Tworzenie połączeń przećwiczymy na przykładzie różnych baz danych, zaczynając od serwera SQL Server firmy Microsoft.
Rysunek 1.1. Fragment pliku typu ODC definiującego połączenie z widokiem bazy danych
Bazy danych zawierają tabele i widoki. Z naszej perspektywy różnice między tymi obiektami są nieistotne – każdy z nich służy do odczytania interesujących nas danych.
1.2. Pobieranie danych z baz SQL Server
SQL Server jest jednym z popularniejszych serwerów bazodanowych – to ten serwer (w darmowej edycji Express) jest wykorzystywany m.in. w programach Płatnik, Asseco WAPRO czy Comarch Optima.
Żeby pobrać dane z tego typu bazy, potrzebne są:
1. Adres lub nazwa serwera SQL Server.
2. Nazwa bazy danych.
3. Nazwy tabel lub widoków, z których odczytamy dane.
4. Konto użytkownika posiadającego co najmniej uprawnienia do odczytywania wybranych tabel lub widoków.
Wszystkie te informacje dostaniemy od administratora serwera bazodanowego.
1.3. Połączenie z bazą relacyjną (pobieranie danych z pojedynczej tabeli lub widoku)
Baza relacyjna (baza OLTP) jest najczęściej używanym typem baz danych. Bazy tego typu przechowują i zarządzają danymi operacyjnymi, np. danymi dotyczącymi bieżących operacji sprzedaży.
Aby pobrać dane z bazy relacyjnej SQL Server:
1. Uruchom arkusz Excel.
2. Utwórz nowy skoroszyt.
3. Przejdź do zakładki Dane.
4. Z lewej strony wstążki wyświetlona zostanie sekcja Pobieranie danych zewnętrznych. Znajdujące się na niej przyciski pozwalają utworzyć nowe lub wybrać istniejące połączenie danych pakietu Office.
5. Kliknij przycisk Z innych źródeł, a następnie z listy dostępnych typów źródeł danych wybierz Z programu SQL Server (rysunek 1.2).
Rysunek 1.2. Zakładka Dane pozwala m.in. tworzyć i pracować z połączeniami danych pakietu Office
Sekcja Pobieranie danych zewnętrznych będzie nieaktywna, jeżeli w danym momencie zaznaczona komórka znajduje się w obszarze tabeli Excela. Aby je uaktywnić, należy kliknąć dowolną, nienależącą do tabeli, komórkę arkusza.
6. Uruchomiony zostanie kreator połączenia danych.
7. Odpowiadając na jego pierwsze pytanie:
a. Wpisz nazwę serwera SQL (może to być nazwa komputera, na którym działa ten serwer, np. Serwer01, lub nazwa komputera uzupełniona o nazwę serwera SQL Server, np. Serwer01\Express),
b. Jeżeli konto użytkownika, na które zalogowałeś się do systemu Windows, ma odpowiednie uprawnienia po stronie serwera SQL Server, kliknij Dalej. W przeciwnym razie należy wybrać opcję Użyj następującej nazwy użytkownika i hasła, a następnie wpisać te dane i kliknąć Dalej.
8. Drugie pytanie będzie dotyczyło:
a. Wyboru bazy źródłowej (bazy, w której znajdują się interesujące Cię dane, np. bazy AdventureWorks2012),
b. Wskazania tabeli lub widoku, z którego chcesz odczytać dane. Jeżeli tylko w bazie istnieją odpowiednie widoki, powinieneś dzięki nim odczytywać dane, a nie bezpośrednio z tabel. W tym przypadku wybierze widok vSalesPerson zwracający dane o wynikach poszczególnych sprzedawców.
9. Ostatnie pytanie dotyczy zapisu utworzonego pliku połączenia. Odpowiadając na nie, możesz:
a. Zmienić lokalizację tego pliku (domyślnie pliki połączeń zapisywane są w folderze C:\Users\
b. Podać opcjonalny opis połączenia (np. Połączenie z widokiem vSalesPerson).
c. Zmienić przyjazną nazwę połączenia (domyślnie zawiera ona nazwę serwera SQL Server uzupełnioną o nazwę bazy danych i tabeli lub widoku).
d. Podać słowa kluczowe, za pomocą których będziemy mogli znaleźć to połączenie.
10. Po kliknięciu przycisku Zakończ połączenie zostanie utworzone i automatycznie uruchomiony zostanie kreator importu danych.
Ponieważ pobierane dane pochodzą z pojedynczego widoku, najlepszym sposobem na ich pobranie będzie import do tabeli Excela (ta opcja jest opcją domyślną). Pozostaje nam jedynie wskazać lokalizację tworzonej tabeli (wybrać komórki istniejącego arkusza lub utworzyć nowy arkusz) i kliknąć OK. Dane (w tym przypadku dane pracowników oraz wyniki ich sprzedaży) zostaną zaimportowane do arkusza i sformatowane jako tabela.
1.4. Połączenie z hurtownią danych (pobieranie danych z połączonych ze sobą tabel lub widoków)
Wykonując to ćwiczenie, dowiemy się, jak pobrać dane z wielu połączonych ze sobą tabel lub widoków. Wykorzystamy w tym celu hurtownię danych, czyli bazę przechowującą (w tabelach faktów) historię wybranego procesu biznesowego (np. sprzedaży), a w połączonych z nią tabelach wymiarów informacje kontekstowe, np. opisujące klientów, produkty czy czas.
Darmowy fragment