SZKOŁA DZIENNIKARSTWA DANYCH #5: Analiza danych

Jedna prosta formuła potrafi przemienić zwykły arkusz kalkulacyjny w narzędzie do analizy danych. Zobaczcie, ile można uzyskać minimalnym kosztem.

ROZDZIAŁ I: Podstawy dziennikarstwa danych
MODUŁ 1.5.: Ale co to znaczy? – analizujemy dane w arkuszach kalkulacyjnych

Przed Wami piąty kurs z cyklu Szkoła Dziennikarstwa Danych. W poprzednich odsłonach mówiliśmy, czym są danegdzie szukać danychjak tworzyć i edytować arkusze kalkulacyjne oraz przyswajaliśmy podstawy matematyki przydatne podczas obróbki danych. Dziś kontynuujemy pracę na arkuszach kalkulacyjnych, skupiając się na analizie danych.

Kilka słów o tym module: Wiemy już, jak czyścić i filtrować dane. Dziś skupimy się na ich analizie. Sprawdzimy, co mogą oznaczać nasze dane oraz na jakie pytania odpowiadają.

Pamiętacie plik, którym dzieliliśmy się z Wami w kursie dotyczącym pracy na arkuszach kalkulacyjnych? Jeśli go nie pobraliście, zróbcie to teraz (link). Plik World Banku (w formacie csv) zawiera informacje o PKB, populacji i wielu innych ciekawych rzeczach. Poświęćcie chwilę, by się z nim zapoznać. Sugerujemy korzystanie z Google Drive, bo to na nim będziemy dziś pracować.

ZADANIE: Urządźcie sobie krótką burzę mózgów. Co można zbadać korzystając z naszej bazy danych?

Oto kilka naszych pomysłów:
1) Ile pieniędzy (w dol.) przeznacza się na publiczną opiekę zdrowotną w każdym z krajów?
2) Ile z tych kwot przypada na jednego mieszkańca?
3) W których krajach wydatki w przeliczeniu na mieszkańca są największe, a w których najmniejsze? Jaka jest średnia na poszczególnych kontynentach? Jaka jest średnia na świecie?
4) Jaki jest związek pomiędzy prywatnymi i publicznymi wydatkami na zdrowie w poszczególnych krajach? Gdzie dominuje opieka prywatna, a gdzie publiczna?
5) Czy istnieje związek pomiędzy wydatkami na zdrowie a przewidywaną długością życia?

WAŻNE! Pamiętajcie, by być ostrożnym podczas wyciągania wniosków. Powiedzmy, że w kraju X wydatki na zdrowie rosną, podczas gdy umieralność obywateli zamiast spadać, również wzrasta. Czy to oznacza, że efektywność służby zdrowia maleje? Niekoniecznie. A co jeśli w analizowanym przez nas okresie w kraju X wybuchła śmiertelna epidemia, której nie odnotowano w danych? Nasza rada: bądźcie ostrożni. I sprawdzajcie swoje wnioski.

Formuły

Przejdźmy do naszych danych. Dane, którymi dysponujemy, nie są do końca kompletne (w kontekście zadanych przez nas pytań). Jak widzicie, obecnie wydatki na opiekę zdrowotną są reprezentowane przez procent PKB. Jeśli zatem chcemy porównać kwotowe wydatki na zdrowie w poszczególnych krajach, musimy posiadać nasze dane wyrażone w dolarach. Użyjemy do tego formuły, która przemieni nasz arkusz kalkulacyjny w narzędzie do analizy danych.

WAŻNE! Od razu po pobraniu pliku z danymi zróbcie jego kopię. Na niej należy dokonywać wszelkich edycji. To ważne, bo pozwala wrócić do pliku źródłowego, jeśli podczas edycji powinie się noga.

Używając prostej formuły odpowiemy na pierwsze z naszych pytań, czyli: ile pieniędzy (w dol.) przeznacza się na publiczną opiekę zdrowia w poszczególnych krajach? Posłuży do tego prosta formuła, którą opiszemy na przykładzie drugiego wiersza naszego arkusza kalkulacyjnego. Znajdują się w nim dane z 2001 r. dotyczące Afganistanu. Wiemy, że PKB wyniosło wówczas 2 461 666 315 dol. (kolumna E). Wydatki na publiczną opiekę zdrowotną wyniosły około 3,03 proc. (kolumna H). Wartość z kolumny E to 100 proc., a zatem nasza formuła powinna wyglądać tak: =(E2*H2)/100. Tę samą formułę stosujemy w komórce poniżej: (E3*H3)/100. Po otrzymaniu wyniku zaznaczamy obie komórki i przeciągamy na sam dół tabeli. Formuły zostaną automatycznie skopiowane. Takim sposobem w wybranej przez nas kolumnie znajdą się kwotowe wydatki na publiczną służbę zdrowia w poszczególnych krajach.

Jeśli zamiast wyniku w komórce z formułą pojawi się informacja o błędzie, zaznaczcie kolumnę z wartościami procentowymi i zmieńcie jej formatowanie na liczbowe (Formatuj -> Liczba). Jeśli i to nic nie pomoże, zamieńcie wszystkie kropki w waszej bazie na przecinki (Ctrl+F -> w oknie wpiszcie kropkę -> kliknijcie przycisk po prawej -> w polu “zamień na” wpiszcie przecinek -> kliknijcie “zamień wszystko”).

Powyższa formuła jest prosta, ale odpowiednio zmodyfikowana pozwala odpowiedzieć na wszystkie pytania z naszej bazy danych.

ZDANIE: Gratulujemy! Właśnie przemieniliście swój prosty arkusz kalkulacyjny w kalkulator do liczenia kwotowych wydatków na publiczną opiekę zdrowia w poszczególnych krajach świata. Teraz, postępując analogicznie, spróbujcie odpowiedzieć na pytania 2 i 3. Powodzenia.

Wszystkie kursy z cyklu Szkoła Dziennikarstwa Danych znajdziecie tutaj: Darmowe kursy dziennikarstwa danych.

Tłumaczenie: Piotr Kozłowski – Datablog.pl
Tekst został opublikowany na licencji CC BY-SA 3.0.

Źródło: School of Data

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *