Giter Site home page Giter Site logo

2022z-datavisualizationtechniques's Introduction

Data Visualization Techniques

Winter Semester 2021/22 @kozaka93 @hbaniecki

Previous: Winter Semester 2020/21

Schedule

# Month-Day Lecture Lab Project Points
1 10-07 Course introduction, data types, visualization tools
10-04 R: review: proton, GitHub Introducing  P1
10-06
10-08
2 10-14 The Grammar of Graphics
10-11 R: dplyr, tidyr, forcats Group work P1 (1p)
10-13
10-15
3 10-19 Colors and scales
10-18 R: ggplot2 - introduction Data exploration P1 (1p)
HW1 (5p)
10-20
10-22
4 10-21 Don't do this at home
10-25 R: ggplot2 - plot modification, theme, facets First visualizations P1 (1p)
10-27
10-29
5 10-28 Other plot types
11-08 R: ggplot2 - advanced, extensions: patchwork, ggstatsplot, map, ggrepel Consultations HW2 (5p)
11-03
11-05
6 11-04 The International Business Communication Standards
11-15 Python: pandas, numpy, pandas.plot Advanced visualizations P1 (1p)
11-17
11-19
7 11-10 History of Statistical Graphics
11-22 Python: matplotlib, seaborn Prototype P1 (1p)
HW3 (10p)
11-24
11-26
8 11-18 How to work in a graphics program? Hans Rosling: The best stats you've ever seen, Let my dataset change your mindset
11-29 R: plotly - interactive visualization Consultations HW4 (5p)
12-01
12-03
9 11-25 Dashboards
12-06 R: Shiny - introduction Discussing P1
Introducing P2
12-08
12-10
10 12-02 Presentation of P1 (part 1) P1 (20p)
12-13 R: Shiny - advanced Group work P2 (1p)
HW5 (5p)
12-15
12-17
11 12-09 Presentation of P1 (part 2)
12-20 R: Xmas trees - gganimate, RBokeh, ggiraph, vegalite, googleVis Data analysis P2 (2p)
HW6 (10p)
12-22
12-21
12 12-16 Scrollytelling: Pockets, Powerless , Here’s How America Uses Its Land
01-03 R: tidycharts, rpivotTable, visNetwork Prototype P2 (2p)
HW7 (5p)
01-05
01-10
13 01-13 Guest lecturer
01-17 R: DataExplorer, visdat etc. Consultations
01-12
01-14
14 01-20 Presentation of P2 (part 1) P2 (20p)
01-24 Python: pandas-profiler etc. Discussing P2 HW8 (5p)
01-19
01-21
15 01-27 Presentation of P2 (part 2)
01-31 Consultations Consultations
01-26
01-28

General rules and course assessment

You can obtain up to 100 points during the term, which will be assigned according to the following list:

  • Projects (2 x 25 points)
  • Homeworks (2 x 10 points, 6 x 5 points)

You need at least 51 points overall, in this at least 13 points from each of the projects, in order to pass the course.

The grades will be given according to the table:

Grade 3 3.5 4 4.5 5
Score (50, 60] (60, 70] (70, 80] (80, 90] (90, ∞)

2022z-datavisualizationtechniques's People

Contributors

amajczyk avatar andrzejmnm avatar azoz01 avatar bieleckipiotr avatar boro128 avatar d3tr0 avatar dawidpludowski avatar dyrewucktv avatar franczakk avatar galkowskim avatar grzgorzk avatar hbaniecki avatar hbujakow avatar hkozubek avatar hoanganhlinh avatar jakub-piw avatar kozaka93 avatar krezelj avatar michal1337 avatar michtom avatar notsabina avatar pawelglr avatar skonieczkak avatar skowronskid avatar sokolowskij avatar szymon-gut avatar szymonsm avatar wi1lku avatar witasm avatar zuzannakotlinska avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

2022z-datavisualizationtechniques's Issues

Praca domowa 2

Celem pracy domowej jest sprawdzenie znajomości pakietu ggplot2 oraz tworzenia poprawnych wizualizacji.

W ramach pracy domowej proszę o przygotowanie wizualizacji utworzonej z wykorzystaniem ggplot2. Praca domowa powinna być wykonana na podstawie wizualizacji dostępnej w prasie, telewizji lub internecie, opublikowanej w ciągu ostatnich 2 tygodni.

Rozwiązanie należy przesłać w postaci raportu w pdf lub html.

W raporcie proszę o:

  • podanie źródła oraz zamieszczenie wizualizacji, która jest poprawiana (warunek konieczny)
  • umieszczenie kodu oraz utworzonej wizualizacji (maksymalnie 4 pkt.)
  • krótkie uzasadnienie, dlaczego wykres jest lepszy niż oryginalny (maksymalnie 1 pkt.)
    Na przykład poprawa czytelności, poprawa słupków, które nie zaczynają się w 0, słupki 2d zamiast 3d, wybranie bardziej pasującego typu wykresu.

Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych numer 4, czyli:

  • Grupa 2 i 4 do 01.11.
  • Grupa 3 do 03.11.
  • Grupa 1 do 05.11.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw2

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 6

Liczba punktów do zdobycia jest równa 10.

Tę pracę domową można wykonywać w zespole do dwóch osób.

Celem pracy jest przygotowanie aplikacji Shiny zawierającej wizualizacje dotyczące nagrody Nobla. Zbiór danych dostępny tutaj.

Aplikacja powinna zawierać tytuł, przynajmniej dwie kontrolki (lub interaktywności w obrębie wykresu - zaimplementowana a nie plotly) i przynajmniej dwa estetyczne wykresy. Warto też dodać instrukcję, jeśli funkcjonalności nie są oczywiste.

Rozwiązanie powinno zawierać:

  • kod aplikacji
  • plik README.md z linkiem do aplikacji na shinyapps.io.

Aplikacja powinna wspierać użytkownika w przeanalizowaniu laureatów nagrody Nobla w różnych kategoriach.

Czas na wykonanie pracy domowej wynosi 2 tygodnie od zajęć laboratoryjnych numer 9, czyli:

  • Grupa 2 i 4 do 20.12.
  • Grupa 3 do 22.12.
  • Grupa 1 do 24.12.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze Nazwisko1Imie1_Nazwisko2Imie2 lub NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw6

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 7 🎄

🎄🎄 Choinki to coroczna tradycja na Technikach Wizualizacji Danych. 🎄🎄

W ramach pracy domowej należy wykonać statyczną lub interaktywną choinkę z użyciem bibliotek do wizualizacji danych z R / Python lub Java Script. Wcześniej należy wygenerować odpowiedni (pomysłowy) zbiór danych.

Drzewka z poprzednich lat można obejrzeć tutaj.

Choinka jest warta 5 punktów.

Rozwiązanie powinno zawierać:

  • kod do wygenerowania choinki
  • plik z wygenerowanym drzewkiem w .pdf, .png, .jpg, .gif lub .html jeśli jest interaktywne.

Termin oddania: zajęcia laboratoryjne numer 11 (czyli odpowiednio 20.12, 21.12 (wtorek jest piątkiem) lub 22.12., ale jeśli ktoś podczas zajęć nie zdąży, to prace będę przyjmowane do 02.01.

Rozwiązanie należy umieścić w folderze NazwiskoImie w https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw7

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 1

Celem pracy domowej jest sprawdzenie znajomości pakietów do analizy danych poznanych na laboratoriach.

Do rozwiązania jest 10 zadań. Plik z treścią zdań jest dostępny tutaj.

Poniższe zadania dotyczą zbioru danych auta2012 dostępnego w pakiecie PogromcyDanych. Zbiór danych auta2012 to ogłoszenia z serwisu otomoto.pl pobrane w 2012, zawiera informacje o ofertach dla przeszło 207 tysięcy ogłoszeń sprzedaży aut.

Rozwiąznie należy przesłać w postaci pliku R z kodem do wygenerowania odpowiedzi oraz zakomentowaną odpowiedzią.

Przykładowa odpowiedź na zadane pytanie:

obraz

Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych, czyli:

  • Grupa 2 i 4 do 18.10.
  • Grupa 3 do 20.10.
  • Grupa 1 do 22.10.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Skrypt z rozwiązaniem należy umieścić w folderze NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw1

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 3

Liczba punktów do zdobycia jest równa 10.

Tę pracę domową można wykonywać samodzielnie lub zespołowo (K osób, patrz opis niżej) i na jej wykonanie są 2 tygodnie. Wszystkie osoby z zespołu otrzymują tyle samo punktów.

W ramach pracy domowej należy przygotować K eksperymentów, sprawdzających czy określone problemy z czytaniem danych wciąż występują (problemy = iluzje na wykresach, błędy w odczytywaniu wykresu kołowego, błędy w pokazywaniu danych za pomocą wykresów 3D, problemy z tytułami na wykresie) (K = liczba osób w zespole, zespół z 3 osobami powinien zrobić 3 eksperymenty).

Następnie należy przetestować na przynajmniej 15 innych osobach czy dany problem występuje, np. przeprowadzając ankietę typu czy lepszy jest wykres A czy B.

Celem pracy jest sprawdzenie czy ,,dobre praktyki'' opracowane lata temu (słupki lepsze niż kąty, kolor wykorzystywany z umiarem, unikanie ozdobników), faktycznie działa w społeczeństwie które wykresami karmione jest od urodzenia.

Rozwiązanie powinno zawierać:

  • opis eksperymentów, które zostały przygotowane
  • opracowanie wyników testów - opisy, tabele, wykresy.

Rozwiązanie należy przesłać w postaci raportu w pdf lub html.

Termin oddania: 21.11. Przesunięty do 24.11.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze NazwiskoImie lub Nazwisko1Imie1_..._NazwiskoKImięK w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw3

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 5

Celem pracy domowej jest sprawdzenie umiejętności przygotowywania interaktywnych wizualizacji z pakietem plotly.

W tym celu należy przygotować interaktywny wykres lub/i animowany oparty na zbiorze danych: https://www.kaggle.com/imdevskp/nobel-prize

Rozwiązanie można przygotować w R/Python, powinno zawierać wizualizację oraz kod. Praca domowa powinna być plikiem w formacie R/Rmd/ipynb/py (oraz dodatkowo HTML jeżeli jest taka możliwość).

Czas na wykonanie pracy domowej wynosi 2 tygodnie od zajęć laboratoryjnych numer 8, czyli:

  • Grupa 2 i 4 do 13.12.
  • Grupa 3 do 15.12.
  • Grupa 1 do 17.12.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw5

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 8

Celem pracy domowej jest przygotowanie wstępnej analizy eksploracyjnej danych.

Jako rozwiązanie należy przygotować raport w R/Python, który będzie opisywał zbiór danych oraz zawierał wnioski płynące z przeprowadzonej analizy.

Rozwiązanie powinno być plikiem w formacie .pdf, .html lub .jpynb.

Numer zbioru dla którego należy przygotować analizę to odpowiednio wynik następującego działania:

(suma cyfr składających się na numeru indeksu) mod 4

  1. https://www.kaggle.com/unsdsn/world-happiness
  2. https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009
  3. https://www.kaggle.com/uciml/mushroom-classification
  4. https://www.kaggle.com/mohamedbakrey/housecsv

Czas na wykonanie pracy domowej wynosi tydzień dwa tygodnie od zajęć laboratoryjnych numer 13, czyli:

  • Grupa 2 i 4 do 24.01. 31.01.
  • Grupa 3 do 19.01. 26.01.
  • Grupa 1 do 21.01. 28.01.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw8

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 4

Celem pracy domowej jest sprawdzenie znajomości pakietu numpy/pandas oraz tworzenia poprawnych wizualizacji (matplotlib/seaborn).

Praca domowa składa się z dwóch zadań. Pierwszym z nich jest udzielenie odpowiedzi na 3 pytania wykorzystując operacje na danych (numpy/pandas). Drugim zadaniem jest przygotowanie wizualizacji, która będzie poprawiała rezultat pracy domowej 2.

Rozwiązanie należy przygotować w pliku Jupyter Notebook, plik z treścią zadań dostępy tutaj.

Zadanie 1 (1.5 pkt)

Używając funkcji z pakietu numpy oraz pandas odpowiedz na poniższe pytania dotyczące zbioru danych o grach.
a) Wybierz gry, które zostały wydane po 2015 roku przez Nintendo oraz ich sprzedaż w Ameryce była niższa niż w Europie.
b) Jak rodzaj gry zarobił najwięcej w roku 2010?
c) Jakie typy gier sprzedają się średnio lepiej w Japonii niż w Europie? Jakie to typy gier i jaka jest ta wartość średnia. Wynikiem powinna być tabelka posortowana względem średnich. Nazwij kolumny Typ Gry i Średnia sprzedaż w Japonii.

Zadanie 2 (3.5 pkt)

Wykorzystując narzędzie do wizualizacji w Pythonie (matplotlib, seaborn) należy poprawić wykres, który był rozwiązaniem pracy domowej 2 (najlepiej poprawić swoją pracę domową, ale można też cudzą).

Rozwiązanie powinno zawierać:

  1. oryginalny wykres wraz ze źródłem

  2. wykres w ggplot2 wraz z linkiem do pracy domowej w której się on pojawił (kod nie jest potrzebny)

  3. poprawiony wykres z punktu 2) w Pythonie

  4. uzasadnienie, czemu wykres w Pythonie jest lepszy od dwóch pozostałych.

Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych numer 7, czyli:

  • Grupa 2 i 4 do 29.11.
  • Grupa 3 do 01.12.
  • Grupa 1 do 03.12.

Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Rozwiązanie należy umieścić w folderze NazwiskoImie w
https://github.com/mini-pw/2022Z-DataVisualizationTechniques/tree/main/homeworks/hw4

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.