Giter Site home page Giter Site logo

mini-pw / 2022l-exploratorydataanalysis Goto Github PK

View Code? Open in Web Editor NEW
12.0 12.0 29.0 241.64 MB

Introduction to exploratory data analysis course for Mathematics and data analysis studies in Spring 2021/2022

R 0.44% HTML 97.03% Jupyter Notebook 2.53% Python 0.01%

2022l-exploratorydataanalysis's People

Contributors

annawawrzynczak avatar antonichudy avatar danielewskai avatar dragowskip avatar dyszkiewiczw avatar grzegorzpioro avatar izabelatelejko avatar jakub-bazyluk avatar jakubacki avatar jancicho avatar jarosinskam avatar jedrzejrucinski avatar kbownik avatar klopotowskik avatar kozaka93 avatar krzysztofadam avatar kuba-mieczkowski avatar madejmat avatar mamlak avatar michalwielgosz avatar mwczajkowska avatar paninka123321 avatar rafalroter avatar sliwinskaw avatar stankiewiczz avatar szymonmadej avatar wmerlin avatar woznicak avatar wroblewskamira avatar ziomek393 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

2022l-exploratorydataanalysis's Issues

Praca domowa 1

Celem pracy domowej jest sprawdzenie znajomości pakietów dplyr oraz tidyr.
Do rozwiązania jest 10 zadań. Plik z treścią zadań jest dostępny tutaj.

Poniższe zadania dotyczą zbioru danych o nieruchomościach dostępnego w pliku .csv. Zbiór danych zawiera informacje o cenie oraz atrybutach nieruchomości położonych w okolicy Seattle - opis kolumn.

data <- read.csv("house_data.csv ")

Rozwiązanie należy przesłać w postaci pliku .R z kodem do wygenerowania odpowiedzi oraz zakomentowaną odpowiedzią.

Przykładowa odpowiedź na zadane pytanie:

obraz

Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych numer 3, czyli: 22.03.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Skrypt z rozwiązaniem należy umieścić w folderze NazwiskoImie w
https://github.com/MI2-Education/2022L-ExploratoryDataAnalysis/tree/main/PraceDomowe/PracaDomowa1

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 2

Celem pracy domowej jest sprawdzenie znajomości pakietu ggplot2 oraz tworzenia poprawnych wizualizacji.

W ramach pracy domowej proszę o przygotowanie wizualizacji utworzonej z wykorzystaniem ggplot2. Praca domowa powinna być wykonana na podstawie wizualizacji dostępnej w prasie, telewizji lub internecie, opublikowanej w ciągu ostatnich 2 tygodni.

Rozwiązanie należy przesłać w postaci raportu w .pdf lub .html.

W raporcie proszę o:

  • podanie źródła oraz zamieszczenie wizualizacji, która jest poprawiana (warunek konieczny)
  • umieszczenie kodu oraz utworzonej wizualizacji (maksymalnie 4 pkt.)
  • krótkie uzasadnienie, dlaczego wykres jest lepszy niż oryginalny (maksymalnie 1 pkt.) Na przykład poprawa czytelności, poprawa słupków, które nie zaczynają się w 0, słupki 2d zamiast 3d, wybranie bardziej pasującego typu wykresu.

Termin oddania: 05.04.2022 do 12:00
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Raport z rozwiązaniem należy umieścić w folderze NazwiskoImie w .../PraceDomowe/PracaDomowa2
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 4

Celem pracy domowej jest sprawdzenie umiejętności przygotowywania interaktywnych wizualizacji z pakietem plotly.

W tym celu należy przygotować interaktywny wykres lub/i animowany oparty na zbiorze danych: https://www.kaggle.com/datasets/chriskachmar/amazon-top-50-bestselling-books-2009-2022

Rozwiązanie można przygotować w R/Python, powinno zawierać wizualizację oraz kod. Praca domowa powinna być plikiem w formacie R/Rmd/ipynb/py (oraz dodatkowo HTML jeżeli jest taka możliwość).

Termin oddania: 10.05.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Raport należy umieścić w folderze NazwiskoImie w .../PraceDomowe/PracaDomowa4

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 6

Celem pracy domowej jest przygotowanie wstępnej analizy eksploracyjnej danych.

Jako rozwiązanie należy przygotować raport w Python, który będzie opisywał zbiór danych oraz zawierał wnioski płynące z przeprowadzonej analizy. Proszę przygotować kod bez zbędnych roboczych komórek, zgodnie z kolejnością niżej podaną.

Rozwiązanie powinno być plikiem w formacie .pdf, .html lub .ipynb. Powinno zawierać takie informacje jak:

  1. Opis zbioru danych (jaka wielkość, jakie zmienne występują).
  2. Podsumowanie zbioru danych (statystyki).
  3. Co najmniej 2-3 wykresy badające rozkład zmiennych + wnioski.
  4. Co najmniej 2 wykresy pokazujące zależność w zbiorze danych.

Numer zbioru dla którego należy przygotować analizę to odpowiednio wynik następującego działania:

(suma cyfr składających się na numeru indeksu) mod 3

0 = https://www.kaggle.com/unsdsn/world-happiness
1 = https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009
2 = https://www.kaggle.com/uciml/mushroom-classification

Termin oddania: 14.06.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Raport należy umieścić w folderze NazwiskoImie w .../PraceDomowe/PracaDomowa6
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 5

Liczba punktów do zdobycia jest równa 10.

Tę pracę domową można wykonywać w zespole do dwóch osób.

Celem pracy jest przygotowanie dashboardu zawierającego wizualizacje dotyczące nieruchomości w Seattle - zbiór danych z pierwszej pracy domowej - dostępny tutaj, opis kolumn.

Dashboard powinien zawierać tytuł, przynajmniej dwa estetyczne wykresy oraz interaktywności w obrębie wykresu (albo użycie plotly albo kontrolki). Warto też dodać instrukcję jak czytać zamieszczone wykresy.

Rozwiązanie można przygotować jako flexdashboard lub aplikację R Shiny. Praca domowa powinna być plikiem w formacie R/Rmd oraz dodatkowo HTML - w przypadku flexdashboard.

Aplikacja powinna wspierać użytkownika w przeanalizowaniu co wpływa na cenę nieruchomości.

Termin oddania: 24.05.2022 do 12:00 29.05.2022 do 23:59
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Raport należy umieścić w folderze NazwiskoImie lub Nazwisko1Imie1_Nazwisko2Imię2 w .../PraceDomowe/PracaDomowa5
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Praca domowa 3

Liczba punktów do zdobycia jest równa 10.

Tę pracę domową można wykonywać samodzielnie lub zespołowo (K osób, patrz opis niżej). Wszystkie osoby z zespołu otrzymują tyle samo punktów.

W ramach pracy domowej należy przygotować K eksperymentów, sprawdzających czy określone problemy z czytaniem danych wciąż występują (problemy = iluzje na wykresach, błędy w odczytywaniu wykresu kołowego, błędy w pokazywaniu danych za pomocą wykresów 3D, problemy z tytułami na wykresie) (K = liczba osób w zespole, zespół z 3 osobami powinien zrobić 3 eksperymenty).

Następnie należy przetestować na przynajmniej 15 innych osobach czy dany problem występuje, np. przeprowadzając ankietę typu czy lepszy jest wykres A czy B.

Celem pracy jest sprawdzenie czy ,,dobre praktyki'' opracowane lata temu (słupki lepsze niż kąty, kolor wykorzystywany z umiarem, unikanie ozdobników), faktycznie działa w społeczeństwie które wykresami karmione jest od urodzenia.

Rozwiązanie powinno zawierać:

  • opis eksperymentów, które zostały przygotowane
  • opracowanie wyników testów - opisy, tabele, wykresy.

Rozwiąznie należy przesłać w postaci raportu w .pdf lub .html.

Termin oddania: 04.05.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Raport należy umieścić w folderze NazwiskoImie lub Nazwisko1Imie1..._NazwiskoKImięK w .../PraceDomowe/PracaDomowa3
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.