mini-pw / 2022l-exploratorydataanalysis Goto Github PK
View Code? Open in Web Editor NEWIntroduction to exploratory data analysis course for Mathematics and data analysis studies in Spring 2021/2022
Introduction to exploratory data analysis course for Mathematics and data analysis studies in Spring 2021/2022
Celem pracy domowej jest sprawdzenie znajomości pakietów dplyr
oraz tidyr
.
Do rozwiązania jest 10 zadań. Plik z treścią zadań jest dostępny tutaj.
Poniższe zadania dotyczą zbioru danych o nieruchomościach dostępnego w pliku .csv. Zbiór danych zawiera informacje o cenie oraz atrybutach nieruchomości położonych w okolicy Seattle - opis kolumn.
data <- read.csv("house_data.csv ")
Rozwiązanie należy przesłać w postaci pliku .R z kodem do wygenerowania odpowiedzi oraz zakomentowaną odpowiedzią.
Przykładowa odpowiedź na zadane pytanie:
Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych numer 3, czyli: 22.03.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Skrypt z rozwiązaniem należy umieścić w folderze NazwiskoImie
w
https://github.com/MI2-Education/2022L-ExploratoryDataAnalysis/tree/main/PraceDomowe/PracaDomowa1
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
Celem pracy domowej jest sprawdzenie znajomości pakietu ggplot2
oraz tworzenia poprawnych wizualizacji.
W ramach pracy domowej proszę o przygotowanie wizualizacji utworzonej z wykorzystaniem ggplot2
. Praca domowa powinna być wykonana na podstawie wizualizacji dostępnej w prasie, telewizji lub internecie, opublikowanej w ciągu ostatnich 2 tygodni.
Rozwiązanie należy przesłać w postaci raportu w .pdf lub .html.
W raporcie proszę o:
Termin oddania: 05.04.2022 do 12:00
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Raport z rozwiązaniem należy umieścić w folderze NazwiskoImie
w .../PraceDomowe/PracaDomowa2
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
Celem pracy domowej jest sprawdzenie umiejętności przygotowywania interaktywnych wizualizacji z pakietem plotly
.
W tym celu należy przygotować interaktywny wykres lub/i animowany oparty na zbiorze danych: https://www.kaggle.com/datasets/chriskachmar/amazon-top-50-bestselling-books-2009-2022
Rozwiązanie można przygotować w R/Python, powinno zawierać wizualizację oraz kod. Praca domowa powinna być plikiem w formacie R/Rmd/ipynb/py (oraz dodatkowo HTML jeżeli jest taka możliwość).
Termin oddania: 10.05.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Raport należy umieścić w folderze NazwiskoImie
w .../PraceDomowe/PracaDomowa4
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
Celem pracy domowej jest przygotowanie wstępnej analizy eksploracyjnej danych.
Jako rozwiązanie należy przygotować raport w Python, który będzie opisywał zbiór danych oraz zawierał wnioski płynące z przeprowadzonej analizy. Proszę przygotować kod bez zbędnych roboczych komórek, zgodnie z kolejnością niżej podaną.
Rozwiązanie powinno być plikiem w formacie .pdf, .html lub .ipynb. Powinno zawierać takie informacje jak:
Numer zbioru dla którego należy przygotować analizę to odpowiednio wynik następującego działania:
(suma cyfr składających się na numeru indeksu) mod 3
0 = https://www.kaggle.com/unsdsn/world-happiness
1 = https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009
2 = https://www.kaggle.com/uciml/mushroom-classification
Termin oddania: 14.06.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Raport należy umieścić w folderze NazwiskoImie w .../PraceDomowe/PracaDomowa6
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
Liczba punktów do zdobycia jest równa 10.
Tę pracę domową można wykonywać w zespole do dwóch osób.
Celem pracy jest przygotowanie dashboardu zawierającego wizualizacje dotyczące nieruchomości w Seattle - zbiór danych z pierwszej pracy domowej - dostępny tutaj, opis kolumn.
Dashboard powinien zawierać tytuł, przynajmniej dwa estetyczne wykresy oraz interaktywności w obrębie wykresu (albo użycie plotly
albo kontrolki). Warto też dodać instrukcję jak czytać zamieszczone wykresy.
Rozwiązanie można przygotować jako flexdashboard
lub aplikację R Shiny
. Praca domowa powinna być plikiem w formacie R/Rmd oraz dodatkowo HTML - w przypadku flexdashboard.
Aplikacja powinna wspierać użytkownika w przeanalizowaniu co wpływa na cenę nieruchomości.
Termin oddania: 24.05.2022 do 12:00 29.05.2022 do 23:59
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Raport należy umieścić w folderze NazwiskoImie
lub Nazwisko1Imie1_Nazwisko2Imię2
w .../PraceDomowe/PracaDomowa5
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
Liczba punktów do zdobycia jest równa 10.
Tę pracę domową można wykonywać samodzielnie lub zespołowo (K osób, patrz opis niżej). Wszystkie osoby z zespołu otrzymują tyle samo punktów.
W ramach pracy domowej należy przygotować K eksperymentów, sprawdzających czy określone problemy z czytaniem danych wciąż występują (problemy = iluzje na wykresach, błędy w odczytywaniu wykresu kołowego, błędy w pokazywaniu danych za pomocą wykresów 3D, problemy z tytułami na wykresie) (K = liczba osób w zespole, zespół z 3 osobami powinien zrobić 3 eksperymenty).
Następnie należy przetestować na przynajmniej 15 innych osobach czy dany problem występuje, np. przeprowadzając ankietę typu czy lepszy jest wykres A czy B.
Celem pracy jest sprawdzenie czy ,,dobre praktyki'' opracowane lata temu (słupki lepsze niż kąty, kolor wykorzystywany z umiarem, unikanie ozdobników), faktycznie działa w społeczeństwie które wykresami karmione jest od urodzenia.
Rozwiązanie powinno zawierać:
Rozwiąznie należy przesłać w postaci raportu w .pdf lub .html.
Termin oddania: 04.05.2022 do 12:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.
Raport należy umieścić w folderze NazwiskoImie
lub Nazwisko1Imie1..._NazwiskoKImięK
w .../PraceDomowe/PracaDomowa3
Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.