Giter Site home page Giter Site logo

lego-sets's Introduction

Analiza Lego™ setov zadnjih dvajsetih let

Projektna naloga pri predmetu Programiranje 1 na FMF

Analiziral bom Lego sete, ki so izšli v zadnjih ~petih letih s spletne strani brickset.com.

Opazoval bom naslednje podatke:

  • tema
  • število kock
  • cena
  • datum izdaje
  • cena po kocki
  • minifigs
  • ocena
  • dostopnost
  • popularnost

Hipoteze:

  1. Lego vsako leto izda več setov
  2. Velikosti setov skozi leta
  3. ppp
    1. Povprečna cena kocke narašča skozi leta
    2. Seti z nižjim ppp vsebujejo več kock
  4. Najbolj izdane teme
  5. Minifigure
    1. Dražji seti vsebujejo več minifigur
    2. Cena minifigure skozi leta

Ta git repozitorij vsebuje:

  • mapo obdelani-podatki, kjer sta shranjeni .json in .csv datoteki zbranih in obdelanih podatkov,
  • mapo html-nalozeni-1999-2019, ki vsebuje 486 .html datotek, ki sem jih naložil s spletne strani brickset.com in so namenjene obdelavi,
  • datoteki urejanje_podatkov.py in orodja.py, ki predstavljata skripti za zajem in obdelavo podatkov.

Obdelani in urejeni podatki so shranjeni v datoteki bricksets-database-1999-2019.csv in obsegajo kategorije:

  • id
  • varianta
  • ime seta
  • temo
  • leto
  • tip seta
  • število vsebovanih figuric
  • število kock
  • vrsto pakiranja
  • dostopnost
  • US ceno in povprečno ceno na kocko v $
  • EU ceno in povprečno ceno na kocko v €
  • in čas izida v US in EU.

Naletel pa sem tudi na dve izjemi v zapisu posamičnih blokov v html datotekah med zajemanjem podatkov, ki za razliko od preostalih 11887 vnosov v svojih html datotekah nista imeli podanega tipa. Bloka teh dveh setov sem skopiral v datoteko izjemi-brez-podanega-tipa.html in jima s funkcijo tip_seta v skripti "ročno" podal njuna pravilna tipa.

Analiza podatkov je shranjena v datoteki lego_analiza.ipynb, zraven pa je še datoteka pomozna_analiza.ipynb v kateri je moj proces risanja grafov in nasploh razvijanja glavne analize podatkov v prvo omenjeni datoteki.


Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.