Giter Site home page Giter Site logo

muzikanalyser's Introduction

Analiza ponavljajočih se sklad na storitvi Strudl Muzik

V tem projektu bom analiziral povaljajoče se sklade na spletni strani muzik.si Muzik je servis, ki poslušalcem omogoča da brezplačno (in skoraj legalno) poslušajo glasbo, ki je dostopna na svetovnem spletu, tako da jo združi v skupno bazo, po kateri omogoča iskanje. Ker je seveda s takim načinom dela ogromno pesmi podvojenih (ali poštirinajsterjenih) se je pojavil problem ponavljanja pesmi v iskalniku, kar je za uporabnike zelo moteče, saj ob iskanju dobimo voliko nepotrebnih rezultatov. Muzik si seveda želi, da bi te rezultate združil in izmed enakih pesmi pokazal samo najkvalitenejšo oziroma s pomočjo pametnega algoritma razporedil uporabo na različne lokacije iste pesmi.

Način dela

Od ustvarjalcev platforme sem pridobil originalno sqlite bazo prejšnje verzije projekta (baza ima sicer manjšo napako), ki sem jo nato izvozil v csv datoteko (med izvozom sem uredil tudi kodiranje znakov, saj del sklad prihaja iz ruskih strežnikov in je bilo v bazi nekaj problemov s kodnimi tabelami). Csv datotke sem nato uvozil in iz njih naredil objekte, ter posamezni pesmi priredil kanonično ime (spremenil čžšćđ... v angleške podobne črke, odstranil posebne znake, odstranil avtorje, in razdelil naslov po besedah). Tako kanonizirane skladbe sem potem dal v skupine glede na enakost kanoničnega imena.

Zajeti podatki

Ker je vseh pesmi preveč (malo čez 6,000,000) sem se odločil, da sem bom omejil samo na del serverjev (po dogovoru z muzik ekipo na tiste, ki so najbolj obiskani)

Tabela zajetih podatkov

Ime v bazi Ime v modelu Opis
id muzik_id Muzik id pesmi (id s katero muzik identificira pesem)
name name Naslov pesmi
server server Id serverja, ki gostuje pesem
bitr bit_rate Bitna hitrost (naše osnovno merilo za kvaliteto pesmi)
time duration Dolžina pesmi (v s)
size size Velikost datoteke (v B)
freq frequency Frekvenca zajemanja
N/A canonic_name Kanonično ime

Predvidena analiza

Namen analize je ovrednotiti kvaliteto iste pesmi na več različnih strežnikih in ugotoviti, kdo izmed teh ponuja najboljšo kvaliteto

  • Pri posamezni ponavljajoči pesmi bomo pogledali, kateri izmed strežnikov jo ponuja pri največji bitni hitrosti (Osnovno merilo za določanje kvalitete)

[//]: # (Pogledali si bomo tudi velikost datoteke pri posamezni bitni hitrosti. Če je velikost datoteke pri večji bitni hitrosti primerljiva z velikostjo pri veliko manjši bitni hitrosti (320 <-> 256 <-> 192 <-> 128 ...), to lahko nakazuje na nesmiselnost večje številke, saj se pogosto dogaja da ve želji po navidezno bolj kvalitetni glasbi datoteke prekodiramo iz manjše v večjo bitno hitrost, a to ne nadomesti izgubljenih podatkov pri kodiranju na manjšo bitno hitrost že prej (MP3 standard za stiskanje podatkov z izgubo))

muzikanalyser's People

Contributors

jo-osko avatar

Stargazers

Žiga Černigoj avatar

Watchers

James Cloos avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.