Giter Site home page Giter Site logo

seleksi-2016's Introduction

Seleksi-2016

Seleksi Calon Warga Basdat 2016: Introduction to Data Science

Spesifikasi Tugas

Pada tugas ini, peserta seleksi calon Warga Basdat diberi kesempatan untuk melakukan eksplorasi lebih jauh tentang data selayaknya seorang Data Scientist. Ada 5 pilihan dataset. Eksplorasi cukup dilakukan dengan salah satu dataset saja. Setiap dataset sudah disertai dengan soal yang harus dijawab oleh peserta. Penjelasan mengenai setiap dataset dapat dibaca pada dokumen Detail Dataset pada masing-masing folder dataset.

Prosedur Pemilihan Dataset

Pemilihan dataset akan dilakukan dengan melakukan tag terhadap dataset yang kelompok anda inginkan melalui sebuah google sheet, yang akan diberikan ketika kelompok telah kami bentuk pada tanggal 23 Mei 2016.

Tools

Tools wajib yang harus digunakan peserta dalam mengerjakan tugas ini adalah R atau Python. Kedua bahasa tersebut merupakan tools untuk data analysis yang sedang banyak digunakan saat ini. Perbandingan umum kedua bahasa tersebut dapat dilihat pada link berikut. untuk membantu peserta dalam menentukan bahasa yang akan digunakan dalam pengerjaan tugas ini. Peserta diperbolehkan menggunakan package yang sudah tersedia pada masing-masing bahasa, misalnya (namun tidak terbatas pada):

Selain R atau Python, peserta juga diperbolehkan menggunakan tools tambahan yang dirasa perlu untuk menyelesaikan tugas ini.

Mekanisme Pengerjaan

Tugas ini dikerjakan secara berkelompok. Setiap kelompok terdiri dari 2 orang. Pembagian kelompok akan ditentukan oleh panitia. Untuk keperluan pembagian kelompok, peserta yang ingin mengundurkan diri diharapkan melakukan konfirmasi melalui email ([email protected]) cukup dengan subjek [SELEKSI BASIS DATA - {NIM} - {NAMA} - PENGUNDURAN DIRI] paling lambat pada hari Minggu, 22 Mei 2016 pukul 23.59. Apabila Anda tidak mengirimkan email tersebut, maka kami mengasumsikan bahwa Anda bersedia untuk mengikuti keseluruhan tahap seleksi kedua calon warga basdat dan Anda siap untuk bertanggung jawab terhadap tugas Anda di dalam kelompok. Pembagian kelompok akan dirilis melalui email pada hari Senin, 23 Mei 2016.

Waktu pelaksanaan eksplorasi ini adalah 4 minggu, terhitung sejak tanggal 23 Mei 2016 hingga 20 Juni 2016 pukul 23.59. Jika peserta menemui kendala di tengah pelaksanaan eksplorasi, peserta diharapkan segera memberitahu panitia melalui email.

Deliverables

Untuk pengumpulan deliverables, setiap kelompok harus melakukan fork pada repository ini. Semua deliverables harus di-push ke forked repo tersebut. Setelah selesai, peserta harus melakukan pull request dengan format [TUGAS_SELEKSI_2_{NIM_ANGGOTA1}_{NIM_ANGGOTA_2}].

Deliverables untuk tugas ini adalah sebagai berikut: Dokumen laporan softcopy (*.pdf) yang minimal berisi penjelasan singkat dataset, langkah-langkah analisis yang dilakukan terhadap dataset, hasil analisis (untuk menjawab pertanyaan dari dataset), dan visualisasi hasil analisis. Script dan semua kode yang digunakan dalam proses analisis. Script dan kode yang dikumpulkan harus terdokumentasi dengan baik (minimal ada komentar singkat untuk menjelaskan kegunaan script/kode tersebut) Data hasil analisis dalam bentuk csv/json.

Opsi Soal dan Dataset

Kelima dataset beserta soal dapat diambil pada link drive ini.

Opsi dataset yang dapat dipilih adalah berikut:

  1. Criminality on San Francisco
  2. Taxi Trip
  3. Salary of San Francisco Citizenship
  4. USA President Election
  5. Take Me Out Indonesia

Referensi

Tambahan

Meskipun Anda mengalami kesusahan dalam menyelesaikan tugas, kami harap agar Anda tetap melanjutkan eksplorasi dan melaporkan langkah2 apa saja yang telah Anda lakukan dan hasilnya. Selamat mengerjakan :)

seleksi-2016's People

Contributors

albertlieyingadrian avatar wargabasdat avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    ๐Ÿ–– Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. ๐Ÿ“Š๐Ÿ“ˆ๐ŸŽ‰

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google โค๏ธ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.