bigdata_class-2021's Introduction
bigdata_class-2021's People
bigdata_class-2021's Issues
3์ฃผ์ฐจ ๊ณผ์
๋ฌธ์ 1: ์คํAPI๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ 5์ฒ ~ 1๋ง ๊ฑด ์ ๋ ์์งํด์ ํ์ผ๋ก ์ ์ฅํ๋ค (์ด๊ณผํด๋ ์ข๋ค).
์ด๋ฆฐ๋ฐ์ดํฐ, ๊ณต๊ณต๋ฐ์ดํฐ ๋๋ (ํ ์ ์๋ค๋ฉด) ํธ์ํฐ์ ๊ฐ์ SNS, ๋๊ธ ๋ฑ ์ ํฉํ ์์ค๋ฅผ ์์ ์ด ์ ํํ๋ค.
๊ณผ์ ์ ํ๋ฐ์ผ๋ก ๊ฐ์, ์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ๊ณผ์ ๊ฐ ์ฃผ์ด์ง๊ฒ ๋๋ค.
ํ๋ก๊ทธ๋จ์์ ๋ช ๊ฑด์ ์ฝ์๋์ง์ ๋ง์ง๋ง ์ค์ ํ๋ฉด ์ถ๋ ฅํ๋ค.
!dir ๋ช ๋ น์ด๋ก ํ์ผ์ด ์กด์ฌํ๋์ง ์ถ๋ ฅํ๋ค. 1๋ง ๊ฑด ์ ๋ ์ ์ฅ๋์์ผ๋ ํ์ผ์ ํฌ๊ธฐ๊ฐ ์ ๋นํ์ง ๊ฐ๋ ํด๋ณด์
๋ฌธ์ 2: ๋ ธํธ๋ถ์์ pyspark ์คํ
์ฃผํผํฐ ๋ ธํธ๋ถ์ ์คํํ ํ, ์ ์์ ์๋ ๋ช ๋ น์ด๋ฅผ ์คํํ์ฌ spark๋ฅผ ์์ฑํ๊ณ , ๊ทธ ๋ฒ์ ์ ์ถ๋ ฅํ์ธ์.
[In] spark.version
[Out] '3.x.x'
๊ทธ๋ฆฌ๊ณ ๋ค์๊ณผ ๊ฐ์ด ๋ฒ์ ์ ์ถ๋ ฅํ๋ค.
pyspark๋ jdk๊ฐ ์ค์น๋์ด ์์ด์ผ ํ๋ค.
!java --version #spark v2.x๋ java 8์ด ์ ๋น.
!javac --version #java ๋ฒ์ ๊ณผ ๋์ผํ์ง ํ์ธํ๋ค.
!python --version
!python3 --version # python 2, 3 ๋ฉํฐ ๋ฒ์ ์ด ์ค์น๋ ๊ฒฝ์ฐ์๋ง ์ถ๋ ฅ
import sys
print(sys.version) # ์์ ์ด ์ฌ์ฉํ๋ python ๋ฒ์ ๊ณผ ๋์ผํ์ง ํ์ธํ๋ค.
๋ฌธ์ 3: ๋ค์ ํ์ผ์ ์ฝ์ด์ RDD๋ฅผ ์์ฑํ๊ณ , 5์ค์ ํ๋ฉด์ถ๋ ฅํ์ธ์.
๊ฒฐ๊ณผ๊ฐ ๊นจ์ ธ๋ณด์ธ๋ค๋ฉด, ๊ทธ ์ด์ ๋ฅผ ๊ฐ๋จํ ์ ์ผ์ธ์.
-
- ๊ฒฝ๊ธฐ๋ ์์ ๋ถ์ ์ธ๊ตฌํํฉ (ํ์ผ๋ช
:
๊ฒฝ๊ธฐ๋ ์์ ๋ถ์_์ธ๊ตฌํํฉ_20200904
)
- ๊ฒฝ๊ธฐ๋ ์์ ๋ถ์ ์ธ๊ตฌํํฉ (ํ์ผ๋ช
:
https://www.data.go.kr/data/15009613/fileData.do
-
- ์ ์ฃผํน๋ณ์์น๋ ์๊ทํฌ์ ๋ด ์ฐ๋๋ณ 65์ธ์ด์ ์ธ๊ตฌ์ ๋ฐ ๊ณ ๋ นํ๋น์จ, ๋
ธ๋ นํ์ง์ ํํฉ (ํ์ผ๋ช
:
์ ์ฃผํน๋ณ์์น๋ ์๊ทํฌ์_๊ณ ๋ นํ๋น์จ๋ฐ๋ ธ๋ นํ์ง์ํํฉ_20200623
)
- ์ ์ฃผํน๋ณ์์น๋ ์๊ทํฌ์ ๋ด ์ฐ๋๋ณ 65์ธ์ด์ ์ธ๊ตฌ์ ๋ฐ ๊ณ ๋ นํ๋น์จ, ๋
ธ๋ นํ์ง์ ํํฉ (ํ์ผ๋ช
:
2์ฃผ์ฐจ ๊ณผ์
'์์ธํน๋ณ์๊ต์ก์ฒญ ๊ณต๊ณต๋์๊ด ์์ฅ๋์'๋ก ๊ฒ์ํ๋ฉด API๋ฅผ ์ฐพ์ ์ ์๋ค.
์ด API๋ ์์ธํน๋ณ์๊ต์ก์ฒญ ๊ณต๊ณต๋์๊ด ๋ฐ ํ์ํ์ต๊ด์ ์์ฅ๋์ ์ ๋ณด (ํ์ , ์ ์, ๋ฐํ์, ๋ฐํ๋ , ์ฒญ๊ตฌ๊ธฐํธ, ์์ฅ์์น, ISBN ๋ฑ)๋ฅผ ์กฐํํ ์ ์๋ค.
๊ฒ์์ด๋ 'ํ์ด์ฌ'์ผ๋ก 20๊ฑด๋ง ํ๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ ํ์ผ์ ์ ์ฅํ๋ค.
ํ์ผ ๋ด์ฉ์ ํ์ธํ๊ธฐ ์ํด, type๋ช ๋ น์ด๋ก ๋ด์ฉ์ ์ถ๋ ฅํ์ธ์. (!type ํ์ผ๋ช )
url์ http://openapi-lib.sen.go.kr, ์ธ์๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌ์ฑํ๋ค.
๋ณ์๋ช | ์ค๋ช
-----|-----
serviceKey | ๊ณต๊ณต๋ฐ์ดํฐํฌํธ์์ ๋ฐ๊ธ๋ฐ์ ์ธ์ฆํค
title | ๋์์ ๋ชฉ๊ฒ์์ด
manageCd | ๋์๊ด์ฝ๋ (MA (๊ฐ๋จ๋์๊ด)..MU (์ข ๋ก๋์๊ด))
numOfRows | ํ ํ์ด์ง ๊ฒฐ๊ณผ ์ (Default: 10)
pageNo | ํ์ด์ง ๋ฒํธ (Default: 1)
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
๐ Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. ๐๐๐
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google โค๏ธ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.