Giter Site home page Giter Site logo

realestatetransactionkorea's Introduction

RealEstateTransactionKorea

부동산 실거래가 데이터

데이터 설명 - data 폴더

  • data 폴더에는 국토교통부에서 공개하는 부동산 실거래가 공개시스템에서 다운받은 데이터가 있습니다.
  • 2020년 4월 6일 ~ 4월 10일 사이에 다운받았습니다. 따라서 데이터의 성격상 최근 데이터는 원본 자체가 추가되거나 수정될 수 있습니다.
  • 정확한 최신 데이터가 필요하신 분은 아래 실거래가 사이트에서 조회하거나 다운받으시기 바랍니다.
  • 2019년 6월 이후로 거래일이 상세하게 표기되도록 변경되었습니다. 조회해보니 과거의 데이터들도 모두 새로운 기준에 맞춰 수정되어 있고, 여기에 올려둔 데이터는 거래일이 상세한 데이터입니다.
  • 각데이터의 시점은 아래와 같습니다.
    • 매매 데이터는 2006년 부터
    • 전월세 데이터는 2011년 부터
    • 분양권 데이터는 2007년 6월 29일부터.
  • 지속적인 업데이트 계획은 없습니다.

원본에서 수정한 내용 - data 폴더

  • 원본 데이터는 csv 형식이라 콤마와 따옴표가 들어가 있습니다. 따옴표 제거하고 tsv (탭으로 구분) 형식으로 변경하였습니다.

  • 거래가격 숫자에서 천의 자리를 구분한 콤마를 제거했습니다.

  • 기타 한 자리 공백이나 문자열 안에 tab이 포함되어 있던 것들을 제거했습니다.

  • 나머지는 원본 그대로입니다. 원본에 null 값의 처리가 여러가지로 되어 있으니 필요에따라 직접 작업해야 합니다.

  • 원본 데이터에는 모든 파일마다 아래의 내용이 상단에 삽입되어 있습니다. 모두 제거하고 아래에 옮겨둡니다.

    • 본 서비스에서 제공하는 정보는 법적인 효력이 없으므로 참고용으로만 활용하시기 바랍니다.
    • 신고정보가 실시간 변경, 해제되어 제공시점에 따라 공개건수 및 내용이 상이할 수 있는 점 참고하시기 바랍니다.
    • 본 자료는 계약일 기준입니다. (※ 7월 계약, 8월 신고건 → 7월 거래건으로 제공)
    • 통계자료 활용시에는 수치가 왜곡될 수 있으니 참고자료로만 활용하시기 바라며, 외부 공개시에는 반드시 신고일 기준으로 집계되는 공식통계를 이용하여 주시기 바랍니다.
    • 국토교통부 실거래가 공개시스템의 궁금하신 점이나 문의사항은 콜센터 1588-0149로 연락 주시기 바랍니다.

데이터 설명 - ref 폴더

  • 코드매칭용테이블.tsv을 이용하면 원본 데이터의 주소 문자열을 법정동 코드로 바꿀 수 있습니다.
    • [원본] 항목에는 데이터 원본에 존재하는 주소 문자열이 들어 있습니다.
    • [매칭용 처리후] 항목에는 code.go.kr 에 올라와 있는 법정동 코드의 주소가 들어 있습니다. [원본]과 같은 것 같지만 다른 것들도 다수 있습니다.
    • [법정동 코드]는 해당 법정동의 10자리 코드입니다. code.go.kr의 2020년 4월 자료를 바탕으로 작업했습니다.
  • 고유PNUXY.tsv 파일에는 실거래가 데이터에 존재하는 주소들의 고유값에 대해 지오코딩을 통해 추출한 좌표가 들어있습니다.
  • 전월세전환율_202003.tsv 파일에는 월세가를 전세로 전환시킬 수 있는 전월세 전환율이 들어 있습니다.
    • 아파트, 연립주택, 단독주택은 국가통계포털의 지역별 전월세 전환율 자료를 이용했습니다.
    • 오피스텔 전월세 전환율은 KB주택가격동향의 오피스텔 자료를 이용했습니다.

데이터 설명 - dataRefined 폴더

  • 원본 데이터를 바탕으로 pnu값과 공간좌표를 부여한 파일이 있습니다.

  • 지번이 별표처리된 원본 데이터는 법정동 중심점으로 공간좌표를 부여했습니다.

  • 거래 건수(count 항목)에 비례하게 좌표를 주변으로 랜덤하게 발생시켰습니다.

  • 기타 자세한 내용은 다음의 글을 참고하시기 바랍니다.

데이터 출처 표기

  • data 폴더의 자료를 사용할 경우 출처는 국토교통부 실거래가로 표기하시면 됩니다. 별다른 처리를 하지 않은 자료입니다.
  • dataRefined의 자료를 사용할 경우 출처를 국토교통부에 덧붙여 이 곳 Github 주소로 동시에 표기해주시기 바랍니다.
  • ref 폴더의 자료는 원본으로부터 선택적으로 추출하여 가공한 자료입니다. 앞에서 언급한 원본 출처 이외의 별도의 출처 표기는 필요 없으나 오류가 있을 수 있으므로 각자의 책임하에 사용해주시기 바랍니다.

realestatetransactionkorea's People

Contributors

vuski avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.