Giter Site home page Giter Site logo

aws-sagemaker-pipeline's Introduction

lab_03_pipeline


lab_03_pipeline 은 lab_01_training, lab_02_inference 이후의 단계 입니다. 이제 모델 훈련, 모델 추론을 실습을 했기에, 이렇게 배운 과정을 SageMaker Model Building Pipeline 으로 구성하는 작업을 합니다.

all_pipeline_base.png

아래와 같이 두가지 방법으로 접근 가능합니다.

  • [Quick Approach]
    • 모든 스텝을 연결하여 파이프라인을 구성 합니다. 약 소요시간은 20분 걸립니다.
  • [Step-By-Step 접근]
    • 스텝을 하나씩 구현해 가면서, 마지막에 전체를 연결하여 완성 합니다. 소요 시간은 약 60분 걸립니다.

[Quick Approach]

  • Step-By-Step으로 접근하지 않고, 빠르게 보시기 위해서는 아래 노트북만을 수행 하세요.
    • 3.0.Setup-Environment.ipynb
    • 3.1.Prepare-Dataset.ipynb
    • 3.6.all-pipeline.ipynb
    • 3.7.Inference-Analyze.ipynb

[Step-By-Step 접근]

  • 3.0.Setup-Environment.ipynb
    • SageMaker Python SDK 업그레이드
  • 3.1.Prepare-Dataset.ipynb
    • 데이터 세트 (claims.csv, customers.csv) 를 S3에 업로드
  • 3.2.Preprocess-Pipeline.ipynb
    • 첫번째의 전처리 과정의 스텝 생성 하며 아래 세가지의 단계별 구현을 합니다.
      • 로컬 노트북에서 전처리 스크립트 실행 (예: python preprocess.py)
      • MBP 의 파이프라인 단계 (step_proecess) 를 생성하여 실행
  • 3.3.Train-Pipeline.ipynb
    • 전처리된 데이터를 바탕으로 모델 훈련을 합니다.
      • MBP 의 파이프라인 단계 (step_train) 를 생성하여 실행
  • 3.4.Create-Model-Pipeline.ipynb
    • 세이제 메이커 모델 생성 단계
  • 3.5.Deploy-Pipeline.ipynb
    • 실시간 엔드포인트 생성 단계
      • SageMaker Pipeline 에서 엔드포인트 생성을 수행합니다.
  • 3.6.all-pipeline.ipynb
    • 위에 생성한 모든 MBP 스텝을 연결하여 모든 파이프라인을 생성 함.
  • 3.7.Inference-Analyze.ipynb
    • 최종적으로 생성한 실시간 엔드포인트에 추론 테스트

[알림] 이 lab_3_pipeline 의 고급 과정은 여기를 참조 하세요.

  • 고급 단계
    • 튜닝 스텝, 모델 레지스트리 스텝, 모델 평가 스템, 조건 스텝 및 캐싱 기능 사용
    • 아래와 같은 파이프라인 구성 구현
    • hpo-pipeline.png

[참고 자료]

aws-sagemaker-pipeline's People

Contributors

hyerankang avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.