Giter Site home page Giter Site logo

kookmin-sw / 2018-cap1-16 Goto Github PK

View Code? Open in Web Editor NEW
4.0 7.0 4.0 106.33 MB

Malware Analysis System in Kookmin

License: GNU General Public License v3.0

Python 67.62% CSS 8.09% JavaScript 8.67% HTML 14.44% Shell 1.19%
tensorflow cuckoo django ida-pro malware-analysis elasticsearch

2018-cap1-16's People

Contributors

brilliantw avatar byeongal avatar cyhan1004 avatar gychoics avatar junnyung-hur avatar yoojeong96 avatar

Stargazers

 avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

2018-cap1-16's Issues

KISA R&D 데이터 셋을 이용한 모델 검증

2017년에 KISA에서 주최한 "정보보호 R&D 데이터 챌린지 대회" 데이터 셋을 이용해 우리 모델을 평가 한다.

당시 1등이였던 고려대 팀의 정확도는 88%인데, 이상의 모델을 만드는게 목적 이다.

4월 23일 회의록

이번주 해야 할 일

  • 쿠쿠샌드박스 & 엘라스틱서치 연동 @cyhan1004 @Junnyung-Heo
  • 피쳐해싱을 어떻게 하면 좋을지에 대한 결과 뽑기 @byeongal
  • csv 파일 뽑기, csv 파일에 대한 md5, 카스퍼스키 라벨, 카스퍼스키 탐지 결과 추출 @Brilliantw
  • 웹에서 파일 업로드할 때 다양한 창 구현 고민 @yoojeong96 @Junnyung-Heo

정상 파일 크롤링 하기

신뢰할 수 있는 개발사에서 개발한 프로그램을 정상파일이라고 가정하고 정상 파일 모으기

모델 학습 경과

다음 4가지 모델에 대한 학습 진행 상황

  • static_bc
  • static_mc
  • dynamic_bc
  • dynamic_mc

엘라스틱서치 환경설정 문제

로컬이 아닌 퍼블릭 ip 사용 및 다중 노드 사용시 환경설정 관련하여 아래와 같이 문제가 발생

  1. max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

Database 운용 관련 이슈

엘라스틱서치,키바나를 운용하기 위해서는 현재 몽고DB에 저장되있는 분석 리포트의 모든 필드가 색인되어야함. 현재 db 운용 이유는 파일에 대한 md5 서치로 리포트를 찾는 것인데
이렇게 되면 같은 내용에 대해 두개의 DB를 운용하게 되는 것과 같음.
따라서 db와 검색엔진 운용에 대해 다시한번 생각해볼 필요가 있음

4월 30일 회의록

이번주 해야 할 일

  • multi-classification 만들기 @byeongal
  • multi-classification을 위한 악성 및 정상 샘플 42,000개씩 총 84,000개 분석@cyhan1004
  • AWS 자동화, csv 파일 만들기 @Brilliantw
  • csv 작업이 완료되는 대로 데이타베이스에 넣기 @Junnyung-Heo
  • 쿠쿠 리포트 시각화 및 multi-classification 시각화 @Junnyung-Heo @yoojeong96

4월 16일 회의록

중간평가 피드백

  • 동적분석 한계점 : 백도어 등 일정시간 잠복기 가지는 경우나 사용자의 반응이 필요한 경우 - 정적분석에서 해결해보기
  • 피쳐추출을 하지 않고 preprocessing 없이 raw 데이터를 직접 입력해서 딥러닝을 할 수 있는 방법 찾아보기

이번주 해야할 일

  • 웹&쿠쿠샌드박스 연동 - 웹에 업로드 했을 때 쿠쿠로 가서 분석 후 분석 결과를 웹에서 가져오기 @Junnyung-Heo @cyhan1004
  • AWS 완전 자동화 @Brilliantw
  • 웹에서 파일 업로드될 때 다양한 창 구현(DB에 있다, 분석 못한다 등등..) @yoojeong96 @Junnyung-Heo
  • 로딩화면 구현 @Junnyung-Heo @yoojeong96
  • 다양한 딥러닝 모델 알아보기 @byeongal

4월 20일 회의록

1. 이번주 진행사항

  • 웹 & 쿠쿠샌드박스 연동 : 쿠쿠에서 분석 끝난 후 리포트를 가져올 수 있음, 웹 연동작업만 진행하면 됨
  • AWS 완전 자동화 : 소스코드로 인스턴스를 켜고 끄는 것은 됨. FTP서버 하나 잡아서 다 풀고 정리하면 될 거 같음
    DB 서버 이용. 얼마나 걸릴지?
  • 웹에서 파일 업로드될 때 다양한 창 구현 : 진행사항 없음
  • 로딩화면 구현 : 구현 완료

2. 다음주 해야할 일

  • 김준호 교수님께 모델 관련 질문하기 -> 메일 보내기

Contents of home(first) page

Now the first page is the analysis page.
But we need a home(first) page.

  • What content should be included.
  • How to show the contents.

동적분석 분석 시간

쿠쿠샌드박스 분석시간 디폴트는 3분임
얼마까지 분석 시간을 줄여도 모델에서 구분 가능할 수 있을지?

어떤 피쳐가 가장 좋을까?

정적 분석(peframe, ida pro)과 동적 분석(cuckoosandbox)결과로 나오는 자료중 어떠한 피쳐를 사용하는게 가장 좋을까?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.