kookmin-sw / 2018-cap1-16 Goto Github PK
View Code? Open in Web Editor NEWMalware Analysis System in Kookmin
License: GNU General Public License v3.0
Malware Analysis System in Kookmin
License: GNU General Public License v3.0
Tensorflow 를 사용하기 위해서는 고정된 크기의 피쳐를 만들어야 한다.
고정된 크기의 피쳐를 만들기 위해 피쳐해싱을 이용할 생각이다.
어떤 식으로 구현해야 가장 좋은 결과가 나올까?
2017년에 KISA에서 주최한 "정보보호 R&D 데이터 챌린지 대회" 데이터 셋을 이용해 우리 모델을 평가 한다.
당시 1등이였던 고려대 팀의 정확도는 88%인데, 이상의 모델을 만드는게 목적 이다.
쿠쿠샌드박스와 엘라스틱서치 연동 설정 하였으나, 연동 실패
연동 에러 : "Could not convert [procmemory.include_in_root] to boolean"
What content is shown on the result screen in what design?
신뢰할 수 있는 개발사에서 개발한 프로그램을 정상파일이라고 가정하고 정상 파일 모으기
다음 4가지 모델에 대한 학습 진행 상황
중간 발표 데모
로컬이 아닌 퍼블릭 ip 사용 및 다중 노드 사용시 환경설정 관련하여 아래와 같이 문제가 발생
엘라스틱서치,키바나를 운용하기 위해서는 현재 몽고DB에 저장되있는 분석 리포트의 모든 필드가 색인되어야함. 현재 db 운용 이유는 파일에 대한 md5 서치로 리포트를 찾는 것인데
이렇게 되면 같은 내용에 대해 두개의 DB를 운용하게 되는 것과 같음.
따라서 db와 검색엔진 운용에 대해 다시한번 생각해볼 필요가 있음
몇백만개의 리포트를 저장하려면 용량 부족 현상이 발생함.
악성코드 분석 시 정상파일 구하는 방법
동적 분석 환경 구축 관련 이슈
issue about building cuckoo sandbox distribute server
바이러스 쉐어에서 토렌트를 이용하여 악성코드 다운로드 받기
Now the first page is the analysis page.
But we need a home(first) page.
정상파일에 대한 정적 및 동적 분석
peviewer 관련 이슈
쿠쿠샌드박스 분석시간 디폴트는 3분임
얼마까지 분석 시간을 줄여도 모델에서 구분 가능할 수 있을지?
정적 분석(peframe, ida pro)과 동적 분석(cuckoosandbox)결과로 나오는 자료중 어떠한 피쳐를 사용하는게 가장 좋을까?
악성코드에게 어떠한 기준으로 라벨을 부여해 분류할 것인가?
패킹이 된 파일만 동적 분석 진행을 해야 하는데, 어떻게 패킹 여부를 확인하는지?
코싸인 유사도가 0.99로 매우 높은 두 악성코드에 ssdeep 유사도가 0이나옴
이것은 이 한쌍의 문제만이 아니라 다른 것들도 유사도가 맞지 않게나옴
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.