Giter Site home page Giter Site logo

h-j-13 / malicious_domain_whois Goto Github PK

View Code? Open in Web Editor NEW
77.0 5.0 43.0 15.49 MB

:beginner: 非法域名挖掘与画像系统

License: GNU General Public License v3.0

Python 87.94% Shell 0.01% C 1.57% Go 0.22% Java 0.96% JavaScript 0.84% PHP 0.49% M4 0.14% OpenEdge ABL 4.53% HTML 0.03% Vue 3.28%
malicious-domains whois domain decision-treed

malicious_domain_whois's Introduction

非法域名挖掘与画像系统


2017年第十届全国大学生信息安全大赛 参赛项目 决赛-三等奖

基于页面关联关系的非法域名分析与挖掘系统。旨在通过域名多元信息对域名进行精准画像,进而分析抽象获取非法域名相关特征,使用基于决策树的机器学习模型进行域名性质判定。通过多过程多方式进行恶意域名挖掘

Summary

系统核心功能

  • 域名评估
    • 域名性质评估
    • 非法域名可疑值量化
  • 域名画像
    • 针对单一域名多元信息画像
    • 非法域名整体态势数据分析
  • 非法域名挖掘
    • 基于WHOIS反查
    • 基于页面链接关系
    • 基于搜索引擎发现

系统实现难点

  • 海量域名及相关数据的高效与统一的存取模型
  • 域名多元关键信息的高效获取与标准化处理
  • 多维特征间静态与动态关联关系的构建
  • 非法域名关键信息提取及知识图谱构建

系统架构

数据库架构

目录说明

DataAnalysis - 数据分析,特征项抽取
DataAquire - 系统数据获取
Database - 数据库设计与架构,操作脚本
EvaluationModel - 系统域名性质判别模型
Website - 系统内容展示网站

Features

  • 基于AMPQ协议的RabbitMQ实现的高效分布式WHOIS数据获取引擎
  • 基于决策树的域名性质评估算法
  • 基尼指数融合的域名可疑性量化模型
  • 基于多维度特征关联的域名画像
  • 基于多因素融合与多过程循环的非法域名挖掘算法

Periodical achievment

  • 截至2017.7
    域名 : 1.3亿条以上
    域名WHOIS数据 : 1.1 亿条以上
    域名WHOIS服务器 : 获取全部1500余顶级域, 382个WHOIS一级服务器, 1000余个WHOIS二级服务器
    域名评估模型准确率 :89.7% (总数据3万,以8:2划分训练集与测试集)
    非法域名数量 : 135,391条记录 (系统起始5000条数据)
    域名画像 :对226,863条域名实现包括域名WHOIS信息、ip记录、多源地理位置信息、网页内容、热度趋势等方面的画像

Installation

各子模块下通过 main.py 文件运行

Contribute

哈尔滨工业大学(威海) 信息与网络安全技术研究实验室
@day-dream @carrie0307

License

GNU GENERAL PUBLIC LICENSE 3.0

Contact

malicious_domain_whois's People

Contributors

day-dreams avatar h-j-13 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

malicious_domain_whois's Issues

关于安装

请问能详细说一下如何安装运行这个系统吗?对恶意域名的判断模块非常感兴趣

哈哈

这ppt的模板还没改啊,得有6、7年的历史了。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.