Giter Site home page Giter Site logo

gintian's Projects

- icon -

1.1问题背景 在电影行业飞速发展的当今,电影已经成为了非常普遍的娱乐选择,**电影最近几年也是突飞猛进,越来越多的人走进电影院。而信息媒体的发展也使得所有人都拥有了随时随地与世界各地的人讨论电影的机会,电影无疑已经进入了全民关注,全民讨论时代。 但是随着越来越多的电影上映,越来越大的阅片量,大家对电影质量和制作水平的要求也越来越高。电影出品方想要斩获高票房,就要把握好消费者的喜好,制作出符合市场期待的电影。 在国内,豆瓣、淘票票、猫眼三家网站都有自己所属平台的评分功能,俨然形成了国内的“电影评分三巨头"。电影评分网站上蕴含了大星的电影评论、排行、评分等信息,是消费者择片困难时的重要参考依据,也是电影出品方了解用户喜好的有效途径。 一份科学的电影消费者数据分析报告,是预测票房的重要依据之- :,也能够帮助出品方规划未来电影拍摄计划,对出品方投资有着重要意义。所以,如何获取、分析消费者喜好信息是电影出品方非常关注的事情。 1.2提出问题 为了获取、分析消费者喜好相关信息,本项目将通过Python网络爬虫获取主流电影评分网站豆瓣上关于《复仇者联盟4》评论用户的基本信息、影评内容等数据,并对获取到的影评数据进行简单的文本分析,帮助出品方了解用户偏好。

--1 icon --1

由于样本类别不平衡,使用树形分层训练,保证每层样本均匀。如类别数目10,5,5,则分为两层,第一层是(10,5+5),第二层是(5,5),可进行端到端训练

-1 icon -1

数据清洗的基本操作

2020-fintch- icon 2020-fintch-

主办方提供了两个数据集(训练数据集和评分数据集),包含用户标签数据、过去60天的交易行为数据、过去30天的APP行为数据。希望参赛选手基于训练数据集,通过有效的特征提取,构建信用违约预测模型,并将模型应用在评分数据集上,输出评分数据集中每个用户的违约概率。

a icon a

科研数据平台

a-community-detect-system-based-on-graphx icon a-community-detect-system-based-on-graphx

图计算和图存储在国内兴起于2012年,此项目为我的本科毕业设计,本人现在TOP厂商工作,工作要求不方便公开透露公司,曾研究图数据库2年,实验室数据库技术从2000年以前开始积累,对外低调,如有工作需要可以推荐!

aaletms icon aaletms

《农业行政执法文书管理系统》是根据农业部发布的关于印发《农业行政执法文书制作规范》和农业行政执法基本文书格式的通知的规定,采用与WORD文档链接技术认真制作,直接在WORD文档模板中录入文书内容,生成的法律文书完全符合规 定的要求。该软件使用方便,可以查看、编辑、查询、删除文书信息,实现了文书管理的网络化,使各类文书信息有序地进行存储、查询,极大的方便了操作者的管 理!

aaocp icon aaocp

一个对用户行为日志进行分析的大数据项目

add_corporate_information_daily_of_china icon add_corporate_information_daily_of_china

**大陆 31 个省份最近几日新增工商企业注册信息以及其他部分企业数据,大概100余万信息,包含企业名称、注册地址、统一社会信用代码、省份、城市、注册日期、经营范围、负责人、邮箱、注册资金、企业类型等资料。 In 31 provinces in mainland China, About 1000000 messages,new business registration information has been added in recent days, including company name, registered address, unified social credit code, province, city, registration date, business scope, responsible person, mailbox, registered capital, and type of business.

administrative-divisions-of-china icon administrative-divisions-of-china

中华人民共和国行政区划:省级(省份直辖市自治区)、 地级(城市)、 县级(区县)、 乡级(乡镇街道)、 村级(村委会居委会) ,**省市区镇村二级三级四级五级联动地址数据。

ageincome icon ageincome

使用客户的历史数据,用Python将用户以age和income进行聚类分群,并计算检验统计量Z评分使数据标准化。

agriculture-knowledgegraph-data icon agriculture-knowledgegraph-data

对知识库Wikidata的爬虫以及数据处理脚本 将三元组关系对齐到语料库的脚本 获取知识图谱数据的脚本

agriculture_knowledgegraph icon agriculture_knowledgegraph

农业知识图谱(AgriKG):农业领域的信息检索,命名实体识别,关系抽取,智能问答,辅助决策

agrproduct icon agrproduct

爬取农业信息网全国农产品数据的简单爬虫

ai icon ai

根据爬过来的数据进行清洗、调用word2vec实现智能分类

ai-talents-anomaleye icon ai-talents-anomaleye

ANOMALeye is a product used for anti-money laundering. It can analyze bank transaction data, record the user's mouse movement, combine user feedback and a skilled human decision-making processes to noticebaly reduce the false positive rate.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.