Giter Site home page Giter Site logo

machinelearning's Introduction

MachineLearning

Introduction

Here are the works of Lizk and WangDiYi in CASIA.

Including

  1. Codes for embedding&RNN are in the folder "RNN_lizk".Dealing with the One-basket problem, we put the embedding method into the recurrent nerual network. Until now, these part of works are not being well. If you have any idea or questions, pls contact us.
  2. Codes for the libsvm: (in the script "testing.py"and "10_19_1.py")
  3. To be continued

Update Note

onlinux.py 最初上服务器版本 10.21 加入了循环控制,读写控制,可以保存结果,完成了第一版可以连夜一直在服务器上运行的程序
10.22 加入了时间显示。检测每一轮训练和测试的时间长度,将程序分成了两个版本,一个是带负采样另一个不带。将loss函数中的计算方式调整为较简便的公式实现。
10.26 为防止loss中的正负样本由于数量差异产生误差,加入bias变量。加入avr变量监测每个篮子的正确率。
10.27 bias改为动态调整。为方便检查,将loss函数改回原来的计算方式。
10.29 将重心转移到训练过程,在训练集上,检测每一个篮子的训练之后对其下一个篮子中的物品的预测准确率,每10轮检测一次,结果不容乐观。(命中/总数:7400/210000)
10.30 加入自适应学习速率,继续监测在训练集上的拟合程度,比昨日有所提升。(命中/总数:8500/210000)且命中率仍然在不断提升,加负采样的情况训练速度比较慢,所以可能需要利用周末时间训练,周一再看具体结果了。
10.31 将learning_rate 设为 1e-3,并保持自适应学习速率。另外, 加入valueTrue计算实际的value值,valuePredict计算预测的value值,并对其进行比较,然而发现valueTrue > valuePredict却没有预测到真实的值。
11.2 _1为加入了用户参量的版本,_2没有加。另外,修复了predict函数中没有更新隐藏层这一问题。_predict为服务器版本,使用周末训练得到的结果进行预测,但是今天的三个版本仍然没有发现正确率有明显提升。问题还是没有解决。(今天将各个版本由单独文件改为了main.py的history版本,这样才是真正利用好git的优势。每个版本都保留单独文件太过于冗长复杂,现已将各个版本更新到了main文件的history中,如需查阅,请自行点击。)
11.3 增加了others.py文件。others:11.3.1用于验证第一个方法,矩阵分解。11.3.1.3为11.3日最终版,学习速率0.05,加入了自适应,全部商品集合负采样。上服务器开始运行。首轮结果750/24000左右。 pre.py合并了所有预处理脚本代码,详情见其history。
11.4 others.py更新至11.4.1,修复了算法更新参数部分的bug,改进了predict函数的算法。
12.8 新增MF代码,在movielens数据集上实现。
12.24 新增RNN代码,位于Tmall文件夹中,pre.py进行数据预处理输出为user_cart.json文件,rnn.py包含了修改之前的bp-rnn,main.py是算法实现主体,test.py文件用于测试各项功能。12.24日增加了每个正样本对应的负样本个数。

2016 3.7 补充说明各个文件夹内容,在各个文件夹中添加了公式。 3.8 目前的主要任务集中在mobile_time_2016文件夹中,工作内容是在小数据集上依次实现基本rnn,多转移矩阵rnn,以及tensor rnn

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.