datawhalechina / fun-rec Goto Github PK
View Code? Open in Web Editor NEW推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/
License: Other
推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/
License: Other
train_model_input = {name: data[name] for name in dense_features + sparse_features}
# 模型训练
history.fit(train_model_input, train_data['label'].values,
batch_size=64, epochs=5, validation_split=0.2, )
这里的 data 应该是处理好的 train_data吧?
如题,感谢!!
初版内容地址:https://datawhalechina.github.io/fun-rec/#/
以上述目录为准,将之前已完成的内容全部都重新检查优化一遍,未完成的内容都补充完整,预计4月底完成初版所有内容。优化完的内容会逐步的更新到新版目录中。
所有代码重新以给定的包版本,规范的数据集、以一种容易理解的pipline全部重新写一遍。
当前未完成内容有:
当前完成一半待优化的内容:
其余所有内容初版基本完成都需要进行优化
大佬你好,请问一下文本推荐系统的YouTubeDNN模型召回那里,gen_data_set里面的test_set的label为什么是0啊
能问一下项目开发环境的版本配置是怎么样的?比如tensorflow等的版本。
在codes/news_recsys/news_rec_server/recprocess/recall/u2i_usercf.ipynb
notebook里有这个依赖:
from metric import PrintMetric
但是我找不到正确的metric包,我用pip install metric
安装的metric包里没有PrintMetric
。
请问这个包在哪里下载?
谢谢啦
请问怎么才能看到md文件中源码编译后的公式?有很多都显示不出来
例如1.1.2里就有部分图片链接失效了,请及时更新一哈
作者大大,您好!项目中很多地方的公式都已经显示不出来了,求修正一下,谢谢!
跪求pdf版本
这个s2是指什么,是Swing吗,
https://datawhalechina.github.io/fun-rec/#/ch02/ch2.1/ch2.1.1/Swing
您好,这个项目后面部分还没有更新,后面会更新吗?
在面试题部分,逻辑回归推导有一步错误表示
无数bug,慎入!!!
无数bug,慎入!!!
无数bug,慎入!!!
deepctr 和tensorflow的版本是多少
请问天池的该比赛结束之后,还有别的途径下载数据吗
同学你好,很高兴能够看到这个开源项目能够帮助大家入门推荐系统。
在此,希望自荐我的个人开源项目:https://github.com/Doragd/Algorithm-Practice-in-Industry
询问是否能够加入到fun-rec项目中
【为什么想加入】:推荐系统是一个非常偏工业界实践的领域,除开基础知识和代码实践外,我觉得非常有用的资料是各个大厂的技术分享文章以及搜广推顶会上的文章。因此,我认为我的项目或许能够帮助fun-rec完善这一部分。
【我的项目是什么】:我的项目收集了:
希望同学可以不吝赐教我的项目:https://github.com/Doragd/Algorithm-Practice-in-Industry
希望以一种合适的方式能够加入fun-rec中,为这个项目添砖加瓦。
此致,
Gordon Lee
可以给个requirements.txt 吗
DIEN.md文件里最下方论文地址没有填写,原论文地址:https://arxiv.org/pdf/1809.03672.pdf
如何在pycharm中安装pyFM包?
md文件中较多图片无法加载,一些公式并没有如预想的显示,是否可以上传pdf版本?非常感谢!
请问新闻推荐数据集在哪里公开的,可以在论文中引用吗?
余弦相似度 余弦相似度衡量了两个向量的夹角,夹角越小越相似。首先从集合的角度描述余弦相似度,相比于Jaccard公式来说就是分母有差异,不是两个用户交互商品的并集的数量,而是两个用户分别交互的商品数量的乘积,公式如下:
这个公式有误,应该修改为:
有pip freeze >> req.txt文件吗
例如基于物品的协同过滤中,通过相似的k个物品计算用户对这个物品的分数,但是如果用户对于对于相似物品的评分也是nan的时候,是作为0处理吗?还有在完整实现代码这种,为什么计算分数就仅仅只是相似度的一个求和,而没有使用说的加权以及减去平均的这种做法呢?
特征工程中只有基于召回结果构建的监督数据集label都为0,没有找到构建label为1的日志数据的这部分代码,是省略了吗?
求助
model = YoutubeDNN(user_feature_columns, item_feature_columns, num_sampled=5, user_dnn_hidden_units=(64, embedding_dim))
是keras和TensorFlow版本问题吗,我都是2.6.0版本
以下代码完成了对self.mu的初始化
cnt = 0 # 统计总的打分数,初始化mu用
for user, items in self.rating_data.items():
self.P[user] = [random.random() / math.sqrt(self.F)
for x in range(0, self.F)]
self.bu[user] = 0
cnt += len(items)
for item, rating in items.items():
# insert self.mu += rating
if item not in self.Q:
self.Q[item] = [random.random() / math.sqrt(self.F)
for x in range(0, self.F)]
self.bi[item] = 0
self.mu /= cnt
此时的self.mu为0,那么执行self.mu /= cnt
后的结果仍然是0,所以应该在第8行加入self.mu += rating
,把self.mu变成分数之和。
$$ L = \sum_{x\in T} (\hat{y}{afm}(x) - y(x))^2 + \lambda ||x||^2 $$,后面那个不是对x正则,是W。应该是 $$ L = \sum{x\in T} (\hat{y}_{afm}(x) - y(x))^2 + \lambda ||W||^2 $$
bagging与boosting分别从什么角度降低过拟合? bagging降低方差,boosting降低方差
bagging降低variance。boosting降低bias来提升预测精度。
【readme.md】文件中,【基于向量的召回】一节中 【FM召回】超链指向错误。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.