Giter Site home page Giter Site logo

xieliaing / data_science_industrial_practice Goto Github PK

View Code? Open in Web Editor NEW
116.0 4.0 66.0 114.39 MB

《数据科学工程实践》一书的Jupyter Notebook库,以及交流园地。

License: GNU General Public License v3.0

Jupyter Notebook 99.89% Python 0.06% R 0.05%
datascience machine-learning ab-testing sqlflow

data_science_industrial_practice's Introduction

数据科学工程实践

用户行为分析与建模、A/B实验、SQLFlow

第1部分(第 1~6 章) 观测数据的分析技术:

  • 第1章:如何分析用户的选择
  • 第2章:随时间可变的行为分析
  • 第3章:洞察消费者长期价值:基于神经网络的LTV建模
  • 第4章:使用体系化分析方法进行场景挖掘
  • 第5章:行为规律的发现与挖掘
  • 第6章:对观测到的事件进行因果推断

第二部分(第7~9章)实验研究探索业务边界

  • 第7章:如何比较两个策略的效果
  • 第8章:如何提高实验效能
  • 第9章:特殊场景下的实验设计和分析方法

第三部分(第10~12章) 自助式数据科学:SQLFlow

  • 第10章:SQLFlow
  • 第11章:机器学习模型可解释性
  • 第12章:基于LSTM-Autoencoder的无监督聚类模型

data_science_industrial_practice's People

Contributors

xieliaing avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

data_science_industrial_practice's Issues

Page 11

极大似然估计函数 L(β) 中的Pit 中的 i 是指什么?

Chapter 3 找到顾客第一次购买行为的时间

2021年到2023年可能Pandas版本几经变更, 导致DataFrame的聚合操作 出现Keyerror : CustomerID, 我调整了一下Code的顺序
data1=data0.assign(amount=data0['UnitPrice'].multiply(data0['Quantity'])) first_time=data1[['CustomerID','InvoiceDate']].groupby('CustomerID').nth(0).reset_index().rename(columns={'InvoiceDate':'first_time'}) first_time['first_time'] = first_time['first_time'].apply(lambda x: x.date()) data2=pd.merge(data1,first_time,how='left',on=['CustomerID'])
应该是可以正常运行了
另外Chapter 3 还有多处 Load Data 指定的数据文件路径一会儿在 Data 子文件夹里, 一会儿又是同级文件夹, 看得人头发晕😂

书是真不行

这书我只能说是写着玩的,要教基础就教基础,要教深度问题就教深度问题,可惜啥也不是。东西都是浅尝辄止,看了一章,我的评价是不如不写。作者自己我相信肯定是懂和会用的,但是别出来赚这黑心钱了,不适合教人!

请教你几个书名。

谢博士,你好。最近拜读了你、缪莹莹等所著的数据科学工程实践,感触良多。如你在前言中所说,这本书点明了关键节点,起到了引导作用。
所以我现在想沿着这个方向,再找一些资料进行学习。你能沿着这本书,给推荐几本书吗或者阅读材料,英文也可
”第三类是少部分互联网领域统计实 验的书,这类书多是外文,知识较新,阅读门槛较高,通常针对互联网 广告和搜索领域,在不理解理论背景的情况下也难以迁移到其他场景“
你在上面这段话中描述的书能推荐给我吗?
非常感谢你百忙中的回复。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.