datawhalechina / dopmc Goto Github PK
View Code? Open in Web Editor NEWDatawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
Datawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
该框架基于Pytorch研发,核心特性是轻量、易用、易拓展,致力于将推荐系统领域的模型进行统一实现,在支持主流排序、召回模型的基础上,着重研究前沿的生态化的推荐场景论文复现,最终展现形式是发布并维护Pypi开源社区的一个package。
内容初步规划:初步规划TODO清单
负责人:赖敏材 (微信:laimc01)
初步版本:https://github.com/morningsky/Torch-RecHub
目前 Datawhale 社区成员的角色划分并不清晰,除了在公众号也并没有明显的加入渠道,目前想通过开放贡献的方式吸收更多对 Datawhale 感兴趣的人,有意愿,有精力的人来参与到社区当中,在这样的背景下,我们希望构建起更加明确的角色制度以及晋升规则,主要包括以下几个方面:
本项目希望通过研读新型数据处理工具Polars的中文文档,实现面向数据分析领域的一个中文教程,进而拓展数据科学学习生态。
项目参考文档:Polars中文文档
目前社区的数据分析课程是由pandas构建的,希望通过该项目帮助学习者学习一种新型的数据处理工具,并帮助学习者打开大数据处理的大门,缓解数据处理的难处。
在校学生或数据分析行业从业者
该项目主要有以下几点内容较为创新:
预计从7月25日开始,用两周时间构建本书的结构,项目共分为以下几个部分:
微信:lj1439313331
@linjing-lab
关于Polars中文教程
,是对pola-rs/polars-book-cn在数据处理与分析层面的推广,是开创新数据分析体系的前导工具教程。
这个由pola-rs官方提供的中文文档仓库,是由linjing-lab与Subranium提出pola-rs/polars/issues/3211争取得来的。
在此要特别鸣谢:linjing-lab、苏鹏、沈豪等成员的贡献与合作,才使得polars的中文文档能够顺利推出。
招募需求:
🚀一个数学建模工具库,这里有你学习数学建模竞赛的所有.
项目规划
1️⃣ 第一阶段【进行中】:完善全课程开发,按照学习路线与学习的迫切性,完成主流数学模型课程与代码的编写;
正在开发中的课程:
a. 数学建模的数学基础【开发进度:75%,2022.06 上线】
b. 奇异博士的时间序列【2022.07上线】
c. 斯塔克的统计机器学习【2022.08上线】
d. 持续开发中......
- 评价模型
- 运筹规划
- 数据分析 & 统计
- 连续优化
- 微分方程
- 网络模型与图论
- 博弈论和模糊决策
- 深度学习
刘斯豪
该项目包括两部分:《从小白到入门》和《从入门到精通》。
本项目希望通过AI以及向量搜索技术实现一个自动剪辑视频的应用。最终应用可以实现通过输入文字描述来对视频的片段进行提取,达到提取素材的目的。
项目demo:输入关键词就能自动剪视频?我写了一个AI视频搜剪神器?
预计从7月18日开始,用两周时间构建该项目,项目共分为以下几个部分
@Alex020769 作为观察员,帮助优化项目构建过程
微信:subranium
1
1
1
1
1
1
https://datawhalechina.github.io/easy-rl
我连wifi打开后显示链接已重置
我连热点打开后
只显示一行-->
打开开发人员工具后显示很多报错,都含有CONNECTION_RESET
昨天晚上就打不开了
一个月前曾成功打开过界面
无
我不清楚是不是我个人的问题
元宇宙兴起,MR作为一种新型的空间计算技术,在工程中的数字孪生开始被国家和行业所重视。为此,在这里会带领大家如何从3D建模,游戏引擎,传感器原理,MRTK开发和Visual studio硬件部署,来开发自己的第一个MR互动程序。
一起学习,探讨问题,落地应用。
具有基本3D建模基础,了解C#和C++(非必要,可以同步学习),对数字孪生感兴趣的人。
亮点:新,乐趣,实用,自主开发性高。
过程:0基础学习,精准高效实现MR程序开发,与其在IoT中的搭建。为了提高大家学习精准率,可以课程直播与脚本分享。
内容----时间 (以参与者角度>>贡献者准备)----人员:【采用流水作业方式】
体系一:快速了解3D建模与文件格式(3天>>10天 ,1人)
体系二:游戏引擎初识与操作(UI界面,功能,脚本,游戏对象)(5天>>12天,2人)
体系三:MR基本功能开发与部署测试(7天>>16天)---搭建你的第一个MR程序(1人)
体系四:实际应用与探讨(5天>>14天)(共同参与)
李伟
https://github.com/USTBliWei?tab=repositories
17772560590(同微信)
Plotly 用于数据可视化,它主要有以下的特点:
统计学习方法(第二版)习题解答,主要完成了该书的前11章习题,并提供代码和运行之后的截图,里面的内容是以统计学习方法的内容为前置知识,该习题解答的最佳使用方法是以李航老师的《统计学习方法》为主线,并尝试完成课后习题,如果遇到不会的,再来查阅习题解答。
Datawhale 目前的情况是在立项之后会召集几个对项目感兴趣的人,然后这几个人在持续的更新迭代这个项目,但是可能存在下面的问题:
所以基于以上的问题,我们希望将关于项目的沟通也变得更加开放,望关于该项目的讨论是公开透明的,这样可以使得对这个项目感兴趣的人了解该项目在做什么,未来要怎么做,是不是有一些内容是可以参与的,为其提供丰富的上下文信息。
希望通过这种方式能使得大家参与到一个项目中时不会那么迷茫,或者不再害怕参与到项目中去。
目前 Datawhale 社区对于新的想法或者立项方式可以参考Datawhale开源项目白皮书(试行),但是当前的方式依托于项目负责人的精力,当项目负责人在收到立项申请后,会交由 DOPMC 成员进行投票表决其是否立项,这套流程是不够透明的,基于目前的流程进行公开性的调整:
目前 Datawhale 社区缺少相应的行为准则,需要 Code of Conduct 来明确哪些行为是社区所不提倡的。
可以参考相关开源项目或组织的 COC 编写初版
No response
在 #3 中我们初步的完善了立项的开放流程,但是缺少公开的投票环节等流程,我们希望将这些流程也公开化,使接触到 Datawhale 的人更了解社区在发生什么,怎么发生的。
深度学习项目讲授和讨论深度学习的主要理论和关键技术,主要内容有深度学习基础、卷积神经网络、循环神经网络、深度生成模型、深度学习正则化等以及上述深度学习理论在图像、语音、自然语言处理等领域的主要应用,同时也介绍了一些新兴的深度学习模型及其应用。
通过本项目,希望大家能够掌握深度学习的基本理论和关键技术,提高基于深度学习技术进行科学研究与应用开发的能力。
free excel 中文意为自由Excel,源于希望学习者能够通过该教程能够更加自由地使用Excel进行数据分析、数据统计,解放 Excel 不再为 Excel 所困。内容上会更加偏实践应用,力求尽可能简单而又具有一定深度。其他很多教程都是按功能模块来讲解,而且还详细的说明每个功能,令人枯燥乏味。Free Excel 根据多年工作经验总结而成,很多内容是常用且重要的,同时学完后能加深对 Excel 的理解。
B站配套视频:https://www.bilibili.com/video/BV1r64y1h75T
面对具有一定机器学习基础,但尚未入门的 NLPer 或经验尚浅的 NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计**,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。
该项目基于 2021 “AI Earth” 人工智能创新挑战赛,以 “AI 助力精准气象和海洋预测” 为主题,旨在探索人工智能技术在气象和海洋领域的应用,项目负责人是该比赛的冠军团队成员
Polars 是一个用 Rust 实现的速度极快的 DataFrames 库,使用 Apache Arrow Columnar Format作为内存模型。在最近几年,Polars 在处理大数据集上的优势逐渐显著,受到国外很多科研机构的喜爱,比如荷兰一家号称“水上特斯拉”的公司 Xomnia 就是该工具的赞助商。
但是如此好用的的一个项目,却在没有一个可供国内使用的中文文档,所以在与 Polars 社区沟通后,开始了用户指南的翻译项目,详情可见 polars-book-cn。
欢迎更多对 Polars 感兴趣的同学参与到翻译当中。
2022.05.03:已开始翻译
背景开始于我们参加一些机器学习比赛,在类似于 kaggle 等大型数据科学竞赛的时候, 我们总喜欢去观摩高分选手的一些参赛模型,得出一个很重要的结论就是:除了深度学习以外的高分模型,无一例外地见到了集成学习和模型融合的身影。这个发现迫使我去学习一些除了基础模型以外的集成学习方法以便在这些比赛上获得更好的成绩。但是,当我使用具体的 sklearn 编程的时候, 往往因为不懂得集成学习的一 些底层知识而不懂参数的含义。因此,在本项目中我们会从基础模型的推导以及 sklearn 应用过渡到使用集成学习的技术去优化我们的基础模型,使得我们的模型能更好地解决机器学习问题。
本项目以游戏引擎使用和混合现实开发为主题。游戏引擎方面包括Unity使用,C#脚本和API的使用;混合现实开发介绍MRTK的使用和Visual Studio的部署,最终实现一个属于自己的混合现实应用。本项目旨在使对着方面感兴趣的同学快速入门,少走弯路,快速熟悉硬件和软件并奠定基础。
在校学生和XR行业入门者
经过调查针对游戏引擎与混合现实开发教程,多属于收费教程;并且开源教程主要集中在游戏引擎的使用方面,极少涉及混合现实开发,例如极客学院等培训机构。混合现实是2019年逐渐流行的技术,它是一种先进的空间交互技术,不同于以往的VR和AR,在数字孪生领域应用前景非常好。对于有游戏引擎开发经验的人员来说,入门混合现实会更加轻松一些,为此,本教程立项的原因在于让想要学习这块内容的同学更加快速的入门,共同丰富这块知识的体系。
备注:表格中涉及时间范围数字,最大值按个人完成计算,最小值按合作人数计算。组织内是否有意向一起参与项目的,非常欢迎。若项目开启顺利,预计批准立项时开始准备课程,准备时间在一个月左右。
*项目内容* | *立项时间(天)* | *人数* | *学习时间(天)* |
---|---|---|---|
*1* 游戏引擎****篇**** | 合计10~15 | 2~3 | 8 |
1.1 游戏引擎介绍 | |||
1.2 Unity开发环境 | 2 | ||
1.2.1 Unity Hub | |||
1.2.2 Unity Editor | |||
1.2.3 Unity Asset | 2 | ||
1.3 Unity界面与功能 | |||
1.3.1 场景管理 | |||
1.3.2 包管理 | |||
1.3.3 资产管理 | 2 | ||
1.4 基于C#的Unity脚本 | |||
1.4.1 C#介绍 | 3~5 | ||
1.4.2 Unity API | |||
1.4.3 MonoBehavior | 2 | ||
1.5 创建第一个C#驱动的游戏 | 2 | ||
*2* *混合现实开发篇* | 合计15~20 | 2~3 | 10 |
2.1 Mixed Reality概念介绍 | |||
2.1.1 VR和AR | 2 | ||
2.1.2 MR和XR | |||
2.2 基于Unity的开发环境 | 2 | ||
2.2.1 Azure云服务 | |||
2.2.2 Mixed Reality Feature Tools | 3 | ||
2.3 Mixed Reality Toolkits | |||
2.3.1 MRTK Examples | |||
2.3.2 MRTK Foundation | |||
2.3.3 MRTK 配置 | 4 | ||
2.4 开发第一个混合实现应用-火星探测器 | |||
2.5 Visual Studio部署与测试 | |||
2.6 MR硬件设备和模拟器 | 6 |
李伟
https://github.com/USTBliWei
17772560590(同微信)
该项目希望大家能够掌握由浅入深地了解 PyTorch 的基本知识和内容,经过自己的动手实践加深操作的熟练度。同时通过项目实战,充分锻炼编程能力,掌握 PyTorch 进行深度学习的基本流程,提升解决实际问题的能力。
@LiJiaqi96 @NoFish-528
伴随组织发展,仅依靠原有的微信群、飞书等方式难以支持组织成员间相互连接,并支持项目发展,为提高组织人员连接效率,故需要设计组织成员数据库
袁明坤 @Gookr5 、司玉鑫 、姜诗扬,有意向参与数据库项目,欢迎联系
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.