Giter Site home page Giter Site logo

dopmc's People

Contributors

sm1les avatar supersupeng avatar truth-14 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

dopmc's Issues

torch-rechub

项目简介

该框架基于Pytorch研发,核心特性是轻量、易用、易拓展,致力于将推荐系统领域的模型进行统一实现,在支持主流排序、召回模型的基础上,着重研究前沿的生态化的推荐场景论文复现,最终展现形式是发布并维护Pypi开源社区的一个package。
内容初步规划:初步规划TODO清单

项目负责人

负责人:赖敏材 (微信:laimc01)
初步版本:https://github.com/morningsky/Torch-RecHub

项目地址

torch-rechub

Datawhale 开放社区构建:构建社区角色划分以及晋升规则

目前 Datawhale 社区成员的角色划分并不清晰,除了在公众号也并没有明显的加入渠道,目前想通过开放贡献的方式吸收更多对 Datawhale 感兴趣的人,有意愿,有精力的人来参与到社区当中,在这样的背景下,我们希望构建起更加明确的角色制度以及晋升规则,主要包括以下几个方面:

  • 明确社区的组织架构
  • 设计社区的人员角色
  • 设计社区人员的晋升与 retire 机制
  • 设计不同阶段的权益

Polars中文教程

你是否已经阅读并同意《Datawhale社区贡献协议》?

项目简介

本项目希望通过研读新型数据处理工具Polars的中文文档,实现面向数据分析领域的一个中文教程,进而拓展数据科学学习生态。

项目参考文档:Polars中文文档

立项理由

目前社区的数据分析课程是由pandas构建的,希望通过该项目帮助学习者学习一种新型的数据处理工具,并帮助学习者打开大数据处理的大门,缓解数据处理的难处。

项目受众

在校学生或数据分析行业从业者

项目亮点

该项目主要有以下几点内容较为创新:

  • 采用新型数据处理工具Polars;
  • 结合pandas特征工程对比学习;
  • 搭建数据分析比赛案例分析;
  • 从API设计分析的异同的角度进行分析学习。

项目规划

预计从7月25日开始,用两周时间构建本书的结构,项目共分为以下几个部分:

  • Python基础
  • Numpy基础
  • 初识Polars
  • Polars基础
  • Polars进阶
  • Polars高级
  • 附属生态

polars-tutorial

项目负责人

微信:lj1439313331
@linjing-lab

help wanted

关于Polars中文教程,是对pola-rs/polars-book-cn在数据处理与分析层面的推广,是开创新数据分析体系的前导工具教程。

这个由pola-rs官方提供的中文文档仓库,是由linjing-labSubranium提出pola-rs/polars/issues/3211争取得来的。

在此要特别鸣谢:linjing-lab苏鹏沈豪等成员的贡献与合作,才使得polars的中文文档能够顺利推出。

招募需求:

  1. 掌握Python与Numpy的人,帮助完成教程的预备知识部分;
  2. 对Pandas有较为深入的研究,理解API构建原理的人,帮助对比研读Polars中文文档
  3. 有数据分析比赛过程中做特征工程的经验,能够将特征工程、数据挖掘等流程融合,来推出polars的应用与实战案例;
  4. 掌握Rust编程、Apache Arrow的人,能够分析Polars的底层API设计机制的;
  5. 对统计学、数据分析理论或实践有较为深入研究的人,同样欢迎大家能够参与到其中。

备注:发起立项申请后DOPMC将会在 72h 之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • 我已知悉上述备注

PRML中文解读

项目简介

PRML中文解读

项目负责人

薛博阳

开源地址

数学建模:GitModel

项目简介

🚀一个数学建模工具库,这里有你学习数学建模竞赛的所有.

🧩在这个仓库里,未来我们将会更新:

  • 有关数学建模的基本知识、算法、以及实战案例
  • 各类数学建模竞赛的Baseline
  • 有关数学建模的竞赛分享与复盘
  • 各类有趣的数学建模案例
  • 还有你想了解or感兴趣的,欢迎跟我们联系或投稿

项目规划

1️⃣ 第一阶段【进行中】:完善全课程开发,按照学习路线与学习的迫切性,完成主流数学模型课程与代码的编写;

正在开发中的课程:
a. 数学建模的数学基础【开发进度:75%,2022.06 上线】
b. 奇异博士的时间序列【2022.07上线】
c. 斯塔克的统计机器学习【2022.08上线】
d. 持续开发中......

  • 评价模型
  • 运筹规划
  • 数据分析 & 统计
  • 连续优化
  • 微分方程
  • 网络模型与图论
  • 博弈论和模糊决策
  • 深度学习

项目负责人

刘斯豪

项目地址

GitModel

powerful-numpy

项目简介

该项目包括两部分:《从小白到入门》和《从入门到精通》。

  • 《从小白到入门》旨在帮助没有基础的同学快速掌握 numpy 的常用功能,保证日常绝大多数场景的使用。
  • 《从入门到精通》目的是帮助有进一步需要的同学对 numpy 进行更深入地了解,主要包括基本介绍、原理分析、基本操作和例子。

项目负责人

@hscspring

项目地址

powerful-numpy

Rust教程

项目简介

Rust教程

项目负责人

陈煜昂

项目地址

vced

项目简介

本项目希望通过AI以及向量搜索技术实现一个自动剪辑视频的应用。最终应用可以实现通过输入文字描述来对视频的片段进行提取,达到提取素材的目的。

项目demo:输入关键词就能自动剪视频?我写了一个AI视频搜剪神器?

项目规划

预计从7月18日开始,用两周时间构建该项目,项目共分为以下几个部分

  • 项目介绍
  • 跨模态模型
  • jina使用
  • 项目后端构建
  • 项目前端构建
  • 项目部署

项目具体分工如图
image

@Alex020769 作为观察员,帮助优化项目构建过程

项目负责人

微信:subranium

项目地址

vced

Datawhale 开放社区建设

你是否已经阅读并同意《Datawhale社区贡献协议》?

项目简介

1

立项理由

1

项目受众

1

项目亮点

1

项目规划

1

项目负责人

1

备注:发起立项申请后DOPMC将会在24小时之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • 我已知悉上述备注

[Feedback]: 在线阅读打不开了

Datawhale 社区中是否已经存在了相似的问题?

  • I have searched the existing issues

描述

https://datawhalechina.github.io/easy-rl
我连wifi打开后显示链接已重置

我连热点打开后
只显示一行-->
打开开发人员工具后显示很多报错,都含有CONNECTION_RESET

昨天晚上就打不开了
一个月前曾成功打开过界面

解决方案

其他信息?

我不清楚是不是我个人的问题

Mixed Reality and Sensors

你是否已经阅读并同意《Datawhale社区贡献协议》?

项目简介

元宇宙兴起,MR作为一种新型的空间计算技术,在工程中的数字孪生开始被国家和行业所重视。为此,在这里会带领大家如何从3D建模,游戏引擎,传感器原理,MRTK开发和Visual studio硬件部署,来开发自己的第一个MR互动程序。

立项理由

一起学习,探讨问题,落地应用。

项目受众

具有基本3D建模基础,了解C#和C++(非必要,可以同步学习),对数字孪生感兴趣的人。

项目亮点

亮点:新,乐趣,实用,自主开发性高。
过程:0基础学习,精准高效实现MR程序开发,与其在IoT中的搭建。为了提高大家学习精准率,可以课程直播与脚本分享。

项目规划

内容----时间 (以参与者角度>>贡献者准备)----人员:【采用流水作业方式】

体系一:快速了解3D建模与文件格式(3天>>10天 ,1人)
体系二:游戏引擎初识与操作(UI界面,功能,脚本,游戏对象)(5天>>12天,2人)
体系三:MR基本功能开发与部署测试(7天>>16天)---搭建你的第一个MR程序(1人)
体系四:实际应用与探讨(5天>>14天)(共同参与)

项目负责人

李伟
https://github.com/USTBliWei?tab=repositories
17772560590(同微信)

备注:发起立项申请后DOPMC将会在24小时之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • 我已知悉上述备注

wow-plotly

项目简介

Plotly 用于数据可视化,它主要有以下的特点:

  • 图形多样化:plotly 中能够绘制多种图形,常见的折线图、散点图、饼图、桑基图、气泡图、联合分布图;还有和机器学习、统计相关的各种图形等
  • 开源免费:Plotly 官网的所有资源都是免费,用户可直接使用
  • 在线可编辑:Plotly 有自己的在线可编辑平台,使用者将图形上传即可编辑和分享
  • 图形绚丽:Plotly 的图形全部是动态可视化的,而且还有多种颜色面板供用户使用
  • 代码量少:Plotly 绘图的过程中,尤其是使用 Plotly 的高级封装 Plotly_express,一行代码即可实现非常漂亮的图形等

项目负责人

@pidada

项目地址

wow-plotly

statistical-learning-method-solutions-manual

项目简介

统计学习方法(第二版)习题解答,主要完成了该书的前11章习题,并提供代码和运行之后的截图,里面的内容是以统计学习方法的内容为前置知识,该习题解答的最佳使用方法是以李航老师的《统计学习方法》为主线,并尝试完成课后习题,如果遇到不会的,再来查阅习题解答。

项目负责人

@Relph1119

项目地址

statistical-learning-method-solutions-manual

问答测试

Discussed in #40

Originally posted by Truth-14 May 10, 2022
哪些节点公开化


BingWallpaper

Datawhale 开放社区构建:构建项目的开放沟通渠道

Datawhale 目前的情况是在立项之后会召集几个对项目感兴趣的人,然后这几个人在持续的更新迭代这个项目,但是可能存在下面的问题:

  1. 外部看到的我们是组队学习的模式,其接触到的就是比较完整的教程,但是构建项目的过程中我们也希望能有更多人持续的参与
  2. 在项目迭代过程中,接触到该项目的人可能并不了解项目在做什么,觉得有距离感,甚至不敢参与进来,这与我们推崇的共创精神是相违背的

所以基于以上的问题,我们希望将关于项目的沟通也变得更加开放,望关于该项目的讨论是公开透明的,这样可以使得对这个项目感兴趣的人了解该项目在做什么,未来要怎么做,是不是有一些内容是可以参与的,为其提供丰富的上下文信息。

希望通过这种方式能使得大家参与到一个项目中时不会那么迷茫,或者不再害怕参与到项目中去。

依托 Github 提供更加清晰且开放的贡献方式

目前 Datawhale 社区对于新的想法或者立项方式可以参考Datawhale开源项目白皮书(试行),但是当前的方式依托于项目负责人的精力,当项目负责人在收到立项申请后,会交由 DOPMC 成员进行投票表决其是否立项,这套流程是不够透明的,基于目前的流程进行公开性的调整:

  1. 想要立项的同学在 DOPMC 项目中创建 Issue 进行初步讨论
  2. 待讨论成型后通过 PR 提交 proposal 详细描述立项的目的,内容以及大概时间节点
  3. 提交的 PR 待 review 后有 DOPMC 成员投票决定是否 merge 到项目中
  4. 待 PR merge 后将对应的 Issue 进行完善,公开项目负责人与项目地址等信息

社区缺少 Code of Conduct

Datawhale 社区中是否已经存在了相似的问题?

  • I have searched the existing issues

描述

目前 Datawhale 社区缺少相应的行为准则,需要 Code of Conduct 来明确哪些行为是社区所不提倡的。

解决方案

可以参考相关开源项目或组织的 COC 编写初版

其他信息?

No response

unusual-deep-learning

项目简介

深度学习项目讲授和讨论深度学习的主要理论和关键技术,主要内容有深度学习基础、卷积神经网络、循环神经网络、深度生成模型、深度学习正则化等以及上述深度学习理论在图像、语音、自然语言处理等领域的主要应用,同时也介绍了一些新兴的深度学习模型及其应用。

通过本项目,希望大家能够掌握深度学习的基本理论和关键技术,提高基于深度学习技术进行科学研究与应用开发的能力。

项目负责人

@liu-yang-maker

项目地址

unusual-deep-learning

free-excel

项目简介

free excel 中文意为自由Excel,源于希望学习者能够通过该教程能够更加自由地使用Excel进行数据分析、数据统计,解放 Excel 不再为 Excel 所困。内容上会更加偏实践应用,力求尽可能简单而又具有一定深度。其他很多教程都是按功能模块来讲解,而且还详细的说明每个功能,令人枯燥乏味。Free Excel 根据多年工作经验总结而成,很多内容是常用且重要的,同时学完后能加深对 Excel 的理解。

B站配套视频:https://www.bilibili.com/video/BV1r64y1h75T

项目负责人

@yangjiada @muxiaoxiong

项目地址

free-excel

hands-dirty-nlp

项目简介

面对具有一定机器学习基础,但尚未入门的 NLPer 或经验尚浅的 NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计**,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。

项目负责人

@chenlian-zhou

项目地址

hands-dirty-nlp

time-series-learning

项目简介

该项目基于 2021 “AI Earth” 人工智能创新挑战赛,以 “AI 助力精准气象和海洋预测” 为主题,旨在探索人工智能技术在气象和海洋领域的应用,项目负责人是该比赛的冠军团队成员

项目负责人

@Harold-Ran

项目地址

time-series-learning

Datawhale 开放社区构建:开放的沟通渠道

目前 Datawhale 社区大多是基于微信群进行沟通,所以造成了一定程度的信息不透明,导致接触到 Datawhale 的朋友可能并不了解社区都在发生些什么,有哪些事情可以参与。在这样的背景下,我们希望尝试构建起更加开放的沟通渠道,具体包含下面几个事项:

  • 在现有微信群的基础上尝试更开放的沟通软件,如 Zulip 或 Discussions #23
  • #2
  • 依托 Issue 与 开放的沟通渠道使社区发生的事情更加透明
  • #25
  • #26
  • #28
  • 规范 Datawhale 社区 Code of Conduct

具体规划可以在这里找到,欢迎感兴趣的朋友一起进行尝试。

408系列教程

项目简介

408系列教程

项目负责人

@叶前坤

项目地址

Polars User Guide 翻译

项目简介

Polars 是一个用 Rust 实现的速度极快的 DataFrames 库,使用 Apache Arrow Columnar Format作为内存模型。在最近几年,Polars 在处理大数据集上的优势逐渐显著,受到国外很多科研机构的喜爱,比如荷兰一家号称“水上特斯拉”的公司 Xomnia 就是该工具的赞助商。

但是如此好用的的一个项目,却在没有一个可供国内使用的中文文档,所以在与 Polars 社区沟通后,开始了用户指南的翻译项目,详情可见 polars-book-cn

欢迎更多对 Polars 感兴趣的同学参与到翻译当中。

项目负责人

@linjing-lab

最新进展

2022.05.03:已开始翻译

help wanted

  • 翻译人员

ensemble-learning

项目简介

背景开始于我们参加一些机器学习比赛,在类似于 kaggle 等大型数据科学竞赛的时候, 我们总喜欢去观摩高分选手的一些参赛模型,得出一个很重要的结论就是:除了深度学习以外的高分模型,无一例外地见到了集成学习和模型融合的身影。这个发现迫使我去学习一些除了基础模型以外的集成学习方法以便在这些比赛上获得更好的成绩。但是,当我使用具体的 sklearn 编程的时候, 往往因为不懂得集成学习的一 些底层知识而不懂参数的含义。因此,在本项目中我们会从基础模型的推导以及 sklearn 应用过渡到使用集成学习的技术去优化我们的基础模型,使得我们的模型能更好地解决机器学习问题。

项目负责人

@Leolee11111

项目地址

ensemble-learning

游戏引擎与混合现实

你是否已经阅读并同意《Datawhale社区贡献协议》?

项目简介

本项目以游戏引擎使用和混合现实开发为主题。游戏引擎方面包括Unity使用,C#脚本和API的使用;混合现实开发介绍MRTK的使用和Visual Studio的部署,最终实现一个属于自己的混合现实应用。本项目旨在使对着方面感兴趣的同学快速入门,少走弯路,快速熟悉硬件和软件并奠定基础。

立项理由

技术方面

  1. 元宇宙概念兴起,其中XR(拓展现实)是其中的一种重要技术;
  2. 游戏引擎是XR开发的必要工具和平台;
  3. C#脚本是驱动Unity的核心语言;
  4. XR在实际应用中潜力巨大;

开源方面

  1. 帮助在校学生快速入门该领域,少走弯路;
  2. 搭建良性体系,共同丰富该部分内容与实际应用框架;
  3. 总结学习心得,共同进步。

项目受众

在校学生和XR行业入门者

项目亮点

经过调查针对游戏引擎与混合现实开发教程,多属于收费教程;并且开源教程主要集中在游戏引擎的使用方面,极少涉及混合现实开发,例如极客学院等培训机构。混合现实是2019年逐渐流行的技术,它是一种先进的空间交互技术,不同于以往的VR和AR,在数字孪生领域应用前景非常好。对于有游戏引擎开发经验的人员来说,入门混合现实会更加轻松一些,为此,本教程立项的原因在于让想要学习这块内容的同学更加快速的入门,共同丰富这块知识的体系。

项目规划

项目负责人:李伟

备注:表格中涉及时间范围数字,最大值按个人完成计算,最小值按合作人数计算。组织内是否有意向一起参与项目的,非常欢迎。若项目开启顺利,预计批准立项时开始准备课程,准备时间在一个月左右。

*项目内容* *立项时间(天)* *人数* *学习时间(天)*
*1* 游戏引擎****篇**** 合计10~15 2~3 8
1.1 游戏引擎介绍
1.2 Unity开发环境 2
1.2.1 Unity Hub
1.2.2 Unity Editor
1.2.3 Unity Asset 2
1.3 Unity界面与功能
1.3.1 场景管理
1.3.2 包管理
1.3.3 资产管理 2
1.4 基于C#的Unity脚本
1.4.1 C#介绍 3~5
1.4.2 Unity API
1.4.3 MonoBehavior 2
1.5 创建第一个C#驱动的游戏 2
*2* *混合现实开发篇* 合计15~20 2~3 10
2.1 Mixed Reality概念介绍
2.1.1 VR和AR 2
2.1.2 MR和XR
2.2 基于Unity的开发环境 2
2.2.1 Azure云服务
2.2.2 Mixed Reality Feature Tools 3
2.3 Mixed Reality Toolkits
2.3.1 MRTK Examples
2.3.2 MRTK Foundation
2.3.3 MRTK 配置 4
2.4 开发第一个混合实现应用-火星探测器
2.5 Visual Studio部署与测试
2.6 MR硬件设备和模拟器 6

项目负责人

李伟
https://github.com/USTBliWei
17772560590(同微信)

备注:发起立项申请后DOPMC将会在 72h 之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • 我已知悉上述备注

thorough-pytorch

项目简介

该项目希望大家能够掌握由浅入深地了解 PyTorch 的基本知识和内容,经过自己的动手实践加深操作的熟练度。同时通过项目实战,充分锻炼编程能力,掌握 PyTorch 进行深度学习的基本流程,提升解决实际问题的能力。

项目负责人

@LiJiaqi96 @NoFish-528

项目地址

thorough-pytorch

Datawhale 社区成员数据库项目

项目背景

伴随组织发展,仅依靠原有的微信群、飞书等方式难以支持组织成员间相互连接,并支持项目发展,为提高组织人员连接效率,故需要设计组织成员数据库

项目计划

  1. 调研需求
  2. 数据库建模,明确数据库字段
  3. MVP产品和技术选型
  4. 收集成员数据 & 数据库开发
  5. 数据库维护

项目组成员:

袁明坤 @Gookr5 、司玉鑫 、姜诗扬,有意向参与数据库项目,欢迎联系

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.