Comments (8)
graph确实存在这个问题, 采用自定义的lr, 必须要定义_generate_conf_for_graph
, 而这个又需要调用C++的接口. 会导致用户完全定义不了自己的LR.
但是现在libai更多的是支持graph模式, 这就导致用户用libai 只能用oneflow内置的lr_scheduler
from libai.
我们可以通过一个 try catch 机制去捕获这个 error,不用重新 copy 一份一样的代码
from libai.
graph确实存在这个问题, 采用自定义的lr, 必须要定义
_generate_conf_for_graph
, 而这个又需要调用C++的接口. 会导致用户完全定义不了自己的LR. 但是现在libai更多的是支持graph模式, 这就导致用户用libai 只能用oneflow内置的lr_scheduler
可以的,写一个build来解决这个问题好了
from libai.
我们可以通过一个 try catch 机制去捕获这个 error,不用重新 copy 一份一样的代码
OKKK
from libai.
先统计一下预计支持哪几种scheduler、目前可以支持哪几种(graph+eager)、暂不支持哪几种,列个清单。如果常用的都支持,个别可以不管。如果某些必要的scheduler目前不支持,那就在oneflow里添加一下吧。
from libai.
先统计一下预计支持哪几种scheduler、目前可以支持哪几种(graph+eager)、暂不支持哪几种,列个清单。如果常用的都支持,个别可以不管。如果某些必要的scheduler目前不支持,那就在oneflow里添加一下吧。
暂时计划是先实现两个,WarmupMultiStepLR
和WarmupCosineLR
,满足目前训练的需求,后续再开PR添加其他的,可以统计一下,因为有些LR Scheduler可能几乎都用不上,不常见的让用户自己添加即可
from libai.
WarmupMultiStepLR是什么更新规则,感觉这些不够啊。transformer模型一般会用Inverse square root scheduler训练,用polynomial decay scheduler微调,这两个都支持warmup。咱们的模型主要是transformer,所以这两个应该也支持一下。
from libai.
WarmupMultiStepLR是什么更新规则,感觉这些不够啊。transformer模型一般会用Inverse square root scheduler训练,用polynomial decay scheduler微调,这两个都支持warmup。咱们的模型主要是transformer,所以这两个应该也支持一下。
可以,这些都很好支持,inverse square这个恐怕是要oneflow内部支持
from libai.
Related Issues (20)
- python requirements缺失?
- 可否支持读取pytorch model进行训练 HOT 3
- 多机训练报错 HOT 13
- 多机训练失败后,非master node的进程没有完全kill掉 HOT 3
- 关于benchmark实验结果的疑问 HOT 2
- [Bug]libai test error:File exists: './data_test/bert_data' HOT 3
- 微信群满了 HOT 3
- CI test 失效
- 纯tensor并行训练,4卡和8卡使用的集合通信算子不同 HOT 2
- TypeError: __init__() got an unexpected keyword argument 'flags' HOT 5
- GLM libai推理报错 HOT 2
- MT5和T5的区别 HOT 4
- [多机多卡][MT5]failed to connect to all addresses HOT 1
- GPT2预训练,libai的throughput和以前的数据不匹配 HOT 1
- 测试并行框架,张量并行结果与官网所给数据不一致
- GLM 10B CN推理加速耗时 HOT 1
- 运行教程的bash tools/train.sh tools/train_net.py configs/vit_imagenet.py 8 命令报错
- Project下的MAE多卡训练报错
- 运行GLM示例报错 module 'oneflow._C' has no attribute 'fused_multi_head_attention_inference_v2' HOT 1
- 建议requirements 中涉及requests指定一下具体版本
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from libai.