Comments (4)
- 학습시에도 관망만 하지는 않았는지 확인해볼 필요가 있습니다. (학습이 제대로 되지 않아 매도만 하는 방향으로 된다면 보유 주식이 없는 상황에서 매도만하므로 관망만 하게 됩니다.)
- 초판에서는 PG(...에 가까운) 방식으로 강화학습을 해서 할인율을 특별히 두지 않았고 개정판에서는 Q 계산을 위해 할인율을 두었습니다.
- ... 뭔가 이상하군요;;
- 3번과도 연관이 있을것 같습니다. 이슈는 파악해 보겠습니다.
from rltrader.
@jaylee4274 테스트 하실때 사용하신 커맨드(옵션들)를 알려주시면 감사하겠습니다.
from rltrader.
이번에도 답변해주셔서 감사합니다. ! ^^
답변이 다소 늦어 죄송합니다.
저는 데이터를 일부 다르게 구성하고, 일부 옵션은 기본 값을 주고 했습니다.
먼저 선생님께서 올려주신 버젼에서 실행한 커맨드 입니다.
-
dev와 동일한 코드를 실행, 005930, 19년에 활용
#Test005930DQN-50
!python
main.py --stock_code 005930 --rl_method dqn --net lstm --num_steps 5 --output_name test2_005930 --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --value_network_namedqn_lstm_value_005930_50
-
제가 만든 버전 2년 학습, 19년 활용, 실행코드에 종목번호(결과출력, 종목코드, 신경망 이름 등)만 다르게 입력해주며 실험했습니다.
-
실행 코드 (학습)
#DQN !python main.py --stock_code --rl_method dqn --output_name --learning #PG !python main.py --stock_code --rl_method pg --output_name --learning #AC !python main.py --stock_code --rl_method ac --output_name --learning #A2C !python main.py --stock_code --rl_method a2c --output_name --learning #A3C !python main.py --stock_code --rl_method a3c --output_name --learning
-
실행코드(테스트)
#TestDQN
!python
main.py --stock_code --rl_method dqn --output_name test_ --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --value_network_name dqn_lstm_value_`
#TestPG
!python main.py --stock_code --rl_method pg --output_name test_ --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --policy_network_name pg_lstm_policy_
#TestAC
!python
main.py --stock_code --rl_method ac --output_name test_ --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --value_network_name ac_lstm_value_ --policy_network_name ac_lstm_policy_`
#TestA2C
!python
main.py --stock_code --rl_method a2c --output_name test_ --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --value_network_name a2c_lstm_value_ --policy_network_name a2c_lstm_policy_`
#TestA3C
!python
main.py --stock_code --rl_method a3c --output_name test_ --num_epoches 1 --start_epsilon 0 --start_date 20190101 --end_date 20191231 --reuse_models --value_network_name a3c_lstm_value_ --policy_network_name a3c_lstm_policy_ `
from rltrader.
혹시 모델 파일 참조가 안된건지 확인이 필요할것 같습니다.
학습시에도 --value_network_name
와 --policy_network_name
를 주면 학습된 모델이 models 폴더에 저장됩니다.
from rltrader.
Related Issues (20)
- main.py 오류 문의입니다. HOT 1
- 예제 5.7 코드 설명좀 부탁드립니다 HOT 1
- 지연보상에 대한 내용이 바뀐 이유와 내용이 궁금합니다. HOT 3
- Network 클래스 질문 HOT 1
- pytorch전용 v3.0 GPU 질문 HOT 1
- 매수 및 매도 단가 갱신 식 관련 HOT 1
- 실행 환경 문의 HOT 1
- Creon 클래스에서 csv파일로 저장방법 문의 드립니다. HOT 2
- main.py를 실행시킬때 mode부분에 update 명령어 질문 HOT 2
- 파이토치 학습된 모델을 test시 학습데이터와 동일하게 테스트 HOT 1
- V1 predict result nan error
- 즉각적인 보상 term에 관련하여 HOT 1
- 코드 구현 문의 (데이터 정규화, replay buffer 사용 여부) HOT 1
- 버전 v3은 잘 되는데, v1,v2는 오류발생 HOT 1
- 마지막 epoch에서는 매매를 하지 않네요. 버그인가요? HOT 4
- 마지막 epoch에서는 매매가 없는 증상이 반복됩니다. HOT 1
- ModuleNotFoundError: No module named 'quantylab' HOT 1
- 학습후 실제 적용시에 탐험을 해야하나요?. HOT 1
- 안녕하세요. issue는 아니고 학습에 질문이 있어서 글 올립니다. HOT 1
- networks_pytorch 질문 드립니다
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from rltrader.