boostcampaitech6 / level1-bookratingprediction-recsys-01 Goto Github PK

View Code? Open in Web Editor NEW

0.0 0.0 1.0 201.07 MB

level1-bookratingprediction-recsys-01 created by GitHub Classroom

Python 100.00%

level1-bookratingprediction-recsys-01's People

Contributors

Forkers

yechance7

level1-bookratingprediction-recsys-01's Issues

데이터 증강을 활용한 과적합 방지 아이디어

기본 모델의 Epoch수가 높지 않은데 Loss값의 양상을 보니 무거운 모델로 좀 더 학습을 시키는 경우 과적합 가능성이 커보입니다. 데이터 증강(노이즈 추가 등)을 통해 모델 성능을 높여보는건 어떨까요?

book data의 category 결측치 채우는 아이디어

category가 비어있는 책에 대해서, 그 책을 읽은 사람들이 공통으로 많이 읽은 책들의 category를 해당 책의 category로 채우면 어떨까요?
해당 책을 읽어서 rating을 한 user들을 찾고, 그 user들이 읽은 다른 책들을 다시 모아서 가장 많이 나오는 category를 찾는 거죠.
근데 지금 대부분의 책의 category가 fiction이어서, 이런 방법으로 결측을 채우면 fiction만 들어갈까 우려가 되긴 합니다.
그래서 추가적으로 생각한 아이디어는, book data에서 나오는 모든 category의 빈도를 구해서, 이를 이용하여 비율을 계산하여 그 비율이 가장 높은 category로 채우는 것은 어떨까 합니다.

boostcampaitech6 / level1-bookratingprediction-recsys-01 Goto Github PK

level1-bookratingprediction-recsys-01's People

Contributors

Forkers

level1-bookratingprediction-recsys-01's Issues

데이터 증강을 활용한 과적합 방지 아이디어

book data의 category 결측치 채우는 아이디어

WDN과 NCF에 dl_data.py 대신 context_data.py로 데이터 로드해도 잘 작동합니다!

CNN_FM에 context data를 추가해보면 어떨까요?

Books 데이터 Language 결측치 채우는 아이디어

User age를 활용하여 category결측치 채우는 아이디어

FM 설명력 개선

users data의 age 변수를 카테고리화할 때의 아이디어

book data의 summary 결측치 채우는 아이디어

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent