Giter Site home page Giter Site logo

cjyyx / ai_gen_novel Goto Github PK

View Code? Open in Web Editor NEW
56.0 3.0 12.0 9.59 MB

基于大语言模型(LLM)和多智能体(Multi-Agent),探究AI写小说能力的边界

License: MIT License

Python 100.00%
fiction llm multi-agent-systems multiagent novel prompt prompt-engineering webnovel

ai_gen_novel's Introduction

探究 AI 写网文能力的极限

简介

近年来,AI在文学创作领域取得了显著进展。从AI微小说大赛到阅文妙笔,再到Midreal AI,这些案例都证明了AI在文学创作上的巨大潜力。作为一名网络文学爱好者,我希望通过大语言模型与多智能体技术,来开发一款能够自动生成网络小说的应用。

网文的创作,可以套用写作的认知过程模型,该模型将写作视为一个目标导向的思考过程,包括非线性的认知活动:计划、转换和审阅。

文献和实践表明,LLM 在转换和审阅上表现较好,而在计划阶段存在缺陷。具体体现为

  • 有限的理解和推理能力
  • 无法记忆和生成长文本
  • 缺乏原创性和多样性

面对这些问题,我的解决方案是

  • 利用LLM的能力压缩长文本为几句话组成的记忆
  • 优化Prompt,多智能体协作,激发 LLM 的能力,提升其原创性
  • 借鉴RecurrentGPT的核心**,基于语言的循环计算,通过迭代的方式创作任意长度的文本
  • 结合网络小说创作的先验知识,对创作流程进行优化

经过一定的探索后,我认为目前的大语言模型还没有足够的能力创作长篇网络小说

未来可能的发展方向是:

对大模型能力要求

  • 更长的上下文
  • 更强的理解和推理能力
  • 以人为评判标准的网文生成的强化学习训练

程序架构的优化

  • 多次尝试,多智能体讨论,提升原创性
  • 引入更多先验知识,如结构化的剧情框架

在线体验

https://modelscope.cn/studios/cjyyxn/AI_Gen_Novel/summary

快速上手指南

步骤1: 环境配置

首先,安装所需的依赖项:

pip install -r requirements.txt

步骤2: 实现LLM接口

项目依赖一个大语言模型。你需要实现LLM.py中的chatLLM函数。

步骤3: 运行项目

  • 直接运行demo.py,将自动创作小说,并将结果保存在novel_record.md文件中。

  • 运行app.py启动一个基于gradio的应用,通过打开显示的链接,你可以体验到AI小说生成的可视化过程。

ai_gen_novel's People

Contributors

cjyyx avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

ai_gen_novel's Issues

good job

好思路,好项目啊,大家要star啊!

对GPU显存是个挑战哇

非常有趣的工作!!!
我调用了本地部署的大模型,生成了一些文字后。成功爆内存了哈哈哈哈

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.