Giter Site home page Giter Site logo

huiguyy / chatpaper2xmind Goto Github PK

View Code? Open in Web Editor NEW

This project forked from masteryip/chatpaper2xmind

0.0 0.0 0.0 42.66 MB

论文XMind笔记生成工具,将论文pdf通过ChatGPT转换为带有图片和公式的简要XMind笔记,提高论文阅读效率。

License: MIT License

Python 100.00%

chatpaper2xmind's Introduction

Logo

ChatPaper2XMind

中文|English

ChatPaper2XMind论文XMind笔记生成工具:使用ChatGPT将PDF转换为带有图片和公式的简洁XMind笔记,提高阅读效率。

注意:受限于ChatGPT生成模型准确性,生成的Xmind笔记更适合作为笔记草稿,在此基础上制作阅读笔记,而不能直接将其当做论文阅读。

功能展示

文档转换

安装与使用

1. 环境设置

cd <root-dir>
pip install -r requirements.txt
git submodule update --init --recursive

2. Config配置

基本设置

  • APIKEY设置(必须配置):在config.py中加入APIKEYs(支持多线程请求)
  • GPT模型选择:在config.py中设置MODEL变量为所需的模型,目前提供"GPT-3.5-turbo"模型可选。
  • 语言设置:在config.py中设置LANGUAGE变量以选择模型的语言,默认为英语,但部分支持中文。
  • 领域关键词:在config.py中设置KEYWORD变量以指定模型关注的领域关键词。
  • 代理设置:在config.py中设置PROXY变量以指定代理地址,如果您的系统已经设置了全局代理,可以保留为None
  • 线程请求速率限制:在config.py中设置THREAD_RATE_LIMIT变量以指定每个APIKEY在一分钟内可以发送的请求次数,由于OpenAI的限制,每个APIKEY最多支持3次请求。

生成设置

  • 最大生成项数:在config.py中设置TEXT2LIST_MAX_NUM和TEXT2TREE_MAX_NUM变量,分别表示文本转列表和文本转树结构的最大生成项数。
  • 使用真实GPT模型:在config.py中设置GPT_ENABLE变量以使用真实GPT/伪GPT
  • 伪GPT模型响应:在config.py中设置FAKE_GPT_RESPONSE变量以指定伪GPT模型的响应内容。

标题正则匹配

  • 标题正则匹配字符串:在config.py中设置SECTIONNUM_MATCHSTR进行对应标题匹配

文件保存

  • Xmind风格模板文件:在config.py中设置TEMPLATE_XMIND_PATH选择风格模板(模板应为空)

3. 开箱使用

将PDF论文转换为XMind

cd <root-dir>
python paper2xmind.py --path <pdf路径或pdf文件夹路径>

运行演示

python paper2xmind.py

未来工作

  • 减少GPT请求次数以加快XMind生成速度
  • 添加元数据和资源解析功能
  • 使用PDFfigures 2.0实现图片检测
  • 改进图像定位方法(由于部分匹配失败导致的图像丢失)
  • 添加Markdown笔记生成功能
  • 优化公式检测(边界检测)
  • 表格检测

鸣谢

感谢以下项目对本项目的宝贵贡献:

以及其他不小心被忽略的项目 :)

特别感谢开源社区和所有为该项目作出贡献的贡献者。

许可证

本项目在MIT许可下发布。有关详细信息,请参阅LICENSE文件。

作者

Master Yip

电子邮件:[email protected]

GitHub:Master Yip

chatpaper2xmind's People

Contributors

masteryip avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.