Giter Site home page Giter Site logo

alog's People

Contributors

duxins avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

alog's Issues

对几个小小新功能的期待

这款 App 实在太棒了!我特地升级了 iOS 系统,只为能够用上你开发的 Alog。已激情付费支持~~

有几点小建议,希望未来版本能够提供:
1.提供内置的纯文字日记编写功能——毕竟不是每天都方便记录语音日志,有的时候整天和别人在一起,如果可以提供文字日记的选项就好了。
2.提供本地的 Whisper 模型离线语音识别选项,这样既可以在没网的时候使用,也帮助开发者省下了 Whisper API 的费用嘛。
3.希望能上架 Mac App Store。其实用不着额外做什么适配,直接让我们下载 iOS 版本的应用就好啦,只是方便在电脑上整理、查阅、编辑、导出。
4.内置几段开发者你自己测试后觉得好用的总结提示词,以供用户上手即用,这样用户就用不着自己摸索自定义提示词的效果了。

这款日记 App 真的是革命性的创新,我已经抛弃了沿用近十年的原日记 App,希望你能长长久久经营维护这个项目哟~

[需求]跨日期进行总结或者处理操作

因为有可能记录的一些想法并不是连续的,需要汇总起来来进行总结操作,或者是要处理几天的任务将它们汇总输出。

既然支持批量处理了,希望也支持批量选择删除。

Wrong Timestamp in App

If I recit a message on my Apple Watch and open the app on the iPhone a few days later, the current day date is assigned to the audio message.

Wouldn’t it be better if the recording date of the audio message was used as the date?

[bug]出现语音无法识别的500错误

今天两条都识别文本报错,如下是其中一条的具体错误信息:

  1. unmarshal_response_body_failed err :invalid character
    '<' looking for beginning of value (request id:20240505072910994103194LGMEILX2)

版本:v0.2.2

简单使用后的功能建议

  1. 希望能像对讲机(或者微信语音)一样,按住按钮讲话,松开就是完成记录。
  2. 按钮位置太靠下,单手操作会不太舒适,或许可以让用户手动调整录音键位置
  3. 好像没见到搜索框

新特性:增加对灵动岛的支持

通过快捷指令或者 Action Button 启动 ALog 后直接进入灵动岛模式,这样不影响其他 App 的浏览和访问,通过灵动岛可以悬浮显示,并能随时切换到前台。

类似于系统「语音备忘录」的展现模式(见下图)
IMG_7141

新功能:希望增加实时识别,实时翻译的功能

这个软件识别非常准确,非常棒,感谢。
但是毕竟语音识别的软件很多,而且免费的也非常多,而且效果也都不错,包括IOS自带的识别也非常精准。
为了能体现差异,而且开拓更大的市场,建议在这个基础上,增加实时识别,实时翻译的功能,这就更加强大了,而且这个领域目前可能还没有开源免费的产品。

新特性建议:希望能批量导出文字内容

已购买高级版,希望大佬能增加批量导出识别后的文字和总结的文字内容,这样方便以后保存在电脑,然后进一步操作之类的。
导出格式的话希望能支持md格式。
感觉可以作为高级版的一个卖点哈,希望作者考虑下~

用着很顺手,提几个期待

1.录制过程增加暂停按钮,有时候会说着说着卡壳,要思考一下。
2.已经可以自定义服务器,是否可以增加自定义模型。
3.导出功能是否能够再优化,目前导出md文件选notion打开会是乱码。

希望能手动修改日期

由于各种情况,有时候需要补记前一两天的日记。补记后时间线里当天的内容就会乱掉了,希望能够手动变更时间线里的日期。

对 Alog 的一些期待

最近笔记圈还挺热门的 Voicenotes,和 ALog 很相像,但是我对这种工具类产品,主要成本在 AI 模型上的订阅制并不看好,AI 作为数字基建通过调用付费,可以节约大量成本,而不是 ChatGPT、Claude、Notion AI、Raycast AI 全部买一遍。类似 perplexity.ai 的开源产品已经好几个了,语音 AI 笔记估计也会越来越多,实际上我已经体验了好几款。

Alog 完成度再高一点也能出圈!

翻看了 Issue,也留言一下我的期待:

  1. 批量导出 / 复制
  2. 优化「总结」Tab,总结只是其中一个 AI Command
  3. 单独或批量对文本执行 AI Command,比如标点优化,表达优化
  4. iPad 版本放开给 macOS
  5. 增加同步方案
  6. 自定义更多大模型
  7. 基于某条文本 / 整个数据做 AI 问答

已 start 和付费支持!期待~

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.