duxins / alog Goto Github PK
View Code? Open in Web Editor NEWAI-Powered Audio Diary
License: GNU General Public License v2.0
AI-Powered Audio Diary
License: GNU General Public License v2.0
Perfectly transcribes speech into text. Great app!
为了获得更好的结果现在用的是GPT4,速度略慢一些。
RT
这样可以更快的实现语音录入。
这款 App 实在太棒了!我特地升级了 iOS 系统,只为能够用上你开发的 Alog。已激情付费支持~~
有几点小建议,希望未来版本能够提供:
1.提供内置的纯文字日记编写功能——毕竟不是每天都方便记录语音日志,有的时候整天和别人在一起,如果可以提供文字日记的选项就好了。
2.提供本地的 Whisper 模型离线语音识别选项,这样既可以在没网的时候使用,也帮助开发者省下了 Whisper API 的费用嘛。
3.希望能上架 Mac App Store。其实用不着额外做什么适配,直接让我们下载 iOS 版本的应用就好啦,只是方便在电脑上整理、查阅、编辑、导出。
4.内置几段开发者你自己测试后觉得好用的总结提示词,以供用户上手即用,这样用户就用不着自己摸索自定义提示词的效果了。
这款日记 App 真的是革命性的创新,我已经抛弃了沿用近十年的原日记 App,希望你能长长久久经营维护这个项目哟~
因为有可能记录的一些想法并不是连续的,需要汇总起来来进行总结操作,或者是要处理几天的任务将它们汇总输出。
既然支持批量处理了,希望也支持批量选择删除。
If I recit a message on my Apple Watch and open the app on the iPhone a few days later, the current day date is assigned to the audio message.
Wouldn’t it be better if the recording date of the audio message was used as the date?
今天两条都识别文本报错,如下是其中一条的具体错误信息:
版本:v0.2.2
手动导出,再导入,还是有点麻烦,如果支持设置webhook,可以一键将笔记发送到其他笔记app中;无需针对个别笔记app做整合,一个webhook就可以了。
是否可以实现类似字幕一样的实时显示语音转文本的功能,这样在回忆记录中效果会更好。谢谢。
是出了什么问题吗?
希望能实现像JustPressRecord那样的锁屏组件和Apple Watch端 这样输入的话会非常方便
不知道能不能引入 https://github.com/huacnlee/autocorrect 类的自动 Formatter 库?
現在靜音模式下播放語音也會靜音
As records grow, finding specific dates becomes tricky - a calendar view would be immensely useful.
用手表或者手机录,在iPad mini上整理笔记的场景比较多
这个软件识别非常准确,非常棒,感谢。
但是毕竟语音识别的软件很多,而且免费的也非常多,而且效果也都不错,包括IOS自带的识别也非常精准。
为了能体现差异,而且开拓更大的市场,建议在这个基础上,增加实时识别,实时翻译的功能,这就更加强大了,而且这个领域目前可能还没有开源免费的产品。
已购买高级版,希望大佬能增加批量导出识别后的文字和总结的文字内容,这样方便以后保存在电脑,然后进一步操作之类的。
导出格式的话希望能支持md格式。
感觉可以作为高级版的一个卖点哈,希望作者考虑下~
方便添加到其他应用,比如任务工具、笔记工具、日记工具等。
场景:用 ALog 将任务和想法灵感快速记录用 AI 整理后自动导入任务工具或笔记工具。比如 Drafts、NotePlan……
在中文识别方面Paraformer做的很不错
支持实时和文件转写, 而且每个月有不少免费额度, 对语音日记型用户很友好
希望能增加支持
API文档
1.录制过程增加暂停按钮,有时候会说着说着卡壳,要思考一下。
2.已经可以自定义服务器,是否可以增加自定义模型。
3.导出功能是否能够再优化,目前导出md文件选notion打开会是乱码。
由于各种情况,有时候需要补记前一两天的日记。补记后时间线里当天的内容就会乱掉了,希望能够手动变更时间线里的日期。
最近笔记圈还挺热门的 Voicenotes,和 ALog 很相像,但是我对这种工具类产品,主要成本在 AI 模型上的订阅制并不看好,AI 作为数字基建通过调用付费,可以节约大量成本,而不是 ChatGPT、Claude、Notion AI、Raycast AI 全部买一遍。类似 perplexity.ai 的开源产品已经好几个了,语音 AI 笔记估计也会越来越多,实际上我已经体验了好几款。
Alog 完成度再高一点也能出圈!
翻看了 Issue,也留言一下我的期待:
已 start 和付费支持!期待~
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.