Giter Site home page Giter Site logo

alog's Issues

恳请大佬更新,给出更多模型选项

比如4o等等,或者能够自定义模型就更好了。voicenotes我也试用了,比这个臃肿了许多,而且界面也用不习惯。这个已经star&购买,再次恳请大佬闲暇时能够更新!

Wrong Timestamp in App

If I recit a message on my Apple Watch and open the app on the iPhone a few days later, the current day date is assigned to the audio message.

Wouldn’t it be better if the recording date of the audio message was used as the date?

新特性:增加对灵动岛的支持

通过快捷指令或者 Action Button 启动 ALog 后直接进入灵动岛模式,这样不影响其他 App 的浏览和访问,通过灵动岛可以悬浮显示,并能随时切换到前台。

类似于系统「语音备忘录」的展现模式(见下图)
IMG_7141

[需求]跨日期进行总结或者处理操作

因为有可能记录的一些想法并不是连续的,需要汇总起来来进行总结操作,或者是要处理几天的任务将它们汇总输出。

既然支持批量处理了,希望也支持批量选择删除。

对 Alog 的一些期待

最近笔记圈还挺热门的 Voicenotes,和 ALog 很相像,但是我对这种工具类产品,主要成本在 AI 模型上的订阅制并不看好,AI 作为数字基建通过调用付费,可以节约大量成本,而不是 ChatGPT、Claude、Notion AI、Raycast AI 全部买一遍。类似 perplexity.ai 的开源产品已经好几个了,语音 AI 笔记估计也会越来越多,实际上我已经体验了好几款。

Alog 完成度再高一点也能出圈!

翻看了 Issue,也留言一下我的期待:

  1. 批量导出 / 复制
  2. 优化「总结」Tab,总结只是其中一个 AI Command
  3. 单独或批量对文本执行 AI Command,比如标点优化,表达优化
  4. iPad 版本放开给 macOS
  5. 增加同步方案
  6. 自定义更多大模型
  7. 基于某条文本 / 整个数据做 AI 问答

已 start 和付费支持!期待~

一些想法

已经购买!觉得这个样子的日记可能可以跟随我很久
有点想法
1,作为碎碎念的日记可能会提到很多特定名词,比如人名,地名,甚至外号,识别不准每次要调文字,是不是能做进某些特定提示引导语音识别软件不要认错这些常用词? 当然如果能调动本地wisper直接在我ios上识别的话可能这个比较容易做到
2,日记可能总结不出什么有价值的,可能周记,月记的总结才有意义,甚至总结一下特定项目,比如过去6个月的日记中总结所有学到的菜谱,这才是每天碎碎念记录的意义,这个怎么实现?
3, 日记重要价值是回头查,如果每天录音碎碎念很快就会找不到自己想要翻找的东西了,如何快速找到特定信息?比如我记得日记里面有记录过哪天去医院看过病,怎么找到这特定日期,找到当时记录下来医生的叮嘱?
4, 基于日记的总结,其实可以很强大,比如按日记记录排出我的未来日程表?按日记记录帮我算出每月收支盈余?
5, 我觉得把上述几条实现,已经是一个基于日记的强大的私人助理了,前景广阔

简单使用后的功能建议

  1. 希望能像对讲机(或者微信语音)一样,按住按钮讲话,松开就是完成记录。
  2. 按钮位置太靠下,单手操作会不太舒适,或许可以让用户手动调整录音键位置
  3. 好像没见到搜索框

关于录音文件的清理

安装了很久,最近两天才正式开始用,发现非常好用!

不过有一点好奇的问题是录音文件是一直保存的吗?虽然现在还看不出来,但是有点担心积攒的录音占用的体积。

之后有计划恢复类似于清理多少天前的录音文件这样的功能吗?

希望能手动修改日期

由于各种情况,有时候需要补记前一两天的日记。补记后时间线里当天的内容就会乱掉了,希望能够手动变更时间线里的日期。

[Bug]近期会有删除了的语音重复出现的问题

RT。
再次删除后,过段时间还是会出现。我用的第三方中转服务器的服务 (不知道是否跟这个有关,但我一直用的第三方的中转服务,之前从来没有出现过该问题)。
应用版本 v0.2.4,iOS 版本 17.5.1。

用着很顺手,提几个期待

1.录制过程增加暂停按钮,有时候会说着说着卡壳,要思考一下。
2.已经可以自定义服务器,是否可以增加自定义模型。
3.导出功能是否能够再优化,目前导出md文件选notion打开会是乱码。

对几个小小新功能的期待

这款 App 实在太棒了!我特地升级了 iOS 系统,只为能够用上你开发的 Alog。已激情付费支持~~

有几点小建议,希望未来版本能够提供:
1.提供内置的纯文字日记编写功能——毕竟不是每天都方便记录语音日志,有的时候整天和别人在一起,如果可以提供文字日记的选项就好了。
2.提供本地的 Whisper 模型离线语音识别选项,这样既可以在没网的时候使用,也帮助开发者省下了 Whisper API 的费用嘛。
3.希望能上架 Mac App Store。其实用不着额外做什么适配,直接让我们下载 iOS 版本的应用就好啦,只是方便在电脑上整理、查阅、编辑、导出。
4.内置几段开发者你自己测试后觉得好用的总结提示词,以供用户上手即用,这样用户就用不着自己摸索自定义提示词的效果了。

这款日记 App 真的是革命性的创新,我已经抛弃了沿用近十年的原日记 App,希望你能长长久久经营维护这个项目哟~

新功能:希望增加实时识别,实时翻译的功能

这个软件识别非常准确,非常棒,感谢。
但是毕竟语音识别的软件很多,而且免费的也非常多,而且效果也都不错,包括IOS自带的识别也非常精准。
为了能体现差异,而且开拓更大的市场,建议在这个基础上,增加实时识别,实时翻译的功能,这就更加强大了,而且这个领域目前可能还没有开源免费的产品。

新特性建议:希望能批量导出文字内容

已购买高级版,希望大佬能增加批量导出识别后的文字和总结的文字内容,这样方便以后保存在电脑,然后进一步操作之类的。
导出格式的话希望能支持md格式。
感觉可以作为高级版的一个卖点哈,希望作者考虑下~

[bug]出现语音无法识别的500错误

今天两条都识别文本报错,如下是其中一条的具体错误信息:

  1. unmarshal_response_body_failed err :invalid character
    '<' looking for beginning of value (request id:20240505072910994103194LGMEILX2)

版本:v0.2.2

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.