FluidVoice：macOS 上最快的离线听写工具

2026-06-30 | AI | 阅读

文章目录

今天在 GitHub Trending 上刷到一个狠角色：FluidVoice，一天涨了 800+ Star，号称「macOS 上最快的离线听写 App」。

市面上的语音转文字方案要么需要联网（隐私没保障），要么延迟感人（说完了半秒后字才蹦出来），要么贵得离谱。FluidVoice 的卖点是：全本地运行、近乎零延迟、开源免费。看了下项目文档，功能设计确实有亮点，分享一下。

FluidVoice 界面

核心亮点

FluidVoice 用的是 NVIDIA 的 Parakeet 系列语音模型，做了原生 macOS 适配。据官方描述，说话的同时字就已经出现在屏幕上了。

这不是云端 API 那种「说完→上传→等服务器→返回」的流程，而是你的 Mac 本地芯片直接跑模型，声音进去文字出来，端到端在你机器上完成。

这是最有意思的部分。光把语音转成文字还不够——你说话的时候可能有口音、断句不规范、专有名词识别错误。Fluid Intelligence 是一个跑在本地的 AI 后处理层，负责：

关键点：这些全部在本地完成，不需要 API Key，数据不离开你的 Mac。

除了听写，FluidVoice 还支持语音命令模式：

动嘴不动手，从听写工具升级成了语音助手。

FluidVoice 历史记录与转录详情

选中任何 App 里的文本，直接用语音重写或者追加新内容。不用切换窗口，不用复制粘贴。

FluidVoice 不绑定单一模型，支持 6 套引擎，按需选择：

支持中文（Parakeet TDT v3 和 Whisper 系列），所以国内用户完全可以用。

一行命令搞定：

1	brew install --cask fluidvoice

或者去 GitHub Releases 手动下载。

安装后给个麦克风和辅助功能权限，设个全局热键，选个语音模型，就能用了。

FluidVoice 的隐私策略不是「我们承诺不上传你的数据」，而是架构层面就没办法上传：

对于涉及敏感内容的场景（商业文档、私人笔记），这种「物理隔离」比任何隐私承诺都靠谱。

GPLv3 开源，代码全在 GitHub 上。Fluid Intelligence（AI 增强层）目前闭源但免费使用，作者说后续可能开放。

如果你也在找一个好用的 macOS 语音输入方案，FluidVoice 值得一试。

安装：brew install --cask fluidvoice

License：GPLv3

要求：Apple Silicon Mac（Intel Mac 只能用 Whisper 模型）

Donate

本文标题：FluidVoice：macOS 上最快的离线听写工具

文章作者：AwesomeYang

发布时间：2026-06-30

最后更新：2026-06-30