今天我们介绍的开源项目，可以免费进行视频/音频转录文字，也支持实时语音转文字，并且离线可用，帮助打工人提升效率，它就是：buzz

工作中你会有这些情况吗，开会想要快速记录内容？想要导出视频的内容文本？想把音频转文字？

今天我们介绍的开源项目，可以免费进行视频/音频转录文字，也支持实时语音转文字，并且离线可用，帮助打工人提升效率，它就是：buzz

buzz 是什么

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持 Windows、macOS、Linux，它可以将麦克风的语音实时转换为文字，也支持将视频、音频文件转换为文字、字幕。buzz目前支持Whisper、 Whisper.cpp、Faster Whisper、 Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API。

Buzz目前的主要功能：

从麦克风实时语音转录文字、实时翻译
导入音频、视频文件（mp3、wav、m4a、ogg、mp4、webm、ogm），导出逐句字幕或逐词字幕（导出格式：TXT、SRT、VTT）

安装buzz

buzz的安装非常方便，各平台都有支持一键安装或下载离线包。离线包还是不小的，以mac为例，下载是380mb，安装后大概要1.3G左右。

macOS

通过brew安装：

css复制代码
brew install --cask buzz

或者，下载并运行该Buzz-x.y.z.dmg文件。

Windows（要求Win10以上）

下载并运行该Buzz-x.y.z.exe文件。

Linux

arduino复制代码
sudo apt-get install libportaudio2

sudo snap install buzz

安装完成后打开软件，界面非常非常的简洁。

使用 buzz

在第一次使用 Buzz 的时候，会下载 Whisper 的模型，根据不同的质量要求，模型的大小也不相同，在有条件的情况下，建议考虑中大型的模型。可以参考下表：

视频/音频转录：

单击“文件”菜单上的“导入媒体文件”（或工具栏上的“+”图标，或Command/Ctrl + O）。
选择音频或视频文件。
选择任务、语言和模型设置。

单击运行，开始任务。

当转录状态显示“已完成”时，双击该行（或选择该行并单击“⤢”图标）以查看结果。

如果选择比较大的模型，那速度就会比较慢。

实时转录：

点击麦克风图表，选择录音任务、语言、质量和麦克风。
单击“录制”。

注意：使用默认 Whisper 模型转录音频会占用大量资源。考虑使用 Whisper.cpp Tiny 模型来获得实时性能。

存储位置：

buzz使用到的模型会存储在本地，但是目前没看到修改存储位置的设置，当前存储位置如下：

Whisper 模型存储在~/.cache/whisper.

Whisper.cpp 模型存储在~/Library/Caches/Buzz (Mac OS)、~/.cache/Buzz(Unix) 或C:\Users\\AppData\Local\Buzz\Buzz\Cache(Windows) 中。

Hugging Face模型存储在~/.cache/huggingface/hub.

总结

Buzz是款非常不错的语音转录工具，可以大大的提升工作效率，我总结一下它具有的特点：

高精度：基于 OpenAI 开源的强大机器学习模型 Whisper ，Buzz的识别精度很高
速度快：Buzz 的模型都是离线使用，因此转换速度很快，适合批量转换语音
跨平台：目前支持Windows /macOS / Linux
多语言：不仅支持中文，也支持很多个国家的语言，还能将结果翻译，但翻译只支持英文

项目信息

项目名称： buzz
GitHub 链接：github.com/chidiwillia…
Star 数：10K

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

[Release] Tree Of Savior

服务器文件圣斗士星矢 2024 + 客户端 + GM 工具 + 安装教程 + 新闻更新

Ragnarok M korea mobile game source(O)

PTS_4.6_Guide

[一键安装] 手游-天道情缘

[一键安装] 霸王大陆EP8-5.0 虚拟机+源码+大背包+商城-最新整理

【灵魂行者】【灵魂武器】【SoulWorker】100级端（后宫行者）虚拟机版

[一键安装] 龙之谷手游飓风龙单机版一键端完整GM后台局域网

10K star！免费离线的语音转文字工具，远超垃圾付费软件

buzz 是什么

安装buzz

使用 buzz

总结

项目信息

我花3天了解了下 Sora，这里给大家汇报一下

通往 AGI 的道路上，OpenAI 逐渐构建了全模态的工具集

{{userData.name}}已认证

buzz 是什么

安装buzz

使用 buzz

总结

项目信息

Related posts: