🎵

音乐分类

AI语音识别

共找到 4 个AI工具

个工具

主分类: 音乐

子分类: AI语音识别

找到 4 个匹配工具

相关AI工具

点击任意工具查看详细信息

WhisperKit

WhisperKit是一个用于自动语音识别模型压缩与优化的工具。它支持对模型进行压缩和优化，并提供了详细的性能评估数据。WhisperKit还提供了针对不同数据集和模型格式的质量保证认证，并支持本地复现测试结果。

性能优化自动语音识别质量保证 +1

音乐访问

Whisper

Whisper 是一个通用的语音识别模型。它经过大量多样化音频的训练，并且是一个多任务模型，可以进行多语言语音识别、语音翻译和语种识别。

多语言语音识别语音翻译

音乐访问

NVAS3d

NVAS3d是一个用于估计包含多个未知声源的场景中任何位置的声音的项目，通过使用多个麦克风的音频录音和场景的3D几何和材料，实现了新视角声学合成。

音频 3D重建声音 +1

音乐访问

SALMONN

SALMONN是由清华大学电子工程系和字节跳动开发的大型语言模型（LLM），支持语音、音频事件和音乐输入。与仅支持语音或音频事件输入的模型不同，SALMONN可以感知和理解各种音频输入，从而获得多语言语音识别和翻译以及音频-语音共推理等新兴能力。这可以被视为给予LLM“听觉”和认知听觉能力，使SALMONN成为通向具有听觉能力的人工通用智能的一步。

大型语言模型音乐音频 +2

音乐访问

探索更多音乐工具

AI语音识别是音乐分类下的热门子分类，包含 4 个优质AI工具

浏览音乐分类分类

AI语音识别

相关AI工具

WhisperKit

Whisper

NVAS3d

SALMONN

相关子分类

音乐生成

音频生成

AI设计工具

AI模型

AI音乐生成

开发与工具

文本转声音

语音克隆

探索更多音乐工具

AI语音识别

相关AI工具

WhisperKit

Whisper

NVAS3d

SALMONN

相关子分类

音乐生成

音频生成

AI设计工具

AI模型

AI音乐生成

开发与工具

文本转声音

语音克隆

探索更多 音乐 工具

探索更多音乐工具