AI工具指南

免费在线文本转语音工具

1、Miso One

Miso One由Miso Labs推出,是一款8B参数开放权重英文TTS模型,主打低延迟、高表现力语音能力,为语音技术研究与内容创作提供全新方案,尤其适用于低延迟语音代理、交互式对话语音场景。平台提供免费使用方案,免费版单次支持120字符,升级后...

2、KugelAudio

KugelAudio是欧洲本土自研落地的生产级文本转语音引擎,本地部署运维、全链路遵循GDPR隐私规范,覆盖40+语种自然人声合成,主打39ms超低首帧时延,面向政企、开发服务商打造安全可控的合规TTS方案,支持免费试用与企业定制化报价。 ...

3、声动视界SoundView

声动视界SoundView是国产一站式「AI音频+视频+图像」多模态创作云,一句话slogan:“上传一段声音,即刻生成声动大片。”面向短视频博主、广告制片、教育讲师、自媒体与广电机构,提供「文字→声音→画面→成片」全自动链路,...

4、IndexTTS2

IndexTTS2是由B站(Bilibili)开发的自回归零样本语音合成模型,于2025年9月8日正式开源。IndexTTS2是首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了...

5、UnifiedTTS

UnifiedTTS是一个一站式文本转语音(TTS)API服务平台,旨在帮助开发者快速集成多种主流的语音合成服务。通过统一的API接口,UnifiedTTS 整合了包括 Microsoft Azure、MiniMax、阿里云和 ElevenLabs 等在内的多家主流TTS服务提供商。开发者无需分别研究不...

6、FireRedTTS-2

FireRedTTS-2是由小红书开源的一款面向多说话者对话生成的长篇流式文本转语音(TTS)系统,旨在提供稳定、自然的语音输出,同时实现可靠的说话人切换和语境感知的韵律。该系统在支持多语言、实现超低延迟方面取得了显著突破,使其成为长...

7、AI speaker

AI Speaker是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的语音。它支持多种语言和声音选择,提供高度拟人的情感表达,适用于多种场景。 AI Speaker功能特点: 1、多语言与多声音支持: - 支持超...

8、EmotiVoice

EmotiVoice是由网易有道开发的一款开源文本转语音(TTS)引擎,支持中英双语,并配备超过2000种不同的音色。其最显著的特点是情感合成功能,能够生成包含快乐、兴奋、悲伤、愤怒等多种情感的语音。该引擎完全免费开源,基于Apache2.0许可证...

热门推荐

热门标签

sci写作助手AI搜索助手高德地图CursorCDN加速古文字识别腾讯开源PDF添加水印游戏网络专家AIGC学习视频播放酒店体验官金山云剪映老爷车