Subspace Institute

TTS

LAPLACE Chat 的控制台提供了 TTS 功能,支持接入多个不同 TTS 服务,是目前全宇宙集成最多 TTS 服务的哔哩哔哩弹幕机

该功能上线于 Dec 21, 2024

特性

  • 全宇宙最全的 TTS 服务集成,支持多种语言、多种模型、多种音色,并提供开放的 API 供其他服务商接入,该接入完全免费,访问 拉普拉斯开放平台通用 API 了解详情
  • 针对不同体量的主播提供了队列模式和零延迟模式

队列模式

默认的朗读模式,开启后将自动播报新事件,将根据队列大小动态合并相同内容的弹幕,并且会优先朗读礼物、醒目留言、大航海事件(按金额 > 时间优先级排序)。朗读队列上限为 15,队列溢出后会根据 FIFO 策略丢弃弹幕事件。礼物等付费事件不受队列限制影响

零延迟模式

LAPLACE Chat 原创零延迟模式,完全模拟用户实时对话,适用于所有外部 TTS 服务,开启后将直接朗读所有弹幕,不经过队列,但与此同时可能会有多个弹幕同时被朗读,弹幕量较大的直播间不建议开启。另外由于零延迟模式不会合并任何弹幕,会增加外部 TTS API 的调用,请根据预算选择适合您的服务

使用方法

访问控制台,打开侧边栏的设置面板即可开启

性能对比

以下是各 TTS 供应商的声音样本,点击播放按钮即可收听。为测试多语言混合效果,以下为本基准测试的测试文本完整内容:

感谢ドラゴンラプラスWeChat的SC:一发sc没被念到我就冷汗直流心跳加速头皮发麻双手痉挛两腿打颤,还不好意思刷弹幕说你漏了,我好怕你看到了装作没看到。我的sc通常很短只有一小时,只有短短的3600秒,但它存在的时候,我会用心跳来为它倒数。私のBANを解除してください。もう二度とスパムしません😭

评测日期:Apr 15, 2025

Azure

多语言混合效果极佳,中文支持优秀,延迟低。$0.15/万字符,推荐使用

小晓(多语言)
云齐(广西)
云登(河南)
晓北(辽宁)
晓妮(陕西)
云翔(山东)
云希(四川)
华马(香港)
小陈(台湾)

ElevenLabs

多语言混合效果一般,中文支持一般,断句有点怪,不过英文不错,不同套餐计价不同

eleven_multilingual_v2

Fish Audio

多语言混合效果尚可,中文支持优秀,偶尔吞字,但模型质量参差不齐。$0.15/万字符

央视播报员

LAPLACE TTS

基于 Azure AI Speech 与混合 LLM 模型的独家 TTS,支持多语言混合,支持实时音频翻译。TTS 能力与 Azure 相同,此处仅列出实时翻译功能的输出结果

Ava (美式英语)
Masaru (日语)

MiniMax

支持多语言混合,但片假名支持一般,中文支持优秀,情感丰富,延迟略高。¥2/万字符

speech-02-turbo
speech-02-hd

OpenAI

多语言混合效果优秀,中文支持尚可,偶尔吞字。不同模型价格不同,约 $0.15/万字符

gpt-4o-mini-tts

Stepfun

支持多语言混合但效果一般,中文支持优秀,情感丰富,长文本延迟略高。¥0.9/万字符

语言解析错误
正常

TTS Monster

无多语言混合,暂无中文支持,延迟略高。高度风格化音色,最低 $0.5/万字符(阶梯定价)

Kawaii
Verdant

阿里云语音合成

目前为 CosyVoice 1.0,支持中英语言混合,中文支持优秀,延迟低。¥2/万字符

龙杰力豆
龙老铁
龙婉

火山引擎语音合成

中英双语混合尚可,中文支持极佳,延迟最低。¥55/万次请求(阶梯定价)

标准音色

自定义 API

如果本站集成的 TTS 服务无法满足你的需求,你可以使用自定义 API 来实现 TTS 功能,自定义 API 需要满足以下条件:

  • 接受 POST 请求,请求体为 JSON 格式,会默认传递 tokentextvoice 字段
  • 返回内容必须为音频本身,支持任意音频格式(.ogg, .mp3, etc.),只要您的浏览器支持播放即可
  • 可正常放行弹幕机地址的 CORS 请求
  • 支持 HTTPS 协议

相关链接

下列项目无法直接对接本站的 API,需要进行封装方可使用

On this page