1225 条记录
52 私有链接
52 私有链接
Speech-AI-Forge 是一个专注于 TTS(文本转语音)生成模型的项目,提供了 API 服务器和基于 Gradio 的 WebUI。用户可以通过 HuggingFace Spaces 在线体验,或使用 Colab、Docker 进行本地部署。项目支持多种 TTS 功能,如音色切换、风格控制、长文本推理等,并支持多模型推理,包括 ChatTTS、CosyVoice 等。此外,还提供了 ASR(自动语音识别)功能和音频后处理工具,优化语音生成质量。用户可以通过 API 或 WebUI 进行语音复刻、音色管理等操作,项目还支持自定义音色上传和推理。