• 正文概述
  • 评价建议
  • 项目简介
    该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至3秒,适合各种应用场景。

    截图

    特色

    • 端到端语音解决方案:支持GLM-4-Voice及级联方案(ASR-LLM-TTS)。
    • 可自定义形象与音色:用户可根据需求自由设置数字人的外观和声音。
    • 音色克隆支持:通过上传参考音频生成个性化语音。
    • 低延迟响应:首包延迟仅为3秒,提升用户体验。
    • 无需训练:简化使用流程,适合快速部署和开发。
    • 多种技术选型:集成ASR、LLM、TTS等模块,灵活应对不同需求。

    项目地址

    资源下载此资源仅限VIP下载,请先
    客服QQ:1140845961
    本资源网站是个人收集整理或个人学习使用后觉得不错的源码或教程,源码均为部署后亲测可用的源码,教程为船长看过的,或者船长本人的一些心得体会,分享到这里,免的找不到,愿意看你就看,不愿意看,你可以走,谢谢!天下没有白吃的午餐,拒绝白嫖,没人欠你,谢谢。
    船长跨境资源 » 实时语音交互数字人项目:支持端到端语音方案与音色克隆功能,实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS

    开通会员

    联系船长 加入社区

    copy fly

    咨询请飞机或邮箱

    欢迎来到黑马源码网,搭建教程请移步:https://yigexueshe.com 若长时间未回复可联系QQ:2212190958/1140845961。本站无在线支付,开通会员请联系飞机/邮箱/QQ,告知管理员账号并开通,感谢支持!