Voice data <= 10 mins can also be used to train a good VC model!
基于Gradio开发的ChatGPT聊天应用,可以文字 或 语音对话,发送的音频通过OpenAI的STT转文本后,再通过ChatGPT生成回复,回复的内容通过OpenAI TTS合成后返回并自动播放,实现语音聊天功能。
基于大模型搭建的微信聊天机器人,同时支持微信、企业微信、公众号、飞书接入,可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。
基于系统代理抓包打造的抖音弹幕服务推送程序,可抓取浏览器直播间,直播伴侣,抖音客户端,的各种弹幕消息。这也是一个对开发者友好的弹幕推送器
(CVPR 2023)SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation
This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and any-to-any voice conversion