SoftwareEngineeringPreProject
面向软件工程课程的 AI 语音助手项目组织,聚焦“语音输入 -> 智能理解 -> 语音输出 -> 系统联动”的完整闭环。
核心功能
- 语音转文字(ASR):将用户语音实时转为文本。
- 大模型对话(LLM):进行上下文理解、问答与任务意图识别。
- 文字转语音(TTS):将回复文本自然地合成为语音。
- 系统控制:支持应用打开、文本输入、系统指令等自动化操作。
- 前端展示:桌宠/桌面交互界面,提供可视化与交互能力。
模块划分
- 前端模块:交互界面与展示。
- 语言转文字模块:语音识别能力。
- 大模型模块:意图理解与对话生成。
- 文字转语言模块:语音合成能力。
- 系统控制模块:系统级操作执行。
仓库说明
组织内仓库按模块拆分,便于协作开发、独立测试与并行迭代。
演示视频
演示视频