# voice-ai **Repository Path**: pzhiq/voice-ai ## Basic Information - **Project Name**: voice-ai - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-19 - **Last Updated**: 2025-06-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README Author: panzhiqiang<潘智强> # Voice AI - 语音交互式AI助手 一个现代化的React应用程序,提供语音AI交互功能,支持OpenAI和Google Gemini双引擎。 ![Voice AI Demo](http://zhiji-pzhiq.top/uploads/1750239546451-0w36uy.png) ## 功能特点 - **语音交互**:使用Web Speech API实现语音识别和语音合成 - **双引擎支持**:集成了OpenAI和Google Gemini API - **响应式设计**:适配各种屏幕尺寸的现代UI设计 - **本地存储**:对话历史和用户设置保存在本地 - **上下文感知**:AI回复会考虑整个对话历史 - **自定义设置**:可调节语音合成参数和AI配置 ## 技术栈 - **前端框架**:React 19 - **类型系统**:TypeScript - **样式工具**:Tailwind CSS - **状态管理**:Zustand - **路由**:React Router - **图标**:React Icons - **动画**:CSS动画和Framer Motion ## 快速开始 ### 环境要求 - Node.js 16+ - npm 或 yarn ### 安装步骤 1. 克隆仓库 ```bash git clone https://gitee.com/pzhiq/voice-ai.git cd voice-ai ``` 2. 安装依赖 ```bash npm install # 或 yarn ``` 3. 创建环境变量文件 创建一个`.env`文件在项目根目录,添加以下内容: ``` REACT_APP_OPENAI_API_KEY=your_openai_api_key_here REACT_APP_GEMINI_API_KEY=your_gemini_api_key_here REACT_APP_DEFAULT_AI_PROVIDER=gemini ``` 4. 启动开发服务器 ```bash npm start # 或 yarn start ``` 5. 打开浏览器访问 [http://localhost:3000](http://localhost:3000) ## 使用指南 1. **开始对话**:点击"开始对话"按钮,进入聊天界面。 2. **语音输入**:点击麦克风按钮,开始语音输入。说完后,内容会自动转换为文字。 3. **文字输入**:您也可以直接在输入框中键入文字,按Enter键发送。 4. **语音回复**:AI的回复会自动朗读(如果启用了语音功能)。您可以点击回复旁的播放按钮重新聆听。 5. **配置设置**:在设置页面中,您可以配置AI提供商、API密钥和语音选项。 ## 注意事项 - Voice AI需要浏览器支持语音识别和语音合成API。推荐使用Chrome、Edge或Safari最新版本。 - 使用语音功能时,请确保您的设备有可用的麦克风,并已授予浏览器使用麦克风的权限。 - 为了使用AI功能,您需要提供有效的API密钥。API密钥仅存储在本地,不会发送到任何第三方服务器。 - 所有的对话数据都存储在浏览器本地,清除浏览器数据可能会导致历史对话丢失。 ## 贡献指南 欢迎贡献代码、报告问题或提出建议!请fork本仓库并提交pull request。 ## 许可证 MIT