# API-期末项目PRD文档 **Repository Path**: itxingqing/api-final-project-prd-document ## Basic Information - **Project Name**: API-期末项目PRD文档 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-04-30 - **Last Updated**: 2025-04-30 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # API-期末项目PRD文档 #### 介绍 |文档名称|读书室 —— 产品需求文档| |:---:|:---:| |产品名称|读书室| |产品版本|1.0| |文件现状|进行中| |文件作者|刘洁明| 价值说明:随着人们生活节奏的加快,越来越多的人想阅读书籍却往往因为没有时间没有精力去执行,电子书随即诞生,让人们利用碎片化的时间阅读或者是听书,进行有声阅读。本产品运用语言识别api,合成声音以阅读书中内容,增加用户的阅读方式。同时也推出每天免费读书1小时功能。该技术综合解决用户合理利用碎片化时间免费听读书籍。 *** ## 一、需求概述 1.产品背景:随着我国互联网、移动互联网的发展,以及数字化硬件渗透率的提升,数字阅读的方便、快捷等优势逐渐凸显,近年来数字阅读逐渐受到阅读者的喜爱,逐渐成为了阅读的主流。据新闻出版研究院发布的最新数据显示,数字阅读的阅读率达到79.3%,远超图书、报纸和期刊的阅读率。 [2020年中国数字阅读行业市场分析](https://bg.qianzhan.com/report/detail/300/201202-fa9669cc.html) [2020年中国数字阅读行业市场现状及发展趋势分析](https://bg.qianzhan.com/report/detail/300/200424-df7d7e23.html) 2.产品市场:市场上阅读app已经存在多数,但同时大多数的读书app都存在收费,部分书籍用户可能并没有购买欲望,或者是买下阅读内容后感到后悔与不值。以及阅读方式只有通过视觉去读书,有的用户希望通过听觉去阅读,即听书。经过对市场上阅读APP的调查,发现进行语音识别与语音合成api并不难实现,但是有这个功能的APP较为缺少。 3.解决方案:在读书室产品中接入语音识别api,实现有声阅读,让忙碌于生活的人们随时随地听书读书。 ## 二、问题需求 1.使用场景:用户在地铁上或者在睡前利用碎片化时间通过产品中的语音合成api功能听取书籍,实现有声阅读,完成读书目的。随着各大平台内容策略的推进和产品矩阵的丰富,有声阅读商业模式同样呈现多元化发展趋势。 2.用户画像 * 用户群体: * 忙于生活无暇阅读却想阅读的群体 * 喜欢有声阅读听书的群体 * 不想对每本书都付费的读书群体 * 用户画像及场景 ![用户画像](image/user.png) ## 三、核心价值和痛点 | 用户痛点 | 智能加值 | | :------------: | :------------: | |没有时间阅读书籍|语音识别API| |没有时间选取合适书籍阅读|数据统计+大数据预测| |不知道有声阅读转换时间|大数据计算| * 产品所完成的主要功能是: * 通过语音识别API,将书中内容语音播放,实现有声阅读。 * 利用大数据,分析用户所偏爱的书籍,推出相关书籍。 ## 四、读书室的价值主张画布 ![价值主张画布](image/value.png) * 读书室在满足用户对电子书的基本需求,解决用户时间利用问题及是否购买书籍等问题的同时,运用语言识别API将书籍文字转化为音频实现有声阅读功能,并且运用大数据推荐书籍给用户,创新每天免费阅读一小时等,解决用户阅读方式、阅读内容的需求。产品界面所加强的交互性与趣味性降低用户在使用本产品的精力,丰富产品本身的内容。 * 学习参考: [价值主张画布](https://www.jianshu.com/p/00a5f0d959fa) ## 五、界面流程 #### 1、产品功能结构图 ![产品功能结构图](image/product.png) #### 2、用户流程图 ![用户流程图](image/client.png) #### 3、产品结构图 ![产品结构图](image/pro-construction.png) ## 六、产品原型及交互设计 ### [读书室--产品原型交互链接](https://modao.cc/app/4e944c80458752acab633de8333d1a685dc1d565?simulator_type=device&sticky) #### 1.登录界面 ![](image/登录.png) #### 2.阅读界面 ![](image/阅读.png) #### 3.分类界面 ![](image/分类.png) #### 4.书架界面 ![](image/书架.png) #### 5.我的界面 ![](image/我的.png) #### 6.收藏书籍界面 ![](image/书桌.png) #### 7.有声阅读播放界面 ![](image/播放.png) #### 8.弹窗界面 ![](image/弹窗.png) #### 9.交互流程图 ![](image/交互流程图.png) * API思路: * 用户可欲用性:用户使用读书室的有声阅读模式可以实现随时随地的听取书籍,不需要用眼睛盯着手机屏幕也能轻松获得书籍内容。读书室包含各类图书,运用语音识别API能轻松实现有声阅读,不再拘束于手机屏幕或者收音机的烦恼。 * 技术可行性:语音识别API发展逐渐成熟,能实现多种不同声音或者风格的文字转语音效果实现有声阅读,同时也接受多种语言实现语言查找功能。 * API智能成本分析: * [百度语音API--语音智能合成计费说明](https://ai.baidu.com/ai-doc/SPEECH/yk38y8pc1) * 百度语音API价目表: ![](image/API-price.png) * 商业模式画布: ![](image/商业模式画布.png) ## 七、需求列表(对应人工智能加值) | 序号 | 技术 | 用途 | 优先级 | | :------------: | :------------: | :------------: | :------------: | | 1 | 百度AI中的语音识别 | 对文本与音频进行转换 | A(重要) | | 2 | 数据预测模型 | 对感兴趣书籍进行预测 | A(重要) | | 3 | 数据预测模型 | 对有声阅读转换时间进行预测 | B(重要)| ## 八、API的使用 ### [百度语音合成API使用](https://gitee.com/jemi-L/api-final-project-prd-document/tree/master/%E8%B0%83%E7%94%A8%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%ABAPI) (一)语音识别 1、百度AI开放平台 —— 语音识别 —— 语音合成 * 接口描述:语音合成可将文字信息转化为声音信息,适用于手机APP、儿童故事机、智能机器人等多种应用场景。 * 接口链接:TTS_URL = 'http://tsn.baidu.com/text2audio' * 请求方式:首先需要通过API Key和Secret Key获取access_token 2、由于百度语音合成API有免费额度的限制,需手动去获取免费额度才能使用,在获取免费额度之前还需进行百度账号的个人认证才可执行。(如图) ![](image/百度API.png) 参考资料: [百度API开发文档](https://ai.baidu.com/ai-doc/SPEECH/jk38y8gno) [简书参考](https://www.jianshu.com/p/b701a43788f3) (二)数据流程设计 * 用户点开某本书籍后,对书籍内容获取大概的简单介绍,然后点击播放书籍页面,在列表中搜索并加入刚刚所了解到的书籍,进行数据传输,实现有声阅读。 * 数据传输中代码实例: ```Python """ 输入TEXT """ TEXT = "如果有人钟爱着一朵独一无二的盛开在浩瀚星海里的花。那么,当他抬头仰望繁星时,便会心满意足。他会告诉自己:“我心爱的花在那里,在那颗遥远的星星上。”可是,如果羊把花吃掉了。那么,对他来说,所有的星光变会在刹那间暗淡无光!而你却认为这并不重要!" TTS_URL = 'http://tsn.baidu.com/text2audio' """ TOKEN start """ TOKEN_URL = 'http://openapi.baidu.com/oauth/2.0/token' """ 获取token """ def fetch_token(): params = {'grant_type': 'client_credentials', 'client_id': API_KEY, 'client_secret': SECRET_KEY} post_data = urlencode(params) if (IS_PY3): post_data = post_data.encode('utf-8') req = Request(TOKEN_URL, post_data) try: f = urlopen(req, timeout=5) result_str = f.read() except URLError as err: print('token http response http code : ' + str(err.code)) result_str = err.read() if (IS_PY3): result_str = result_str.decode() result = json.loads(result_str) if ('access_token' in result.keys() and 'scope' in result.keys()): if not 'audio_tts_post' in result['scope'].split(' '): print ('please ensure has check the tts ability') exit() return result['access_token'] else: print ('please overwrite the correct API_KEY and SECRET_KEY') exit() """ TOKEN end """ ``` * 用户选择书籍后,后台将TEXT传入语音合成API,成功后数据将以mp3格式输出,实现有声阅读。用户可选择将书籍文本一起输入,也可只停留在书籍播放页进行听书功能。 (三)讯飞语音合唱API对比:讯飞语音合成为流式版,该语音能力是通过Websocket API的方式给开发者提供一个通用的接口。Websocket API具备流式传输能力,适用于需要流式数据传输的AI服务场景。相较于SDK,API具有轻量、跨语言的特点。讯飞API对于新用户的收费是免费的,有效期为90天,所拥有的功能也有很多。但是对比百度语音合成API,讯飞所编写的代码量要大得多,这对编程新手来说是不友好的,也是容易报错的。同时大量的代码也会让服务器承受大压力,所以这里使用的是百度API。 * 参考资料:[讯飞API开发平台](https://www.xfyun.cn/doc/tts/online_tts/API.html#%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E) ## 九、竞品分析 1、从知乎中寻找到三款阅读app,接下来将对这三款产品进行分析 |竞品|简介|功能|优势| |:---:|:---:|:---:|:---:| |藏书馆|一款海量免费图书资源的APP,资源丰富,可以轻易在上面找到比较好的图书资源。|藏书馆是一个共享式的阅读App。用户可以自由的上传图书,并且可以通过借阅的方式免费读书。|藏书馆中的书较同类App中是最丰富的,有超过 50 万本图书。| |Kindle阅读|一个kindle官方的APP,使用它,可以体验到跟Kindle一样的阅读感觉。|如果拥有Kindle 的机器,那么这款软件,可以通过账号实时同步Kindle的内容,当然在该软件上看的内容,也会自动同步到Kindle。|可以在两款设备中进行同步观看。| |妙读|一款阿里巴巴出品的精品阅读软件,上面有很多的读书资源,都是免费的。|软件的金句功能,看到自己喜欢的金句,可以直接生成金句。|每天都有一群大咖为你解读一本书的精华,且都配备有高品质的音频。| * [参考资料](https://www.zhihu.com/question/366232461/answer/1035380452) 2、分析: * 藏书馆最大的特点是资源丰富,用户都可以推书上架进行共享。 * Kindle阅读是连接Kindle产品的阅读器,可以实现在两个设备中的同步,有名的阅读工具。 * 妙读拥有文本转文字的功能,具有高品质的音频让用户使用,是“读书室”一个值得参考的软件。 3、竞品缺点: 三款竞品都存在着书籍收费的现象,虽然介绍时说明免费阅读, 但在真正下载后还是发现很多书籍需要收费。所以读书室所拥有的功能——每天免费阅读1小时,很好解决了用户这一痛点。此外,前两个产品都无涉及文本转语音功能实现有声阅读,这让一些用户无法享受到这一产品体验。 * 结论:功能需要进行更进一步的用户调研和迭代进步,但是可以得到全文本转音频还处在一个萌芽的阶段,需要进一步的研究和发展。 ## 十、心得总结与感谢 * 心得总结:本次完成PRD文档遇到很多困难,但是都通过网络的查找一一解决,同时也认识到以前学过的知识都是一种积累,包括对价值主张的认识以及对商业模式画布的知识,都是大一学过的内容,在这次文档中运用到也是一种学习的体现。在调用API时遇到报错的情况已经练就不慌张的态度,查找原因,找到解决方法已经成为第一反应。 在这次作业中或许有很多不完美,对API的调用也是不熟练, 但是让我更加了解和掌握API的知识了,API的调用可以实现现在大部分生活中的智能化产品,拥有极大的发展前景,慢慢满足用户日常生活中的应用,将产品更好的呈现在用户眼前。 * 感谢:感谢百度API提供的免费调用服务,接口服务及技术文档。 感谢文档中所展现的参考资料的作者。 参考PRD文档:[藏书馆](http://www.woshipm.com/evaluating/4090971.html) [樊登读书](http://www.woshipm.com/pmd/3959511.html)