# 保险知识库抓取 **Repository Path**: jiangsongbai/captureInsureKnowledge ## Basic Information - **Project Name**: 保险知识库抓取 - **Description**: 各个保险公司知识库内容抓取 - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2018-09-28 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 保险知识库抓取 #### 项目介绍 各个保险公司知识库内容抓取 #### 软件架构 使用JDK1.8,HTMLCleaner抓取页面数据,并存储到本地MySQL。 导出Excel的默认路径是/tmp 可以根据需要进行修改 #### 使用说明 1. 使用JDK1.8 2. HTMLCleaner 3. MySQL #### 参与贡献 1. Fork 本项目 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 码云特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. 码云官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解码云上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目 5. 码云官方提供的使用手册 [http://git.mydoc.io/](http://git.mydoc.io/) 6. 码云封面人物是一档用来展示码云会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)