# www.itdaan.com **Repository Path**: Alive/www.itdaan.com ## Basic Information - **Project Name**: www.itdaan.com - **Description**: IT答案网是一个提供给广大IT开发者的垂直搜索引擎,它收集国内外大量的IT解决方案。使用的技术:SpringMVC+Sorl+Mysql+Shiro等等。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: http://www.itdaan.com - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 11 - **Created**: 2016-11-23 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #www.itdaan.com 这是一个提供给广大IT开发者的专业知识库,它使用定制化的爬虫来爬取IT博客以及问答资料,进行索引并提供全文搜索功能。 ##网站所使用技术 1,前端:bootstrap,jquery 2,后端:springmvc,mybatis,shiro 3,索引:solr 4,缓存:EhCache ###v20160217 1,完成评论审核后,重建索引的功能; 2,初始化的功能放到了SetUpCrawl定时任务里; 3,评论功能:评论成功后刷新页面 ###v20160324 修复 评论列表 内容ID链接可以直接链接到内容了; 内容页面跳转:如果User-Agent为Java 1.6的话,直接访问该地址;如果User-Agent中没有java关键词,则跳转到静态页面。 ###v20161113 增加收藏功能以及优化首页和搜索页面 将大文本存储到solr中,这样节省数据库空间,也可以使Mysql查询速度变快!最主要的是能省钱啦,阿里云磁盘买了200G,平均3万条记录一个G存储! ##待完成任务 ###v20161113 ####1、需要完善多线程爬虫以及后台 其实开始,每篇文章都生成了HTMLIO静态化,每个大文本都存储在mysql数据库中,并且按区间分库了。后来数据库爆增达到450万数据了,这个时候,我买了200G的空来来存储,可恶的Money!不得不改变架构,唯一的可行性就是借助Solr来存储大文本。于是,重新建立一个Core,专门用于存储大文本,这样非常省空间,但是最终Solr是否能支撑多高的并发仍然是未知数。 ####接下来是完善后台,将定时任务爬虫管理起来,并改变存储方式,将按照规则爬取的大文本存储到Solr。 ####2、需要完善前台,本站用户的后台 由于UI主要借助于bootstrap,所以有时候调整一个页面需要一天,甚至更长。