# WeiboEmotionAnalyzer **Repository Path**: Extremepyz/WeiboEmotionAnalyzer ## Basic Information - **Project Name**: WeiboEmotionAnalyzer - **Description**: 个人毕设所做项目-“基于词典的中文微博细粒度情感分析系统的设计与实现”,简称WEA,后台主要用到网络爬虫,NLPIR中文分词,XML解析,情感分析算法,图片转换,前端是采用div+css网页布局,利用AJAX,JavaScript以及Highcharts插件实现动态交互,完成一个“完善”的web系统。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 7 - **Created**: 2016-06-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #WeiboEmotionAnalyzer ###系统介绍 在本系统中,视图层是用JSP+CSS+JavaScript来设计前端界面,包含数据验证、用户交互、图表展示等功能,其中与后台交互使用的是JSON文本格式; 控制层是采用Servlet来实现的,Servlet根据前端传过来的用户的特定请求,选择适当的视图用于显示,并解释请求将数据以JSON格式返回客户端; 本系统模型层的功能是对微博数据进行情感分析,并提供接口将分析结果供Servlet使用,进行一定处理后传回客户端。 ###主要内容 1. 微博爬虫 1.1 利用JSOUP实现在线抓取并解析微博。 2. 情感分析算法 2.1 中文分词,应用中文自然语言处理(NLPIR)对微博文本进行分词。 2.2 情感分析,使用基于情感词典(包含七种情感的概率值)的方法进行情感分析,算法综合表情符号,程度副词和否定副词进行微博的情感值计算。 3. 图表展示 3.1 数据处理,对微博文本情感分析后的结果进行一定的分析与统计。 3.2 图表显示,利用highcharts插件绘出曲线图、饼状图、折线图和柱状图等统计图直观展示出情感分析的结果。 ###开发环境 开发工具:Myeclipse 服务器:Tomcat 7 开发语言:Java、jsp、css、JavaScript(jQuery) js脚本调试:Firebug插件(Firefox浏览器) ###部署 将项目tomcat_bin文件夹所有内容拷进tomcat的bin目录下 ###TODO: - 对代码要进行重构,尽量消除重复,让代码更显表现力。 - 提高微博爬虫性能,增加多进程。 - 增加数据库,代替静态文件存储爬取到的微博数据。 - 改进情感分析算法,试试基于机器学习的算法。(待定) - 增加新的功能需求,尽量靠近实际需求