# comm_backup **Repository Path**: YouNow/comm_backup ## Basic Information - **Project Name**: comm_backup - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2017-03-17 - **Last Updated**: 2020-12-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Commentbox 一个抓取网易云音乐精彩评论的爬虫 爬虫实现可见[Python之美](https://zhuanlan.zhihu.com/p/22456856)。请访问[云音乐评论](http://music.python-cn.org/)看真实效果。 预览,Web端: ![](https://cloud.githubusercontent.com/assets/841395/18956907/baa10988-868f-11e6-868f-36702546ddec.png) 移动端效果: ![](https://cloud.githubusercontent.com/assets/841395/18956895/b2e7a1fc-868f-11e6-8283-f7740632f03b.jpg) ### 使用技术 1. 后端: Flask + Mongoengine + Mako + requests + Redis + lxml + concurrent.futures 2. 前端:React + Mobx + Fetch + Material-UI + ES6 + Webpack + Babel ### Getting Started #### 虚拟环境和安装应用依赖 ``` ❯ git clone https://github.com/dongweiming/commentbox ❯ cd commentbox ❯ virtualenv venv ❯ source venv/bin/activate ❯ pip install -r requirements.txt ❯ cp local_settings.py.tmpl local_settings.py # 然后修改其中的配置(如Redis,MongoDB) ``` #### 爬虫篇 1. 抓取之前可以添加一些代理地址到local_settings.py中,否则会影响爬取速度。 2. 修改run.py中max_workers的数量,建议选择服务器CPU核数作为这个值。 然后启动`python run.py`就开始抓取了。 #### 前端开发篇 先安装: ``` ❯ cd assets ❯ npm install # 推荐使用cnpm, 要不然有点慢 ``` 开发: 开发时可以先修改server.js里面的主机和端口号,然后启动 ``` ❯ make dev ``` 目前默认后端使用8100端口,开发模式使用3000端口。 部署: ``` ❯ make build ``` 执行完毕就会在生成新的static/js/dist/index.bundle.js*文件了。 Enjoy it!