# BaiduTieBaCrawl

**Repository Path**: linqiliang/BaiduTieBaCrawl

## Basic Information

- **Project Name**: BaiduTieBaCrawl
- **Description**: 通过Scrapy框架去爬去每一个主题贴下的全部回复内容
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2017-01-15
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

#通过Scrapy去爬去贴吧的回复内容
## 主要遇到几个问题
  1、中文字符处理
  2、爬出来的数据要通过xpath合理处理
  3、迭代执行新获取到的url