# BaiduTieBaCrawl **Repository Path**: linqiliang/BaiduTieBaCrawl ## Basic Information - **Project Name**: BaiduTieBaCrawl - **Description**: 通过Scrapy框架去爬去每一个主题贴下的全部回复内容 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2017-01-15 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #通过Scrapy去爬去贴吧的回复内容 ## 主要遇到几个问题 1、中文字符处理 2、爬出来的数据要通过xpath合理处理 3、迭代执行新获取到的url