# QHtmlTidy
**Repository Path**: moriv4/qhtml-tidy
## Basic Information
- **Project Name**: QHtmlTidy
- **Description**: C++ Qt 调用 libtidy 库,把html转换为xml,用于编写爬虫程序
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2022-03-03
- **Last Updated**: 2022-03-03
## Categories & Tags
**Categories**: Uncategorized
**Tags**: Qt, HTML, XML
## README
tidy 工具库提供 html 转换为 xml 的功能,网址 http://www.html-tidy.org/
本程序使用 C++ Qt 封装 libtidy 的C语言接口库,实现了 QHtmlTidy 类。
tidy version: 5.8.0 (应该适用于 tidy 5.x.x)
使用方法:下载 tidy 的二进制发布包,把 include 文件夹放入项目源码,把 tidy.dll tidy.lib 放入build目录
pro文件:
INCLUDEPATH += tidy-5.8.0-win64/include
LIBS += -L. -ltidy
main.cpp 是 CSDN 爬虫程序,数据保存到 SQLite 文件中 C:\sqlite3\csdn.db 。表的DDL见代码INSERT语句。