# QHtmlTidy **Repository Path**: moriv4/qhtml-tidy ## Basic Information - **Project Name**: QHtmlTidy - **Description**: C++ Qt 调用 libtidy 库,把html转换为xml,用于编写爬虫程序 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-03-03 - **Last Updated**: 2022-03-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: Qt, HTML, XML ## README tidy 工具库提供 html 转换为 xml 的功能,网址 http://www.html-tidy.org/ 本程序使用 C++ Qt 封装 libtidy 的C语言接口库,实现了 QHtmlTidy 类。 tidy version: 5.8.0 (应该适用于 tidy 5.x.x) 使用方法:下载 tidy 的二进制发布包,把 include 文件夹放入项目源码,把 tidy.dll tidy.lib 放入build目录 pro文件: INCLUDEPATH += tidy-5.8.0-win64/include LIBS += -L. -ltidy main.cpp 是 CSDN 爬虫程序,数据保存到 SQLite 文件中 C:\sqlite3\csdn.db 。表的DDL见代码INSERT语句。