# CSDN2Markdown **Repository Path**: liushili888/csdn-is---mark-down ## Basic Information - **Project Name**: CSDN2Markdown - **Description**: 使用java爬取csdn为markdown文件 - **Primary Language**: Java - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 97 - **Forks**: 50 - **Created**: 2022-04-09 - **Last Updated**: 2025-04-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # climbCSDNblogsUtils ## 将CSDN文章转化为Markdown文档 >很多情况下,我们需要将CSDN中的文章转化为markdown文档,直接复制全文是不可以的,CSDN不支持。 ## 那有什么办法快速得到md文档? `原理`: - 由于CSDN不是获取数据不是前后端分离的,所以无法根据接口获取文章的所有数据,它的数据是和页面元素组合在一起的,需要根据页面中的元素标签转化为markdown中的元素标签。 - 使用jsoup解析csdn文档 - 利用`jericho-html`、`flexmark-all`、`jsoup`等工具将html文档转化为markdown文档 `使用`: - 直接将CSDN文章的url放入`climbDetailByUrl(url)`方法的参数即可 - 也支持爬取某个作者所有的文章,`climb(userName)` ## 例如: ### 获取单个文章markdown ```java public class ClimbUtil { public static void main(String[] args) { climbDetailByUrl("https://blog.csdn.net/qq_45774645/article/details/123489756?spm=1001.2014.3001.5502"); } } ``` ### 获取所有的文章markdown ```java public class limbUtil { public static void main(String[] args) { //其中userName指定是博客介绍中的名字 climb(userName); } } ``` ## 项目中待解决的问题 ![img.png](img.png) `TODO ‘> ’标签中包含代码块,需要处理`
`TODO 代码中格式待处理`
`TODO 增加GUI页面`
`TODO 公式、表格标签的处理`
## 欢迎大家提出问题,一起完善这个项目