dhd

@dhd_index

dhd 暂无简介

dhd的个人主页
/
关注的仓库(171)

    Watch dhd/zongtui-doc forked from cloudskyme/zongtui-doc

    所有关于众推的项目文档!

    最近更新: 10年多前

    Watch dhd/GuozhongCrawler forked from 郭钟/GuozhongCrawler

    guozhongCrawler的是一个无须配置、便于二次开发的爬虫开源框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。其设计灵感来源于多个爬虫国内外爬虫框架的总结。采用完全模块化的设计,功能覆盖整个爬虫的生命周期(链接提取、页面下载、内容抽取、持久化),支持多线程抓取,分布式抓取,并支持自动重试,定制执行js、自定义cookie等功能。在处理网站抓取多次后被封IP的问题上,guozhongCrawler采用动态轮换IP机制有效防止IP被封。另外,源码中的注释及Log输出全部采用通俗易懂的中文。让初学者能有更加深刻的理解

    最近更新: 10年多前

    Watch dhd/nlp-spider-dynamic forked from gitclebeg/nlp-spider-dynamic

    nlp项目基础框架:爬虫,针对动态网页(JS)的专有爬虫

    最近更新: 10年多前

    Watch dhd/cocook-spider forked from panmingguang/cocook-spider

    分布式数据抓取平台

    最近更新: 10年多前

    Watch dhd/zongtui-classifier forked from cloudskyme/zongtui-classifier

    用于各种分类问题,包括bayes、svm等各种分类器。

    最近更新: 10年多前

    Watch dhd/jeecg forked from JEECG/jeecg

    基于代码生成器的智能开发平台

    最近更新: 10年多前

    Watch dhd/jeewx-api forked from JEECG/weixin4j

    现在微信越来越火,基于微信的公众号和服务号越来越丰富,虽然微信帮助文档已经提供了相关的接口,但是接口比较多,通过代码自己调用比较麻烦,所以为减轻开发者独自创造轮子,将微信API进行了统一封装!

    最近更新: 10年多前

    Watch dhd/nutch-htmlunit forked from xautlx/nutch-htmlunit

    基于Apache Nutch和Htmlunit的扩展实现AJAX页面爬虫抓取解析插件,镜像自:https://github.com/xautlx/nutch-htmlunit

    最近更新: 10年多前

    Watch dhd/gdhs forked from jetliu1987/gdhs
    关闭

    XML文件配置的hadoop平台的数据分析系统雏形,暂时支持hive和mr程序,不断完善中,后期打算支持shell和python脚本,代码质量有待改善。

    最近更新: 10年多前

    Watch dhd/jeeww forked from 道在何方/jeeww

    jeeww java web 开源MIS系统解决方案

    最近更新: 10年多前

搜索帮助