JeeSite 是一个企业信息化开发基础平台,Java EE(J2EE)快速开发框架,使用经典技术组合(Spring、Spring MVC、Apache Shiro、MyBatis、Bootstrap UI),包括核心模块如:组织机构、角色用户、权限授权、数据权限、内容管理、工作流等。
牛抓-neocrawler nodejs 的爬虫系统。 特点: 支持web界面方式的摘取规则配置(css selector & regex); 包含无界面的浏览器引擎(phantomjs),支持js产生内容的抓取; 用http代理路由的方式防止抓取并发量过大的情况下被对方屏蔽; nodejs none-block 异步环境下的抓取性能比较高; 中央调度器负责网址的调度(同一时间片内一定数量的抓取任务中根据网站的权重来决定派发任务量; 支持多种抓取实例并存,定制摘取引擎和存储方式。
A java crawler for infomation collection.
开源中国openapi 应用demo,应用为从csdn ,cnblogs, 51cto, iteye个人博客列表下载所有博文,导入到该用户的oschina博客。应用以webmagic爬虫获取csdn博客,感谢@黄亿华 。
这是一个 Java 的缓存框架,可以让应用支持两级缓存框架 ehcache + redis (memcached)。避免完全使用独立缓存系统所带来的网络IO开销问题。【目前OSChina网站正在使用该缓存框架】
Atomikos 是一款 Java/JTA 事务处理工具并且与spring完美结合,跨平台,不受应用服务器限制,多数据源分布式事务的开源解决方案
webmagic的是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。
django-xadmin是一个替代django admin的项目,使用了更加灵活的架构设计及Bootstrap UI框架