Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台
Myolotrain是一个可视化管理yolo视觉模型训练的系统,为计算机视觉任务提供了直观的图形界面。该平台集成了数据集管理、模型管理、训练管理和目标检测功能,支持windows、linux、docker等多种部署方式,使用户能够轻松地训练和部署 YOLOv8 模型,支持CPU和GPU,使用tensorboard实时查看训练进度,具备数据集自动分割功能。
2025年2月17日,微软发布了革命性的视觉Agent框架OmniParser V2。这个能把DeepSeek-R1、GPT-4o等大模型变成"计算机使用智能体"的黑科技,让AI终于不再只是"脑补"屏幕内容——它现在能像人类一样精准识别UI元素,甚至能发现你都没注意到的隐藏按钮!
基于Vue3+Element Plus+FastAPI开发的一个通用中后台管理框架(若依的FastAPI版本),支持代码生成
Mirror of https://huggingface.co/qihoo360/360LayoutAnalysis
https://github.com/cxcscmu/Crawl4LLM Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的一个智能爬虫系统。专为提升 LLM 预训练效率而设计。它的核心优势在于智能评估网页对LLM预训练的影响力,并根据网页的预期价值优先抓取有意义的数据。 适用场景 • 大规模LLM预训练 • 数据集构建 • 搜索引擎优化 • 网络监测与分析
Browser Use 是一款功能强大且灵活的开源工具,可以将 AI 智能体与浏览器操作完美结合,实现自动化、高效的网页交互。,,它允许通过 AI 代理自动操作浏览器,无论是发邮件、订机票,还是网页内容提取、文件存储、数据库操作等都直接用。 https://github.com/browser-use/browser-use
基于python的网页自动化工具。既能控制浏览器,也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大,内置无数人性化设计和便捷功能。语法简洁而优雅,代码量少。
FastAPI + vue3 前后端分离后台管理系统,包含PC端,微信小程序端。PC 端使用:Vue3+Typescript+Vite+Element Plus,小程序使用:Uni-APP + uview ui,接口使用:FastAPI+Pydantic+SQLAlchemy 2.0+Mysql。异步存储,RBAC 权限管理,定时任务,部门管理等功能。
frp-python是基于frp原理实现的轻量级python版frp,frp-python具有非常简洁的设计,在速度方面甚至优于frp。
若依wms是一套基于若依的wms仓库管理系统,支持lodop和网页打印入库单、出库单。包括仓库/库区/货架管理,出入库管理,客户/供应商/承运商,库存看板、库存记录等功能。
若依wms是一套基于若依的wms仓库管理系统,支持lodop和网页打印入库单、出库单。包括仓库/库区/货架管理,出入库管理,客户/供应商/承运商,库存看板、库存记录等功能。
可视化生成CRUD代码、内置WEB终端,前后端分离,基于Vue3.x(setup)+ThinkPHP6+TypeScript+Vite+Pinia+Element Plus的商业级后台管理系统,自适应多端,同时提供Web和Server端、自动注册路由、无限级菜单权限节点、全局数据回收站、字段级修改保护等等,是集颜值、实用、敏捷于一身的管理系统。
🎉🎉🔥基于vue3.x 、Typescript、vite、Element plus等,适配手机、平板、pc 的后台开源免费模板库(vue2.x请切换vue-prev-admin分支)