from: https://github.com/modelscope/FunASR.git; FunASR 是由阿里巴巴达摩院开发的一个开源自动语音识别(Automatic Speech Recognition, ASR)工具包。
基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
olmOCR 是强大的开源文档 OCR 工具,专为高精度转换 PDF 和其他文档为纯文本而设计
一个打造大模型微调数据集的利器。用户只需上传文件,它便能智能分割内容,生成问题,并为模型微调提供高质量的训练数据。支持 Alpaca、JSON等多样化数据格式,无缝兼容所有遵循OpenAI格式的大型语言模型API。无论是Windows、MacOS还是Linux系统,均可直接下载安装包,快速启动。Docker部署和NPM安装同样不在话下。立即体验Easy DataSet,开启你的数据集创建之旅。
微软研究团队开发了一种全新的修复旧照片的工具
General Simultaneous Localization and Mapping Framework
MindFace是一款基于MindSpore的开源工具包,包含最先进的人脸识别和检测模型,如ArcFace、RetinaFace和其他模型,主要用于面部识别和检测等常见应用场景
AI拟声: 克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
https://github.com/openai/whisper
AntV 是蚂蚁集团开源的企业级数据可视化解决方案,让人们在数据世界里获得视觉化思考能力
来自 weiwill88 的RAG项目
Rankify 是一站式解决检索、重排和检索增强生成任务的综合性 Python 工具包,它提供了一个模块化和可扩展的框架,让使用者能够在检索管道中无缝进行实验和基准测试
Agentic Reasoning 是一个将代理工具集成到 LLM 推理过程中的框架,让 LLM 像人类一样会用工具进行深度研究和多步逻辑推理,基于使用搜索引擎、代码执行器、思维导
n8n-nodes-mcp为n8n工作流提供强大的MCP交互能力
n8n是一个工作流自动化平台,它的主要作用是帮助人们把一些重复性、规律性的任务自动完成,从而节省时间和精力,提高工作效率。它为技术团队提供了代码的灵活性和无代码的速度。n8n 拥有 400 多个集成、原生 AI 功能和公平代码许可证,可让您构建强大的自动化功能,同时完全控制您的数据和部署。https://github.com/n8n-io/n8n
SQL Chat 是一个基于对话式交互的 SQL 客户端,可以使用自然语言询问数据库问题和查询数据库
All-MiniLM-L6-v2 是一个小型的预训练语言模型,具有6层,针对资源受限或需要轻量级模型的场景设计。尽管规模较小,但它在各种自然语言处理任务上表现出色,包括文本生成、情感分析和关键词提取等。