from: https://github.com/modelscope/FunASR.git; FunASR 是由阿里巴巴达摩院开发的一个开源自动语音识别(Automatic Speech Recognition, ASR)工具包。
最近更新: 7个月前基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
最近更新: 7个月前olmOCR 是强大的开源文档 OCR 工具,专为高精度转换 PDF 和其他文档为纯文本而设计
最近更新: 7个月前一个打造大模型微调数据集的利器。用户只需上传文件,它便能智能分割内容,生成问题,并为模型微调提供高质量的训练数据。支持 Alpaca、JSON等多样化数据格式,无缝兼容所有遵循OpenAI格式的大型语言模型API。无论是Windows、MacOS还是Linux系统,均可直接下载安装包,快速启动。Docker部署和NPM安装同样不在话下。立即体验Easy DataSet,开启你的数据集创建之旅。
最近更新: 7个月前微软研究团队开发了一种全新的修复旧照片的工具
最近更新: 7个月前General Simultaneous Localization and Mapping Framework
最近更新: 7个月前MindFace是一款基于MindSpore的开源工具包,包含最先进的人脸识别和检测模型,如ArcFace、RetinaFace和其他模型,主要用于面部识别和检测等常见应用场景
最近更新: 7个月前AI拟声: 克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
最近更新: 7个月前