# Dango-Translator-tesseract **Repository Path**: xu_wanghao/Dango-Translator-tesseract ## Basic Information - **Project Name**: Dango-Translator-tesseract - **Description**: 加入Tesseract OCR与自动朗读功能的团子翻译器 - **Primary Language**: Python - **License**: LGPL-2.1 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2022-10-07 - **Last Updated**: 2023-10-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 团子翻译器 + Tesseract OCR 基于[2022年7月29日PantsuDango/Dango-Translator主线分支](https://github.com/PantsuDango/Dango-Translator/tree/14c8d0bfb4d1398a84331f7765c74a4ba9b6b274)的魔改版本,为团子翻译器添加了以下功能: - 使用离线OCR引擎Tesseract进行文本识别 - 自动朗读当前OCR的文本识别结果 [Tesseract](https://github.com/tesseract-ocr/tesseract)是一款历史悠久的强大离线OCR引擎,可以识别[超过100种的语言](https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html)。现在用户可以使用团子翻译器中的Tesseract OCR来识别并翻译小语种了。 ## 示例图片 > assets/tesseract_ui.jpg > assets/reader_ui.jpg > assets/tesseract_demo_rus1.jpg > assets/tesseract_demo_rus2.jpg ## 运行环境 - Windows - Python3 附:本人开发时的环境 - Windows 10 21H2 19044 x64 - Python3.9.1 x64 ## 安装方法 0. **加速安装Python包** 整个安装过程需要下载很多Python包。若在执行`pip install 包名称`时下载进度缓慢,可以使用国内的PyPi加速镜像。使用中科大镜像源加速的格式如下: ``` pip install 包名称 -i https://mirrors.ustc.edu.cn/pypi/web/simple ``` 1. **打开`PowerShell`,创建一个Python虚拟环境** 我们即将安装一系列的Python包,为了让这些包和外界环境隔离,建议使用虚拟环境。如下命令执行完毕后,会在Windows的`C:\Users\用户名\`目录下创建一个`app_env`文件夹,里面存放着一个独立的Python虚拟环境。 ``` pip install virtualenv virtualenv $HOME/app_env cd ~/app_env ``` 2. **激活虚拟环境** 激活成功后命令行会出现`(app_env)`字样。接下来Python包都会被装进该环境,与外部环境隔离。 ``` ./Scripts/activate ``` 3. **克隆或下载该项目** 把本项目的代码克隆或下载到当前虚拟环境目录;进入项目目录。 ``` git clone --depth 1 https://github.com/NewComer00/Dango-Translator-tesseract cd Dango-Translator-tesseract ``` 4. **安装Python依赖包** 如果下载缓慢,记得按照第`0`步提示加速哟,在下述命令结尾加上`-i 镜像源链接`即可。 ``` pip install -r ./requirements.txt ``` 5. **运行程序** 程序内有比较完整的新功能教程,如果出现问题欢迎提出Issue。 ``` python ./app.py ``` 6. **退出虚拟环境** 如需退出虚拟环境,直接在命令行输入`deactivate`即可。关闭`PowerShell`时也会自动退出虚拟环境。 ## 再次运行 首次安装完成后,如需再次运行,请打开`PowerShell`输入以下命令: ``` cd ~/app_env; ./Scripts/activate; cd ./Dango-Translator-tesseract; python ./app.py ```