新闻中心

AgentOCR:一个多语言支持、易于使用的 OCR 项目

2025-07-18
浏览次数:
返回列表
AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少、易打包。可通过 pip 安装,需手动装 ONNXRuntime。支持多语言识别,通过配置文件快速切换,调用简单,能输出识别文本及位置、置信度等信息。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

agentocr:一个多语言支持、易于使用的 ocr 项目 -

引入

  • AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目
  • 本项目目前包含 Python Package 【AgentOCR】 和 OCR 标注软件 【AgentOCRLabeling】

项目细节

  • Github:AgentMaker/AgentOCR
  • 使用指南:AgentOCR Package 使用说明

特性

  • API 基本与 PPOCR Package 保持一致,只需简单改动模型加载代码即可直接切换
  • 基于 ONNXRuntime 开发,剔除无用依赖,易于 Python 程序打包

安装

  • AgentOCR 可直接通过 pip 进行下载安装
  • Package 依赖 ONNXRuntime,不过由于 ONNXRuntime 的版本过多,安装 AgentOCR 不会自动安装该依赖
  • 需要根据 ONNX 官网安装提示,手动选择合适的平台版本进行安装
In [1]
# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntime# 安装 GPU 版本 ONNXRuntime# !pip install onnxruntime-gpu

使用

  • 支持多语言识别模型,可通过内置的配置文件进行快速切换

中/英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 -

In [2]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='ch')# 设置测试图片路径img_path = 'images/ch.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2025/08/20 17:30:08] root INFO: All *ailable providers: ['CPU']
[2025/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:09] root DEBUG: dt_boxes num : 16, elapse : 0.13202576501464844
[2025/08/20 17:30:09] root DEBUG: rec_res num  : 16, elapse : 0.590078592300415
[[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.9713771]]
[[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.99220806]]
[[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤,100公斤起订)', 0.961909]]
[[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元,1000瓶起订)', 0.99086225]]
[[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】:代加工方式/OEMODM', 0.9834662]]
[[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】:纯臻营养护发素', 0.9786148]]
[[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】:YM-X-3011', 0.98218465]]
[[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.88782406]]
[[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】:220ml', 0.9954411]]
[[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】:适合所有肤质', 0.9606319]]
[[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】:鲸蜡硬脂醇、燕麦-葡聚', 0.9720796]]
[[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油xian胺内基甜菜碱、泛醇', 0.8544037]]
[[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['(成品包材)', 0.9908909]]
[[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['(主要功能】:可紧致头发磷层,从而达到', 0.9463466]]
[[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果,给十燥的头', 0.94709635]]
[[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.99771744]]

英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 -

mallcloud商城 mallcloud商城

mallcloud商城基于SpringBoot2.x、SpringCloud和SpringCloudAlibaba并采用前后端分离vue的企业级微服务敏捷开发系统架构。并引入组件化的思想实现高内聚低耦合,项目代码简洁注释丰富上手容易,适合学习和企业中使用。真正实现了基于RBAC、jwt和oauth2的无状态统一权限认证的解决方案,面向互联网设计同时适合B端和C端用户,支持CI/CD多环境部署,并提

mallcloud商城 0 查看详情 mallcloud商城 In [3]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='en')# 设置测试图片路径img_path = 'images/en.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2025/08/20 17:30:13] root INFO: All *ailable providers: ['CPU']
[2025/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:13] root DEBUG: dt_boxes num : 3, elapse : 0.030713796615600586
[2025/08/20 17:30:13] root DEBUG: rec_res num  : 3, elapse : 0.027882814407348633
[[[77.0, 121.0], [268.0, 124.0], [268.0, 164.0], [77.0, 161.0]], ['EPPING', 0.9977331]]
[[[100.0, 182.0], [247.0, 185.0], [246.0, 206.0], [100.0, 203.0]], ['Twinned with', 0.997261]]
[[[67.0, 204.0], [275.0, 209.0], [275.0, 231.0], [66.0, 227.0]], ['EppingenGermany', 0.9897056]]

韩文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 -

In [4]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='korean')# 设置测试图片路径img_path = 'images/korean.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2025/08/20 17:30:16] root INFO: All *ailable providers: ['CPU']
[2025/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2025/08/20 17:30:17] root DEBUG: dt_boxes num : 5, elapse : 0.3222081661224365
[2025/08/20 17:30:17] root DEBUG: rec_res num  : 5, elapse : 0.06328773498535156
[[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.758096]]
[[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가간차좋아하는사양이성서서호과공증', 0.60792387]]
[[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가죽어어킬것만갈하서어기를한다', 0.7302016]]
[[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈앞에아른아른거리는잘생긴열굴가푸', 0.6773213]]
[[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에명도는 그의촉촉한 옥소리예', 0.8373457]]

以上就是AgentOCR:一个多语言支持、易于使用的 OCR 项目的详细内容,更多请关注其它相关文章!


# 是一个  # 库尔勒外贸网站建设  # 荔湾区建设网站  # 静海seo排名  # 代刷咸鱼网站推广  # 雅安定制网站建设  # 丝瓜_seo_1.3.0.aph  # 东营网络营销小程序推广  # 有口碑的句容网站优化  # 辽宁信息化网站优化大全  # 求教网络营销推广产品  # 护发素  # python  # 可通过  # 英文  # 多国语言  # 官网  # 一言  # 配置文件  # 中文网  # 多语言  # fig  # ai  # git 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 苹果16有哪些可以设置  typescript要用什么工具  怎么下载360桌面壁纸  命令行如何打开文件  汽车收音机power是什么意思  红米手机怎么设置变成5G手机  debian和ubuntu命令一样吗  typescript如何开发  typescript为什么能运行  .asm如何在命令行运行  云淡风轻什么意思  阿里云盘共享账户怎么用  typescript的语法格式是什么  juice是什么意思  iPhone无法打开YouTube原因分析与解决方案  命令指示符如何打开盘符  交管12123协议头不完整是啥意思  mysql的datediff函数怎么用  typescript的文件如何执行  学typescript有什么用  ts什么意思  如何在命令提示符播放音频  苹果ipad爱奇艺怎么投屏到电视  苹果16日发售哪些机型  如何显示固态硬盘  hen是什么意思  eraser是什么意思  typescript如何定义常量  路由器上的power按钮是什么意思  单片机怎么加死循环  单片机*计步器怎么用  单片机速度怎么看  单片机怎么定义字符长度  mac如何使用vi命令行  如何使用net命令  type-c输入接口是什么  单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐  智能锁type-c接口是什么  什么是域名解析 域名解析中采用了什么  交管12123协议头不完整怎么解决  阿里云盘扩容是什么_扩容阿里云盘方法是什么教程  typescript和哪个语音很像  element ui是什么  shell如何执行sql脚本命令行  苹果16有哪些黑科技  春运抢票最新技巧与方法  显示器上power键是什么意思  如何找出命令行  市盈率亏损是什么意思  如何自己加装固态硬盘 

搜索