OCR-字符识别笔记

简介: OCR-字符识别笔记

安装

环境依赖

Linux | Windows | macOS

Python 3.7

PyTorch 1.6 或更高版本

torchvision 0.7.0

CUDA 10.1

NCCL 2

GCC 5.4.0 或更高版本

准备环境

注解

如果你已经在本地安装了 PyTorch,请直接跳转到安装步骤。

第一步 下载并安装 Miniconda.

第二步 创建并激活一个 conda 环境:

conda create --name openmmlab python=3.8 -y
conda activate openmmlab

第三步 依照官方指南,安装 PyTorch。

GPU 平台CPU 平台

conda install pytorch torchvision -c pytorch

安装步骤

我们建议大多数用户采用我们的推荐方式安装 MMOCR。倘若你需要更灵活的安装过程,则可以参考自定义安装一节。

推荐步骤

第一步 使用 MIM 安装 MMEngine, MMCV 和 MMDetection。

pip install -U openmim
mim install mmengine
mim install mmcv
mim install mmdet

第二步 安装 MMOCR.

若你需要直接运行 MMOCR 或在其基础上进行开发,则通过源码安装(推荐)。

如果你将 MMOCR 作为一个外置依赖库使用,则可以通过 MIM 安装。

源码安装MIM 安装

git clone https://github.com/ocr.git
cd mmocr
pip install -v -e .

“-v” 会让安装过程产生更详细的输出

“-e” 会以可编辑的方式安装该代码库,你对该代码库所作的任何更改都会立即生效

第三步(可选) 如果你需要使用与 albumentations 有关的变换(如 ABINet 数据流水线中的 Albu),或需要构建文档、运行单元测试的依赖,请使用以下命令安装依赖:

源码安装MIM 安装


安装 albu

pip install -r requirements/albu.txt

安装文档、测试等依赖

pip install -r requirements.txt

注解


我们建议在安装 albumentations 之后检查当前环境,确保 opencv-python 和 opencv-python-headless 没有同时被安装,否则有可能会产生一些无法预知的错误。如果它们不巧同时存在于环境当中,请卸载 opencv-python-headless 以确保 MMOCR 的可视化工具可以正常运行。


查看 albumentations 的官方文档以获知详情。


检验

你可以通过运行一个简单的推理任务来检验 MMOCR 的安装是否成功。


PythonShell

在 Python 中运行以下代码:

from mmocr.apis import MMOCRInferencer

ocr = MMOCRInferencer(det=‘DBNet’, rec=‘CRNN’)

ocr(‘demo/demo_text_ocr.jpg’, show=True, print_result=True)

若 MMOCR 的安装无误,你在这一节完成后应当能看到以图片和文字形式表示的识别结果:

识别结果

{'predictions': [{'rec_texts': ['cbanks', 'docecea', 'grouf', 'pwate', 'chobnsonsg', 'soxee', 'oeioh', 'c', 'sones', 'lbrandec', 'sretalg', '11', 'to8', 'round', 'sale', 'year',
'ally', 'sie', 'sall'], 'rec_scores': [...], 'det_polygons': [...], 'det_scores':
[...]}]}

56192f8f12f5418898bc1d1ca4cf8e66_f2d56ceb35204f55b61b46ccab06c424.png

相关文章
|
2天前
|
文字识别 前端开发 JavaScript
Star33.1k!推荐一个基于网页的OCR(光学字符识别)引擎库
想要在前端解决图像识别的兄弟,可以到 Github 上下载Tesseract.js库,安装和相关学习文档都能下载到,实在获取不到的兄弟找V哥发给你,假期第二天,出去放松的同时也可以看看 V 哥的文章,祝大家玩得开心。
|
2天前
|
机器学习/深度学习 文字识别 算法
[Halcon&识别] OCR字符识别
[Halcon&识别] OCR字符识别
102 0
|
机器学习/深度学习 存储 文字识别
Halcon解决方案指南(18)OCR--字符识别
第18章 光学字符识别_OCR OCR(Optical Character Recongnition)即我们通常意义上讲的光学字符识别。在HALCON中,OCR常被用来分割区域及读取识别图像中的字符含义。
7204 0
|
11月前
|
人工智能 文字识别 API
OCR(Optical Character Recognition,光学字符识别)
OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字转换成可编辑文本的技术。OCR 技术可以应用于各种场景,例如自动化办公、图像文本识别、车牌识别、身份证识别、发票识别等。
155 1
|
11月前
|
文字识别 算法 计算机视觉
MATLAB实现OCR识别数字和字符
OCR也叫做光学字符识别,是计算机视觉研究领域的分支之一。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。
|
11月前
|
机器学习/深度学习 人工智能 文字识别
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
|
12月前
|
机器学习/深度学习 文字识别 算法
【OCR学习笔记】6、OCR传统字符识别实践
【OCR学习笔记】6、OCR传统字符识别实践
87 0
|
机器学习/深度学习 文字识别
OCR+CNN完成铭牌字符识别【MATLAB】
OCR+CNN完成铭牌字符识别【MATLAB】
494 0
OCR+CNN完成铭牌字符识别【MATLAB】
|
机器学习/深度学习 文字识别 算法
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别
|
机器学习/深度学习 算法
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测

热门文章

最新文章

http://www.vxiaotou.com