18案例Photo OCR

发表于2020-10-12|更新于2020-10-12|机器学习

|总字数:583|阅读时长:1分钟|浏览量:

机器学习案例-Photo OCR

问题描述

主要目的：
- 复杂的机器学习系统是如何组建出来的
- 机器学习流水线的概念。
- 如何分配机器学习资源
问题描述：照片的光学识别。
1. 找出由文字的区域text detection
2. 字符分割character segment
3. 字符识别character classification
机器学习流水线photo ocr pipeline
- image -> text detection -> character segment -> character classification
- 将图片传入一系列机器学习组件，完成一系列任务。

滑动窗口

使用一个固定大小滑动窗口，在待检测的图片上遍历所有可能存在目标的区域。
调整滑动窗口的大小，将滑动窗口映射为固定大小，然后继续进行滑动，并检测窗口中是否存在目标。（100-50的区域，通过数据处理映射为50-25的检测单元，然后进行目标分析）

获取大量数据和人工数据

人工合成数据

识别字体图片中：使用网络上个中免费的字体，添加各种不同的背景，对字体进行缩放旋转扭曲等操作，人工合成数据集。
语音识别：给正常的语音添加各种不同的背景噪音。

是否需要获得大量数据

保证假设函数的偏差很小
考虑是否能够快速获取十倍于现在的数据集
- 人工合成
- 众包服务
- 网上搜集

时间规划

做机器学习，最重要的是时间，其次是数据，然后是算法选择，最后是系统实现和调参。
考虑机器学习系统、机器学习流水线上，准确率的瓶颈在哪里。
一个机器学习流水线的实例。

如果自己开发及其学习的过程，应该也要建立相应的流水线，每一个流水线上单独的算法，都应该可以发表一篇论文。关键是如何设计机器学习的流水线过程—————-应该通过广泛阅读相关论文，论证如何实现机器学习系统。

建议：把机器学习问题分成很多模块，对整个系统进行上下限分析，给出需要投入时间最多的模块，合理规划任务。

文章作者: Estom

文章链接: https://estom.github.io/2020/10/12/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%90%B4%E6%81%A9%E8%BE%BE%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/18%E6%A1%88%E4%BE%8BPhoto%20OCR/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

进行系统实现

相关推荐

消息队列消息队列本质定义生产者先将消息投递一个叫做「队列」的容器中，然后再从这个容器中取出消息，最后再转发给消费者 ![](/note_image/Go/5 GoWeb开发/kafka/image/2021-09-03-08-08-11.png) 消息：就是要传输的数据，可以是最简单的文本字符串，也可以是自定义的复杂格式（只要能按预定格式解析出来即可）。队列：大家应该再熟悉不过了，是一种先进先出数据结构。它是存放消息的容器，消息从队尾入队，从队头出队，入队即发消息的过程，出队即收消息的过程。再看今天我们最常用的消息队列产品（RocketMQ、Kafka 等等），你会发现：它们都在最原始的消息模型上做了扩展，同时提出了一些新名词，比如：主题（topic）、分区（partition）、队列（queue）等等。 2 消息模型队列模型P2P模式最初的消息队列就是上一节讲的原始模型，它是一个严格意义上的队列（Queue）。消息按照什么顺序写进去，就按照什么顺序读出来。不过，队列没有 “读” 这个操作，读就是出队，从队头中...

14.利用SVD简化数据

第14章利用SVD简化数据SVD 概述12奇异值分解（SVD, Singular Value Decomposition）: 提取信息的一种方法，可以把 SVD 看成是从噪声数据中抽取相关特征。从生物信息学到金融学，SVD 是提取信息的强大工具。 SVD 场景信息检索-隐性语义检索（Latent Semantic Indexing, LSI）或隐形语义分析（Latent Semantic Analysis, LSA）隐性语义索引: 矩阵 = 文档 + 词语是最早的 SVD 应用之一，我们称利用 SVD 的方法为隐性语义索引（LSI）或隐性语义分析（LSA）。推荐系统利用 SVD 从数据中构建一个主题空间。再在该空间下计算其相似度。(从高维-低维空间的转化，在低维空间来计算相似度，SVD 提升了推荐系统的效率。) 上图右边标注的为一组共同特征，表示美式 BBQ 空间；另一组在上图右边未标注的为日式食品空间。图像压缩例如: 32*32=1024 => 32*2+2*1+32*2=130(2*1表示去掉了除对角线的...

2019.11.01-2019.11.31

文献阅读内容整理主题：群体智能与协同防御课题目标将群体智能与网络安全技术进行结合，实现局域网范围内的协同防御。主要对象局域网内的计算机、工控设备、打印机等网络设备。主要任务能够从局域网内的不同设备采集数据。群智感知？分布式数据采集？显然主要任务是实现分布式数据采集。群智感知的对象是分布式网络中的智能个体-人。人后通过智能个体构成的分布式网络实现对整个社会的感知任务。然而在我们的目标当中，每个对象都是计算机，不需要激励机制，不需要设备对象感知社会。不过也存在这么一种情况。如果是分布式的群体智能的话，即没有中央控制的智能设备的话，智能个体之间的交互是否可以存在两种形式：请求响应，主动分发。通过这两种形式，实现局域网络内智能设备的沟通与同步，实现知识积累后的传递。综上所述，群智感知领域的论文可能不太适合，应该是分布式数据采集的能力。关于构想的模型，分布式数据采集，是否需要中央控制器。群体智能与协同防御是否是中央控制网络还是分布式控制网络。如果要实现分布式控制网络，每个个体可能都是一个能够独立完成任务的独立个体。所以相比中央控制的网络具有哪些优势？就像传统的360安全控制一样，有统...

30.如何保证接口的幂等性常见的实现方案有哪些

如何保证接口的幂等性？常见的实现方案有哪些？幂等性问题是面试中常见的面试问题，也是分布式系统最常遇到的问题之一。在说幂等性之前，我们先来看一种情况，假如老王在某电商平台进行购物，付款的时候不小心手抖了一下，连续点击了两次支付，但此时服务器没做任何验证，于是老王账户里面的钱被扣了两次，这显然对当事人造成了一定的经济损失，并且还会让用户丧失对平台的信任。而幂等性问题说的就是如何防止接口的重复无效请求。我们本课时的面试题是，什么是幂等性？如何保证接口的幂等性？典型回答幂等性最早是数学里面的一个概念，后来被用于计算机领域，用于表示任意多次请求均与一次请求执行的结果相同，也就是说对于一个接口而言，无论调用了多少次，最终得到的结果都是一样的。比如以下代码： 12345678910111213141516public class IdempotentExample { // 变量 private static int count = 0; /** * 非幂等性方法 */ public static void addCount() {...

基础知识 1.数学数学是学不完的，也没有几个人能像博士一样扎实地学好数学基础，入门人工智能领域，其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程，这三门课程是本科必修的。这里整理了一个简易的数学入门文章。数学基础: 高等数学https://zhuanlan.zhihu.com/p/36311622数学基础: 线性代数https://zhuanlan.zhihu.com/p/36584206数学基础: 概率论与数理统计https://zhuanlan.zhihu.com/p/36584335 机器学习的数学基础资料下载:1.机器学习的数学基础.docx中文版，对高等数学、线性代数、概率论与数理统计三门课的公式做了总结2) 斯坦福大学机器学习的数学基础.pdf原版英文材料，非常全面，建议英语好的同学直接学习这个材料下载链接: https://pan.baidu.com/s/1LaUlrJzy98CG1Wma9FgBtg 提取码: hktx 推荐教材相比国内浙大版和同济版的数学教材，通俗易懂，便于初学者更好地奠定数学基础下载链接: ...

17 综合组网实验

e# 综合组网试验 1 总体规划设计系统需求和设计目标6层楼约30个机房约1600多台计算机，为一般网络应用、监控、服务器、存储、信息发布、电子教室、中控和投影等多个系统提供网络平台将整个实验中心机房连成一个相对独立的局域网，保证互联互通、学生自由上机、正常上网、刷卡系统、网络服务器、考试系统的正常运行。满足多媒体教学、流媒体教学的需要，保证音、视频的流畅播放，确保良好的服务质量。网络的连通性完全可控，要求满足某些机房考试时禁止该机房访问互联网，而其他机房正常上课不受影响。网络支持组播应用，能够满足机房管理软件等教学相关应用的需求。网络设备支持抗ARP病毒攻击、广播风暴抑制、DHCP协议、IPv6协议等功能。所有网络设备都要能够被实时监控和管理。总体规划信息平台网络采用TCP/IP体系结构，以满足与其他网络系统的互联互通。分层次的方法划分网络不同层次使用不同级别的千兆交换机，出口路由器采用中高端路由器采用地址转换技术(NAT)规划网络。IP地址的划分采用每个机房一个网段。NAT采用基于端口的NAT-PT技术。申请至少128个公网地址的地址池。 ...

数据加载中