图像处理怎么入门？？？ - Win

TOP

图像处理怎么入门？？？(一)

2019-10-09 19:57:45 【大中小】浏览:82次

最近有人问我图像处理怎么研究，怎么入门，怎么应用，我竟一时语塞。仔细想想，自己也搞了两年图像方面的研究，做个两个创新项目，发过两篇论文，也算是有点心得，于是总结总结和大家分享，希望能对大家有所帮助。

在写这篇教程之前我本想多弄点插图，让文章看起来花哨一点，后来我觉得没必要这样做，大家花时间沉下心来读读文字没什么不好，况且学术和技术本身也不是多么花哨的东西。
一、图像处理的应用
这个其实没什么好说的，一种技术的应用价值不是靠嘴上说，而是要看有多少人去搞，很简单的道理。其实我觉得判断一项技术有没有价值、有多大价值的最简单最有效的方法就是看有多少人在研究它。如果大家都在研究，那必然说明它很火，至少目前很火，以后的几年里依然还会火。因此，如果你不确定图像处理是不是有价值，那就查查全国图像处理工程师的数量就行了。

当然这里还是简单提一下。如果你真的只想问“图像处理有什么用？”，相信百度会给出比我更专业的答案。不过作为图像处理的行内人，我还是从几个基本的点来具体说一下。
1) 身份认证
21世纪是刷脸的时代，这一点无可厚非。首先是银行，据说重庆的银行已经使用了人脸识别的验证系统来进行辅助的认证。

其次是门禁系统，以前是指纹，虹膜，现在就是人脸。指纹、虹膜的识别虽然准确，但是有侵犯性，采集的过程中有侵犯性，验证的过程中也有侵犯性，反正让谁天天录指纹（采集指纹信息），用眼睛瞪摄像头（采集虹膜信息），谁都会觉得不舒服的，况且手还会脱皮。

相比之下，人脸的识别就方便多了，拍张照片（采集人脸信息）谁都不会介意。最后是监控，一个摄像头所拍的监控能从不同的角度记录成百上千的人（比如车站等密集场所的监控），让警察去辨认将是一个浩大的工程，要是系统能够自动判别人员信息，无疑会给办案带来极大方便。
2) 监控安防
安防监控可以说是图像处理领域最有潜力的应用领域。如今各个城市都在疯狂的安装监控摄像头，全国时刻都有无数的摄像头在录监控，但是安防监控的后端处理却没跟上。

什么是后端处理，简单的说就是监控录像的视频处理。注意这里的视频处理可就不止包含人脸识别了，还有行人检测、异常检测、显著性检测、协同跟踪等。人脸识别之前说了，这里简单说说行人异常检测。

图像处理中的行人异常检测在外行人眼中是一个非常有魔力的东西。毕竟让摄像头通过监控视频就能判断出当前画面中谁是好人谁是坏人（当然直接分为好人和坏人还是太武断了），在一般思维中貌似是不可能的。但是请不要忽略这样一个事实，就是目前大部分监控视频的分析处理都是由人工来完成的，警察破案时经常动不动就调出最近几天的监控视频，然后从头看到尾，其工程量之大可想而知。也正是这样才催生了人们对智能监控方面的研究，因为有这方面的实际需求。当然我们的视频分析程序不会直接给出诸如“好人or坏人”这样的武断而片面的判断结果。

就当前的技术水平而言，能够统计当下监控画面中的人数（行人检测）、定位他们的人脸（人脸检测）、识别他们的身份（人脸识别）、判别他们的表情（表情识别）、检测他们的动作（异常检测），这就已经够了。这样以后人们就不会再面对长达几十甚至上百个小时的监控视频发呆，而是直接分析计算机给出的数据，当前画面中有多少人、都是谁、谁的动作可疑等。总之，接下来智能监控发展会很迅速，因为需求很迫切。
3) 深度学习（Deep Learning）
通俗的说一句，“图像处理是深度学习应用的天堂”。深度学习这个概念可能有人不太熟悉，大家可以自行百度，我这里给出一个相对通俗的解释：“如果你不知道什么叫深度学习，就想想《终结者》中的T-800”。当然这句话不是我说的，是出自业界的一位大牛之口。当然这可能有点小片面，不过深度学习确实是公认的新一代人工智能的基础。

这里举两个例子。一是谷歌的人工大脑项目。谷歌公司可以说是深度学习方面的牵头企业了，其在2012年公布的谷歌大脑项目，动用了1.6万个计算节点，训练数周，得到的人工智能模型能够自主识别猫脸图像，为新一代人工智能开辟了道路，之后微软深度学习研究院、百度深度学习研究院等机构都开始大量投入，各个高校也搞得风声水起，原因很简单，大家都知道它会火。

第二就是图像识别方面的竞赛。最有权威的就是ImageNet竞赛。大家在一个拥有上千万张，上千类别的图像数据库上训练和测试自己的算法，比拼识别率。近几年来，摘得桂冠的一直都是深度学习模型，确切的说是卷积神经网络。更多有关ImageNet历年的竞赛信息大家可以自行百度。

说道深度学习在图像处理的应用，不得不提中国的汤晓鸥教授，说他是国内深度学习的领头羊也不为过。他提出的DeepID人脸识别算法（一共分为三代），在一些大规模人脸数据库上的正确率（若LFW库）已经达到了99.75%，单纯从数字上讲的话可以说已经超越了人类的识别率，为此汤教授还开办了公司，开发FaceSDK（虽然还没有公布）。不过拿计算机和人脑相比本身就是不合理的，各有所长嘛。不过可见DeepLearning在图像识别领域的强大威力。至于深度学习与图像处理的关系这里就不用多说了，谷歌大脑识别的是图像，深度学习竞赛用的是图像，DeepID识别的还是图像人脸，虽然深度学习在其他方面诸如语音识别等也有应用，在图像处理依然是其主要的应用领域。
二、图像处理研究工具
图像处理的研究分为算法研究和应用两个部分。用到的主要编程语言有Matlab、C/C++、Python等，原因很简单，它们都有很多响应的第三方库，不用我们从零开始编程。
1) Matlab
MathWork公司的Matlab软件可以说是算法研究的利器，它的强大之处在于其方便快捷的矩阵运算能力和图形仿真能力，单从简洁性和封装性来说，确实完爆其他语言。但高度封装必然会相应的损失一部分灵活性，况且Matlab严格的讲更像是一个工具，而非一门编程语言。顺便提一句，它在2015年编程语言排行榜中位于第20名，仅次于IOS开发的Objective-C。

对于算法研究人员（尤其是高校的硕士博士），首选工具自然是matlab，因为它简便快捷，封装性好，更重要的是全世界几乎所有的算法大牛、精英教授都会首先公布对应的Matlab源码，然后在逐步改写成其他语言进行实际应用。所以，如果你想做图像处理方面的研究，Matlab是必须掌握的，而且是熟练掌握。

当你有一些想法需要验证时，最好明智的先用matlab编写出来测试。如果你上来就用看似高大上的C++来实验，不仅错误BUG一大堆，到头来可能效果还不佳，就算效果好，时间也会耽搁不少，毕竟算法开发还是要快的，这样才能赶在别人之前发论文。总之，只要是接触图像算法，终究逃不过Matlab，就算你是软件开发的，不研发算法，但总得能看懂别人的Matlab算法吧。

对于之前没怎么接触过Matlab与图像处理的人，在这里推荐一本相关的书籍《MATLAB图像处理实例详解（附光盘）》。这本书对于Matlab图像处理入门还是很有帮助的。记得我当时刚上研究生时就靠两本书入门的，一是冈萨雷斯的《数字图像处理》，二是这本《MATLAB图像处理实例详解》。

不过这里友情提示，在看这类教程（不仅仅是Matlab）时千万不要试图去记忆所有的工具函数，这种做法是十分愚蠢的。正确的做法是根据自己的情况快速翻阅这类工具书，可以找出里面的有实际意义的源码来敲一敲练练手

首页上一页 1 2 3 下一页尾页 1/3/3
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：Win10-无法启动虚拟机	下一篇：保护模式_1_段寄存器_段描述符_段..