人工智能课|新公布5个人工智能计算机视觉技术的内容，这些细节你还不知道?

环球网校·2020-04-08 15:49:24浏览收藏

地区
选择考试省份
获取验证码

请输入下面的图形验证码

提交验证

预约成功

我知道了

摘要随着当今社会科学技术的持续发展，和人们对编程技术的发展，近年来AI产业正在飞速发展，并且当今社会也有越来越多的人工智能产业实践，所以越来越多的人都开始关注人工智能方面，由此可见人工智能在当今社会中的热度，今天就来讲讲人工智能计算机视觉技术的内容。

人工智能计算机视觉是使用计算机模仿人类视觉系统的科学，让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深度学习的发展，预处理、特征提取与算法处理渐渐融合，形成端到端的人工智能算法技术。根据解决的问题，计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。

(1)人工智能计算机视觉技术——计算成像学

计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机成像原理方面，计算成像学不断促进现有可见光相机的完善，使得现代相机更加轻便，可以适用于不同场景。同时计算成像学也推动着新型相机的产生，使相机超出可见光的限制。在相机应用科学方面，计算成像学可以提升相机的能力，从而通过后续的算法处理使得在受限条件下拍摄的图像更加完善，例如图像去噪、去模糊、暗光增强、去雾霾等，以及实现新的功能，例如全景图、软件虚化、超分辨率等。

(2)人工智能计算机视觉技术——图像理解

图像理解是通过用计算机系统解释图像，实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息的抽象程度可分为三个层次：浅层理解，包括图像边缘、图像特征点、纹理元素等;中层理解，包括物体边界、区域与平面等;高层理解，根据需要抽取的高层语义信息，可大致分为识别、检测、分割、姿态估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统，如刷脸支付、智慧安防、图像搜索等。

(3)人工智能计算机视觉技术——三维视觉

三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获取的三维信息的科学。三维重建可以根据重建的信息来源，分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解，即使用三维信息辅助图像理解或者直接理解三维信息。三维信息理解可分为，浅层：角点、边缘、法向量等;中层：平面、立方体等;高层：物体检测、识别、分割等。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。

(4)人工智能计算机视觉技术——动态视觉

动态视觉即分析视频或图像序列，模拟人处理时序图像的科学。通常动态视觉问题可以定义为寻找图像元素，如像素、区域、物体在时序上的对应，以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。

(5)人工智能计算机视觉技术——视频编解码

视频编解码是指通过特定的压缩技术，将视频流进行压缩。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264、H.265、M-JPEG和MPEG系列标准。视频压缩编码主要分为两大类：无损压缩和有损压缩。无损压缩指使用压缩后的数据进行重构时，重构后的数据与原来的数据完全相同，例如磁盘文件的压缩。有损压缩也称为不可逆编码，指使用压缩后的数据进行重构时，重构后的数据与原来的数据有差异，但不会影响人们对原始资料所表达的信息产生误解。有损压缩的应用范围广泛，例如视频会议、可视电话、视频广播、视频监控等。

目前，人工智能计算机视觉技术发展迅速，已具备初步的产业规模。未来人工智能计算机视觉技术的发展主要面临以下挑战：一是如何在不同的应用领域和其他技术更好的结合，计算机视觉在解决某些问题时可以广泛利用大数据，已经逐渐成熟并且可以超过人类，而在某些问题上却无法达到很高的精度;二是如何降低计算机视觉算法的开发时间和人力成本，目前计算机视觉算法需要大量的数据与人工标注，需要较长的研发周期以达到应用领域所要求的精度与耗时;三是如何加快新型算法的设计开发，随着新的成像硬件与人工智能芯片的出现，针对不同芯片与数据采集设备的计算机视觉算法的设计与开发也是挑战之一。

以上就是有关于人工智能计算机视觉技术的内容了，即使当前时代人工智能的发展依然有限，但是依然不影响大家对于人工智能这一行业的热情，小编相信在不久的未来，人工智能一定能为我们的社会带来更多便利，环球网校小编在此祝大家人工智能行业的学习之路顺利。

展开剩余

资料下载

历年真题

精选课程

老师直播

更多资料 >

更多试题 >

报考

备考

政策

人工智能课|新公布5个人工智能计算机视觉技术的内容，这些细节你还不知道?

最新推荐