反思深度学习与传统计算机视觉的关系

日期:2021-06-06 00:15:02 | 人气: 74685

反思深度学习与传统计算机视觉的关系 本文摘要:录音:【图像来源:谷歌所有者:谷歌本·本】现在深度自学在很多领域都有座位,特别是在计算机视觉领域。

录音:【图像来源:谷歌所有者:谷歌本·本】现在深度自学在很多领域都有座位,特别是在计算机视觉领域。虽然很多人都很着迷,但是深网相当于黑盒子,我们很多人甚至在这个领域拒绝接受训练的科学家都不告诉我们是怎么工作的。深度自学的顺利和结束事例给我们带来了宝贵的课程,教我们正确处理数据。在本文中,我们将了解深度自学的潜力,深度自学与经典电脑视觉的关系,深度自学作为重要应用的潜在危险性。

视觉问题的非常简单和简单,首先要明确提出视觉/计算机视觉问题的意见。可以这样解读,人们应该等价照相机拍摄的图像,允许计算机询问与该图像内容相关的问题。问题的范围可以从图片中是否不存在三角形、图片中是否有人脸等非常简单的问题到更简单的问题,比如图片中是否有狗在追猫。这样的问题看起来很接近,对人类来说有点不足,但事实证明这些问题隐藏的复杂性没有很大差异。

图片有没有红圈和图像有多少亮点等问题比较简单,但是图像有没有猫等看起来非常简单的问题比较简单。非常简单的视觉问题和简单的视觉问题的区别是无法界限的。值得注意的是,对于人类这种高度视觉简化的动物来说,上述问题都足以成为难题,对孩子们来说,问上述视觉问题也不难。

但是,在变革时期的深刻自学无法回答这些问题。传统计算机视觉V.S.深度自学传统计算机视觉是普遍算法的子集,允许计算机从图像中提取信息(一般应对像素值数组)。目前,传统的计算机视觉有很多用途。

欧洲杯买球正版APP

例如,对不同的对象展开噪音、强化和检查。一些用途目的是寻找非常简单的几何原语,如边缘检测、形态分析、霍夫转换、斑点检测、角点检测、各种图像阈值化技术等。还有一些特点代表技术,比如方向梯度直方图可以作为机器学习分类器的前端,构建更简单的检测器。

与广泛的观点无视,上述讨论工具融合后,可以使用对特定对象的检测器,该检测器性能强,效率高。此外,人们还可以建造面部检测器、汽车检测器、路标检测器,在精度和计算的复杂性方面,这些检测器可能比深度自学高。然而,问题是,每个检测器都必须由有能力的人从头开始建造,这不道德、陈旧和廉价。因此,从历史上看,优秀的探测器只限于经常检测,需要证明前期投资是明智的对象。

这些探测器有很多专用的,不向公众开放。例如脸部探测器、车牌识别器等。但是,为了从图像中分类狗的品种,没有人花钱写狗的探测器和分类器。因此,深度自学首先有用。

尖子生的启发是教计算机视觉课程,在课程的前半部分,带领学生们学习大量的专业知识,抽出时间完成任务,收集图像内容提问。任务一开始就非常简单,比如通过告知图片中是否有圆形或方形,然后进行更简单的任务,比如区分猫和狗。

学生每周写电脑程序完成任务,管理学生写的代码,运营调查效果如何。本学期,新生重新加入了你的班级。他不爱人,不爱人社交,也没有问题。

但是,当他提出自己的第一个任务方案时,你深感交通事故。这个新生写的代码不能解读。我从未见过这样的代码。

看起来他用随机的过滤器卷起每个图像,用非常奇怪的逻辑得到最后的答案。你运营了这个代码,效果很好。

你认为这个解决方案很少见,只要有效就足够了。几周过去了,学生们必须完成的任务可玩性更低,你也从这个新生那里得到了更简单的代码。他的代码优秀地完成了可玩性越来越小的任务,但是不能确实解读其中的内容。

期末,给学生们安排作业,用现实的照片区分猫和狗。结果,学生不需要在这项任务中超过65%的精度,但新生写的代码精度达到95%,令人吃惊。你开始在接下来的几天里深入分析这些深刻的代码。

给出新的例子,展开变更,找到影响程序决策的因素,试着开展偏移工程。最后,你得出了一个惊人的结论:代码不会检测到狗的标签。

如果能检测到标签,就能判别对象的下部是否为茶色。如果是,返回cat,否则返回dog。如果检测不到标签,检测对象的左侧是否比右侧朱。

如果是,返回dog,否则返回cat。你邀请这个新生去办公室,把研究结果圆形地交给他。

你告诉他你知道解决问题了吗?长期绝望后,他再次喃喃自语,他解决了数据集表示的任务,但他不知道狗的长度,也不告诉狗和猫之间有什么不同……显着,他出轨了。他解决问题的目的与你想的目的有关。但是,他没有作弊。

因为他的解决办法明显有效。但是,其他学生的表现不太好。他们试图解决问题,而不是原始数据集。他们的程序运行不好,倒下也没有奇怪的错误。

深度自学的祝福和魔鬼深度自学是一项技术,用于分解程序(也称神经网络),就像上述故事中学生写的程序一样。这些程序和优化技术对世界一无所知,它关心的只是建立一组切换和条件,并将准确的标签分配给数据集中的准确图像。通过将更好的数据添加到培训中,可以避免欺诈的偏差,但预示着数百万的参数和数千个条件的检查,偏差传播分解的程序并不大,非常复杂,因此可以瞄准更小偏差的人群。

任何通过正确的标签,可以使用统计数据优化目标函数的方法,与任务的语义精神无关。这些网络最后能否瞄准语义精准的先验?当然可以。但是,现在很多证据表明这不是这些网络的区别。

无视的例子指出,对图像的展开非常小,无法发现的变更可以改变检查结果。研究人员研究了训练的数据集的新例子,结果表明原始数据集以外的一般化比数据集内的一般化弱得多,因此说明了网络依赖的等价数据集具有特定的低层特性。在某些情况下,更改单个像素不足以产生新的深度网络分类器。在这种情况下,深度自学仅次于的优势是自动创建没有人想不起的特性能力,同时也是其次于的弱点,这些功能至少从语义上看,可以说是怀疑。

什么时候有意义,什么时候没意义?深度自学无疑是计算机视觉系统的有趣补充。我们现在可以更容易地训练探测器来观测便宜而不现实的物体。我们还可以在一定程度上扩展这些检测器,以便更好地计算能力。

欧洲杯买球正版APP

但是,我们对这种奢侈的代价很高。我们不告诉深刻的自学是如何区分的。而且,分类的依据很可能与任务的语义精神有关。

此外,只要输出数据违反训练集中的低水平偏差,检测器就不会经常过热。这些过热条件目前还不为人知。因此,在实践中,深度自学对于那些错误不是很严重,确保输出与训练数据集有很大差异的应用程序非常简单,这些应用程序需要承受5%以内的错误率是没有问题的,还包括图像搜索、监视、自动零售具有讽刺意义的是,很多人指出深度自学是应用领域的革命,深度自学的决策具有实时性,错误具有根本性,不会产生自动驾驶汽车、自律机器人等可怕结果。我不能把这种信念描述为对意外的误解。

有些人对深度自学在医学和临床上的应用寄予厚望。然而,在这方面也有一些令人担忧的发现,例如,一个组织数据的模型无法很好地检测到另一个组织数据。

这再次证明了这些模型提供的数据比很多研究者期待的要深。数据比我们想象的要深刻,深刻的自学教授了视觉数据(一般是高维数据),这个观点可能比我们过去指出的深得多。可能有更多的方法来统计数据,分离印刷高级人类类的可视化数据集,分离这些语义正确的数据集。

换句话说,这两组低水平的图像特征比我们想象的要统计数据意义。这是深度自学最好的发现。如何分解语义上合理的方法分离可用数据集模型的问题还不存在,但实际上这个问题现在可能比以前更难听。

结论深度自学已成为计算机视觉系统的最重要组成部分。但是,传统的计算机视觉并没有达到那一步,而且还可以用来建设非常强大的探测器。这些人工制作的检测仪在某些特定的数据集量上可能无法构建深度自学的高性能,但可以确保依赖输出的语义涉及特性集。深度自学获得统计资料性能强的检测器,不必壮烈牺牲特征工程,但仍需有大量标记数据、大量GPU和深度自学专家。

但是,这些强大的检测器也不会遭遇交通事故的结束。因为适用范围不能只说明(或者说更清楚,不能说明)。

需要注意的是,上述讨论与人工智能中的人工智能有关。我不指出深度自学和解决问题的人工智能问题有什么关系。但我明显指出,深度自学、特性工程和逻辑推理相结合,可以在普遍的自动化空间中构建非常有趣和简单的技术能力。

记录:本文编译器是Piekniewskis的blog(公共编号:)记录:【封面照片来源:网站名谷歌,所有者:谷歌】版权文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:2021欧洲杯用球,欧洲杯买球正版APP

本文来源:2021欧洲杯用球-www.andrejao.com