计算机视觉的下一个重大突破将会是什么?

译文内容: 为了不改变原本的意思,需要将内容改写成中文。不需要出现原句

审校 | 重楼

20世纪50年代的计算机视觉首批用例可以分析键入文本和手写文本。早期的商业应用程序致力于单个图像,包括光学字符识别、图像分割和对象检测。人脸识别方面的开创性工作始于20世纪60年代,科技巨头们在2010年左右开始推出相关功能。 重写后:20世纪50年代的计算机视觉首批应用案例能够分析键入文本和手写文本。早期的商业应用主要关注单个图像,包括光学字符识别、图像分割和目标检测。人脸识别方面的开创性工作始于20世纪60年代,科技巨头们在2010年左右开始推出相关功能

计算机视觉市场规模在2022年估计为140亿美元,预计从2023年到2030年将以19.6%的年复合增长率增长。虽然有许多新的计算机视觉突破和初创公司,但与其他人工智能技术相比,市场规模还是很小。比如说,到2032年,生成式人工智能的市场规模估计将达到1.3万亿美元。

计算机视觉的新兴用例

如今无论您走到哪里,摄像头都可能在扫描您,计算机视觉算法执行实时分析。计算机视觉的主要用例包括文档扫描、视频监控、医疗成像和交通流量检测。实时计算机视觉方面的突破促进了自动驾驶汽车的发展,并推动了无收银员商店和库存管理等零售用例的发展。

您可能在过去的经历中或读到过类似的面向消费者的案例,尤其是在汽车和消费者市场中的计算机视觉主要应用方面

您可能不太了解制造业、建筑业及其他工业企业在如何使用计算机视觉技术。这些行业的企业通常迟迟不愿投入于技术,但制造、数字建筑和智能农业等行业的工业4.0计划正在帮助行业领导者更好地了解新兴技术带来的机遇。

减少制造过程中的浪费

制造业中的计算机视觉技术带来了巨大的机遇,其算法准确率已达到99%。考虑到只有10%的公司正在使用这项技术,这方面的潜力尤其惊人。工业领域是否会迎来一场数字革命,还是这些企业在采用计算机视觉技术方面会继续落后呢?

IndustrialML首席执行官Arjun Chandar表示,在制造业中,识别动态材料的产品质量是主要的用例。“借助高帧率的相机和逐帧运用机器学习模型,就可以快速识别生产线上的瑕疵。”

全球制造商每年浪费高达8万亿美元,计算机视觉可以帮助监控设备、制造部件和环境因素,从而帮助制造商减少这些损失。

Chandar表示,许多制造业用例的底层技术是主流技术。他说:“这些主要使用2D相机,但具有高分辨率和每秒20帧或更高的帧率,并且还使用卷积神经网络(CNN)。”

为了提高准确性,制造商需要一种策略来充实这些数据。Chandar补充道:“要像在典型的制造环境中那样增强训练能力,具有良好产品质量的图像数量需远远超过瑕疵。”

消除这个缺口的一种方法是使用合成数据,这是开发团队用来增加测试数据多样性的一种方法。

Syntax数据管理和创新合伙人Jens Beck表示,制造商可以从基本的视觉检查步骤入手,随后寻求更大的自动化机会。他说:“我们看到计算机视觉和人工智能结合用于视觉检查,比如在汽车上检查胶水痕迹。对客户来说,商业价值不仅仅在于通过自动化手动步骤来提高整体设备有效性(OEE),还在于将检查记入文档,然后将计算机视觉集成到制造执行系统(MES)中,最终集成到企业资源规划系统(ERP)中。” 重写后的内容:Syntax数据管理和创新合伙人Jens Beck表示,制造商可以从基本的视觉检查步骤入手,然后寻求更大的自动化机会。他指出:“我们发现,计算机视觉和人工智能的结合可以应用于视觉检查,例如在汽车上检查胶水痕迹。对于客户而言,商业价值不仅仅在于通过自动化手动步骤提高整体设备有效性(OEE),还在于将检查结果记录在文档中,然后将计算机视觉整合到制造执行系统(MES)中,最终整合到企业资源规划系统(ERP)中。”

提高工厂车间的安全性

计算机视觉的应用不仅可以提高质量和效率,还有助于提高工人的安全性,减少工厂车间和其他工作场所的事故。根据美国劳工统计局的数据,2021年制造业有近40万人受伤和患病

Synthesis AI的首席执行官兼创始人Yashar Behzadi表示:“计算机视觉可以比人员监管体系更快速、更高效地不断识别员工面临的潜在风险和威胁,从而提高工人的安全性。要实现这一点,计算机视觉需要使用大量的数据来训练机器学习模型;在这些特定的应用场景中,机器学习工程师通常会面临以原始、未标记形式呈现的非结构化数据。”

使用合成数据对于安全相关的用例也很重要,因为制造商不太可能有着重显示潜在安全因素的图像。Behzadi补充道:“合成数据等技术通过提供准确标记的高质量数据,减轻了机器学习工程师的压力。这些数据可以解释极端情况,从而节省时间和金钱,并避免不准确的数据导致的棘手问题。”

Gramener的物流和供应链SBU负责人Sunil Kardam表示:“计算机视觉的优势包括实时分析、提高效率和改进决策。”Kardam还分享了一些典型的应用场景:

  • 跟踪物料移动、识别产品和包装的瑕疵以及减少浪费
  • 通过监视未授权人员的行为来落实协议
  • 简化文档处理、优化库存、帮助保险索赔,并实现高效的物流管理

卡达姆认为,计算机视觉依赖于摄像头和先进的算法,例如YOLO、Faster R-CNN和OpenCV。他指出,计算机视觉的机器学习模型可以在边缘设备或云端进行处理,智能摄像头和基于云的API提供了强大的功能

监测电网

大多数制造都在室内进行,工程师对环境有一定的控制,包括在哪里放置摄像头以及何时添加照明设施。需要使用安装的相机、无人机、飞机和卫星分析室外区域和景观时,计算机视觉用例会比较复杂。

Buzz Solutions首席技术官、首席运营官兼联合创始人Vik Chaudry分享了一个使用无人机的例子。他表示:“我们利用计算机视觉技术来监测和识别电网、公用事业公司和变电站的故障,以确保美国各地的电网互联可靠。通过收集来自全美各地众多公用事业公司的数千张图像,我们可以准确识别潜在威胁、故障和异常情况。”

电力线火灾是一个值得关注的重要领域。据美国国家跨部门消防中心声称,从1992年到2020年,美国各地发生了3.2万多起电线引燃的野火,加州的第二大野火是由电线太靠近一棵树引起的。公用事业公司现正在评估人工智能的机会,以优化维修,尽量降低风险。

Chaudry表示:“由于该软件使用来自现有公用事业公司的真实数据和图像,因此它非常准确,能够识别来自天气、维护不良的基础设施和气温上升的一系列威胁。这项技术能够实现快速高效的维护,同时防止大面积停电和电网引发的灾难。”

脑机接口

首席技术官Naeem Komeilipoor透露,AAVAA展望未来,计算机视觉和新兴技术设备正迎来新的前沿。他指出:“在工业环境中,脑机接口(BCI)技术可以作为一种补充方法,特别是在低能见度、极端温度或摄像头使用受限制的危险环境中,用于某些工业计算机视觉用例。”

在危险条件下完成维修是一种用例,但更常见的用例是当建筑施工、炼油厂工作或其他现场工作需要使用双手来检查或操控机械设备时。

以工地上进行维修为例。Komeilipoor表示,智能眼镜中采用的BCI技术提供了一种替代方法,无需外部摄像头即可追踪眼球运动,因此工人可以在艰苦的条件下正常工作。他说:“BCI技术不依赖于摄像头,而是通过解读大脑和眼电图(EOG)等生物信号来监测眼球运动。这项技术需要先进的信号处理和机器学习算法,以分析通过专门传感器捕获的眼球运动。”

原文标题:Computer vision's next breakthrough,作者:Isaac Sacolick

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

相关文章