深度学习与工业场景之间的“语义鸿沟”及相应创新举措

(ChinaIT.com讯)2012年,神经网络之父Geoffrey Hinton的学生Alex Krizhevsky,通过改进的LeNet在视觉领域竞赛ILSVRC 2012中摘下桂冠。在百万量级的ImageNet数据集合上,改进的LeNet效果大幅度超过传统方法,从此引爆深度学习在各个场景中的应用。

此后,Google、Facebook和NVIDIA等强ToC背景企业,逐步引领深度学习在ToC 领域落地实施并率先取得成功。深度学习在购物推荐、广告推荐、路径规划和喜好挖掘等领域得到广泛应用,更通过植入到手机等终端设备的方式走到每个人身边。

 

既然深度学习性能这么好,能不能把它应用在工业场景,重复、有效、可靠地解决问题?应用在瑕疵检测、缺陷分级和根因分析上?如果简单的把它移植过来,会出现哪些鸿沟和问题?

第一个鸿沟:深度学习平台

大家熟知的AI头部公司多有自己的深度学习平台,包含整合的算力、存储、数据、数据标注、模型训练和模型部署等功能。这类平台只适合于具有少高效应(项目数量少、样本量大且算力需求大)的公司,比如互联网企业。而工业场景中的项目却以长尾效应(项目数量多、样本量小且算力需求小)为主,如工业质检行业。云模式是否适用于工业质检行业?将花费高代价整合出来的算力和存储根据项目分割,是否是最优选择?

第二个鸿沟:预训练

做工业质检时,即使在算法层面上开发相应的框架形成自己的平台,最常用的基本上还是一些非常顶尖的ToC企业发布的框架网络,如ImageNet的预训练权重。但在实践过程中我们发现,虽然ImageNet的图片和工业图片之间的鸿沟非常大,但仍然可以提升模型的性能。这样就引出了第二个鸿沟,是不是可以有属于自己、图片完全来源于工业领域的预训练模型?

第三个鸿沟:小样本

在工业人工智能领域,随着产品良率和产能的提升,缺陷瑕疵的数量必然会越来越少,深度学习在工业中的使用场景会逐渐收敛为小样本的场景,小样本深度学习未来是工业人工智能核心。2018年之后,出现了很多小样本相关的论文,但不难发现,这些顶尖的小样本深度学习算法并不是为工业量身打造,将学术界提出的小样本识别方法直接应用在工业中,往往是不能立刻见效的。

 

深度学习有三个很重要的因素,即平台、数据和算法。凌云光大胆创新,提出了全新的深度学习平台、数据预训练及改进算法,从而使深度学习契合工业界的发展和需求。

建立统一规格的多维度深度学习平台

凌云光深度学习平台包含三个维度,分别是超轻型的深度学习的平台、服务器的深度学习平台、云端的深度学习平台。超轻型深度学习平台针对的是边端保密项目,这类项目往往数量少,边端无法联网,这种情况下,超轻型的便携式深度学习算力平台就十分有优势。对于各个边端可以进行联网互联,数据量在服务器算力承受范围之内的产线级客户来说,服务器的深度学习平台才是最佳选择。而针对数据量大,没有保密需求的客户,需要云级别的算力,则可以使用云端的算力平台。凌云光以多维度算力平台,满足不同的客户需求,提升客户服务能力。

数据层

充分利用扎根工业领域多年的优势,凌云光收集大量的缺陷样本数据,并对样本进行清洗和标注,形成数据资源。此外,还对过往样本的缺陷和根因也进行标注,便于在未来进行数据挖掘和根因分析,从而从根本上提高工厂的检测效率,进而提高工厂产品良率。

算法层

凌云光深度剖析开源深度学习算法,构建属于工业人工智能深度学习的顶尖算法研究方向,包括小样本、超低耗时的模型研发等。比如在印刷质量检测领域,幅宽一米的印刷品,速度要达到120米/分钟,常规的深度学习模型是行不通的。此外,我们还深入研究了深度预适应算法、Open Set Learning、零样本学习方法、细粒度图像的分类方法、工业的知识图谱等。

小结

小样本深度学习未来会成为一个体系,会有多种多样的方法。例如:可以使用模型微调的方法、数据增强的方法、迁移学习的方法等。凌云光正在研发的下一代真正适用于工业的小样本深度学习就融合了这些方法。

回顾工业人工智能的发展过程不难发现,直接套用已有的国外的开源模型,很难满足实际需求,在前人的基础上,必须有所创新,去适应工业中的小而多的应用场景。我们在工业人工智能领域,不要成为旁观者,必须通过自主研发,成为行业参与者、引领者,进而构建真正的智慧工厂。

ChinaIT.com 网站文章仅限于提供更多信息,不代表本网站立场观点。如需转载,请注明来源 。转载之文章来源于互联网,如有版权问题,请与我们联系:content@chinait.com。

扫码关注ChinaIT小程序,随时掌握最新IT资讯