国际新闻

您所在位置:首页 > 国际新闻 > 正文

极验发布全国首个图数据建模平台,“新引擎”助力企业告别AI“马车时代”

文章作者:www.mersingece.com发布时间:2020-01-25浏览次数:1845

2019年7月11日,极地考察主办的图形学习创新大会和图形2019数据建模平台在北京泰富酒店举行。此次会议邀请了203位行业领袖、媒体和嘉宾讨论交流目前最热门的图形神经网络,共同见证了国内首个自主开发的图形数据建模平台的启动时刻。

叠加地图,中国第一个地图数据建模平台

中国需要技术创新

这是一个伟大的工业智能时代。企业的发展与数据联系越来越紧密。标题算法造就了字节跳动的崛起。Deepmind用AlphaGo击败李世石引爆机器智能的无限可能性。阿里和华为分别推出了人工智能芯片,潜在的支持也将带来变化。

实现智慧有很多方法。过去,企业通过深入学习来训练神经网络,但在关系数据挖掘方面仍然缺乏。图形神经网络在关系数据挖掘中具有巨大的潜力,正成为学术界和工业界研究和开发的热点。

人工智能时代是企业成长的关键

从2012年到2018年,人工智能技术仅仅在6年内就带来了巨大的变化。例如,有线电视新闻网的出现使计算机视觉得以突破,刷脸付费,刷脸进入车站,自动驾驶的发展非常迅速。RNN在自然语言处理方面取得了巨大进步。机器翻译和智能助手等应用越来越成熟。

然而,这个世界上产生的数据不仅仅是图像或声音,也是具有特定关系的关系数据。波士顿咨询公司的报告显示,进入互联网时代后,企业产生的数据大幅增加,但只有40%得到了有效利用。

最重要的原因之一是关系数据没有得到有效的使用。数据作为人工智能的燃料,没有得到有效利用,这是企业无法实现增长突破的关键。

graph神经网络的出现将充分发挥关系数据的能量,是企业在人工智能领域竞争的又一次良机。“图形数据建模平台”“如何解决登陆困难”图形神经网络出现得很晚。这是一项相对较新的技术,具有很强的能力,包括适应多种类型数据的能力、学习关系的能力和逻辑推理的能力。这些强大的功能如何应用于商业?实际上很难实现这项技术的落地。

首先,系统是可扩展的。在工业场景中,地图数据达到数千万级。该系统必须具有处理大规模数据的能力。二是GNN模型对分配的高效适应性。如今,大数据的分发已经非常成熟。然而,在处理图形数据时有两个问题。首先是图形数据不容易剪切。二是图形数据库历史悠久。在设计之初,主要考虑的是添加、删除、检查和修改。然而,GNN的分布式建模需要更多地考虑数据特定操作的效率和数据提取的吞吐率。

极其有经验的人花了很多时间测试和研究。经过在实际业务中的探索和思考,发现要解决这一难题,必须从底层调整数据存储方案和运行模式。

定制的技术架构

可扩展性和高效率是系统真正落地的必要条件。在图形数据建模的多年探索中,充分考虑到图形数据建模的特点和困难,开发了一套满足建模要求的底层数据引擎。技术框架:

整个技术框架的核心是中间三层,即存储层、操作层和建模层,它们是根据地图数据的特点定制和开发的。

存储层和操作层称为图形存储引擎,主要完成图形数据的分布式存储和图形数据操作的抽象接口。在该层的设计中,他们围绕图形划分、图形数据的结构设计和存储、整个数据系统的索引设计和优化做了大量的开发工作,以支持上层数据操作的高效率,如随机漫步、子图形采样等。

在模型层,消息传递机制是

在不到20秒的时间内可以映射一百万个节点。对于具有1亿个节点和5亿个边缘的数据,10个工作人员的映射时间仅需150秒。在读取性能方面,测试子图采样的性能。在这个指示器中,时间被极度限制为100毫秒。为了达到这个效率,图形卡将不会有计算延迟的情况。

Products to enterprise

Overlay Graph是首个支持企业级图形数据深度学习的建模平台,为企业提供一站式建模服务。随着SAAS服务模式越来越流行的今天,从事金融、零售和医疗的企业完全没有必要花大力气从底层一步步搭建平台。在这一过程中消耗的资源、人力和时间的成本不可低估。细化分工,让专业人士做专业的事情是我们整个社会不断进步和生产力不断提高的重要前提。

降低企业的应用门槛

Overlay阿特拉斯已成为大规模地图数据的分布式建模能力,提供企业无需专家即可直接使用的网上操作。其次,整个建模过程都固化在平台上,大大降低了后期模型的维护成本。

叠加贴图可用于各种场景。

今天,几乎所有的企业都在发展多种业务。一个主要业务下可能有几个子业务场景。叠加地图可以充分支持企业的多场景需求。

图形数据建模的业务效果非常突出。

今年流行的概念叫做“技术中心站”和“数据中心站”,意思是集中企业的各种业务和场景数据进行数据生产。这是未来两年的大趋势。图形建模可以从数据的相关性入手,将各种数据集成到模型中,这将大大提高业务效果。

应用场景

图形数据是最能描述关系的数据。有许多业务场景可以应用,主要包括两种类型的业务场景:风控制和营销,使整个行业。

风险账户识别

GCN模型已用于识别公众熟知的产品中的风险账户。利用账户、设备、知识产权等数据进行映射,然后将映射输入模型,GCN将学习一些模式,如高密度二分图(如下图所示)。

GCN的AUC指数增加了1.2倍,鲁棒性增加了1.5倍,这是模型在更新周期中的效果。这表明,GCN是健康和可持续对抗的安全方法。

汽车保险反欺诈

图形数据建模也非常适合汽车保险欺诈检测。有许多关于车辆事故的数据,例如关于车辆损坏的数据,包括褶皱、凹痕、裂缝、划痕等。车辆的属性信息,例如,每辆车来自不同的制造商、不同的年份和不同的版本。这些数据之间有非常复杂的关系。例如,当一辆汽车的发动机损坏时,其他部件也经常损坏。

而图表是最能描述这种关系的数据形式。通过构建汽车保险理赔图,利用图神经网络,可以很好地发现在线风险、二手车风险、人身伤害和瓷器、理赔人员问题等风险模型。

在实践过程中,基本上可以提高生产效率一百倍,并实现大量的损失。

企业风险识别

在金融业,实时判断贷款企业的风险,及时调整贷款,降低风险也非常重要。根据企业的舆情信息、相关企业信息、股东信息、产业链信息等构建地图数据,地图计算用于舆情热点分析、企业动态分析和企业贷款政策的及时变更。

人工智能下半年入场券

在现在和未来数据不断膨胀的时候,借助图形数据提升企业的技术实力将是一个重要的解决方案,可以实现行业整体效率的飞跃。

图形计算发展迅速。世界上所有的数据都可以用图形结构来表示。然而,对新技术的研究

“地图”也继续赋予各个行业权力。如金融反欺诈、银行反洗钱、保险反欺诈、企业风控等领域,图形技术的大量应用,在医疗药物开采、图像识别、智能城市等领域的研究也在不断深化;图形技术可广泛应用于挖掘行为异常、构建知识地图、推理节点关系等场景。

技术驱动的开发、需求创造和应用、图形技术领域的许多技术挑战和行业的巨大需求。不幸的是,所有的企业都能意识到“地图”的价值,但不是每个人都能从零开始支付研发的资金、人力和时间成本。重叠地图的出版将为地图生态建设提供关键环节。