本次世界人工智能大会上,蚂蚁除了发布多模态医疗大模型及大模型安全一体化解决方案“蚂蚁天镜”2.0版本外,还发布了“银域云”大模型密码计算平台。围绕隐私计算产品通用安全分级和个人信息匿名化体系,蚂蚁联合国内多家产学研机构联合发布了《个人信息匿名化体系白皮书:技术与法律(2024)》《隐私计算产品通用安全分级白皮书》两份白皮书。

与更贴近用户的智能助手相比,隐私计算似乎相对遥远且不为大众所熟悉,但数据因素在蚂蚁集团的未来战略中却扮演着至关重要的角色。

蚂蚁集团董事长兼首席执行官井贤栋在今年的数字中国建设峰会上表示:蚂蚁未来十年的技术战略有两条主线,聚焦人工智能和数据要素,而大模型密码计算平台代表了蚂蚁在数据要素领域最新的商业进展。

今年5月31日,蚂蚁成立蚂蚁机密科技,由蚂蚁集团副总裁、首席技术安全官韦涛担任董事长,传递出一个关键信号——在可信数据流通领域,蚂蚁开始从技术探索走向市场。

按照蚂蚁的愿景,在突破数据孤岛、实现可信数据流通之后,数据要素的流通将彻底改变当前的行业生态,推动密集计算的普及,从智能大模型的发展、AI智慧医疗到农民小额贷款、新能源汽车保险降价等。

今年世界人工智能大会期间,蚂蚁金服董事长韦涛、CEO王磊向观察者网阐述了蚂蚁在密码计算领域的技术探索和商业蓝图。

人工智能短期关注计算能力,长期关注数据

作为近年来最火热的赛道,AIGC的出现让世界首次见证了通用人工智能,这也让很多人享受到了未来AI将如何改变一切的乐趣。然而,AIGC在应用领域还存在不少问题。在本次世界人工智能大会上,有嘉宾就表示:“聪明的AI只能帮忙做些小事,愚蠢的AI却能闹出大麻烦。”AI在垂直行业仍有巨大的发展和提升空间。

对于人工智能的现状和前景,魏涛认为,人工智能目前处于发展初期,但未来前景极其光明。

他表示,人工智能目前的发展,只相当于蒸汽机发明的年代,而蒸汽机作为人类历史上第一种通用动力,在发明之初也十分简陋,这并不是说当初汽车跑不过马车是蒸汽机的本质问题,而是需要进一步迭代升级。

AI行业内也有不少人持类似观点。华为人工智能战略与产业发展副总裁秦尧在人工智能大会“值得信赖的大模型推动产业创新”论坛上也表示,考虑到AI可能有50年的发展过程,目前还处于发展的早期阶段,还有很大的提升和发展空间。

说到升级,“算力恐慌”是去年以来国内厂商绕不开的一个词。对此,魏涛有着不同的看法。

他认为,AI时代由算法、算力、数据三个核心要素构成,三者目前都有进一步发展的空间。相比算法和算力,数据才是限制AI能力上限的关键因素。无论是通用领域还是专业垂直领域,大模型最缺的就是数据。现在的算力恐慌,未来可能会演变成算力陷阱。

魏涛解释称,目前由于成本和性能限制,大型模型在推理层面无法使用非常复杂的算力,所以所谓的算力不足其实是指训练时算力不足。考虑到具体的使用场景,训练所需的算力其实是有上限的,不会无限增加。盲目囤积算力可能会导致过度投入和能耗瓶颈的风险。

相比于可以克服的算力差距,数据差距是所有大型模型公司面临的更为迫切的共同问题。

当没有数据的时候,不管大模型有多聪明,人有多聪明,都无法做出决策,如果要做决策,只能盲目猜测,或者胡乱瞎搞。目前AI不专业的现象,本质上就是数据不足,而这个问题不是算法和算力能够解决的。

在韦涛眼中,现实行业专业应用问题的解决,取决于能否按需获取关键数据供给。中文语料的稀缺导致大模型无论在训练还是推理上都存在很大的数据供给缺口,成为制约大模型进一步发展的瓶颈。

要解决这个问题,最大的挑战是如何让数据,特别是优质数据流动起来,发挥其自身的价值。

打破数据流通壁垒既是挑战也是机遇

其实,我国并不缺少优质数据,但目前的情况是,出于对数据安全、数据隐私等方面的担忧,越有价值的数据,流通起来就越困难。

与美国“重发展、弱监管”、欧盟“强监管、弱发展”模式不同,我国走的是“安全与发展并重”的模式,这也导致充分开发和利用数据面临更大挑战。

要实现数据流通,有很高的信任成本。魏涛说:数据非常容易被复制、拆分、加工、变形。本来你的数据产品应该有一千个、一万个用户,但等你卖给第十家公司的时候,整个行业已经有了。因为非常容易被复制,商业利益也非常容易被侵犯,大家都不愿意让数据流通。更严重的是,明文流通就会泄露,泄露之后很难追踪到底是谁泄露的。这个事件对数据源头来说,导致巨大的连带风险,所以大家都不敢流通。

除了信任成本之外,数据安全风险也不容忽视。

去年5月,三星因一个月内发生3起内部代码泄露事件,全面禁止员工使用该软件。这也给国内企业敲响了警钟。基于大模型是否会利用数据进行二次训练从而泄露核心技术和商业机密的不确定性,大量企业不允许将涉及公司机密和商业信息的内容输入大模型。

数据方对数据安全的担忧并非空穴来风。IBM《2023年数据泄露成本报告》显示,2023年数据泄露的平均成本为445万美元,其中82%涉及云环境。更令人担忧的是,三分之二的数据泄露方甚至对此毫不知情。

除了外部泄密风险外,内部员工导致的公司数据泄露在国内也很常见。近年来,就曾发生某招聘网站员工贩卖简历库信息,造成2500万元损失,某快递公司快递员伙同外部人员泄露用户信息,造成1200万元损失等案件。

北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏表示,过去几年,数据市场面临数据“供给不了、流通不了、用不好”、数据“不敢用、用不了、不好用”和数据“难确权、难定价、难流通”三大难题。在他看来越早知道越好(澳门今晚一肖一码100准)美国重发展,欧洲重安全,中国在人工智能领域如何能两全其美?,在数据分解过程中,这三大难题需要分别利用资源(制度)、技术和商业模式来解决。

针对“数据供给不了、流通不了”,从中央到地方在顶层设计上相继出台了一系列政策,包括《关于加快公共数据开发利用的指导意见》、《关于促进数据流通交易的指导意见》、《“数据要素×”三年行动计划(2024-2026年)》等,都在加速疏通体制机制瓶颈。而根据国家数据局今年在公开官方场合的表态,一系列实施细则和配套规则正在大力推进。

除了政策对数据流动的支持,蓬勃发展的大模型行业对数据尤其是高质量数据的渴求也让蚂蚁看到了商业机会。如果能给数据方一份“安心”,打通数据孤岛,这不仅意味着大模型和整个AI行业的爆发式发展,也意味着蚂蚁在数据要素流通方面的储备技术可以商业化。这也是蚂蚁投入密集计算的机会。

魏涛表示,我们认为数据保密是未来的必然趋势,而保密计算将成为数据可信流通的新型算力。数据只有以保密的方式流通,才能发挥正向价值,控制负向风险。目前太多数据源头不敢把自己的数据拿出来,因为发挥数据价值的过程本身就会产生泄露,而保密研发将以前无法流通的数据流通起来,发挥数据的价值。

7月5日,蚂蚁金服在世界人工智能大会上发布了“银域云”大模型机密计算平台。“银域云”大模型机密计算平台首批推出两项服务,分别是大模型机密托管和大模型机密推理。大模型机密托管是指模型提供方可以将模型加密托管在平台上,一键完成云端机密部署,保护模型资产不被泄露和滥用;大模型机密推理是指以机密形式对数据进行推理,保护用户交互过程中的数据安全和商业秘密。通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理环节实现数据的机密流动,保护模型资产、数据安全和用户隐私。

今天的加密计算就是十年前的云计算。

事实上,针对数据安全的需求,市面上已经出现了不少提供相关服务的隐私计算公司。但纵观行业发展,由于安全成本过高,近年来不仅没有一家公司能凭借其高速发展脱颖而出,整个行业似乎都举步维艰。学术界甚至有传言称“不是隐私计算用不起,只是其他技术更划算”。那么,蚂蚁入局这一赛道的决定,能否给行业带来改变呢?

对此,王磊表示,数据安全是有客观成本的,目前行业客户承受不起、企业亏损不起的局面,是因为隐私计算只能解决小规模的应用,不仅难以形成规模,软件销售模式的高昂交付成本也会给数据安全公司带来巨大的运营压力。

对于蚂蚁机密计算的商业模式,王磊认为,一方面,隐身云平台利用可信芯片与机密计算技术进行协同安全,从而大幅降低成本,实现低成本机密计算,在业界形成规模应用解决方案。

另一方面,蚂蚁机密计算试图通过结果导向、确保安全的方式,减少企业维护数据安全的额外成本,并通过数据利润共享,实现数据方和蚂蚁机密计算的共赢。

对于企业是否有必要购买数据安全服务的问题,魏涛也坦言,并不是所有数据企业都需要数据安全服务,即使需要数据安全服务,对数据安全要求的层次也不尽相同。蚂蚁机密计算计划从高价值场景数据入手,最终实现行业规模化发展。

对于密码计算领域的发展前景,魏涛表达了积极的看法:“十几年前,云计算刚出来的时候,大家都认为只是虚拟化,但真正上云、规模化之后,就发生了根本性的变化。我们认为算力会从智能计算走向密码计算,算力的变化会给整个行业带来巨大的变革。演进的速度和中长期的影响,都比我们今天想象的要大得多。”

蚂蚁机密就目前客户画像和落地场景,也分享了几个实际案例。

在新能源汽车保险领域,由于新能源汽车的驾驶习惯,驾驶人群的属性与传统燃油汽车不同,但保险公司数据不足,无法通过多维度画像覆盖新能源汽车的附加风险保费,最终导致新能源行业度电费低、保费高的现状。通过秘算,保险公司拥有保险数据、平台人的数据、车辆的数据,可以综合起来更精准判断车主出险概率。蚂蚁秘算已与人保财险、平安财险、太平洋财险等多家保险公司合作,已将新能源汽车平均保费降低 8%。

在金融领域,蚂蚁机密举了农户贷的例子,过去由于贷款额度低、尽职调查成本高,农户贷一直是金融机构微利甚至无利的领域,成为金融服务难以覆盖的盲区。

农业农村部大数据发展中心、浙江网商银行、蚂蚁集团联合推出的“农户二贷”服务,基于密码学和星展可信隐私计算技术栈,联合构建金融风控模型,推出农户二贷服务。截至2024年5月初,已有600多万农户获得贷款额度,其中78.3%的农户种植面积在10亩以下,这是过去金融服务难以覆盖的群体。该项目还入选了2024年国家数据局“数据元素x”典型案例。

魏涛对观察者网表示,基于现有的行业实践,他非常看好行业的发展,并认为只需三年时间,加密行业就会进入快速发展阶段。

行业发展不能靠单打独斗

对于产业发展的最终形态,魏涛描述道,数据元产业将从最初像水井一样自产自销的数据孤岛,走​​向“桶装水”式的点对点流通,接下来大规模数据流动将发展成为像“城市自来水网”一样的行业间、区域间信任流通,未来走向更广泛的信任流通,形成综合性的水利工程。大规模模型产业和各类数据元应用场景,可以充分发挥数据元的价值,实现跨行业、跨区域、跨云的信任流通和互联互通。

而要实现这样的商业生态,除了企业层面的技术实力外,行业技术生态和技术体系标准也必不可少。

在实现数据流通的过程中,我们面临的最现实的两个问题就是个人隐私的保护。当数据不再是封闭系统内独立流动,而是互联互通时,如何保护个人信息的隐私成为行业发展的重要议题。

值得注意的是,在本次人工智能大会上,由对外经济贸易大学、大数据技术标准推进委员会、蚂蚁集团联合发布的《个人信息匿名化体系白皮书:技术与法律(2024)》正式发布。这是学术界与产业界首次从技术和法律双重维度,对个人信息匿名化问题进行系统梳理和阐释,并探索可行的技术方案和数据流通解决方案。

在个人信息匿名化制度被提出的同时,如何建立行业标准、推行行业落地也成为行业发展的核心问题。

目前,由于隐私计算的技术路线众多,在产业应用中存在着人们“说不清楚”“看不懂”“不敢用”的情况,隐私计算产品需要一种能够为实际产品选型提供指导的安全分级方法,使隐私计算技术能够在产业中大规模落地。

目前,虽然针对单一技术路线存在一些安全分级标准,但不同技术路线的分级标准完全不兼容,用户无法对所有产品进行横向比较,这些标准也不适用于新兴的技术路线。因此,需要明确一种适用于所有技术路线的普适性安全分级思路,以指导跨域数据流通不同技术的安全评估。

为了解决这一问题,本次人工智能大会上发布了《隐私计算产品通用安全等级保护白皮书》。

白皮书由蚂蚁集团牵头编写,中国通信标准化协会大数据技术标准推进委员会、深圳国家金融科技测评中心、清华大学等16家国内机构参与撰写,撰写指导组成员包括中国科学院院士、国际密码协会会士王小云,浙江大学计算机学院院长、区块链与数据安全国家重点实验室副主任任奎等权威学者。

在本次人工智能大会上,蚂蚁集团董事长井贤栋表示,未来的智能用户体验一定不能只依赖一个大模型,而是需要全行业的深度协作,需要众多专业智能实体的参与,各司其职。蚂蚁坚持走开放的道路,与行业共同构建专业智能实体生态。

对于蚂蚁机密而言,这份白皮书的发布也代表着蚂蚁深度挖掘数据元素赛道、与合作伙伴共建行业生态和行业标准的决心。

蚂蚁集团CTO何正宇曾描述过蚂蚁未来的发展路径,蚂蚁第一个十年专注支付,第二个十年专注金融管家婆必出一肖一码一中一特,第三个十年专注科技,蚂蚁希望未来能成为大众眼中的一家科技公司。

在AI大会上,魏涛描述了他眼中的蚂蚁机密的使命:“蚂蚁集团坚信数据的价值,我们的业务也非常依赖数据。我们认为数据要素的流通会给整个社会、整个行业带来巨大的改变,而且这种改变非常深远。蚂蚁机密的使命是通过机密计算技术,推动数据的可信流通。”

自2016年开始探索隐私计算以来,数据要素已成为蚂蚁集团的核心技术战略,并成立机密计算公司开始商业化。在未来的人工智能时代,蚂蚁不仅要做C端的多模态智能助手,更要做B端的铲子卖家。