数字经济时代,数据成为关键的生产要素。加快数据要素流通,实现跨行业、跨领域的数据共享和应用已成为企业刚需。与此同时,如何运用技术方法在保证数据资产安全、保护个人隐私的前提下,安全合规地使用数据,成为了影响数据价值释放的重要的条件。隐私计算技术可以帮助企业在保障数据和隐私安全的前提下使用数据、挖掘数据价值,已被金融、政府与公共服务、医疗等领域众多用户初步尝试应用,目前正呈现出加快落地的趋势。
为帮企业洞察隐私计算技术的潜在价值,更好地进行隐私计算产品和服务选型,支撑数字化转型,爱分析于6月8日正式对外发布《2022爱分析·隐私计算厂商全景报告》。
金融隐私计算解决方案、政府与公共服务隐私计算解决方案、医疗隐私计算解决方案、隐私计算平台
注:本报告为精简版,扫码下图二维码或左下角“阅读原文”,可下载完整版《2022爱分析·隐私计算厂商全景报告》。
隐私计算,又称隐私保护计算(Privacy-Preserving Computation),是指基于一套融合密码学、信息论、分布式计算、安全硬件、数据科学等多学科技术,能对处于加密或非透明状态的数据来进行计算的技术体系。常见的隐私计算技术包括了多方安全计算、联邦学习、可信执行环境、同态加密、差分隐私等,通过应用隐私计算技术,企业用户能在提供数据隐私保护的前提下,实现数据在流通共享中的“可用不可见”。
在本报告中,爱分析将隐私计算市场分为应用层、平台层和算力层。其中,应用层是指针对金融、政务、医疗、零售、电信、交通等各行业业务场景提供的包含隐私计算产品和服务的应用解决方案;平台层是指用于支撑构建应用解决方案的平台型产品,即隐私计算平台;算力层是指针对隐私计算性能提升提供的各类算力解决方案,包括算法优化、硬件加速等。
综合考虑企业关注度、行业落地进展等因素,爱分析在本次研究中选取了应用层的金融隐私计算解决方案、政府与公共服务隐私计算解决方案、医疗隐私计算解决方案,以及平台层的隐私计算平台,共4个特定市场,进行重点研究。
本报告面向企业和政务机构决策层,以及大数据和AI部门、科学技术创新部门、各业务部门负责人,通过对各特定市场的需求定义和代表厂商的能力解读,为各行业企业和政务机构的隐私计算应用规划与厂商选型提供参考。
爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在隐私计算市场中具备成熟解决方案和落地能力的入选厂商,详见下图。
爱分析对本次隐私计算项目重点研究的特定市场定义如下。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。更多厂商评估详情请扫描下方二维码,获取完整版PDF报告。
定义:金融隐私计算解决方案是指面向银行、保险、证券等金融机构的数据流通场景,实现用户数据可用不可见的隐私计算产品和服务,主要使用在于精准营销、联合风控、反欺诈、合规认证、金融监督管理等场景。
银行、保险、证券等金融机构的大数据部门,科学技术创新部门,风控、营销、信贷、信用卡中心、资管等业务部门
随着银行等金融机构全面拥抱互联网和数字化转型,数据已成为支撑其产品服务创新的核心要素。尽管凭借广泛的客户基础,金融机构已经积累了海量的用户数据,但这一些数据往往存在数据维度单一的问题。为了提供更精准、更多元的金融理财产品和服务,金融机构需要从外部引入更多的用户行为、场景等数据,从而丰富数据维度,延伸应用场景。以往受政策、观念、技术等因素限制,机构之间的数据安全共享难以突破,而隐私计算技术能够在保障数据隐私的前提下,实现数据在机构间安全地流通、共享和应用,正被金融机构广泛关注并开始采用。金融机构对隐私计算解决方案的核心需求包括:
金融领域数据类型丰富,相应地,隐私计算的应用场景也非常多样,并且每家金融机构对于隐私计算应用都存在一定的个性化需求,因此金融机构需要应用多种隐私计算技术,并能以灵活的方式对不同技术方案进行融合。此外,在一些常用场景,如匿踪查询、隐私求交中还需要能快速使用标准化的解决方案。
金融机构的一些业务场景,如信贷审批、交易监控等,需要以很低的时延获得计算结果,以保证客户服务质量,并快速识别风险、降低损失。因此,在此类实时场景中,金融机构需要隐私计算解决方案具备较强的端到端性能。
通过引入第三方数据源和专业机构的建模咨询服务,在特定场景中提升模型效果。
金融机构应用隐私计算的根本在于提升产品服务的业务收益,而实现这一目标的关键是在业务场景中构建更有效的模型,因此,金融机构一方面需要引入合适的第三方数据,丰富样本数据的数据维度,另一方面需要引入专业机构的建模咨询服务,在数据、算法的选择、模型训练、隐私计算工具使用等方面提供专业的指导,从而提升模型效果。
一方面,金融机构希望隐私计算应用能快速落地并产生效果,因此就需要解决方案能以便捷和快速的方式进行部署;另一方面,金融机构通常已经建立了较复杂的业务和IT系统,因此需要隐私计算解决方案能在对原系统改造尽量小的前提下,与原系统集成。
金融数据的敏感性,加上监管机构对于金融数据安全的多重要求,使得金融机构对于隐私计算解决方案在数据安全保护、系统环境、计算流程的可解释性等方面有较高的安全性要求,并要求供应商的产品通过权威测评机构的安全标准测评。
具备多方安全计算、联邦学习等多种隐私计算技术能力,并能以较灵活的方式为用户提供服务。
一方面,厂商需要提供丰富的加密算法的算子库和联邦学习算法组件,允许用户自定义组合实现针对特定应用场景的隐私计算应用,兼顾安全性、性能、精度的不同需求。另一方面,厂商需要提供可直接调用的匿踪查询、隐私求交等应用解决方案,满足金融用户在跨机构数据协作中广泛的数据对齐、ID融合的需求。
由于在实时计算中网络延迟是目前会影响端到端性能的主要因素,因此厂商需要着重对通信效率进行优化,如通过优化流程编排、任务调度,提高算子并行度等方式提升多节点间的通信效率,从而提升性能。
厂商需要建立较广泛的数据资源生态,具备运营商、支付、互联网、政务等领域的数据资源链接能力,为金融机构提供更多的用户行为、场景等数据。此外,厂商还需要与其它厂商建立互通互联协议,方便金融机构跨平台调用第三方数据。
厂商相关团队需要具备金融领域丰富的从业经验,能够为金融机构在模型构建中提供常用的算法,并在数据、算法的选择、模型训练、隐私计算工具使用等方面提供专业建议,为金融机构实现更好的模型效果。
在解决方案部署方面,厂商需要提供敏捷化的部署和交付方式,如平台采用云原生架构,支持容器化的交付方式;以SDK或API的方式提供隐私计算能力,支持用户快速构建隐私计算应用;在与原系统集成方面,厂商需要提供组件化和接口化服务支撑金融机构在隐私计算平台与原系统之间做数据与模型的传输与对接,减少对原系统的改造。
厂商需要通过提供完善的数据加密技术、完善平台系统的安全性设计等方式提高解决方案的安全性;并需要支持算法流程可视化,以及支持接入第三方流量审计工具对数据用途进行验证等方式提高解决方案的可解释性和可信度。同时,厂商的产品需获得权威测评机构的安全标准测试。
洞见科技是由中国最大的信用产业集团“中诚信”孵化、网信事业国家队“中电科”投资的领先的专精型隐私计算技术服务商,专注于为政务、金融、通信等行业客户提供隐私计算技术平台建设以及面向场景的数据智能服务。公司核心成员来自中诚信、大型银行、保险公司以及人工智能企业,具备丰富的行业知识和服务经验。
富数科技成立于2016年,是国内领先的隐私安全计算技术服务商之一,专注于联邦学习、安全多方计算、匿踪查询等加密计算领域,业务场景以金融、运营商、政务为主,并拓展到医疗、司法监管、工业互联等领域。富数科技是隐私计算互联互通协议首个国家标准的牵头单位,深度参与信安标委、金标委、工信部等标准的制定。
锘崴科技成立于2019年, 是一家专注隐私保护计算技术的服务提供商,创始团队来自加州大学圣地亚哥分校UCSD等高校,具备深厚的隐私计算、生物医疗信息等领域的学术和实践经验,团队成员多来自IBM、Google、Thermo等世界五百强企业。锘崴科技开发了一整套自主、安全、可控的隐私保护计算平台产品,业务场景覆盖医疗、金融、保险、政务、安防等。
同盾科技是中国领先的人工智能科技企业,专注于决策智能领域,通过基于人工智能的决策智能平台和基于隐私计算的共享智能平台,聚焦金融风险、安全和政企数字化三大领域,利用公司的算法、工具以及数据生态,帮助客户防范欺诈和安全风险,推动智能化决策进程,提升业务决策的灵活性、敏捷性和准确性。
定义:政府与公共服务隐私计算解决方案是指面向政府与公共服务的数据流通场景,实现用户数据可用不可见的隐私计算产品和服务。主要应用于政务部门各类数据共享和数据对外开放场景。
各地大数据局、数据交易所、委办局等政府和公共服务机构的信息化部门、大数据部门、业务办理部门等
随着数据要素市场化、政企数据融合等政策的相继出台,政府与公共服务等政务机构近年来正积极推动政务数据在不同部门间的内部共享,从而提高政府治理水平和公共服务效能,同时,政务数据进一步的对外开放还可为众多行业企业赋能,提高社会经济效益。由于政务数据包含社保、公积金、税务、交通、水电等多种数据,分散在不同部门,加上政务数据涉及大量公民隐私,管控严格等因素,以往的政务数据流通共享审批手续繁琐,协调非常困难。隐私计算技术能够在保障数据隐私的前提下,实现数据在机构间安全地流通、共享和应用,正被政务机构开始尝试采用。政务部门对隐私计算解决方案的核心需求包括:
目前政务部门对隐私计算应用的主要诉求在于打通多方数据,满足常见业务场景的需求,如统计分析、联合建模、数据查询等,因此政务部门需要使用多方安全计算、联邦学习等技术实现这些应用。此外,政务隐私计算解决方案存在大量业务部门的用户,因此需要在常用场景中可以直接调用已封装好的应用。
政务隐私计算应用通常涉及多个政务部门的数据源,且随着政务数据进一步对外开放,数据应用方也将可能达到数十甚至数百家。因此,政务部门需要在这类场景中保障较高的计算性能。
政务数据通过隐私计算发挥协同价值的前提是数据能够跨部门、跨区域、跨行业充分流通和开放,因此,政务部门需要完善的数据运营体系支撑数据的流通和开放,并通过区块链技术对数据进行确权,实现数据资产化。
政务数据涉及大量公民隐私,政务部门对其管控严格,因此政务部门需要隐私计算解决方案在数据安全保护、系统环境等方面具备很高的安全性。同时,为保证隐私计算核心技术的自主可控,政务部门要求隐私计算解决方案相关软硬件的核心模型实现完全的国产化。此外,政务部门还要求供应商的产品通过了权威测评机构的安全标准测评。
具备多方安全计算、联邦学习、同态加密等多种隐私计算技术能力,并能较低的门槛供业务用户使用。
一方面,厂商需要提供多方安全计算、联邦学习等技术支撑政务部门的统计分析、联合建模、数据查询等应用需求,且厂商尤其需要具备高性能的同态加密技术,以在多参与方的计算场景中提高计算性能,并降低对政务部门业务系统的改造。另一方面,厂商需要为一些政务部门常用的场景,定制隐私计算应用,并以可视化的方式供业务用户调用,或以软硬件一体机的形式提供给用户。
一方面,厂商需要针对联合计算、匿踪查询等场景提升计算性能,包括算法优化、通信优化、硬件加速等多方面的性能优化;另一方面,厂商需要进一步提供多租户管理能力,对计算资源进行切割,提升高并发和多租户模型下的计算性能。
厂商需提供数据流通/共享平台,并以平台为中心构建数据运营服务体系,连接多方的数据源机构和数据应用机构,以支撑各方在平台上完成数据的流通和共享。同时,厂商需要在平台中应用区块链技术,通过对数据、数据处理路径和规则、参与方身份、分配机制等进行上链存证,保障数据流通各环节中数据和参与方的安全可信。
厂商需要通过提供完善的的数据加密技术、完善平台系统的安全性设计等提高解决方案的安全性;同时,厂商需要实现隐私计算相关软硬件核心模型的全部国产化;此外,厂商的产品需获得权威测评机构的安全标准测试。
零数科技成立于2016年8月,是一家具备领先区块链底层技术及深度应用场景的国家高新技术企业。公司旨在通过区块链及隐私计算技术,打造数据价值流通基础设施,确保数据在多主体间可信有序流通和安全高效应用,服务于汽车、金融、政务、双碳、文化等领域深度数字化。
同态科技是一家隐私计算数据保护服务商,基于自主可控的同态加密技术,在政务、金融、军民融合等领域为用户提供数据交换共享及隐私计算数据保护服务,实现数据可用不可见、合规数据标准化、数据应用全流程可控等。
定义:医疗隐私计算解决方案是指针对医疗领域的数据流通场景,实现用户数据可用不可见的隐私计算产品及服务,主要应用于临床诊断、医学研究、医保管理、医药研发、基因分析、疾控管理等场景。
医院各科室,各地卫健委、医保局、疾控中心等医疗机构的大数据部门、科技研发部门,医药企业的药物研发部门等
伴随医疗信息化的持续推进,医疗机构积累了大量医疗数据,通过人工智能和统计分析,这些数据可以被应用在临床诊断、医学研究等众多场景。然而,医疗数据的应用通常需要收集来自不同地区、不同人群的样本数据,并需要包含临床、检验、基因等多种维度。由于单个医疗机构积累的样本数据量通常有限,因此医疗机构需要采用隐私计算技术对不同的数据源进行联合建模或联合计算。医疗机构对隐私计算解决方案的核心需求包括:
医疗隐私计算应用场景多样且复杂,如疾病诊断、医学影像、基因组学、药物靶点发现等,各类场景对于精度、性能和安全性的要求差别较大,因此医疗机构需要应用多种隐私计算技术,并根据需求对不同技术方案进行融合。
医疗数据的类型较复杂,包含各种结构化和非结构化数据,尤其是基因、医学影像等数据的复杂度极高;与此同时,医疗领域的数据处理高度专业化,需要广泛结合医学、生物学、药学等领域的专业知识。因此,医疗机构在处理数据时需要应用多种医疗领域专业的AI模型和统计分析方法。
医疗隐私计算应用场景,如联合多家机构的病例对比,药物有效性研究,经常需要联合十多家甚至更多的参与方。医疗机构因此需要在这类场景中保障较高的计算性能。
一些医疗隐私计算应用场景,如病人用药和疗程规划等,要求计算结果非常精确。因此,医疗机构需要隐私计算解决方案在这类场景中具备很高的模型精度。
医疗隐私计算应用经常会受限于样本数据量,如疾病诊断,单个医院拥有的病例样本量往往有限,因此医疗机构通常需要链接同一区域或同一领域多方的数据源满足模型训练或联合计算要求。
医疗数据涉及大量病患隐私,这些数据的泄漏会造成法律和道德风险,因此医疗机构需要隐私计算解决方案在数据安全保护、系统环境等方面具备很高的安全性。
具备多方安全计算、联邦学习、同态加密、差分隐私、可信执行环境等多种隐私计算技术能力。
厂商需要提供多种密文计算技术,以实现对联合建模或联合计算不同环节的加密,满足安全性要求的同时,兼顾性能和精度;针对医疗行业用户,厂商尤其需要提供基于可信执行环境的解决方案,以在计算复杂度,以及性能、精度和安全性要求都很高的场景中,满足用户需求。
如针对临床诊疗,提供辅助诊断、治疗方案推荐、用药推荐等方面的AI模型;针对医学影像分析,提供病灶识别等AI模型;针对基因分析,提供基因对齐、全基因组关联分析、人口分层等分析方法。
一方面,厂商需要对计算效率、数据压缩、带宽等进行优化,提升多参与方之间的通信效率,从而提升计算性能。另一方面,厂商也可以通过算力网络为用户调度第三方算力资源来提升计算性能。
厂商需要在对计算结果精确度要求很高的场景中提高模型精度,如通过自研联邦学习框架,降低联邦学习模型拆分造成的精度损失。
在特定区域或领域范围建立数据生态,通过数据运营为用户提供丰富的数据资源。
医疗隐私计算应用落地的关键是数据资源,厂商需要在特定区域,如省市级内,或特定领域,如针对某一疾病的研究,联合卫健委、医院、医保局、医药公司等多方建立丰富的数据生态,并提供数据运营服务。
厂商需要通过提供高等级的数据加密技术、完善平台系统的安全性设计等提高解决方案的安全性。并获得权威测评机构的安全标准测试。
锘崴科技成立于2019年, 是一家专注隐私保护计算技术的服务提供商,创始团队来自加州大学圣地亚哥分校UCSD等高校,具备深厚的隐私计算、生物医疗信息等领域的学术和实践经验,团队成员多来自IBM、Google、Thermo等世界五百强企业。锘崴科技开发了一整套自主、安全、可控的隐私保护计算平台产品,业务场景覆盖医疗、金融、保险、政务、安防等。
翼方健数(Basebit.ai)是“数据和计算互联网”的先行者,是一家专注隐私安全计算、人工智能和大数据的高科技公司。翼方健数以隐私安全计算为核心,服务医疗、政务、金融、保险、营销、科学等领域,建设在数据安全和个人隐私保护基础上的数据开放生态和数据共享协作环境,并在此基础上发展人工智能的能力,为行业赋能。
定义:隐私计算平台,是指基于安全多方计算、联邦学习等多种隐私计算技术,在为数据提供隐私保护的前提下,实现数据在流通中可用不可见的平台型工具。隐私计算平台具备通用的隐私计算技术服务能力,能够支撑企业用户构建各类隐私计算应用解决方案。
金融、政务、医疗、零售、电信、交通等各领域企业或机构的IT部门、大数据部门、科技创新部门
随着数据成为各行业企业创新业务、优化运营管理的关键要素,跨组织的数据流通共享成为企业越来越重要的需求。与此同时,《网络安全法》、《数据安全法》、《个人信息保护法》等法律法规的陆续出台,为数据流通增加了诸多合规要求。因此,近年来各行业众多企业和机构都开始关注隐私计算,并希望搭建隐私计算平台,为进一步探索隐私计算的应用场景构建基础设施。企业对于隐私计算平台的核心需求通常包括:
企业潜在应用场景非常广泛,但在平台部署初期这些应用场景往往不够明确。因此,企业需要平台具备较高的通用性,能满足企业未来潜在的多种应用场景和功能需求。
不同隐私计算应用场景的定制化程度存在差异,从调用算子来组合计算流程,到自定义计算流程,其对于用户技术水平要求也不同。因此,企业需要平台具备多种操作方式,灵活满足用户需求。
一方面,企业希望隐私计算应用能快速落地并产生效果,因此要解决方案能以便捷和快速的方式来进行部署;另一方面,很多企业已经建立了较复杂的业务和IT系统,因此就需要隐私计算解决方案能在对原系统改造尽量小的前提下,与原系统集成。
在联合建模、联合统计分析等离线场景中,随着数据规模的增加,以及应用场景的丰富,其计算性能会受到制约;而在联合预测、匿踪查询等实时性要求较高的场景中,随着请求量的增加,计算时延也会逐渐显现。企业需要平台能在这些场景中具备较高的性能。
为保障数据资产安全,以及为满足相关法律法律的要求,企业需要平台在数据安全保护、系统环境、计算流程的可解释性等方面满足较高的安全性要求。
在隐私计算技术方面,平台需要具备联邦学习、多方安全计算等多种隐私计算技术能力,能支撑联合建模、联合统计、隐私求交、匿踪查询等多种应用场景;在系统功能方面,平台需要将系统功能模块化,支持用户根据需求自助增加功能模块,如区块链存证、AI计算、SQL等模块。
一方面,平台需要将多方安全计算、联邦学习等算法拆分为细化的算子,支持用户根据需求以图形化的方式组合算子,构建计算流程;另一方面,平台还需要支持一些用户在定制化程度更高的场景中采用Python和SQL等方式编译计算脚本,自定义计算流程。
在部署方面,除了本地部署模式,平台需要出示敏捷化的部署和交付方式,如平台采用云原生架构,并支持容器化的交付方式;以SDK或API的方式支持用户快速构建隐私计算应用;在与原系统集成方面,平台需要出示组件化和接口化服务支撑隐私计算平台与原系统之间在数据、账号、日志等方面快速对接。
在离线场景中,平台需要支持大规模分布式计算和硬件加速能力,提高计算性能;在实时场景中,平台需要在通信效率上做深度优化,并保证实时计算的稳定性,降低实时计算的时延。
厂商一定要通过提供完善的数据加密技术、完善平台的权限控制等方式提高平台的安全性;并需要支持算法流程可视化,以及支持接入第三方流量审计工具对数据用途做验证等方式提高计算流程的可解释性和可信度。
爱分析厂商全景报告面向数字化市场的甲方用户,由爱分析定期撰写并公开发布,为甲方采购旅程中的数字化规划、厂商选型等环节,提供决策依据和支撑。
报告提供所覆盖领域的数字化市场全景地图、特定市场定义与入选标准,以及入选厂商列表、代表厂商评估等研究成果。
甲方用户都能够依据入选厂商列表,拟定潜在供应商名单,并通过爱分析第三方评估,了解厂商在特定市场的产品服务优势,选择正真适合的厂商进行选型。