在生成式AI爆火的2023年,数据协作和数据交换的商业价值越来越明显。大模型的训练正需要海量跨领域数据的“投喂”,才能真正创造商业价值涌现的奇迹。而如何在保护数据安全的前提下,有效发挥数据资产的商业价值,成为企业数字化亟需解决的问题。
值2023国庆节期前夕,亚马逊云科技举办了一次数据分析与安全主题交流会。在此次交流会上,亚马逊云科技大中华区产品部总经理陈晓建例举了一个国庆节场景下的创意数据应用,引发了广泛的兴趣。这个应用假设在国庆节期间,某城市政府期望了解来当地旅游的外地游客中,某个年龄范围之内的未婚人口比例,并根据统计结果设计旅游项目。
由于消费者数据隐私保护的要求,即使是城市政府机构也不能直接获取外地游客的隐私数据。要解决这个创意数据问题,可以通过运营商数据了解哪些手机是在国庆节期间漫游到该城市的用户,而这些漫游手机用户的年龄属性和未婚属性数据则属于户籍信息,尽管运营商或城市户籍管理机构都无法把自己的数据交给对方进行交叉分析,但可以将这些数据都存储在Amazon S3公有云存储中,再通过亚马逊云科技提供的Amazon Clean Rooms,就可以轻松实现交叉分析。
Amazon Clean Rooms分析服务能够帮助企业与合作伙伴在互相不暴露原始数据的情况下进行数据协作,也无需在云上移动数据。使用Amazon Clean Rooms,用户可以在几分钟内创建一个安全的数据Clean Room,通过创建协作项目,实现数据的多方协作。AWS Clean Rooms提供了一个密态计算的环境,数据的提供方可以对数据进行预加密,在Clean Rooms 环境中的数据以加密的形态完成数据分析操作,并将分析结果解密后返回。对于数据提供方而言,不仅可以通过数据预加密对数据进行保护,而且因为所有成员都是直接从Amazon S3贡献数据,从而真正实现了只有数据查询和分析而没有数据移动。
对生成式AI基础模型而言,模型训练需要海量的第三方非结构化数据。亚马逊云科技提供的Amazon Data Exchange,可提供来自300多家提供商的3500多种公共数据产品,可以帮助客户轻松查找、订阅和使用所需的各种第三方数据。Amazon Data Exchange与Amazon EMR Serverless等分析服务相结合,可以大幅简化企业生成式AI应用开发方面的数据获取难题,加速生成式AI落地。
Amazon Clean Rooms和Amazon Data Exchange等是亚马逊云科技针在确保数据安全前提下,提供的创造与发挥数据资产商业价值的四大类方案之一。亚马逊云科技围绕业务数据的可识别、可见、可协作和安全数据四大场景,提供创新服务和解决方案,例如:保障数据合规的敏感数据保护解决方案,提升数据可见性的数据治理服务Amazon DataZone,助力多方数据协作的分析服务Amazon Clean Rooms和Amazon Data Exchange,以及对安全日志进行统一管理的安全数据湖服务Amazon Security Lake。
在敏感数据识别和保护方面,亚马逊云科技的一家出海企业客户,由于跨境数据监管的条例,必须要做自身内部业务数据的识别,并且进行跨境数据的传输和管理。该出海企业在不同的国家开展业务,面临着很多语言的识别问题,特别是一些小语种的识别问题,而不同国家和地区对敏感数据的识别和定义也有所不同。该出海企业客户采用敏感数据保护解决方案,开发了一个已经支持200多种数据格式的工具,特别对进入印度和越南等对数据合规要求特别复杂的国家,起到了非常大的作用。
在数据可见方面,伊塔乌联合银行是一个全球化的金融服务公司,他们利用Amazon DataZone的能力来平衡数据访问和治理、合规政策方面的关系。用他们自己的话来讲,“我们很高兴能测试使用Amazon DataZone,因为它能够简化数据治理,使跨业务部门的数据访问变得更容易。借助Amazon DataZone,我们能够快速、轻松地为各种角色、分析师、工程师和科学家团队来设定更加精细合理的访问权限,帮助他们在各个业务场景中实现业务的假设。”
在安全数据方面,IPG是一家全球营销解决方案提供商,他们专注于广告、数字营销、传播计划、媒体公共关系等业务。由于行业的属性,IPG必须要管理来自于各地不同供应商的安全日志,并对其进行分析。使用Amazon Security Lake,IPG可以非常轻松把安全日志集中到一个或者是多个汇总区,并实现了对亚马逊云科技的日志以及第三方来源日志的高度整合。同时,由于Amazon Security Lake使用了Amazon S3,大幅降低了存储的成本。IPG也使用了Amazon Athena进行查询,大幅提升了查询和分析的效率。
陈晓建表示,进入2023年以后,云上的业务越来越复杂,数据规模的扩大带来了数据的协同、可视、可见、安全等挑战,而亚马逊云科技从第一天就把安全作为最高优先级,借助云原生的安全特性和强大的数据分析工具,保障企业用户上云,为数据安全、合规和数据协同保驾护航。
那么,在即将到来的国庆节期间,还有哪些可能的创意数据应用?在亚马逊云科技的数据安全与分析能力加持下,不妨打开想像的空间。(文/宁川)