在2022亚马逊云科技re:Invent全球大会上的第三天,Swami博士为大家带来了关于“数据与机器学习如何助力企业构建端到端的数据战略”的解读。亚马逊云科技拥有强大的云原生数据能力,用来帮助企业扩展其数据库和数据分析服务,并确保数据安全与数据质量。
1.Amazon Athena for Apache Spark更简易直观的数据分析服务
Swami博士指出,亚马逊云科技推出的Amazon Athena服务以其易用性而广为流行,已有数以万计的客户注册。为了帮助用户以一种更直观的方式来运行复杂的数据分析,让用户将更多的时间用于洞察,而不是等待结果,我们推出Amazon Athena for Apache Spark,这项服务不到1秒钟的时间就可以运行交互式的Spark数据分析应用,它比其他类似的Spark解决方案快75倍。
2.Amazon DocumentDB Elastic Clusters完全托管型解决方案
Swami博士表示,亚马逊云科技为企业提供所需工具来帮助提供可扩展性和处理能力。接下来,他发布了Amazon DocumentDB Elastic Clusters,这是一个完全托管的数据库扩展特性,可以帮助DocumentDB根据流量需求轻松实现上下扩展。它可以在几分钟内弹性扩展工作负载,甚至可以自动管理底层基础设施,降低运维的时间成本。
3.Amazon Redshift Multi-AZ高可用性与高可靠性
Swami博士指出,可靠性和安全性是各企业选取云服务商的关键考虑因素。“你需要采取适当的保障措施。”他强调了亚马逊云科技构建此类安全可靠服务的悠久历史。然而客户总是有着更多需求,尤其是在应用程序和数据库方面。因此,新的Amazon Redshift Multi-AZ功能将有助于为Mission-critical的分析任务工作负载提供高可用性和可靠性。
4.Trusted Language Extensions for PostgreSQL快速集成数据
为了帮助提升PostgreSQL扩展程序的安全性,Swami博士宣布推出Trusted Language Extensions for PostgreSQL服务,这是一个新的开源项目,支持Amazon RDS和Aurora上的PostgreSQL扩展程序。这些语言和延伸可以让你非常安全地把它加入到你数据的基础设施上,同时也可以得到亚马逊云科技的认证。有了这样的解决方案,亚马逊云科技的客户就可以非常快速地集成他们的数据,还可以基于他们核心的数据库来开发应用。亚马逊云科技将会不断地向开源社区做新贡献。
5.Amazon GuardDuty RDS Protection智能化威胁检测,守护数据安全
为了保护RDS数据库的安全,亚马逊云科技还宣布推出Amazon Guard Duty RDS保护解决方案。只要一个点击,Amazon Guard Duty RDS Protection就可以在Amazon Aurora上面运行基于机器学习的智能威胁检测来保护你的数据,这也为企业数据保护提供了基础,让你可以在不同的数据存储位置中把这些连接起来。
6.Amazon Glue Data Quality (Preview)更好地管理数据湖质量
提到数据湖与数据质量,Swami博士表示,保持数据质量需要各种手动创建的数据质量规则。为了更好地帮助客户管理数据湖中的数据质量,Swami博士宣布推出Amazon Glue Data Quality解决方案。
Amazon Glue Data Quality可以进一步萃取数据价值,保证数据治理。每天从数据中自动建立数据质量规则,只需花几个小时的时间就可以产生新鲜的高质量数据,以便客户每天都能做出更明智的关键决策,这项服务可以将人工工作从几天减少到几小时。
7.Centralized Access Controls for Redshift Data Sharing简易且安全的数据访问权限管理
为了简化Redshift数据访问权限管理,Swami博士宣布推出Centralized Access Control for Redshift Data Sharing平台。基于这个平台,你可以非常容易地在内部运行一个集中的数据管理,通过这项服务你可以管理不同的查询,也可以管理获取某一种数据的权限,这也有助于维护数据安全。客户能够在运行权限管理的情况下进入各个不同的数据分布。
8.Amazon Redshift auto-copy from S3简化数据分析与移动
Swami博士指出,客户正在寻找更简单的方法来移动和分析大数据,亚马逊云科技希望做到这一点。Amazon Redshift auto-copy from S3是一个新的自动复制功能,使创建和维护简单的数据接收管道变得更加容易。