内容简介
机器学习大数据平台的构建、任务实现与数据治理
你需要构建安全、稳定的数据平台,需要可以扩展到任何规模的工作负载。当项目从实验室进入生产环境时,你需要确信它可以应对现实工作中的挑战。本书能够帮助你实现这些需求,将讲述如何设计和实现基于云的、可以轻松监控、扩展和修改的数据基础设施。
通过本书,你将学到构建和维护大型企业大数据平台所需的技能。书中包括设置基础设施、编排、工作负载和治理,写作风格清晰、实用。在学习过程中,你将建立高效的机器学习管道,然后掌握省时的自动化和DevOps解决方案。书中基于Azure的示例很容易在其他云平台上实现。
编辑推荐
主要内容
● 数据字典和数据治理
● 数据质量管控、合规和分发
● 构建自动化管道以提高可靠性
● 数据摄取、存储和分发
● 支持生产环境中的数据建模、分析和机器学习
图书评价
◆◆◆◆◆ 有志于研究Azure数据平台和数据工程?本书将助你腾飞!
——valiant2ex
我目前从事与Azure和Azure数据工厂相关的工作。入职之初,我对这些知识一无所知。本书从数据工程的角度剖析Azure生态系统,使我的技术飞速提升。本书示例丰富,在学习之旅中,我备感愉悦轻松。
Azure是浩瀚的知识海洋,本书就像一盏明灯,将我们引向成功的彼岸。有本书在手,数据工程解决方案学习曲线将变得十分平缓。
◆◆◆◆◆ 关于Azure数据工程的重量级好书。
——Rodrigo de Moura Leite Proenca
我是一名从事数据工程工作的新软件工程师,此前曾读过另一本指南书籍。但遇到这本更好的书,我顿感眼前一亮,相见恨晚!本书知识内涵丰富,极具价值,不仅呈现理论概念,而且列举实例,帮助读者加深理解这些概念。
本书还提供一个GitHub Repo来帮助运行命令,可帮你省下大量时间!还有很棒的图表,让你更直观、更全面、更透彻地理解技术原理。