内容简介

数据运营是指通过数据来分析和解决问题,利用各种数据科学技术挖掘数据价值,帮助企业优化业务管理和提升决策效率。随着我国数字化转型的深入,传统基于项目、人工处理的各类数据运营活动已经无法满足业务发展要求。集合了敏捷开发、精益制造以及DevOps理念的DataOps因此顺势而生,并且受到了业界的广泛关注。

本书总结了作者25年的行业经验和对DataOps的认知,从当前数据科学交付面临哪些挑战、什么是DataOps、通过哪些手段可以建立对数据的信任,以及如何实现DataOps目标和成功实施DataOps几个方面进行了系统的阐述。

本书适合参与数字化转型的各类角色人员学习,尤其有助于数据科学高级管理岗位的专业人士开拓视野、提升领导力。

 

译者序

近年来,数字化转型已经上升到国家战略层面,各行各业都在规划和实施着数字化转型的工作。数字化最重要的特征,就是数据不再仅仅是对业务过程的信息化记录,而是可以从数据中挖掘出更多价值,更好地反哺业务的发展,甚至数据本身也可以成为产品和服务。2020年4月9日,中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》中,已经把数据作为与土地、劳动力、资本、技术并列的重要生产要素。

发挥数据的价值离不开数据运营(Data Operation),数据运营通过数据来分析和解决问题,可以帮助企业优化业务管理、提升决策效率。数据运营的主要过程包括数据的采集、加工、分析和挖掘等各种活动。传统上,这些需求都以项目的方式实施,各个计算活动大部分以人工操作为主,数据在这些活动之间的流动是以批量方式处理的。这种运作方式在早期需求比较少、要求不是很高的情况下,尚能满足业务发展要求。

随着数字化转型的深入,面对数据呈指数级增长,人们对数据运营的要求越来越高,对于数据科学类的需求处理量,以及数据运营的时效有了更高的要求,传统基于项目、基于人工处理的各类数据运营活动已经无法满足业务发展的要求。大多数公司开始在数据科学方面增加投入,期望能有更高的回报,但是往往事与愿违。业界开始反思并借鉴IT软件开发及其他行业里的一些成功经验。DataOps作为一个专有名词应运而生,它融合了敏捷开发、精益制造以及DevOps(开发运维一体化)等多种理念,受到了国内外业界的广泛关注,并得到了快速发展。

本书作者哈文德·阿特瓦尔是一名经验丰富的数据专家,他不仅对算法十分感兴趣,还对从数据中获取价值所需的人员、流程和技术□革非常关注,对包括数据采集、数据管理、数据治理、云和内部数据平台管理、数据工程、商业智能、产品分析和数据科学的全生命周期管理工作十分熟悉。DataOps作为一个新的术语,其代表的内涵在业界还没有得到统一的认识。本书总结了作者25年的行业经验和对DataOps的认知,希望通过本书的翻译引进,对中国读者理解和发展DataOps的理念提供一些帮助。

本书不是一本纯粹的技术书籍,作者写作的视角也相当开阔,涉及敏捷开发、精益制造、开发运维一体化等多层次的管理和知识领域,对从业者深入理解DataOps概念大有裨益。多位具有国际数据管理专业CDMP认证的同仁一起参与了翻译和校对工作,翻译组多次组织会议讨论斟酌。为了力求翻译准确,中国信通院DataOps数据研发运营一体化能力成熟度模型标准编写组的多位专家也参与了本书的校对工作,并提出了宝贵的意见,他们是骆阳、符山、付威、李乌英嘎、朱红伟、李成强、李林洋、巫雪辉、于鹏、沈浩、杜文健、王溧、项子林、王项□、谭晟中、付云攀、张亮、姜春宇、尹正等,在此对所有参与翻译和校对的同仁表示由衷的感谢。

本书存在大量跨领域的内容,由于译者能力和认识有限,尽管进行了多轮的校对检查,书中可能还是存在瑕疵和不足,此外,关于书名中的DataOps、敏捷的术语Epic等词汇是否需要翻译,各位译校者也有不同意见。望各位读者可以通过读者群向我们反馈您的见解或给予指正,共同促进DataOps的理念得到更好的实践和发展,一起为我国数字化转型贡献绵薄之力!

DataOps实践手册