无论是企业还是美国政府,拥有 C 级数据领导者都是宝贵的
随着越来越多的企业认识到数据驱动决策的价值,我们看到了 C 级数据领导职位(如“首席数据官”(CDO)或“首席数据科学家”)的增加。在某种程度上,这些角色的范围比 CTO 或 CIO 窄,专注于数据相关活动,而不是企业整体的技术使用。另一方面,CDO 角色以独特的方式将技术和业务战略联系在一起,因为该领导者负责公司如何使用数据来做出所有决策。此外,CDO 的工作涵盖了多个汇报线,处理从数据管理的法律方面(如 GDPR)到将算法结果置于情境中所需的领域特定知识。这种特定但范围广泛的范围是许多企业选择将一个不同的 CDO 角色区分开来,而不是将职责整合到现有技术或业务领导者之下的部分原因。
随着企业发展壮大并变得更加复杂,将数据管理监督整合到像 CDO 这样的专用领导者之下越来越有意义,他们可以定义公司的“数据战略”并确保其正确执行。公司的具体需求和规模将决定确切的职位名称——首席数据官、首席数据科学家、首席数据分析师等——但高级目标和职责将保持一致。对于非常大或复杂的组织,甚至可能需要让负责数据程序各个要素的几名高管向 CDO 报告,例如拥有首席数据科学家和首席数据合规官。
例如,2015 年,美国政府设立了白宫科学技术政策办公室的美国首席数据科学家职位,作为更大的 OSTP CTO 团队的一部分工作。他们选择 Dr. DJ Patil 担任该职位,负责帮助“负责任地最大化国家对其数据投资的回报”,以及其他任务。他关注的具体领域包括关于警务实践和精准医疗的数据。虽然美国首席数据科学家的范围当然比单个企业需要的范围更广,但他们可以进行的项目类型是相似的。
首席数据科学家的角色
首先,这包括使用数据驱动决策来创造更好的结果。作为这项工作的一部分,首席数据科学家必须教育决策者将算法结果与人类理解相结合,以创造数据增强决策。有时,人们认为将数据纳入决策过程将意味着完全自动化的,“设置并忘记”的规则制定。但是,组织的数据科学领导者可以为将人类知识和直觉与算法相结合铺平道路,以做出最关键的选择。
首席数据科学家的角色还包括确保他们的组织进行负责任的数据科学和机器学习,包括在必要时引入来自学术界、商业领袖和其他公共政策制定者的观点。我们经常谈论的是,对所面临问题的领域知识——而不仅仅是统计学和建模方面的专业知识——对于数据科学家出色完成工作至关重要。同样,首席数据科学家应该与社会科学、法律和伦理等其他领域专家建立联系,以确保他们的组织正在制定数据科学和机器学习政策,这些政策将为每个人创造负责任的成功。
数据科学家和机器学习工程师经常转向开源工具来完成他们的工作。在我们2020 年数据科学现状报告中,49% 的数据科学家和 66% 的开发人员表示,“创新速度”或“最适合我需求的工具”是他们对开源软件最重视的方面。开源软件在经过深思熟虑地使用后,可以成为组织的宝贵资产,包括安全问题以及如何可持续支持社区的考虑因素。鉴于开源软件在数据科学工作流程中发挥着重要作用,首席数据科学家应该与其他高管合作,确保他们的组织是开源数据科学社区的真诚参与者和管理者。
在大型组织(如美国政府或主要企业)中,首席数据科学家还在企业如何参与开放数据交换中发挥作用。无论是故意使用用于训练组织算法的公共数据集(提出诸如“这些数据来自哪里?”和“可能存在哪些偏差?”之类的问题),还是找到安全地将他们的数据开放给其他人的方法。首席数据主管可以帮助在开放数据运动中绘制一条成功的道路。
使 C 级数据领导者最适合您的组织
并非每个公司都已准备好拥有专门的首席数据科学家;有些公司可能需要将这些特定职责整合到更广泛的 CDO 职位中,而另一些公司可能需要将 CIO 或 CTO 时间的一部分专门用于数据问题。但每个公司都应该至少有一位高级领导者负责确保组织从其数据中获得战略价值,并对其进行道德和合法的管理。数据科学和机器学习可以为组织解锁巨大的好处,但前提是这些举措必须以负责任和周到的方式处理。这就是为什么 C 级数据角色数量不断增加的趋势将继续下去。
如果您已经建立了数据领导团队,但希望更好地了解如何组织其支持人员,请务必查看我们关于如何构建数据科学团队以取得成功的白皮书。