2020 Anaconda 数据科学现状报告:从炒作走向成熟

我们每年都会进行一项调查,以评估数据科学社区的脉搏,并更好地了解世界上最受欢迎的职业之一的责任、期望和挑战。今年 2 月 12 日至 4 月 20 日,我们询问了使用数据科学和机器学习工具的个人,以及协助数据科学家工作的个人,并收到了来自 2,360 人的回复。受访者包括数据科学家、研究人员、开发人员、分析师、数据工程师、业务经理等,这表明推动数据科学领域发展的学科和技能组合仍然像以往一样多样化。

数据科学已经过了它的婴儿期,进入了青春期。自 2008 年“数据科学”一词被创造出来以来,我们见证了该领域新工具、应用程序和初创公司的爆炸式增长,导致了一个拥挤的市场,人们很容易沉迷于新事物。然而,我们开始看到这种态度正在发生转变,越来越多的行业参与者表现出对数据科学的能力、局限性和具体价值的更高理解。在各行各业,人们都在努力将数据科学更多地视为一项战略性业务职能,而不是新奇事物或科幻小工具。

要查看 2020 年数据科学现状的完整调查结果,我们邀请您下载报告此处

让数据科学取得成功

数据科学家的作用在不同的组织中表现形式不同。在我们调查的受访数据科学家当中,有 28% 在数据科学卓越中心 (COE) 工作,22% 在研发部门工作,21% 在业务部门工作。很明显,没有一种适合所有人的团队结构方法。

但值得注意的是,团队结构与员工满意度和成功相关。例如,在 IT 部门工作的受访者报告说,他们在展示数据科学影响力方面不如在其他团队结构中工作的同行有效。卓越中心模式通常出现在数据成熟度更高的公司,这种模式与展示的业务价值相关性最强,在 COE 工作的受访者中,超过 70% 的人报告说他们“大多数情况下”或“几乎总是”有效地展示了影响力。

跨职能可见性的必要性

在所有受访者中,我们发现了一些根据角色的不同而对情绪产生显著差异的情况。例如,以开源安全为例。发现业务经理和系统管理员比平均水平更担心管理开源工具中的安全性和漏洞,而研究人员和数据科学家报告的担忧程度最低。鉴于 30% 了解其公司安全实践的受访者表示,他们的公司没有机制来保护其开源数据科学管道,因此重要的是,数据科学团队要从一开始就传达所涉及的风险。观察到的差异表明,需要进一步提高跨职能对每个角色的担忧和挑战的可见性,以便团队齐心协力。

Anaconda 的服务副总裁 Michael Grant 和我在网络研讨会中更深入地讨论了这些主题,并回顾了调查结果。请注册此处,加入我们,倾听我们的讨论。

未来展望

今年,我们首次要求受访者告诉我们他们认为 AI 和机器学习中最大的问题是什么。数据偏差和隐私影响被认为是几乎一半受访者最关心的问题。很明显,与数据偏差和隐私相关的挑战对企业、社会和我们的个人生活都产生了深远的影响,数据专业人员对这些影响的担忧是合理的。

但存在脱节。我们的研究发现,只有一小部分组织实施了解决方案来解决数据偏差 (15%) 或模型可解释性 (19%)。此外,只有 15% 的大学表示他们提供数据科学伦理方面的培训。虽然我们正在考虑数据伦理和偏差的紧迫问题,但我们采取措施解决这些问题的做法之间仍然存在差距。重要的是要继续进行这些对话,并考虑管道的所有方面,从教育到企业监督,在这些方面我们应该密切关注这些问题。

为此,我们的首席执行官 Peter Wang 将与 DiKayo Data 创始人 Danielle Oberdier 坐下来讨论 AI 中的公平性问题。请注册此处,加入我们,倾听讨论。

数据科学家有望站出来,帮助推动其组织的战略转型。工具和角色正在不断发展,我们越来越多地参与有关数据科学如何改善我们生活的对话。我们乐观地认为,数据科学行业正走在开放增长的正确道路上。

与专家交谈

与我们的专家交谈,找到适合您 AI 之旅的解决方案。

与专家交谈