每年,我们都会进行一项调查,以评估数据科学界的脉搏,并更好地了解世界上最受欢迎的职业之一的职责、期望和挑战。在今年的 2 月 12 日至 4 月 20 日期间,我们询问了使用数据科学和机器学习工具的个人,以及协助数据科学家工作的人员,共收到 2,360 人的回复。受访者包括数据科学家、研究人员、开发人员、分析师、数据工程师、业务经理等,这表明推动数据科学领域发展的学科和技能组合仍然像以往一样多样化。
数据科学已经超越了婴儿期,进入了青春期。自从“数据科学”一词在 2008 年被创造出来以来,我们目睹了该领域新工具、应用程序和初创公司的爆炸式增长,导致竞争激烈的局面,人们很容易被闪亮的新事物所吸引。然而,我们开始看到这种态度的转变,越来越多的行业参与者表现出对数据科学的能力、局限性和具体价值的更高理解。在各个行业中,人们都在推动将数据科学更多地视为一种战略业务职能,而不是一种新奇事物或科幻小工具。
要查看关于 2020 年数据科学现状的完整调查结果,我们邀请您此处下载报告。
为数据科学的成功做好准备
数据科学家的角色在不同组织中以不同的方式体现。在回复我们调查的数据科学家中,28% 在数据科学卓越中心 (COE) 工作,22% 在研发部门工作,21% 在业务部门工作。显然,团队结构没有一刀切的方法。
但值得注意的是,团队结构与员工满意度和成功相关。例如,在 IT 部门工作的受访者表示,与在其他团队结构中工作的同行相比,他们在展示数据科学的影响方面效果较差。卓越中心模式通常在数据成熟度较高的公司中发现,它成为与已证明的商业价值最密切相关的一种方法,超过 70% 在 COE 工作的受访者表示,他们在展示影响方面“大部分时间”或“几乎总是”有效。
对跨职能可见性的需求
在调查受访者中,我们发现有几个例子表明,基于角色的情绪存在显着差异。以开源安全性为例。业务经理和系统管理员比一般人更担心管理开源工具中的安全性和漏洞,而研究人员和数据科学家报告的担忧程度最低。鉴于 30% 了解公司安全实践的受访者表示,他们的公司没有任何机制来保护其开源数据科学管道,因此数据科学团队从一开始就沟通所涉及的风险非常重要。观察到的差异表明,有机会进一步提高对每个角色担忧和挑战的跨职能可见性,以便团队能够齐心协力。
Anaconda 服务副总裁 Michael Grant 和我将在一个网络研讨会中讨论这些主题,更深入地回顾调查结果。加入我们,通过此处注册来收听我们的讨论。
未来展望
今年,我们首次要求受访者告诉我们他们认为人工智能和机器学习中最大的问题是什么。数据偏差和隐私影响被近一半的受访者评为首要考虑因素。很明显,与数据偏差和隐私相关的挑战正在对企业、社会和我们的个人生活产生深远的影响,数据专业人士理所当然地对这些影响感到担忧。
但存在脱节。我们的研究发现,只有少数组织实施了解决方案来解决数据偏差 (15%) 或模型可解释性 (19%)。此外,只有 15% 的大学表示他们为数据科学提供伦理方面的培训。虽然我们正在思考数据伦理和偏差的紧迫问题,但在我们采取措施解决这些问题的方式上仍然存在差距。重要的是继续进行这些对话,并考虑从教育到企业监督的整个流程的各个方面,我们应该密切关注这些问题。
为此,我们的首席执行官 Peter Wang 将与 DiKayo Data 的创始人 Danielle Oberdier 坐下来讨论人工智能的公平性。加入我们,通过此处注册来参与讨论。
数据科学家已准备好挺身而出,帮助推动其组织中的战略转型。工具和角色正在不断发展,我们越来越多地参与关于数据科学如何改善我们生活的对话。我们乐观地认为,数据科学行业正朝着开放增长的正确方向发展。