在去年的数据科学现状报告中,我们探讨了数据科学领域如何从炒作走向成熟。一个早在 2012 年就被誉为“21 世纪最性感的工作”的职业,在随后的几年里发现自己处于炒作泡沫的中心,这或许是不可避免的。但正如去年的数据科学现状报告所显示,数据科学家及其所在组织已经找到了有效的合作方式来创造真实、可衡量的价值。通过这样做,该领域已经从一个闪亮的新事物(备受渴望但并非总是有效利用)转变为企业决策基础设施的关键组成部分。
在 2020 年全年向我们介绍的众多新概念中,其中之一是“必要工作者”的概念。哪些工作或角色对于企业的运作至关重要,以至于公司没有它们就无法运营? “必要性”的概念提供了一个有用的框架,用于考虑数据科学与组织最重要的运营的整合程度。
在人们猜测 COVID-19 疫情(以及由此产生的经济挑战)是否会抑制过去几年一直火热的数据科学领域的需求之际,Anaconda 向 2021 年数据科学现状调查的受访者询问了他们所看到的影响。 50% 的受访者表示,由于疫情,他们组织在数据科学方面的投资保持不变或增加,而 37% 的受访者表示他们看到投资减少。 对于那些在此期间看到投资增加的受访者,其表现形式包括数据科学预算增加、积极招聘以及额外项目或加快项目时间表。 这反映了我们在自己的 Anaconda 使用数据中看到的趋势,在 2020 年 3 月至 2021 年 2 月期间,我们看到了 46 亿次软件包下载,比上一年增长了 48%。
过去一年中,一半的受访者看到其组织在数据科学方面的投资保持稳定或增加,这一事实表明数据科学在商业环境中展现了真正的价值。 今年的数据科学现状调查进一步反映了这一点,其中 53% 的受访者表示,他们组织中的许多或所有业务决策都是基于其数据科学家解释的见解。
这些结果表明,数据科学正变得对组织“不可或缺”,但也表明该领域仍有增长空间。 毕竟,37% 的受访者表示,由于疫情,他们的组织减少了在数据科学方面的投资。 一些公司可能需要在过去一年艰难的经济环境下全面削减开支。 但是,在可能避免削减开支的领域,哪些因素可以帮助解释为什么数据科学是一个投资减少的领域?
一个可能的解释是,这些组织在业务团队和数据科学团队之间仍然存在很大的沟通和理解差距,从而降低了数据科学家工作的效率。 例如,当被问及限制他们影响业务决策能力的因素时,33% 的受访者指出业务重点快速转移,25% 的受访者指出其组织的决策者在数据素养方面存在困难,11% 的受访者表示,他们受到无法证明业务影响这一事实的限制。 25% 的受访者指出,有效分析的资源不足是根本原因,这表面上看起来可能不相关。 然而,即使是这一点也表明,业务领导者和数据科学领导者在理解什么是足够的工具方面存在差距。
根据报告的调查结果,双方似乎都需要努力弥合这一差距并更有效地协作。 从业务角度来看,领导者应投入时间提高他们的数据素养,以更好地了解其组织的数据科学家的角色和工作。 在今年的数据科学现状报告中,只有 36% 的受访者表示,他们组织的决策者非常具备数据素养,并且理解可视化和模型所讲述的故事。 令人鼓舞的是,52% 的受访者表示,他们组织的决策者主要具备数据素养,但在可视化和模型所讲述的故事方面需要一些指导。 尽管如此,该领域仍有进一步增长的空间,这将使整个企业受益。
从另一个角度来看,数据科学家也应努力提高他们对业务和任何相关领域知识的理解,以便更高效、更成功地运营。 当被问及“贵组织的数据科学/ML 领域缺少哪些重要技能和知识”时,今年调查中近四分之一的受访者列出了“业务知识”。 在关于数据科学专业的学生在学校学习什么的问题中,“业务知识”的排名也相对较低。 沟通技巧是另一个需要改进的领域,22% 的受访者表示,他们组织的数据科学/ML 领域缺少沟通技巧——数据科学家必须学会成为优秀的讲故事者,能够以清晰且引人入胜的方式解释他们的发现。 培养这些软技能将帮助数据科学家对其组织产生积极影响,并成为日常运营中“不可或缺”的一部分。 与 2020 年相比,今年调查中 Z 世代受访者的数量增加了 15%,这为更有效地将这些技能融入教育课程提供了明确的机会,从而使学生能够更好地为作为专业人士进入该领域做好准备。 然而,更有经验的数据科学家也应投入时间进一步发展软技能,作为他们持续职业发展的一部分。
成为数据科学社区的一份子,现在是前所未有的激动人心的时刻,我们深受鼓舞,将继续尽我们的一份力量,帮助 Anaconda 的各行各业的数据科学家进步和获得支持。 虽然仍有潜力待挖掘,但很明显,数据科学家正在成为其组织不可或缺的组成部分,提供业务价值,并将该领域推向新的发展领域。 我们迫不及待地想看到未来一年中出现的趋势和变化!
要查看完整的《2021 年数据科学现状报告》,包括关于数据科学家如何分配时间、哪些编程语言最受欢迎以及当今从业者关注的问题的调查结果,请点击此处。