2021 年数据科学现状报告探讨了数据科学作为一项领域的发展趋势,商业环境和学术机构的采用总体趋势,以及学生如何为未来做好准备。
今年的在线调查共收到来自 140 多个国家的 4,200 多名使用数据科学和机器学习工具的个人回复。
疫情对数据科学的影响
COVID-19 疫情是否影响了贵组织对数据科学的投资?
COVID-19 疫情产生了连锁反应,影响了几乎所有行业,从医疗保健到政府、金融机构等等,他们都需要找到方法,快速利用数据并找到解决新问题的方法。此外,当被问及他们在商业决策中的作用时,14% 的受访者表示“所有”决策都依赖于他们或他们团队解释的见解,39% 的受访者表示“许多”商业决策都依赖于他们。虽然我们仍然需要努力确保将数据科学家纳入决策流程,但看到他们的价值在组织中得到认可,这令人鼓舞,这可能是数据科学领域投资没有大幅下降的原因。
数据工作和未来工作
您对数据科学中自动化或 AutoML(将机器学习应用于现实世界问题的任务自动化过程)有何看法?
当今新闻中一个常见的主题是自动化正在接管,最终将取代人类工人。然而,结果表明,自动化在数据科学领域受到欢迎,不被视为竞争对手,而是从业者的补充工具。
企业采用开源
您的雇主是否鼓励您和您的团队为开源项目做出贡献?
使用和贡献开源软件(Python/R 库,如 pandas、NumPy 等)是创新型组织的关键区别因素。通过使用开源软件,组织可以节省大量的时间和资源。
Python 的流行度
您使用以下语言的频率如何?
63% 的受访者表示他们经常或总是使用 Python,使其成为今年调查中包含的最流行的语言。此外,71% 的教育工作者正在教授 Python,88% 的学生报告称他们在准备进入数据科学/ML 领域时接受过 Python 的教学。
展望未来
为了迎接该领域的下一个发展,我们概述了企业需要关注的主题。
随着数据角色在企业内部不断增长和扩展,了解数据专业人员的日常工作、成功所需的工具和语言,以及组织如何确保数据素养以充分利用其以数据为中心的团队至关重要。除了回答有关偏差、可解释性、自动化等热门问题的疑问外,这份报告还分享了企业采用机会、大学的重点领域,以及个人如何为该领域的职业做好准备。