2022 数据科学现状

今年,我们开展了数据科学现状调查,以收集有关社区的人口统计信息,了解社区的工作方式,并收集对社区最关心的重大问题和趋势的见解。3,493 位来自 133 个国家和地区的个人参与了 4 月 25 日至 5 月 14 日进行的在线调查。*

我们由此得出的 2022 数据科学现状报告着眼于数据科学、机器学习和人工智能行业内的可行问题,例如开源安全、人才困境、道德与偏差等等。

*本着民主化数据的精神,我们很高兴将 2022 数据科学现状调查的 原始数据 通过 Anaconda Nucleus 公开提供给公众。

数据专业人员的工作

数据科学家如何安排时间?

数据专业人员将时间花在各种需要不同技术和非技术技能的任务上。受访者表示,他们大约 37.75% 的时间花在数据准备和清理上。除了准备和清理数据外,解释结果仍然至关重要。 数据可视化 (12.99%) 和通过报告和演示展示数据的价值 (16.20%) 是使数据可行并为关键问题提供答案的必要步骤。通过选择、训练和部署使用模型大约占受访者时间的 26.44% (-8.56% 年同比)。

n = 1,966

企业采用开源

您的雇主如何赋予您和您的团队为开源做出贡献的能力?

在 2021 年,65% 的商业受访者表示,他们的团队被鼓励为开源项目做出贡献,其中大多数受访者 (54%) 表示,他们的雇主通过增加与开源项目开发相关的资金来赋予他们为开源做出贡献的能力。

今年,只有 51.99% 的商业受访者表示,他们的团队被鼓励为开源项目做出贡献——年同比下降约 13%,这可能是由于安全问题所致。这些受访者中的大多数 (54.04%) 表示,他们的雇主通过为他们提供更多时间来参与开源项目开发,来赋予他们为开源做出贡献的能力。

n = 890

数据工作和未来工作

吸引和留住员工比以往任何时候都更具挑战性。您的组织对人才短缺的潜在影响有多担心?

大多数 (62.51%) 商业受访者表示,他们的组织至少对人才短缺的潜在影响感到相当担心。只有 10.43% 的受访者表示,他们的组织对此毫无担心。

n = 1,438

重大问题和趋势

您最看重开源技术的什么?

尽管与开源相关的挑战,调查受访者仍然认识到开源的多种优势,其中可负担性 (20.84%) 和创新速度 (20.54%) 几乎并列为最受重视的优势。

n = 2,154

获取报告

还有大量数据来自此处!在我们数据科学现状报告的最后,我们汇总了数据专业人士不容错过的主要要点和反思。请填写下面的表格以获取报告。

获取报告