2022 数据科学现状

今年,我们进行了数据科学现状调查,以收集有关我们社区的人口统计信息,了解该社区的工作方式,并收集对社区关注的重大问题和趋势的见解。3,493 位来自 133 个国家和地区的个人参与了从 4 月 25 日到 5 月 14 日进行的在线调查。*

我们由此产生的 2022 年数据科学现状报告探讨了数据科学、机器学习和人工智能行业中可操作的问题,例如开源安全、人才困境、道德和偏差等。

*本着民主化数据的精神,我们很高兴通过 Anaconda Nucleus 向公众提供 2022 年数据科学现状调查原始数据

数据专业人员在工作

数据科学家如何分配时间?

数据专业人员将时间花在各种需要多种技术和非技术技能的任务上。受访者表示,他们大约 37.75% 的时间用于数据准备和清理。除了准备和清理数据外,解释结果仍然至关重要。 数据可视化 (12.99%) 和通过报告和演示展示数据的价值 (16.20%) 是使数据可操作并提供关键问题的答案的重要步骤。通过选择、训练和部署使用模型大约占受访者时间的 26.44% (-8.56% 年同比)。

n = 1,966

企业采用开源

您的雇主如何授权您和您的团队为开源做出贡献?

2021 年,65% 的商业受访者表示他们的团队受到鼓励为开源项目做出贡献,而大多数受访者 (54%) 表示他们的雇主通过增加与开源项目开发相关的资金来授权他们为开源做出贡献。

今年,只有 51.99% 的商业受访者表示他们的团队受到鼓励为开源项目做出贡献——年同比下降约 13%,这可能是由于安全问题。大多数受访者 (54.04%) 表示他们的雇主通过增加专门用于为开源项目做出贡献的时间来授权他们为开源做出贡献。

n = 890

数据工作和未来的工作

吸引和留住员工比以往任何时候都更难挑战科技行业。您的组织对人才短缺的潜在影响有多担心?

大多数 (62.51%) 的商业受访者表示,他们的组织至少适度担心人才短缺的潜在影响。只有 10.43% 的受访者表示他们的组织毫不担心。

n = 1,438

重大问题和趋势

您最重视开源技术什么?

尽管开源存在一些挑战,但调查受访者认识到 OSS 的一系列好处,其中可负担性 (20.84%) 和创新速度 (20.54%) 几乎并列为最重视的。

n = 2,154

访问报告

还有更多数据等着您来探索!在我们数据科学现状报告的最后,我们将整合关键要点和反思,数据专业人员不容错过。请填写下面的表格以访问报告。

获取报告