2020 数据科学现状
从炒作走向成熟
好消息是,围绕数据科学和机器学习的炒作正在让位于现实。但坏消息是,在我们实现成熟之前还有很长的路要走。企业、学者和数据专业人士需要做很多工作,才能让这一学科真正实现其在商业和社会中的潜力。
我们的 2020 数据科学现状报告对此进行了深入探讨。
数据科学的面貌
今年的调查,我们招募了使用数据科学和机器学习工具的个人,以及协助数据科学家工作的个人,共收到来自 100 多个国家的 2,360 份回复。受访者包括数据科学家、研究人员、开发人员、分析师、数据工程师、业务经理等,这表明推动数据科学领域发展的学科和技能组合依然多样。
虽然企业已在各种功能中采用开源工具,但它们的安全性措施并不总是跟得上。令人担忧的是,30% 了解其公司安全实践的受访者表示,他们的组织没有建立任何机制来保护用于数据科学和机器学习的开源工具。
您如何确保用于数据科学和机器学习的开源软件包符合企业安全标准
虽然 COVID-19 给就业市场带来了不确定性,但企业仍应关注数据科学家的工作满意度。三分之一的数据专业人士报告称,他们计划在未来 12 个月内寻找新的职位,另外 24% 的人预计在未来三年内跳槽。
您计划在目前的雇主工作多久?
效率差距
将数据科学成果投入生产,使其能够影响业务,并不总是直截了当。受访者报告称,平均而言,他们有 45% 的时间花在准备数据(加载和清理)上,然后才能使用它来开发模型和可视化。一旦他们的模型准备就绪投入生产,他们必须应对无数环境、依赖项,甚至技能差距,才能让模型问世。
考虑到您目前的工作,您在以下每项任务上花费了多少时间?
也许是由于这些生产问题,不到一半(48%)的受访者认为他们可以证明数据科学对业务成果的影响。
您认为您的团队在证明数据科学对贵公司业务成果的影响方面有多有效?
重大问题
数据专业人士担心偏差和隐私问题,近一半的受访者认为这两个主题是“当今人工智能/机器学习领域需要解决的最大问题”。但令人担忧的是,只有 15% 的受访者表示他们的团队目前正在积极解决偏差问题,只有 15% 的大学开设了伦理课程。
您认为当今人工智能/机器学习领域需要解决的最大问题是什么?
展望未来
如今,数据科学学科仍在寻找自己的身份,但走向成熟的旅程仍在继续。我们预计,未来 2-3 年将继续数据科学走向成熟的轨迹,使其成为更广泛的行业中的战略性业务功能,但在此过程中,机构和企业将面临持续的成长烦恼。
详细了解数据科学从业人员和领导者如何帮助确保该学科充分发挥其潜力,从而改善社会、消费者体验和业务绩效。