2022 年人工智能/机器学习和数据科学领域的 5 项专家预测

2021 年,即使在围绕伦理和偏见等问题的行业发展阵痛持续存在的情况下,人工智能和数据科学应用领域的创新、采用和投资趋势仍然有增无减。对于许多人来说,2021 年是令人兴奋的一年,数据科学的可能性成熟为对潜在的积极业务影响更为清晰的看法。现在是成为数据科学社区成员有史以来最令人兴奋和最重要的时刻。

这种轨迹在 2022 年及以后会走向何方?为了找到答案,我们向 Anaconda 的专家和其他领先的行业声音征求了他们对来年的预测。以下是他们对来年值得关注的事物的看法——如果您想听到更多我们对明年的预测,请收听我们 12 月 15 日的网络研讨会,届时来自 Netflix、Meta 和 Wikimedia 的领导者将与我们自己的 Peter Wang 一起讨论人工智能和机器学习在新的一年中的未来发展。

兑现道德人工智能的承诺

人工智能中的伦理挑战从未像现在这样受到公众的关注,但在这个领域仍然需要取得更多进展。在很大程度上,人工智能工作流程并没有发生根本性的变化。相反,一些公司正在构建工具来帮助检测机器学习模型漂移,而行业人士则被要求使用这些工具和其他工具来约束自己。Anaconda 首席技术官 Kevin Goldsmith 认为,将人工智能的道德实施留给个人及其组织是无效的,而且展望未来,我们将看到更多关于人工智能和个人数据使用的监管和行业范围的治理。这很可能通过政府干预和新的大规模标准来实现,这些标准对于全面提升人工智能的道德品质至关重要。虽然完全采纳这些标准需要时间,但在 2022 年及以后,自我监督是行不通的。

与此同时,这并不意味着从业者应该放弃对实践道德人工智能的所有责任。Anaconda 技术咨询总监 James A. Bednar 认为,我们不能忽视道德实践始于人。随着该领域的持续发展,一些有能力的研究人员和从业者正在努力创建更公平和有效的人工智能,但很少有人真正了解负责任且有效地使用这些工具所需的所有方面。新的一年应该看到重新努力为个人配备他们所需的资源,以了解应用领域和机器学习算法,尤其是在云计算和 AutoML 技术继续变得更容易访问的情况下。

为创新而创新的终结

企业自然而然地关注最新技术和工具可以为其业务带来的机会。因此,考虑不同的技术实际上将如何影响用户通常是次要考虑因素。社会技术发展实验室 Emerge 的创始人兼首席执行官 Lucia Gallardo 认为,这种情况将在 2022 年及以后发生改变。随着广泛的利益相关者倡导加强对技术如何影响个人和社会进行监督,这将要求我们摆脱关于可持续性、包容性和影响的传统思维,并将这些考虑因素从预期结果转向长期嵌入式战略。道德关切将加速以环境、社会和公司治理 (ESG) 标准为指导的投资,并鼓励努力改进我们衡量影响的方式。

通过透明的可追溯性应对训练数据和安全挑战

为了满足对复杂的数据中心产品的需求,开发人员经常求助于在互联网上“找到”的训练数据。多年来,这种常见做法的伦理和法律影响基本上未得到解决,但 2022 年可能标志着一个转折点,Anaconda 社区创新高级总监 Stan Seibert 认为。随着人工智能驱动的编码助手的引入,关于使用不同数据集的权利以及可能管辖它们的许可证的问题变得更加复杂。这些产品使用公共源代码本身作为训练数据。虽然大多数公共源代码都附带许可证,但不清楚这些许可证如何应用于模型的训练数据。我们对许可证和版权的法律理解需要发展以适应这些新的机器学习用例。根据 Stan 的说法,回答诸如此类的问题并确立指导性先例将是 2022 年的重点。

除了许可问题外,现代软件开发的混合搭配性质也可能带来安全挑战。由于代码的小片段经常嵌入到较大的项目中,因此很难跟踪代码的出处,尤其是在开源软件世界中。随着围绕可追溯性的问题越来越受到关注,联邦政府权衡了今年早些时候的行政命令中软件物料清单 (SBOM) 的价值,客户将要求了解其系统中运行的所有代码的来源。Anaconda 产品高级副总裁 Stephen Nolan 认为,这项新标准将给从业人员开发代码的方式带来变化。在 2022 年,开发人员将开始更仔细地监控应用程序和代码安全性,并在代码开发的所有阶段实施安全措施。期望开发人员不断监控漏洞是不合理的,这就是为什么像 conda 签名验证这样的解决方案对于新一年的从业人员和企业都将非常有用。

进一步扩大 Python 的受众和用例

随着企业数据科学团队成倍增加,越来越多的人正在使用 Python。该语言最近在 TIOBE 指数(衡量编程语言流行度的指标)中超越 Java 和 C 跃居榜首,对软件开发人员的需求预计将从 2020 年到 2030 年增长 22%。Anaconda 产品管理总监 Saundra Monroe 认识到,由于 Python 的优势和简洁性,新手和经验丰富的开发人员都被 Python 所吸引,并认为新的一年该语言整体的关注领域之一将是改进初学者成为有能力的编码人员的可用路径。

根据我们专家的说法,除了扩展到更多编码人员(无论是专业人士、学生、爱好者还是介于两者之间的人)之外,Python 还将在 2022 年继续扩展到数据科学以外的更新用例。Stan 认为,对于微控制器和物联网设备等通常由其他编程语言主导的用例,由于 MicroPython 和 CircuitPython 的兴起,我们将看到 Python 的采用率增长。Anaconda 高级技术客户经理 Joseph J. Currenti 和 Lucia 从不同的方向提出问题,他们预计 Python 将更多地用于游戏开发,因为开发人员希望利用 AI 来创造更身临其境的游戏体验。

通过标准化和教育增强社区能力

近年来,软件开发领域的不同工具和社区越来越强烈地推动标准化和凝聚力。AI 驱动的软件平台 Forethought 的 Staff Software Engineer Sebastián Ramírez Montaño 认为,随着开发人员寻求构建受编辑器和云提供商等多种工具支持的软件包,这种势头将在 2022 年只会增强。实际应用中此原则的示例包括 Python 类型注释和 async/await 等。标准化工具更易于开发人员使用,最终有助于增加使用 Python 进行工作和开发的社区数量。

Sebastián 认为,2022 年发展 Python 社区的另一个关键将是改进对 async 和 await、并发、线程和任务本地状态等元素的教育,因为正确使用它们是获得更好吞吐量性能的关键。随着程序员越来越多地使用分布式系统、微服务以及与其他工具的集成来完成诸如将 ML 服务系统与 Python API 连接起来之类的任务,这些与并发相关的功能将至关重要。

展望令人兴奋的新一年

从努力减轻 AI 模型中的偏见,到 Python 的主导地位日益提高,对于数据社区来说,这是增长的一年。我们很高兴看到该领域在新的一年里取得进一步的进展,并在企业环境中数千种不同的用例中得到更广泛的应用。数据科学领域确实有适合每个人的东西,我们很自豪能成为其中的一部分!加入我们 12 月 15 日美国东部时间下午 2 点/太平洋标准时间上午 11 点的网络研讨会,听取更多行业领导者的预测。

与专家交谈

与我们的专家之一交谈,为您的 AI 之旅找到解决方案。

与专家交谈