企业需要以不同的方式看待数据科学。以下是如何做到。

具备数据科学素养的公司基于真实的数据模型做出和沟通决策,而不仅仅是依靠直觉或传统。他们欢迎新的数据科学技术作为潜在的创新机会,而不是采取怀疑和抵制的态度。随着企业竞相拥抱数据科学,他们正在发现一些重要的真理,这些真理是企业在整个企业中培养数据流畅性的基础。

首先,有效的数据科学不应被视为另一种业务流程,也不能像流水线一样进行操作。

顾名思义,数据科学是一种类似于“真正”科学的探究和探索模式。

正如物理学家使用数学来推理自然世界一样,数据科学家利用数学和计算工具来推理商业世界。

就像真正的科学一样,一些成功的实验可能会产生无效的结果;另一些实验可能会产生准确的模型,但在实践中却无法使用。虽然没有人会庆祝这些结果,但任何想要拥抱数据科学的企业都必须对“失败”发展出一种组织上的容忍度,将其视为即使是最有效的数据科学也自然而然、不可避免的代价。

由于传统的商业分析(例如,生成报告和仪表板)本质上是相对程序化的,因此人们倾向于将数据科学视为类似类型的活动,并据此进行管理。然而,数据科学不是程序化的,因为它依赖于创造性探索和直觉这些不可约约的人为因素。这使得整个过程更难操作和管理。有效的数据科学还需要跨越传统部门的知识和经验。

其次,数据科学家不是适合任何传统孤岛的传统技术专家。他们是一群多元化的混合型从业者,这应该被视为一个机会加以利用,而不是被视为需要消除的异常现象。

现代数据科学家来自不同的背景。他们将主题专业知识与应用统计学和高度专业化的编码技能(与通常的软件开发人员技能截然不同)相结合。这种独特的技能和技术需求组合无法完全融入任何传统的公司孤岛。

典型的公司免疫反应是将一切都部门化,即使以分割使数据科学有效的集成功能为潜在代价也在所不惜。有时,企业心态会加剧这种情况,即将任何类型的编程活动都视为“软件开发”,即使数据科学家使用 Python 代码构建模型与 Java 业务应用程序完全不同。

此外,正如我们在 2019 年数据科学状况报告的开发过程中发现的那样,各个领域的人们都在学习数据科学,并将其应用于他们目前的角色。在几年内,我们目前称之为“数据科学”的技能将广泛分布在许多职位名称可能不是“数据科学家”的人员中。那些拥抱跨越传统界限的协作作为其数字化转型一部分的组织将为这种可能性做好更充分的准备。那些不学习如何拥抱数据科学的混合型、跨部门性质的企业将从根本上停滞不前。

我如何让我的企业为数据科学做好准备?

以下是我关于以更现实的方式将数据科学融入您的组织的建议

对您的内部数据科学准备情况进行诚实的评估。数据驱动的决策是商业界更大、更全面的“数字化转型”运动的一个组成部分。实现有效数据科学的挑战不是暂时的,而是更宏大旅程中的步骤(通常是朝着 AI 和云计划的方向发展)。诚实评估您的组织对这一旅程的承诺,并相应地“调整规模”您的数据科学计划,以适应风险和预算概况。为了使全面的数据科学赋能取得成功,您的组织必须充分拥抱数据驱动的数字化转型。

没有人可以向您出售一个大红色的“预测!”按钮。数据科学需要深入的主题专业知识和对您业务独特方面的熟悉。即使您聘请顾问来启动数据科学计划,随着时间的推移,您的内部团队也必须学习如何维护和发展他们构建的模型和管道。有效的数据科学会影响您如何思考业务中的核心问题;几乎永远不会有适用于所有人的现成的预测系统。

与 IT 部门交朋友。对于许多公司 IT 团队来说,数据科学家的计算需求相对新颖:数百个开源库;Python 和 R 等语言;海量的内存需求;GPU 和向量加速器。为了使数据科学团队取得成功,他们需要 IT 部门盟友的支持和协助。

不幸的是,公司 IT 部门往往名声不好,被认为是“拒绝之塔”,数据科学领导者(尤其是那些刚进入企业的新手)很容易对他们在 IT 部门的同行感到愤世嫉俗。我们已经看到数据科学领导者和 IT 部门通过实施 Anaconda Enterprise 作为用于协作、部署、安全和治理的企业级平台,在中间地带富有成效地会合。

您可以从小处着手。尽管数据科学和机器学习领域可能看起来广阔而令人生畏,但请记住,您始终可以从小处着手。选择一个真正痛苦且具有明确业务驱动因素的问题,并快速取得成功,以帮助建立认同感和信任感。在早期,明确解决一个清晰且易于理解的问题比在大型、雄心勃勃的问题上产生模棱两可的结果更重要。

随着公司真正拥抱数据科学,他们将体验到远远超出组织结构图的转变,延伸到文化、规范和思维方式。这种改变是值得努力的:虽然标准的流水线式商业分析是关于计数测量,但数据科学为您提供了构建更好标尺的洞察力。

与专家交谈

与我们的专家之一交谈,为您的 AI 之旅找到解决方案。

与专家交谈