每位数据科学家必备的六项软技能

今天,我们很难想象一个没有数据科学的世界。在过去的几十年里,它已经根深蒂固于社会。尤其是在 COVID-19 大流行期间,数据每天都占据着新闻头条。话虽如此,重要的是要记住,数据科学仍然是一个新兴领域,并且并非没有挑战需要克服。

为了解数据科学学科在商业和学术环境中如何成熟,我们针对年度《数据科学现状》报告,调查了 100 多个国家/地区的 2,300 多名在职数据科学家、学生和学者。一项令人担忧的发现是,40% 的受访者表示,他们“几乎从不”或“有时”才能有效地展示数据科学在其组织内的业务影响。

如果无法展示影响,数据科学项目可能永远无法启动——而那些启动的项目也面临着被降低优先级或取消的风险。这个障碍通常与技术技能关系不大,而更多与沟通和人际关系建立等软技能有关。

这六个技巧将帮助数据科学家以及与他们一起工作的人展示其工作的价值。

1. 优先考虑正确的项目

为了能够展示业务价值,您必须首先确定符合更广泛业务优先事项的项目。虽然某个项目可能在其他方面有趣或有价值,但如果它不能帮助实现已确定的业务目标,那么争取利益相关者的支持和展示有意义的结果将是一场艰苦的战斗。

2. 尽早引入利益相关者

在您评估项目的同时,您还应该识别并引入相关的利益相关者。成功的实施需要业务不同领域人员的支持、反馈和资源。

花费与理解您的数据一样多的时间来理解您的利益相关者及其需求——这是许多数据科学家没有花费足够时间的一个步骤。充分了解利益相关者将使用您的数据做出哪些决策将有助于您成为更好的合作伙伴。

来自 IT 和产品部门的人员是显而易见的利益相关者,但数据科学家应该更进一步,识别对项目成功感兴趣并获得其赞助的高管。高管可以帮助识别和 привлечь 其他利益相关者,确保项目与更大的业务目标保持一致,并消除障碍。

3. 设定明确的 KPI 并提供定期更新

在就项目的目的和范围达成一致后,下一步是定义如何衡量其成功或失败。有一些 KPI 可以说明数据科学项目的进展和内在成功,例如不同的里程碑或指标,如精确度、目标分布等。

然而,将您的项目与反映业务目标和指标的 KPI 联系起来也至关重要。这可能需要将数据科学 KPI 翻译成内部非科学受众更容易理解的语言,例如成本、收入、降低客户流失率或节省的时间。

一旦您定义了指标,关于进展的报告并不会就此结束。定期沟通您的目标进展情况;更好的是,创建一个仪表板或应用程序,让利益相关者可以自行查看和操作这些信息。

4. 实现并沟通快速成功

随着项目的启动和运行,取得快速成功可能是保持势头的关键方法。快速成功意味着一个与业务优先事项相关的目标,您可以在 6-12 周内定义、实现和完成该目标。快速成功让利益相关者保持投入,并向您的组织表明您正在交付即时价值。

为了做到这一点,访问干净、随时可用的数据是必要的;在确定您可能的快速成功时,请记住这一点。

5. 了解您的受众

正如您可能已经注意到的,清晰、频繁的沟通对于展示您的工作的影响至关重要。在我们的调查中,近四分之一的受访者表示,他们组织的数据科学/机器学习领域缺乏沟通技巧。数据科学团队通常可能与业务的其他部门隔离,并且最习惯使用其他人可能不理解的技术语言。但是数据科学家有责任根据他们的受众调整他们的沟通:使用您的利益相关者关心的指标和他们理解的语言。使用故事、类比和有效的数据可视化来表示您的数据。

6. 可视化

数据可视化可以帮助您更有效地沟通和展示影响,但如果使用不当,它们也可能分散注意力、使人困惑或误导。与沟通技巧类似,24% 的受访者表示他们的数据科学团队缺乏数据可视化技能。此外,只有 49% 的参与调查的学生表示他们在学校接受数据可视化方面的教育。

与 R 和 Javascript 不同,Python 中有大量的可视化库可供选择。Pyviz.org 是一个很好的资源,可以了解更多关于不同工具以及如何使用它们的信息。在 Anaconda,我们支持开源可视化项目 Holoviz,该项目专注于支持 Web 浏览器的工具。当您尝试与业务利益相关者和领导层沟通时,您需要使用一种允许您轻松共享可视化的工具。

在选择和使用这些工具时,关键是要问您试图通过可视化实现什么。要有意识地了解您如何传达数据。不要试图将您的数据强行塞进不适当的可视化中。

通过清晰的计划、有意识的关系建立和良好的沟通技巧,数据科学领域的人员可以更好地代表自己、他们的工作及其业务影响。随着对数据科学的理解加深,更广泛的组织也会增加投资和信任,这些都是数据科学学科走向成熟和突出的关键要素。

与专家交流

与我们的专家之一交流,为您的 AI 之旅寻找解决方案。

与专家交流