如今,很难想象一个没有数据科学的世界。在过去的几十年里,数据科学已经深深融入社会。尤其是在 COVID-19 大流行 期间,数据每天都成为头条新闻的中心。话虽如此,但重要的是要记住,数据科学仍然是一个新兴领域,并非没有挑战要克服。
我们在年度 数据科学现状 报告中调查了 100 多个国家/地区的 2300 多位数据科学家、学生和学者,以了解数据科学学科如何在商业和学术环境中不断发展。一个令人担忧的发现是,40% 的受访者表示他们“几乎从不”或“只是偶尔”能够有效地展示数据科学对其组织的业务影响。
如果无法展示影响,数据科学项目可能永远无法启动——而那些已经启动的项目则有被降级或取消的风险。这种障碍通常与技术技能关系不大,而更多地与沟通和建立关系等软技能有关。
以下六个技巧将帮助数据科学家及其合作者展示其工作的价值。
1. 优先考虑正确的项目
为了能够展示业务价值,您必须首先确定与更广泛的业务优先事项相一致的项目。虽然一个项目可能以其他方式很有趣或有价值,但如果它不能帮助实现既定的业务目标,那么在获得利益相关者的认可和展示有意义的结果方面将是一场艰苦的战斗。
2. 早期引入利益相关者
在评估项目的同时,您还应该确定并引入相关利益相关者。成功的实施需要来自企业不同领域的员工的认可、反馈和资源。
花与理解数据一样多的时间去理解您的利益相关者及其需求——这是许多数据科学家没有花足够时间的一步。全面了解利益相关者将使用您的数据做出哪些决策将帮助您成为更好的合作伙伴。
来自 IT 和产品部门的人员是显而易见的利益相关者,但数据科学家应该更进一步,确定对项目成功感兴趣的高管并获得他们的赞助。高管可以帮助确定和接触其他利益相关者,确保项目与更大的业务目标一致,并消除障碍。
3. 设置清晰的 KPI 并提供定期更新
在项目目标和范围达成一致后,下一步是定义如何衡量其成功——或失败。有些 KPI 指示了数据科学项目的进展和固有成功,例如不同的里程碑或指标,如精度、目标分布等。
但是,将您的项目与反映业务目标和指标的 KPI 联系起来也至关重要。这可能需要将数据科学 KPI 翻译成内部非科学受众更容易理解的语言,例如成本、收入、减少流失或节省的时间。
定义指标后,报告进展不会就此结束。定期沟通您的目标进展;更重要的是,创建一个仪表板或应用程序,让利益相关者可以自己查看和操作这些信息。
4. 实现并传达快速胜利
随着项目启动并运行,取得快速胜利可能是保持动力的关键方法。快速胜利是指与您可以在 6-12 周内定义、达到和实现的业务优先事项相关的目标。快速胜利可以保持利益相关者的参与,并向您的组织表明您正在提供直接价值。
为此,访问干净、易于获得的数据是必需的;在确定可能的快速胜利时请牢记这一点。
5. 了解您的受众
您可能已经注意到,清晰、频繁的沟通对于展示您工作的意义至关重要。在我们的调查中,近四分之一的受访者 表示,他们组织的数据科学/机器学习领域缺乏沟通技巧。数据科学团队通常与企业其他部门隔绝,并且最习惯使用其他人可能不理解的技术语言。但是,数据科学家有责任根据其受众调整其沟通方式:使用利益相关者关心的指标和他们理解的语言。使用故事、类比和有效的数据可视化来表示您的数据。
6. 将其可视化
数据可视化可以帮助您更有效地传达和展示影响,但如果使用不当,它们也会分散注意力、造成混淆或误导。与沟通技巧类似,24% 的调查受访者 表示,他们的数据科学团队缺乏数据可视化技巧。此外,只有 49% 参加调查的学生表示他们在学校学习数据可视化。
与 R 和 Javascript 不同,Python 中有大量可供选择的可视化库。Pyviz.org 是一个了解不同工具以及如何使用它们的绝佳资源。在 Anaconda,我们支持开源可视化项目 Holoviz,该项目完全专注于支持 Web 浏览器的工具。当您试图与业务利益相关者和领导层沟通时,您需要使用允许您轻松共享可视化的工具。
在选择和使用这些工具时,至关重要的是要问自己,您试图通过可视化实现什么。在您如何传达数据方面要有意识。不要试图将您的数据强行适合不合适的可视化。
有了清晰的计划、有意的关系建立和良好的沟通技巧,数据科学领域的人员可以更好地展现自己、他们的工作以及他们的业务影响。随着对数据科学的了解不断加深,来自整个组织的投资和信任也会不断增加,这是数据科学学科不断成熟和突出的关键因素。