2021年数据科学家的年度目标

新年伊始是重新调整习惯并设定个人和职业改进目标的普遍时机。首先,盘点现状有助于明确潜在的改进领域。在数据科学领域,过去一年代表着该学科成熟的又一步,尤其是在 COVID-19 疫情爆发之后。我们看到研究人员齐心协力,利用数据和开源软件来改善公共健康,并且当我们试图遏制疾病蔓延时,统计建模的概念变得主流。与此同时,如果我们不关注数据中的偏见问题以及算法的可解释性,我们就会瞥见未来分裂的景象。

数据科学家有责任指导他们所在组织正在进行的以数据驱动的转型。我们都必须扪心自问:如何坚持优点并克服不良习惯和实践?对于所有技能水平的数据科学从业者,我想提出以下建议。我希望这些想法能够帮助数据科学家在这个充满活力的领域中发挥领导作用。

1. 加深你的主题领域专业知识

解决问题过程的一半是识别你试图解决的问题。对于数据科学家而言,这需要加深我们对给定问题领域的熟悉程度,而不是仅仅专注于“数据科学”组成部分。继续从你周围的主题专家和业务线经理那里吸收信息,以便你可以进一步改进你的方法和应用。如果最复杂的算法不适合手头的领域,它将毫无价值。

2. 遵守安全最佳实践

安全绝非一蹴而就。这是一个持续的实践,所有数据科学家都应认真对待,尤其是在涉及可能在传统 IT 安全监管之外运行的开源工具时。由于开源是数据科学家工具包不可或缺的一部分,因此从业人员及时了解其工具的补丁、更新和漏洞至关重要。在新年初花时间与 IT 部门同事联系,并在一种方法上达成一致,这种方法既能实现实验速度,又不会增加安全风险因素。

3. 为开源做贡献

开源社区对支持的需求永无止境,无论你是识别错误、编写文档还是提出功能。开源是一个超越地理位置、时区和组织的协作生态系统——花时间与为我们带来了当今如此多重要后端技术的社区互动,同时扩展你的专业网络并学习新技能。

4. 永不停歇地学习

在数据科学领域取得成功所需的技能有时可能让人感到难以承受——不仅要会编码,还要掌握和应用抽象的数学概念和定理。与此同时,数据科学的美妙之处在于总有新的东西要学习。我向数据科学家推荐的最佳方法之一是在 Kaggle 和 Github 上阅读别人的代码。了解关于算法或软件包的某些决策是如何做出的,将扩展你对你可以支配的工具种类的认识。同样,确保为你自己的代码编写可靠的文档,以帮助其他人了解你决策背后的“原因”。

5. 找到你的社区

数据科学家的角色有时会感到孤独,因为许多从业人员要么是组织中为数不多的几个人之一,要么分散在各个团队中。由于数据科学领域发展如此迅速,融入社区对于理解最佳实践和共享资源至关重要。虽然 COVID-19 暂停了线下聚会,但我鼓励所有数据从业人员找到并加入围绕他们最喜欢的库或语言发展起来的充满活力的团体。去年,我们调查了 2,000 多名数据从业人员,发现绝大多数人有兴趣寻找导师,但一半以上的人不知道在哪里寻找。尽你所能提供支持和指导——我们都在一起探索这个不断变化的领域!

现在是重新开始的最佳时机——尤其是在年初。当我们投入日常工作并实现我们的目标时,我建议数据从业人员牢记这些目标。鉴于我们领域不断创新,我们都应该致力于持续学习、社区建设和工具安全。

咨询专家

与我们的专家交流,为您的 AI 之旅寻找解决方案。

咨询专家