新年的开始是重新调整习惯和设定个人和职业发展目标的热门时间。首先,对现状进行评估很有帮助,以便确定潜在的改进领域。在数据科学领域,过去一年代表着该学科走向成熟的又一步,尤其是在 COVID-19 大流行爆发之后。我们看到研究人员齐心协力,利用数据的力量和开源软件来促进公共卫生,并且随着我们试图遏制疾病的蔓延,统计建模的概念成为主流。与此同时,我们也看到了一个未来的分化景象,如果我们不注意数据中的偏差问题和算法的可解释性。
数据科学家有责任指导他们所工作的组织正在进行的数据驱动转型。我们必须扪心自问:如何将好的方面发扬光大,克服坏习惯和做法?对于所有技能水平的数据科学从业人员,我想建议以下决心。我希望这些想法能够赋予数据科学家在这一充满活力的领域中带头前进的力量。
1. 深化您的专业领域知识
解决问题过程的一半是确定您要解决的问题。对于数据科学家来说,这意味着要加深我们对给定问题的领域的熟悉程度,而不能只专注于“数据科学”的组成部分。继续从周围的主题专家和业务线经理那里吸收信息,以便进一步改进您的方法和应用。最复杂的算法如果没有适合手头的领域,就毫无价值。
2. 协商一致的安全最佳实践
安全永远不是一劳永逸的。这是一个所有数据科学家都应认真对待的持续实践,尤其是在涉及可能被传统 IT 安全忽视的开源工具时。由于开源是数据科学家工具箱中不可或缺的一部分,因此从业人员必须跟上其工具的补丁、更新和漏洞。在年初花时间与 IT 对口部门沟通,协商一致的方法,以便在不增加安全风险的情况下实现快速实验。
3. 为开源做出贡献
开源社区需要大量支持,无论您是发现错误、编写文档还是提出功能。开源是一个超越地理位置、时区和组织的协作生态系统,花时间参与这个社区,它为我们带来了当今众多不可或缺的后端技术,同时扩展您的专业网络,学习新技能。
4. 永远不要停止学习
在数据科学领域取得成功所需的技能有时看起来不堪重负,不仅需要编写代码,还需要理解和应用抽象的数学概念和定理。同时,数据科学的魅力在于总有新东西可以学习。我建议数据科学家学习的最佳方法之一是阅读 Kaggle 和 Github 上其他人的代码。理解为什么在算法或软件包方面做出某些决定,将扩展您对可用工具的思维方式。同样,也要确保为自己的代码编写可靠的文档,以帮助其他人了解您决定背后的“原因”。
5. 找到您的社区
数据科学家的角色有时会让人感觉很孤独,因为许多从业人员要么是他们组织中少数几个人之一,要么是分散在各个团队中。由于数据科学领域发展迅速,融入社区对于了解最佳实践和共享资源至关重要。虽然 COVID-19 暂停了线下聚会,但我鼓励所有数据从业人员找到并加入围绕他们最喜欢的库或语言建立的充满活力的群体。去年,我们调查了 2000 多名数据从业人员,发现虽然绝大多数人有兴趣找到导师,但超过一半的人不知道在哪里寻找导师。在您力所能及的地方提供支持和指导,我们都在共同探索这个不断变化的领域!
现在正是重新开始的最佳时机,尤其是新的一年开始的时候。当我们投入到日常工作并实现目标时,我建议数据从业人员牢记这些决心。鉴于我们领域不断涌现的创新,我们都应致力于持续学习、社区和我们工具的安全。