Anaconda 2023年第一季度开源综述

实质性和有影响力的开源创新是 Anaconda 努力提供用于更快地开发和部署安全 Python 解决方案的工具的核心。为了捕捉和传达我们的团队对各种开源项目的许多持续贡献,我们现在在我们的博客上定期提供相关新闻综述。

开发团队亮点

Anaconda 有许多不同的团队致力于开源,每个团队执行各种各样的任务。下面我将介绍我们的一些核心工作和最近的里程碑。请注意,分成要点仅仅是为了便于阅读;在实践中,我们中的许多人跨部门工作。

Dask 和数据访问

查找、读取和写入任何格式或位置的数据 → 此处

  • Dask-awkward 于去年年底首次发布,将大数据并行分布式处理与 awkward 数组处理不规则、可变长度数据的便利性结合在一起。从那时起,我们一直在努力进行优化,以便我们不必将实际上不必要的用于执行所请求操作的数据加载到内存中。当您处理 TB 级的 JSON 或 Parquet 嵌套数据结构时,这将节省大量的处理时间和资源。
  • Intake 一直在对其文档和 GUI 进行更新,为 Anaconda Nucleus 上新的公开策划目录和更丰富的插件生态系统做准备。这是在我们计划于今年 7 月在奥斯汀举行的 SciPy 会议上举办教程之前进行的,届时我们将众包有趣的数据集和驱动程序。
  • fastparquet 的写入性能得到了大幅提升,之前的优化工作主要集中在读取方面。
  • Python-graphblas 反映了图社区的持续工作,我们以支持身份参与其中。最近的工作包括加速 NetworkX 和用于高效存储图的二进制稀疏标准。

Jupyter

用于 Python 和其他语言的浏览器内交互式开发环境 → 此处

  • JupyterCon 2023 即将到来,我们的团队将参加。我们将就 Jupyter Notebook 的过去、现在和未来发表演讲。不要错过!
  • 我们一直在努力帮助测试和更新 JupyterLab 扩展,以确认与即将推出的 JupyterLab 4 的兼容性。
  • “经典” Jupyter Notebook 正在显示一个横幅,引导用户了解即将发布的 Notebook 版本 7(基于 JupyterLab 组件),这可能会对使用 Notebook 版本 6 自定义扩展的用户产生影响。在迁移指南中了解更多信息。

HoloViz

用于 PyData 的交互式可视化和绘图 → 此处

  • Panel 正在冲刺 1.0 版本。亮点包括
    • 得益于 Bokeh 3,性能显着提升
    • 良性反馈循环:Panel 从新的 Bokeh 中获益匪浅,而 Bokeh 从 Panel 维护人员的错误报告中获益,因为我们的 Mateusz Paprocki 可以及时修复错误
    • 老旧且有些混乱的用户指南正在转变为更独立的、组织良好的操作指南和背景页面
    • 可以独立于模板应用的新设计系统
  • HoloViews:Simon Hansen 已担任首席维护人员的角色,并且正在继续开发两个主要新功能
    • 用于注释数据的通用概念和 API
    • 支持多个 y 轴
  • Datashader 正在通过添加新的缩减函数来改进其检查功能,这将最终使所有 HoloViews 检查工具受益。
  • Lumen 的第一个正式版本 (0.5.0) 于 2022 年 12 月 14 日发布,并以 Diátaxis 文档框架为基础进行了完整的文档重写。

Conda 

Python(以及所有事物)包管理器 → 此处

  • 我们即将发布 conda-project,这是一种用于封装、运行和重现具有 conda 环境的项目的工具。它允许您将代码、它需要的环境和预期的命令与简单的处方一起打包,从而使分布式工作流程更轻松。

BeeWare 

在任何平台上运行 Python 应用程序,包括移动设备 → 此处

  • Toga 0.3.0(GUI 工具包)终于发布了,这是很久以来的第一个“非开发”版本。它在 macOS、iOS 和 GTK 上集成了新的测试框架,并在 Android 上实现了更好的覆盖。
  • 发布了新版本的 Chaquopy(在 Android 上部署),构建时间大大缩短。
  • 发布了新版本的 Briefcase(顶层发行版管理),其中包含许多修复、速度改进和新的“测试模式”。
  • 在此处查看最新的路线图 here

Numba 

通过 JIT 编译加速您的 Python 数值代码 → 此处

  • 此处 here 提出了并讨论了 Numba 的大型重构和升级,并谈到在年底前展示新架构。编译器工具包将获得新组件,以帮助持续维护和开发相对于 Python 和编译器版本的软件包,这对于 Python 主要版本发布频率增加的情况来说已变得必要。
  • 对 Python 3.11、LLVM 14 和 NumPy 1.24 的支持已全部合并到主开发分支中,为近期发布候选版本做准备。

保持联系!

我们感谢您对更频繁更新的 Anaconda OSS 新闻页面是否有用或社区是否感兴趣的任何反馈,因此请随时通过您首选的项目渠道、社交媒体或 Anaconda Nucleus 与我们联系。

您可能还对我们在博客上介绍的其他一些近期软件活动感兴趣

下个季度见!

关于作者

Martin Durant 曾是一位天体物理学家,拥有多年的科学研究经验。他还曾在医学影像领域工作,构建 AI/ML 管道和研究平台。在短暂担任广告技术领域的数据科学家之后,Martin 加入 Anaconda 从事 PyData 教育工作。他现在领导着许多开源 PyData 项目,专注于数据访问、格式和并行处理。

与专家交流

与我们的专家之一交流,为您的 AI 之旅找到解决方案。

与专家交流