实质性和有影响力的开源创新是 Anaconda 努力提供用于更快地开发和部署安全 Python 解决方案的工具的核心。为了捕捉和传达我们团队对各种 开源项目 的大量持续贡献,我们现在将在我们的博客上定期提供相关新闻项目的综述。
按开发团队分类的亮点
Anaconda 有许多不同的团队在从事开源工作,每个团队都执行各种各样的任务。以下我将介绍我们的一些核心工作和最近的里程碑。请注意,将这些内容分成各个项目只是为了便于阅读;实际上,我们很多人都跨越这些部门工作。
Dask 和数据访问
查找、读取和写入任何格式或位置的数据 → 这里
- Dask-awkward 于去年年底首次发布,它将大数据并行分布式处理与 awkward 数组处理的不规则、可变长度数据的便利性结合在一起。从那时起,我们一直在努力进行优化,因此我们不需要将实际上不需要执行请求的操作的数据加载到内存中。当您处理数 TB 的 JSON 或 Parquet 嵌套数据结构时,这将节省大量处理时间和资源。
- Intake 正在对其文档和 GUI 进行更新,为 Anaconda Nucleus 上新的公开策划的目录和更丰富的插件生态系统做准备。这是为了在我们今年 7 月在奥斯汀举行的 SciPy 大会上提议的教程做准备,届时我们将对有趣的数据集和驱动程序进行众包。
- Python-graphblas 反映了图形社区正在进行的工作,我们正在以支持的角色参与其中。最近的工作包括加快 NetworkX 的速度,以及用于有效存储图形的二进制稀疏标准。
Jupyter
用于 Python 和其他语言的浏览器内交互式开发环境 → 这里
- 我们一直在努力帮助测试和更新 JupyterLab 扩展,以确认与即将发布的 JupyterLab 4 的兼容性。
- “经典”Jupyter Notebook 正在显示一个横幅,指导用户了解即将发布的 Notebook 版本 7(基于 JupyterLab 组件)的更多信息,这可能会对使用 Notebook 版本 6 的自定义扩展的用户产生影响。在 迁移指南 中了解更多信息。
HoloViz
用于 PyData 的交互式可视化和绘图 → 这里
- Panel 正在朝着 1.0 版本发布迈进。亮点包括
- 由于 Bokeh 3,性能显着提高
- 良性反馈循环:Panel 从新的 Bokeh 中获益匪浅,而 Bokeh 则从 Panel 维护人员的错误报告中获益,因为错误可以由我们的 Mateusz Paprocki 迅速修复
- 正在将老旧且有些混乱的用户指南转变为更独立、组织良好的操作指南和背景页面
- 一个可以独立于模板应用的新设计系统
- HoloViews:Simon Hansen 已经担任首席维护人员,并且正在继续进行两个主要的新功能
- Datashader 正在通过添加新的约简函数来改进其检查功能,这最终将使所有 HoloViews 检查工具受益。
- Lumen 的第一个正式版本 (0.5.0) 于 2022 年 12 月 14 日发布,其中包含基于 Diátaxis 文档框架的完整文档重写。
Conda
Python(以及所有内容)软件包管理器 → 这里
- 我们很快将发布 conda-project,这是一个用于使用 conda 环境封装、运行和重现项目的工具。它允许您将代码、其需要的环境以及预期命令与简单的说明一起打包,从而简化分布式工作流。
- Conda 本身在本季度发布了两次,其中包含大量 改进和修复。
BeeWare
在任何平台(包括移动设备)上运行 Python 应用程序 → 这里
- Toga 0.3.0(GUI 工具包)终于发布,这是很长时间以来的第一个“非开发”版本。它在 macOS、iOS 和 GTK 上整合了新的测试框架,并且在 Android 上的覆盖率有了很大提高。
- Briefcase(顶级发行版管理)发布了新版本,其中包含许多修复、速度改进和新的“测试模式”。
Numba
使用 JIT 编译加速 Python 数值代码 → 这里
- Numba 的一项重大重构和升级被提议并讨论 这里,其中讨论了在今年年底之前展示新架构。编译器工具包将获得新组件,以帮助相对于 Python 和编译器版本持续维护和开发软件包,由于主要 Python 版本发布频率的增加,这变得必要。
- 对 Python 3.11、LLVM 14 和 NumPy 1.24 的支持都已合并到主要开发分支中,为即将发布的候选版本做准备。
保持联系!
我们感谢您对是否需要更频繁更新的 Anaconda OSS 新闻页面是否对社区有用或有趣提供任何反馈,因此请随时通过您喜欢的项目频道、社交媒体或 Anaconda Nucleus 与我们联系。
您可能也对我们博客上介绍的其他一些最近的软件活动感兴趣
下个季度再见!
关于作者
Martin Durant 是一位前天体物理学家,拥有多年的科学研究经验。他还从事医学影像工作,构建 AI/ML 管道和研究平台。在广告技术领域短暂担任数据科学家后,Martin 加入 Anaconda 从事 PyData 教育工作。他现在领导着多个开源 PyData 项目,专注于数据访问、格式和并行处理。