将 Python 与 Excel 集成是一个突破性的插件,它充当连接两个流行但以前相互独立的生态系统的桥梁。将 Python 代码无缝集成到 Excel 工作簿中,使我们能够在 Excel 中直接利用 Python 丰富的库进行数据分析和可视化,使其成为数据爱好者和分析师的宝贵工具。在这篇博文中,我们将探讨 Python 在 Excel 中如何使用 Seaborn(一个流行的 Python 可视化库)进行数据可视化,而无需离开 Excel 网格。
注意:要重现本文中的示例,请安装Python 在 Excel 中的试用版。
在 Excel 中编写 Python 代码:“=py” 前缀
在 Excel 中使用 Python 非常简单。要在 Excel 单元格中编写 Python 代码,您只需在输入的开头加上 “=py” 前缀。例如,假设您在 “data” 工作簿中有一些数据,并且想要将其读入 pandas 数据帧中。在 Excel 单元格中,输入:=py(“. 然后,您可以像在常规 Python 环境中一样继续编写 Python 代码。要从 “data” 工作簿中读取数据并创建 pandas 数据帧,请使用以下语法:
df = xl("data!A1:I399", headers=True)
在此示例中,您将从 “data” 选项卡上的指定范围 “data!A1:I399” 中读取数据。“headers=True” 参数表示第一行包含列标题,允许 Excel 创建具有正确列名称的 pandas 数据帧。
要检查 Excel 中数据帧的前五行,您可以直接执行命令 “df.head()”。此示例展示了一个包含汽车技术规格的数据集。
为什么要使用 Seaborn?
Seaborn 是一个构建在 Matplotlib 之上的数据可视化库,Matplotlib 是 Python 中另一个流行的绘图库。虽然 Matplotlib 为创建静态、交互式和动画可视化提供了灵活的基础,但 Seaborn 提供了一个更高级的接口,简化了生成信息丰富且美观的统计图形的过程。
在 Excel 中进行 Seaborn 绘图
Seaborn 受欢迎的主要原因之一是它易于使用的绘图语法。只需几行代码,您就可以创建视觉上令人惊叹的绘图,而使用其他库则需要付出更大的努力。Seaborn 的高级函数使我们能够快速生成各种类型的绘图,例如散点图、条形图、直方图、箱线图等等,只需最少的编码。
- 显示每加仑英里数 (MPG) 分布的直方图
- 显示 MPG 分布的核密度图
- 显示 MPG 与重量之间关系的散点图
创建统计图
Seaborn 在创建统计图方面表现出色,可以揭示复杂数据集中的宝贵见解。通过在其绘图函数中加入统计估计方法,Seaborn 可以自动计算和显示必要的汇总统计数据,并拟合线性回归模型。这不仅节省了时间,而且还为我们的可视化表示提供了更多统计见解。
- 例如,您可以为重量与 MPG 之间的关系绘制线性回归模型。
- 为每个起源指定色调和标记,以创建三个线性回归模型。
可视化多个关系
在数据分析中,我们经常遇到包含多个变量的数据集。Seaborn 的能力在可视化多个变量(包括分类变量和数值变量)之间的关系方面表现出色。通过利用 jointplot() 和 pairplot() 等功能,Seaborn 使我们能够使用来自不同模块的多种类型的图,在一个图形中表示数据集的多个方面。
- 例如,您可以使用 jointplot() 来关注每个起源的重量与 MPG 之间的特定关系。此图使我们能够观察每个变量在每个起源中的分布,同时还可视化重量与 MPG 之间的相关性。
结论
总之,Python 在 Excel 中对于经常处理数据并依赖 Excel 和 Python 的任何人来说都是一个游戏规则的改变者。通过结合 Excel 和 Seaborn 的强大功能,您可以更轻松地访问强大的数据分析功能,并释放数据驱动见解的全部潜力。那么,为什么不深入了解 Python 在 Excel 中和 Seaborn 的世界,来发现隐藏的模式,并从您的数据中获得更深入的见解呢?祝您可视化愉快!
想要使用 Python 和 Excel 做更多的事情吗?请查看这篇博文 “从笔记本到工作簿:使用 Python 在 Excel 中进行数据报告”。
想要更深入地了解使用 Seaborn 可视化数据吗?请参加这个使用 Python 进行数据可视化简介课程。
免责声明:截至本文发表时,Microsoft Excel 中的 Python 集成处于 Beta 测试阶段。功能和函数可能会发生变化。如果您在此页面上发现错误,请随时联系我们。
个人简介
Sophia Yang 是 Anaconda 的高级数据科学家和开发者倡导者。她热衷于数据科学界和 Python 开源社区。她是多个 Python 开源库的作者,例如 condastats、cranlogs、PyPowerUp、intake-stripe 和 intake-salesforce。她担任 Python 开源可视化系统 HoloViz 的指导委员会和行为准则委员会成员。她还在 NumFOCUS、PyData 和 SciPy 大会上担任志愿者。她拥有得克萨斯大学奥斯汀分校的计算机科学硕士学位、统计学硕士学位和教育心理学博士学位。