在 Excel 中使用 Python 进行数据可视化简介

Sophia Yang

将 Python 与 Excel 集成是一个突破性的插件,它充当桥梁,连接两个流行但以前分离的生态系统。在 Excel 工作簿中无缝集成 Python 代码使我们能够在 Excel 中利用 Python 丰富的库进行数据分析和可视化,使其成为数据爱好者和分析师的宝贵工具。在这篇博文中,我们将探讨如何在 Excel 中使用 Python 通过流行的 Python 可视化库 Seaborn 进行数据可视化,而无需离开 Excel 网格。

注意:要重现本文中的示例,请安装 Python in Excel 试用版。 

在 Excel 中编写 Python 代码: “=py” 前缀

在 Excel 中使用 Python 非常简单。要在 Excel 单元格中编写 Python 代码,您只需以 “=py” 前缀开始输入。例如,假设您的 “data” 工作簿中有数据,并且想要将其读取到 pandas dataframe 中。在 Excel 单元格中,输入:=py(“. 然后您可以像在常规 Python 环境中一样继续编写 Python 代码。要从 “data” 工作簿读取数据并创建 pandas dataframe,请使用以下语法: 

df = xl("data!A1:I399", headers=True)

在此示例中,您将从 “data” 工作表上指定的范围 “data!A1:I399” 读取数据。“headers=True” 参数指示第一行包含列标题,允许 Excel 创建具有正确列名的 pandas dataframe。

要检查 Excel 中 dataframe 的前五行,您可以直接执行命令 “df.head()”。此示例展示了一个包含汽车技术规格的数据集。

为什么使用 Seaborn?

Seaborn 是一个数据可视化库,构建于 Matplotlib 之上,Matplotlib 是 Python 中另一个流行的绘图库。虽然 Matplotlib 为创建静态、交互式和动画可视化提供了灵活的基础,但 Seaborn 提供了一个更高级别的界面,简化了生成信息丰富且美观的统计图形的过程。

在 Excel 中使用 Seaborn 绘图

Seaborn 受欢迎的主要原因之一是其用户友好的绘图语法。只需几行代码,您就可以创建视觉上令人惊叹的图表,而使用其他库则需要付出更多的努力。Seaborn 的高级函数使我们能够以最少的编码快速生成各种类型的图表,例如散点图、条形图、直方图、箱线图等等。

  • 直方图,显示每加仑英里数 (MPG) 的分布
  • 核密度图,显示 MPG 的分布
  • 散点图,显示 MPG 和重量之间的关系

创建统计图表

Seaborn 擅长创建统计图表,从复杂的数据集中揭示有价值的见解。通过在其绘图函数中结合统计估计方法,Seaborn 可以自动计算和显示必要的汇总统计信息并拟合线性回归模型。这不仅节省了时间,还为我们的可视化表示提供了更多的统计见解。

  • 例如,您可以绘制一个线性回归模型,表示重量和 MPG 之间的关系。
  • 为每个产地指定色调和标记,用于三个线性回归模型。

可视化多种关系

在数据分析中,我们经常遇到具有多个变量的数据集。在可视化多个变量(包括分类变量和数值变量)之间的关系时,Seaborn 的功能大放异彩。通过利用 jointplot() 和 pairplot() 等功能,Seaborn 使我们能够使用来自不同模块的多种类型的图表,以在单个图中表示数据集的多个方面。

  • 例如,您可以使用 jointplot() 来关注每个产地重量和 MPG 之间的特定关系。此图允许我们观察每个产地中每个变量的分布,同时可视化重量和 MPG 之间的相关性。

结论

总之,对于经常处理数据并依赖 Excel 和 Python 的任何人来说,Excel 中的 Python 都是一个改变游戏规则的工具。通过结合 Excel 和 Seaborn 的强大功能,您可以更轻松地进行强大的数据分析,并释放数据驱动洞察的全部潜力。那么,为什么不深入 Excel 和 Seaborn 中的 Python 世界,以发现隐藏的模式并从您的数据中获得更深入的见解呢?祝您可视化愉快!

想要使用 Python 和 Excel 做更多事情吗?查看这篇博文 “从 Notebooks 到 Workbooks:使用 Excel 中的 Python 进行数据报告。” 

想要更深入地了解如何使用 Seaborn 可视化数据?参加“Python 数据可视化入门”课程。 

免责声明:截至本文发布时,Microsoft Excel 中的 Python 集成仍处于 Beta 测试阶段。功能和特性可能会发生变化。 **如果您在本页上发现错误,请随时联系我们。** 

个人简介

Sophia Yang 是 Anaconda 的高级数据科学家和开发者倡导者。她对数据科学社区和 Python 开源社区充满热情。她是多个 Python 开源库(如 condastats、cranlogs、PyPowerUp、intake-stripe 和 intake-salesforce)的作者。她在 Python 开源可视化系统 HoloViz 的指导委员会和行为准则委员会任职。她还在 NumFOCUS、PyData 和 SciPy 会议上担任志愿者。她拥有德克萨斯大学奥斯汀分校的计算机科学硕士学位、统计学硕士学位和教育心理学博士学位。

与专家交流

与我们的专家之一交流,为您的 AI 之旅寻找解决方案。

与专家交流