WPS表格Python脚本:读取与筛选数据实战

📅 2026/7/6 4:50:20
WPS表格Python脚本:读取与筛选数据实战
WPS软件表格内置Py脚本编辑与运行WPS表格内置了Python脚本编辑与运行功能用户无需安装额外的Python环境或IDE即可在表格中直接编写和执行Python代码。本文将围绕WPS表格内置的Py脚本功能介绍如何使用内置的xl()函数读取单元格数据并进行列筛选输出。1. 认识WPS表格内置Py脚本环境WPS表格内置的Py脚本功能为表格用户提供了便捷的数据处理方式用户可以在当前工作簿内直接编写Python代码通过内置的xl()函数访问工作表数据。无需单独安装pandas、openpyxl等库环境已预置常用数据分析包。打开方式在WPS表格顶部菜单栏中找到「效率工具」或「开发工具」即可进入Py脚本编辑面板。2. 使用xl()函数读取数据xl()是WPS表格内置Py环境专门提供的函数用于直接从当前工作簿读取指定范围的单元格数据返回一个DataFrame对象。语法如下xl(cell_range, headersTrue)cell_range字符串格式的单元格范围如A1:C5。headers布尔值表示是否将范围的第一行作为列名表头默认为True。以下代码演示如何读取A1:C5范围的数据# 读取表格数据 A1:C5 df2 xl(A1:C5, headersTrue) 查看数据基本信息 print(数据形状:, df2.shape) print(列名:, list(df2.columns)) print(数据预览:) print(df2.head())实战示例员工信息表读取假设工作表中存在如下员工信息数据A1:D6 区域员工姓名部门入职日期月薪张三技术部2024-03-1512000李四市场部2024-06-0110000王五技术部2023-11-2013500赵六财务部2022-08-1011000孙七市场部2024-01-0510500使用xl()读取并查看数据结构及前两行# 实战示例读取员工信息表 A1:D6 df_employee xl(A1:D6, headersTrue) 查看数据结构 print(数据形状:, df_employee.shape) print(列名:, list(df_employee.columns)) 显示前两行数据 print(\n前两行数据:) print(df_employee.head(2))3. 列筛选与输出读取数据后可以像操作标准pandas DataFrame一样对列进行筛选。下面展示如何从已读取的数据中提取产品名称和发货日期两列# 读取表格数据 A1:C5 df2 xl(A1:C5, headersTrue) 筛选列 df2_subset df2[[产品名称, 发货日期]] 打印输出 print( 原始数据 ) print(df2) print(\n 筛选后数据 ) print(df2_subset)如果希望一次性筛选多个列只需在列表中指定对应的列名即可# 多列筛选 selected_columns [产品名称, 发货日期, 数量] df_multi df2[selected_columns] print(df_multi)实战示例基于员工信息表的条件筛选结合上一节中员工信息表的实战案例A1:D6下面展示如何按条件筛选出「技术部」员工并输出其姓名和月薪# 实战读取员工信息表 A1:D6 df_emp xl(A1:D6, headersTrue) 条件筛选部门为「技术部」的员工 tech_dept df_emp[df_emp[部门] 技术部] 输出筛选后的员工姓名和月薪 print( 技术部员工 ) print(tech_dept[[员工姓名, 月薪]])4. 常用数据分析操作在WPS内置Py环境中同样可以使用pandas丰富的分析方法对数据进行处理、统计与清洗# 读取完整数据 df xl(A1:D100, headersTrue) 1. 基本统计 print(数据概览:) print(df.describe()) print(\n各列缺失值数量:) print(df.isnull().sum()) 2. 按条件筛选 high_value df[df[销售额] 1000] print(f\n销售额大于1000的记录数: {len(high_value)}) 3. 数据分组统计 if 产品名称 in df.columns and 销售额 in df.columns: product_stats df.groupby(产品名称)[销售额].sum().reset_index() print(\n按产品统计销售额:) print(product_stats)5. 完整示例读取、筛选与输出以下是一个完整的工作流示例在WPS表格内置Py编辑器中可直接运行# WPS表格内置Py脚本完整示例 1. 读取表格数据 A1:C5 df2 xl(A1:C5, headersTrue) 2. 数据预览 print( 步骤1读取原始数据 ) print(df2) print(f共 {len(df2)} 行{len(df2.columns)} 列) 3. 筛选指定列 df2_subset df2[[产品名称, 发货日期]] 4. 输出筛选结果 print(\n 步骤2筛选后的数据 ) print(df2_subset) 5. 简单统计 print(\n 步骤3数据统计 ) print(f产品种类数: {df2_subset[产品名称].nunique()}) print(f发货日期范围: {df2_subset[发货日期].min()} 至 {df2_subset[发货日期].max()})6. 使用注意事项数据范围格式xl()函数接收的单元格范围格式为A1:C5确保使用英文冒号分隔起始和结束单元格。列名大小写列名严格区分大小写筛选列时需与表格中的实际列名完全一致。表头处理如果数据区域第一行不是表头应将headers参数设为False数据将以整数列索引命名。大数据量处理读取大范围数据时注意性能建议按需读取所需行数。输出结果print()输出会显示在Py脚本面板的结果区域方便查看和调试。7. 总结WPS表格内置Py脚本功能通过xl()函数屏蔽了传统Python数据分析中的文件路径、库导入等繁琐步骤让用户可以直接聚焦于数据处理逻辑。本文的内容可总结为三个核心步骤使用xl(A1:C5, headersTrue)读取指定范围数据通过df2[[产品名称, 发货日期]]进行列筛选用print()输出查看结果