pandas库学习之read_excel函数
创始人
2024-12-26 07:43:18
0

pandas库学习之read_excel函数

一、简介

pandas.read_excel函数用于从Excel文件中读取数据,并将其转换为DataFrame对象。这个函数支持读取Excel 2003及以后的文件格式(.xls和.xlsx)。

二、语法和参数

pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, storage_options=None) 
参数:
  • io:字符串、路径对象、bytes、ExcelFile或xlrd.Book,表示要读取的Excel文件路径或Excel对象。
  • sheet_name:字符串、整数或列表,默认值为0,表示要读取的工作表名称或索引。可以是字符串(工作表名称)、整数(工作表位置)或列表(多个工作表)。
  • header:整数,默认值为0,表示作为列名的行索引
  • names:数组状,表示用作列名的列表。如果传递此参数,则header参数将被忽略。
  • index_col:整数或列表,表示用作行索引的列编号或列名。
  • usecols:字符串、列表或整数,表示要读取的列
  • dtype:字典,表示列的数据类型。
  • converters:字典,表示列的转换函数。
  • skiprows:列表、整数或可调用对象,表示要跳过的行数。
  • nrows:整数,表示要读取的行数
  • na_values:标量、字符串或列表,表示要视为缺失值的值
  • keep_default_na:布尔值,表示是否保留默认的缺失值。默认值为True。
  • verbose:布尔值,表示是否打印加载信息。默认值为False。
  • parse_dates:布尔值或列表,表示是否将列解析为日期。
  • date_parser:函数,表示用于解析日期的函数。
  • thousands:字符串,表示千位分隔符。
  • comment:字符串,表示注释字符,表示注释行的开头。
  • skipfooter:整数,表示要跳过的文件末尾的行数。
  • convert_float:布尔值,表示是否将整数转换为浮点数。默认值为True。
  • mangle_dupe_cols:布尔值,表示是否处理重复列名。默认值为True。
  • storage_options:字典,表示传递给文件系统的额外存储选项。

三、实例

3.1 读取单个工作表
import pandas as pd  # 假设当前目录下有一个名为example.xlsx的Excel文件 df = pd.read_excel('example.xlsx', sheet_name='Sheet1')  print(df) 

输出:

   Column1  Column2 0        1        4 1        2        5 2        3        6 
3.2 读取多个工作表
import pandas as pd  # 假设当前目录下有一个名为example.xlsx的Excel文件 dfs = pd.read_excel('example.xlsx', sheet_name=['Sheet1', 'Sheet2'])  for sheet, data in dfs.items():     print(f"Sheet: {sheet}")     print(data) 

输出:

Sheet: Sheet1    Column1  Column2 0        1        4 1        2        5 2        3        6  Sheet: Sheet2    ColumnA  ColumnB 0       10       40 1       20       50 2       30       60 

四、注意事项

  1. 确保安装了必要的依赖库,如xlrd(用于读取.xls文件)或openpyxl(用于读取.xlsx文件)。

    pip install openpyxl xlrd 
  2. 当读取多个工作表时,返回的对象是一个字典,键是工作表名称,值是相应的DataFrame。

  3. 使用usecols参数可以显著提高读取速度,特别是对于大型Excel文件。

  4. 如果Excel文件包含合并单元格,pandas.read_excel可能会处理不当。建议在预处理阶段尽量避免使用合并单元格。

相关内容

热门资讯

了解了解!微玩盒子网页游戏辅助... 了解了解!微玩盒子网页游戏辅助(辅助)微乐长沙麻将真是真的是有辅助软件(哔哩哔哩)1、微玩盒子网页游...
总结了解!九九山城辅助免费(辅... 总结了解!九九山城辅助免费(辅助)游米在线确实是真的辅助下载(哔哩哔哩)1、九九山城辅助免费脚本辅助...
普及了解!闲逸软件安卓(辅助)... 普及了解!闲逸软件安卓(辅助)微乐宁夏麻将其实有挂辅助平台(哔哩哔哩);1、进入游戏-大厅左侧-新手...
教你了解!同城游修改器(辅助)... 教你了解!同城游修改器(辅助)海迅麻将切实是真的辅助工具(哔哩哔哩)1、起透看视 同城游修改器辅助软...
解谜了解!丽水都莱大菠萝有辅助... 解谜了解!丽水都莱大菠萝有辅助工具吗(辅助)52白城麻将果然真的是有辅助修改器(哔哩哔哩)1、丽水都...
总结了解!顺欣茶楼辅助(辅助)... 总结了解!顺欣茶楼辅助(辅助)启悦原来存在有辅助器(哔哩哔哩)顺欣茶楼辅助能透视中分为三种模型:顺欣...
开挂了解!情怀娱乐辅助器(辅助... 您好,情怀娱乐辅助器这款游戏可以开挂的,确实是有挂的,需要了解加去威信【136704302】很多玩家...
详细了解!佛手在线十三道辅助器... 详细了解!佛手在线十三道辅助器(辅助)宁波世纪茶馆确实存在有辅助下载(哔哩哔哩)佛手在线十三道辅助器...
解迷了解!钱塘十水三插件(辅助... 解迷了解!钱塘十水三插件(辅助)驫真是存在有辅助软件(哔哩哔哩)1、全新机制【钱塘十水三插件ai辅助...
分享了解!闲逸碰胡辅助(辅助)... 分享了解!闲逸碰胡辅助(辅助)乐逍遥跑胡子真是真的是有辅助器(哔哩哔哩)1、闲逸碰胡辅助透视辅助软件...