pandas.read_excel函数用于从Excel文件中读取数据,并将其转换为DataFrame对象。这个函数支持读取Excel 2003及以后的文件格式(.xls和.xlsx)。
pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, storage_options=None)  import pandas as pd  # 假设当前目录下有一个名为example.xlsx的Excel文件 df = pd.read_excel('example.xlsx', sheet_name='Sheet1')  print(df)  输出:
   Column1  Column2 0        1        4 1        2        5 2        3        6  import pandas as pd  # 假设当前目录下有一个名为example.xlsx的Excel文件 dfs = pd.read_excel('example.xlsx', sheet_name=['Sheet1', 'Sheet2'])  for sheet, data in dfs.items():     print(f"Sheet: {sheet}")     print(data)  输出:
Sheet: Sheet1    Column1  Column2 0        1        4 1        2        5 2        3        6  Sheet: Sheet2    ColumnA  ColumnB 0       10       40 1       20       50 2       30       60  确保安装了必要的依赖库,如xlrd(用于读取.xls文件)或openpyxl(用于读取.xlsx文件)。
pip install openpyxl xlrd  当读取多个工作表时,返回的对象是一个字典,键是工作表名称,值是相应的DataFrame。
使用usecols参数可以显著提高读取速度,特别是对于大型Excel文件。
如果Excel文件包含合并单元格,pandas.read_excel可能会处理不当。建议在预处理阶段尽量避免使用合并单元格。