Pyhton 处理 excel 文档
· One min read
这是一篇对使用 python 进行 excel 文档数据处理的一些技术说明。
依赖包:numpy, pandas
pd.read_excel
dtype: 制定数据类型 engine: 数据分析引擎
使用 read_excel 可以读取 excel 中的内容,返回 dataFrame 的数据格式。
pd.read_csv
使用 read_csv 可以读取 csv 文件,返回 dataFrame 的数据格式。
dataFrame.merge | dataFrame.join
merge 以列为基准去合并 join 以行为基准去合并
pd.Series
生成 Series 格式的数据,多个 Series 组合成 dataFrame。
dataFram[["a", "b"]]
截取列数据
dataFrame.rename
columns={"name_source": "name_renamed"}
如果想要对数据中的列进行重命名,则需要 rename,里面提供 columns 参数。
pd.pivot_table
values columns index
如果要对数据进行分组,出了 groupby 外,还可用 pivot_table,pivot_table 是商学院里面教学的工具,使用非常广泛。
dataFrame.to_excel
parameter: path_file_with_name
将 dataFrame 输出到 Excel 表格里面。
