python:pandas合并csv文件的方法(图书数据集成)

时间:2021-05-22

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

ReaderRentRecode.csv:

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-import csv as csvimport numpy as np# -------------# csv读取表格数据# -------------'''csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))header = csv_file_object.next()print headerprint type(header)print header[1]data = []for row in csv_file_object: data.append(row)data = np.array(data)print data[0::, 0]'''# -------------# pandas读取表格数据# -------------import pandas as pddf = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表'''print df.head()print '----------------'print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列print '------------------------------------------------------------------'print'''dd = pd.read_csv('ReaderInformation.csv')'''print dd.head()print '----------------'print dd[['读者证号', '读者性别', '读者单位', '读者类别']]print '------------------------------------------------------------------'print'''data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]print dataprint '------------------------------------------------------------------'print# -------------# pandas写入表格数据# -------------data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章