python:pandas合并csv文件的方法(图书数据集成)
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:

ReaderRentRecode.csv:

pandas读取csv文件,并进行csv文件合并处理:
# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
pyTorch深入学习梯度和Linear Regression实现
这篇文章主要介绍了pyTorch深入学习,实现梯度和Linear Regression,文中呈现了详细的示例代码,有需要的朋友可以借鉴参考下,希望能够有所帮助2021-09-09
python实现几种归一化方法(Normalization Method)
这篇文章主要介绍了python实现几种归一化方法(Normalization Method),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2019-07-07
浅谈Python2.6和Python3.0中八进制数字表示的区别
下面小编就为大家带来一篇浅谈Python2.6和Python3.0中八进制数字表示的区别。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧2017-04-04


最新评论