Pandas 同元素多列去重的实例
有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。
首先我们看一下数据类型:
G1G2 ab ba cd dc ef
对这样的两列数据进行同元素去重,最终得到结果为:
G1G2 ab cd ef
代码如下:
#-*-coding:utf-8-*-
data={'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data=pd.DataFrame(data)
data['G3']=data['G1']+'|'+data['G2']
p=[]
foriindata['G3'].tolist():
tmp=sorted(i.split('|'))#Themostimportantpart,sort
p.append(tmp[0]+'|'+tmp[1])
data['G3']=pd.Series(p)
data=data.drop_duplicates('G3')
以上这篇Pandas同元素多列去重的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
热门推荐
10 诗词送行祝福语大全简短
11 新房开工吉日祝福语简短
12 50多岁生日简短祝福语
13 安徽疫情祝福语简短英语
14 农民朋友发财祝福语简短
15 对生活祝福语简短精辟
16 搬家词简短祝福语朋友
17 女神结婚快乐祝福语简短
18 文学短句祝福语大全简短