Python pandas DataFrame操作的实现代码
1.从字典创建Dataframe
>>>importpandasaspd >>>dict1={'col1':[1,2,5,7],'col2':['a','b','c','d']} >>>df=pd.DataFrame(dict1) >>>df col1col2 01a 12b 25c 37d
2.从列表创建Dataframe(先把列表转化为字典,再把字典转化为DataFrame)
>>>lista=[1,2,5,7] >>>listb=['a','b','c','d'] >>>df=pd.DataFrame({'col1':lista,'col2':listb}) >>>df col1col2 01a 12b 25c 37d
3.从列表创建DataFrame,指定data和columns
>>>a=['001','zhangsan','M'] >>>b=['002','lisi','F'] >>>c=['003','wangwu','M'] >>>df=pandas.DataFrame(data=[a,b,c],columns=['id','name','sex']) >>>df idnamesex 0001zhangsanM 1002lisiF 2003wangwuM
4.修改列名,从['id','name','sex']修改为['Id','Name','Sex']
>>>df.columns=['Id','Name','Sex'] >>>df IdNameSex 0001zhangsanM 1002lisiF 2003wangwuM
5.调整DataFrame列顺序、调整列编号从1开始
https://www.nhooo.com/article/163644.htm
6.DataFrame随机生成10行4列int型数据
>>>importpandas >>>importnumpy >>>df=pandas.DataFrame(numpy.random.randint(0,100,size=(10,4)),columns=list('ABCD'))#0,100指定随机数为0到100之间(包括0,不包括100),size=(10,4)指定数据为10行4列,column指定列名 >>>df ABCD 067283766 121274337 273549885 34078493 499606316 548462461 659526228 720743664 814134660 918447036
7.用时间序列做index名
>>>df#原本index为自动生成的0~9 ABCD 031254567 162126188 279362097 326575044 42412501 54619962 640475227 78366714 858592562 93881608 >>>importpandas >>>dates=pandas.date_range('20180121',periods=10) >>>dates#从20180121开始,共10天 DatetimeIndex(['2018-01-21','2018-01-22','2018-01-23','2018-01-24', '2018-01-25','2018-01-26','2018-01-27','2018-01-28', '2018-01-29','2018-01-30'], dtype='datetime64[ns]',freq='D') >>>df.index=dates#将dates赋值给index >>>df ABCD 2018-01-2131254567 2018-01-2262126188 2018-01-2379362097 2018-01-2426575044 2018-01-252412501 2018-01-264619962 2018-01-2740475227 2018-01-288366714 2018-01-2958592562 2018-01-303881608
8.dataframe实现类SQL操作
pandas官方文档ComparisonwithSQL
https://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。