Python内建数据结构详解
一、列表(List)
list是一个可以在其中存储一系列项目的数据结构。list的项目之间需用逗号分开,并用一对中括号括将所有的项目括起来,以表明这是一个list。下例用以展示list的一些基本操作:
#定义一个list对象class_list: class_list=['Michael','Bob','Tracy'] #获得一个class_list的长度 print'classhave',len(class_list),'students' #访问class_list中的对象 print'The3rdstudentinclassis',class_list[2] #往class_list中插入对象 class_list.append('Paul') #从class_list中删除一个项目 delclass_list[0] #对class_list进行排序 class_list.sort() #遍历整个class_list中的项目 print'Thesestudentsare:', forstudentinclass_list: printstudent,
输出结果为:
classhave3students
The3rdstudentinclassisTracy
Thesestudentsare:BobPaulTracy
关于上面的代码有几点要注意的是:
可以往class_list中加入任何类型的对象,也就是说,并不要求一个list中的项目具有相同类型。你甚至可以往class_list中插入一个list。
排序函数作用于本身,而不是返回一个副本,这与字符串类型是不同的,因为字符串不可修改。
print函数的end关键字参数用来指定输入完成之后的输出,默认是换行符,上面的代码用空格符替代换行符。
二、元组(Tuple)
tuple在用法与概念上与list没有多大差别,可以将tuple看做是一个只读版list。也就是说tuple一经定义便不能被修改——不能添加和删除对象,也不能修改tuple中的对象。
tuple中的项同样应该用逗号分开,并用圆括号将这些项目括起来以表是是一个tuple。这个圆括号是可选的,也就是说可以用以下两种方式定义一个tuple:
t='Adam','Lisa','Bart'
t=('Adam','Lisa','Bart')
不过省掉那对圆括号不见得是什么好的习惯。另外当tuple只有一个项时,第一项之后必须有一个逗号,该情况下应该这样定义t=('Adam',)。这似乎是一个古怪的约束,但是假如没有这个逗号,不带括号定义的tuple就变成了t='Adam'这明显具有二义性。
三、字典(Dictionary)
字典可以看做是一组键-值(key-value)对的集合。键必须是唯一的,而每一个键关联着一个值。key必须是一个不可变的对象(如:tuple、数值型、字符串)。还要注意的是,在字典中的键值对并没有以任何方式进行排序。
一个字典的定义应该照这样的格式d={key1:value1,key2:value2,key3:value3}。键和值之间用冒号分隔,而键值对之间用逗号相隔,再用大括号将所有的键值对括起来。一些基本操作如下:
#字典的定义 d={ 'Adam':95, 'Lisa':85, 'Bart':59 } #通过键来获取值 print"Adam'sscoreis",d['Adam'] #删除一个键值对 deld['Bart'] #遍历字典 forname,scoreind.items(): print'{0}is{1}'.format(name,score) #往字典中增加一个键值对 d['Paul']=72 #判断字典中是否存在某键,也可以用ifab.has_key('Lisa') if'Lisa'ind: print"Lisa'saddressis",d['Lisa']
输出的结果为:
Adam'sscoreis95 Lisais85 Adamis95 Lisa'saddressis85
四、序列(Sequences)
上面介绍的三种内建数据结构都是序列,索引操作是序列的一个基本操作。通过下标操作可以直接访问序列中的对象。上面虽然已经演示了下标操作——队列和元组用数字下标,字典用关键字下标。
序列的下标是从0开始的,上面的例子中只使用了下标为正数的情况,其实下标还可以为负数,如-1,-2,-3…。负数下标表示的意义为反方向的位置,如class_list[-1]返回的是class_list的倒数第一个项目。
序列不但支持负数下标还支持双下标,这对双下标表示一个区间。如class_list[0:3]返回的是一个class_list中从下标为1到下标为3之前的子序列副本。注意这个区间是一对半闭半开的区间。这种操作被称作切片操作(slicingoperation)。如果切片操作的第二个下标超出了序列的范围,那么切片操作会到序列的末尾终止。切片操作中的两个下标都有默认值,第一个的默认值为0,第二个的大小为序列的长度。
还可以给切片操作提供第三个参数,第三个参数代表切片操作的步长,它的默认值是1。步长代表了项与项之间的间距,比方name[0:10:3],返回的就是name中下标为0,3,6,9组成的子序列。
五、集合(Set)
集合是无序简单对象的聚集。当你只关注一个对象是否存在于聚集中,而不管它存在的顺序或在出现的次数时,则适宜用集合。基本功能:判断是否是集合的成员、一个集合是不是另一个集合的子集、获取两个集合的交集等等。实例:
s=set(['Adam','Lisa','Bart','Paul']) #判断对象是否在集合中 if'Bart'ins: print"Bartisin?",'Bart'ins #使用copy函数来拷贝一个set sc=s.copy() #往集合中添加对象 sc.add('Bill') #从集合中删除对象 sc.remove('Adam') #求两个集合的交集,也可以使用s.intersection(sc) prints&sc
输出的结果:
Bartisin?True set(['Lisa','Paul','Bart'])