Ruby中Hash哈希结构的基本操作方法小结
关于哈希
先来了解一下Hash的基本思路:
设要存储对象的个数为num,那么我们就用len个内存单元来存储它们(len>=num);以每个对象ki的关键字为自变量,用一个函数h(ki)来映射出ki的内存地址,也就是ki的下标,将ki对象的元素内容全部存入这个地址中就行了。这个就是Hash的基本思路。
为什么要用一个函数来映射出它们的地址单元呢?
假设现在我要存储4个元素1371411
显然,我们可以用数组来存。也就是:a[1]=13;a[2]=7;a[3]=14;a[4]=11;
当然,我们也可以用Hash来存。下面给出一个简单的Hash存储:
先来确定那个函数。我们就用h(ki)=ki%5;
对于第一个元素h(13)=13%5=3;也就是说13的下标为3;即Hash[3]=13;
对于第二个元素h(7)=7%5=2;也就是说7的下标为2;即Hash[2]=7;
同理,Hash[4]=14;Hash[1]=11;
现在我要你查找11这个元素是否存在。你会怎么做呢?当然,对于数组来说,那是相当的简单,一个for循环就可以了。
也就是说我们要找4次。
下面我们来用Hash找一下。
首先,我们将要找的元素11代入刚才的函数中来映射出它所在的地址单元。也就是h(11)=11%5=1了。下面我们来比较一下Hash[1]?=11,这个问题就很简单了。也就是说我们就找了1次。这个就是Hash的妙处了,通过制定一个规则(函数)来映射出它的地址,数据也就能通过这个规则去找到它的内存地址了。
Ruby中的Hash结构
1.创建哈希:就像创建数组一样,我们可以通过Hash类来创建一个Hash实例:
h1=Hash.new#默认值为nil h2=Hash.new(“Thisismyfirsthashinstance”)#默认值为”Thisismyfirsthashinstance”:
上面两个例子都创建了一个空的Hash实例。一个Hash对象总是有一个默认的值——因为如果在一个Hash对象里没有找到指定的索引(key),将会返回默认值。
创建了Hash对象后,我们就可以像数组那样给他添加/删除项了。唯一不同的是,在数组中的索引只是能整数,而在Hash中索引(key)可以是任何类型(anytypeofobject)且唯一的数据:
h2["one"]="北京" h2["two"]="上海" h2["three"]="深圳" h2["four"]="广州"
Note:如果在给Hash赋值时,使用的相同的key,那么后面的值会覆盖掉前面的值。另外,Ruby还提供了一种方便的创建和初始化Hash的方法,只需要在key后面加一个=>符号并跟一个值即可。每个key-value对用逗号隔开。然后整体用大括号括起来:
h2={ "one"=>"北京", "two"=>"上海", "three"=>"深圳", "four"=>"广州" }
2.通过索引存取Hash的值:
要想获取某个值,可以用下面的方法:
putsh2[“one”]#=>”北京”
如果指定的key不存在,将返回默认的值(前面有提到过)。此外,我们还可以用default方法获取默认值,用default+=方法设置默认值
putsh1.default h1.default+=“Thisissetvaluemethod”
3.复制Hash:
和数组一样,我们可以把一个Hash变量分配给另一个hash变量,它们都引用想同的Hash,所以如果其中一个的值变了,那么另外一个的值也会跟着变:
h3=h2 h3[“one”]=“西安” putshh2[“one”]#=>”西安”
有的时候我们不希望上面的情况发生,即:修改了其中一个的值另一个也跟着修改了,我们可以使用clone方法makeanew
copy h4=h2.clone h4[“one”]=“大连” putsh2[“one”]#=>”西安”(i.e.值没有修改)
4.Hash排序:
当我们需要对Hash进行排序时,不能像数组那样简单的使用sort方法,因为数组中的数据类型都是一样的(整型),Hash中的数据类型可能并不完全一样,如整数类型和字符串类型就没法一起排序,此时就需要我们进行处理,如下(如果Hash中的数据类型全部相同可以不进行如下处理):
defsorted_hash(aHash) returnaHash.sort{ |a,b|a.to_s<=>b.to_s } End h1={1=>'one',2=>'two',3=>'three'} h2={6=>'six',5=>'five',4=>'four'} h3={'one'=>'A','two'=>'B','three'=>'C'} h4=h1.merge(h2)#合并hash h5=h1.merge(h3) defsorted_hash(aHash) returnaHash.sort{|a,b|a.to_s<=>b.to_s} end p(h4) p(h4.sort) p(h5) p(sorted_hash(h5))
结果:
{5=>"five",6=>"six",1=>"one",2=>"two",3=>"three",4=>"four"} [[1,"one"],[2,"two"],[3,"three"],[4,"four"],[5,"five"],[6,"six"]] {"two"=>"B","three"=>"C",1=>"one",2=>"two","one"=>"A",3=>"three"} [[1,"one"],[2,"two"],[3,"three"],["one","A"],["three","C"],["two","B"]]
事实上Hash的sort方法是把一个Hash对象转换成以[key,value]为单个元素的一个数组,然后再用数组的sort方法进行排序。
5.Hash类常用方法:
e.g.
student={ "name"=>"Steve", "age"=>22, "Gender"=>"male" } pstudent.keys#=>["name","Gender","age"] pstudent.values#=>["Steve","male",22] putsstudent.include?("age")#=>true putsstudent.size#=>3 student.delete("Gender") putsstudent.has_key?("Gender")#=>false putsstudent.size#=>2
深度挖掘
1.把Hash当作数组来处理:
Hash中的keysandvalues方法的返回值都是一个数组,所以我们可以使用数组的方法来对它们操作:
h1={1=>'one',2=>'two',3=>'three',4=>'four'} h2={1=>'one',3=>'two',4=>'four',5=>'five'} p(h1.keys&h2.keys) p(h1.values&h2.values) p(h1.keys+h2.keys) p(h1.values-h2.values) p((h1.keys<<h2.keys)) p((h1.keys<<h2.keys).flatten)
结果:
[1,3,4] ["one","two","four"] [1,2,3,4,5,1,3,4] ["three"] [1,2,3,4,[5,1,3,4]] [1,2,3,4,5,1,3,4]
2.追加和连续的区别:
+:给一个数组添加元素,创建一个新的数组
<<:给一个数据添加元素,直接操作原数组,当给一个数组添加的新元素也是一个数组时,该新元素作为数组的最后一个元素:
a=[1,2,3] b=[4,5,6] p(a+b) p(a<<b)
结果:
[1,2,3,4,5,6] [1,2,3,[4,5,6]]#[1,2,3,[4,5,6]].flatten=>[1,2,3,4,5,6]