python hash每次调用结果不同的原因
这篇文章主要介绍了pythonhash每次调用结果不同的原因,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
importtime importmultiprocessing device=['3695a1c7-0fa6-4fa8-a563-8fd462c04af5','0dfdd431-f9bc-4c90-b246-f2b19d20969c','0323488d-7c9c-4244-8fc6-07266124d2f0','689cde3c-6ca4-4ed7-b63a-e114b76650fb','bc4084a5-da8e-4673-a214-4b5f5de4b21d','b6ec0d69-af49-43d1-b77d-e72da48df2e6','a7fe06e8-ff26-4ebf-b526-ca7083ccb031','7a8db973-6a7b-481b-ba80-0afb5594b6cd','637db54f-9932-4d8e-8b87-5c92011578e9','506b79bd-e174-4c24-8e39-9410ef7ef1f2'] defdo_hash(d): print("%s%d%d%d"%(d,hash(d),hash(d),hash(d)%10)) time.sleep(0.01) res,pool=[],multiprocessing.Pool(processes=len(device)) fordindevice: do_hash(d) foriinrange(10): res.append(pool.apply_async(do_hash,args=(d,))) whileres: forretinres: ifret.ready(): res.remove(ret) time.sleep(0.01)
如上代码,用来验证hash的结果。
- 在同一个程序运行过程中,单进程下,hash同一个字符串,结果是否一致。答案:一致
- 在同一个程序运行过程中,多进程中,不同子进程hash同一个字符串,结果是否一致。答案:一致
- 同样的代码,多次运行同一个程序,每次运行程序时,hash同一个字符串,产生的结果和其他运行过程产生的结果是否一致。答案:不一致
如下是运行测试。
运行一次
$python3~/t.py|sort|uniq-c 110323488d-7c9c-4244-8fc6-07266124d2f0-6009992680465351322-60099926804653513228 110dfdd431-f9bc-4c90-b246-f2b19d20969c-5508606457111079556-55086064571110795564 113695a1c7-0fa6-4fa8-a563-8fd462c04af5470771203703863269147077120370386326911 11506b79bd-e174-4c24-8e39-9410ef7ef1f28578247211387710698578247211387710699 11637db54f-9932-4d8e-8b87-5c92011578e9575453669763312589057545366976331258900 11689cde3c-6ca4-4ed7-b63a-e114b76650fb525406831134634284852540683113463428488 117a8db973-6a7b-481b-ba80-0afb5594b6cd656955691435893029365695569143589302933 11a7fe06e8-ff26-4ebf-b526-ca7083ccb031-7752949605389894777-77529496053898947773 11b6ec0d69-af49-43d1-b77d-e72da48df2e6539145035606623106753914503560662310677 11bc4084a5-da8e-4673-a214-4b5f5de4b21d866337969957954506186633796995795450611
再运行一次:
$python3~/t.py|sort|uniq-c 110323488d-7c9c-4244-8fc6-07266124d2f0663720049581895808766372004958189580877 110dfdd431-f9bc-4c90-b246-f2b19d20969c255008577703681975025500857770368197500 113695a1c7-0fa6-4fa8-a563-8fd462c04af5329175774209513467632917577420951346766 11506b79bd-e174-4c24-8e39-9410ef7ef1f2-1500680899775158570-15006808997751585700 11637db54f-9932-4d8e-8b87-5c92011578e9-1846084821474967397-18460848214749673973 11689cde3c-6ca4-4ed7-b63a-e114b76650fb-8218022715868473813-82180227158684738137 117a8db973-6a7b-481b-ba80-0afb5594b6cd-783003051379698560-7830030513796985600 11a7fe06e8-ff26-4ebf-b526-ca7083ccb031-4314803525216302877-43148035252163028773 11b6ec0d69-af49-43d1-b77d-e72da48df2e6169942127825522829716994212782552282977 11bc4084a5-da8e-4673-a214-4b5f5de4b21d613544631771742010061354463177174201000
原因是:
python的字符串hash算法并不是直接遍历字符串每个字符去计算hash,而是会有一个secretprefix和一个secretsuffix,可以认为相当于是给字符串加盐后做hash,可以规避一些规律输入的情况显然这个secret前后缀的值会直接影响计算结果,而且它有一个启动时随机生成的机制,只不过,在2.x版本中,这个机制默认是关闭的,前后缀每次启动都设置为0,除非你改了相关环境变量来要求随机,而在3.x中修改了默认行为,如果你不配置环境变量,则默认是随机一个前后缀值,这样每次启动都会不同这个环境变量是PYTHONHASHSEED,无论在2.x还是3.x中,配置为一个正整数,将作为随机种子;配置为0,则secret前后缀默认清零(和2.x默认行为就一样了),配置为空串或“random”,则表示让进程随机生成(和3.x默认行为一样)具体为啥要这么做,猜测一个是为了安全性(防字符串hash表的攻击,比如php曾经碰到的攻击),另一个可能也是强调不要依赖一些内建结果,因为这种算法可能随着版本而更新,避免有些用户不看文档,误以为是永远不变的
设置固定的PYTHONHASHSEED后结果一致:
yzc:~youzhengchuan$PYTHONHASHSEED=10python3~/t.py|sort|uniq-c 110323488d-7c9c-4244-8fc6-07266124d2f0214151920291266652421415192029126665244 110dfdd431-f9bc-4c90-b246-f2b19d20969c-843959203188636526-8439592031886365264 113695a1c7-0fa6-4fa8-a563-8fd462c04af5512453433556079220751245343355607922077 11506b79bd-e174-4c24-8e39-9410ef7ef1f2-8435934314154906615-84359343141549066155 11637db54f-9932-4d8e-8b87-5c92011578e9-8619377286856168125-86193772868561681255 11689cde3c-6ca4-4ed7-b63a-e114b76650fb909442215520213072790944221552021307277 117a8db973-6a7b-481b-ba80-0afb5594b6cd107785060874670470610778506087467047066 11a7fe06e8-ff26-4ebf-b526-ca7083ccb031-4716484918100210177-47164849181002101773 11b6ec0d69-af49-43d1-b77d-e72da48df2e6-5676381002318020516-56763810023180205164 11bc4084a5-da8e-4673-a214-4b5f5de4b21d410724273300364828141072427330036482811 yzc:~youzhengchuan$PYTHONHASHSEED=10python3~/t.py|sort|uniq-c 110323488d-7c9c-4244-8fc6-07266124d2f0214151920291266652421415192029126665244 110dfdd431-f9bc-4c90-b246-f2b19d20969c-843959203188636526-8439592031886365264 113695a1c7-0fa6-4fa8-a563-8fd462c04af5512453433556079220751245343355607922077 11506b79bd-e174-4c24-8e39-9410ef7ef1f2-8435934314154906615-84359343141549066155 11637db54f-9932-4d8e-8b87-5c92011578e9-8619377286856168125-86193772868561681255 11689cde3c-6ca4-4ed7-b63a-e114b76650fb909442215520213072790944221552021307277 117a8db973-6a7b-481b-ba80-0afb5594b6cd107785060874670470610778506087467047066 11a7fe06e8-ff26-4ebf-b526-ca7083ccb031-4716484918100210177-47164849181002101773 11b6ec0d69-af49-43d1-b77d-e72da48df2e6-5676381002318020516-56763810023180205164 11bc4084a5-da8e-4673-a214-4b5f5de4b21d410724273300364828141072427330036482811 yzc:~youzhengchuan$PYTHONHASHSEED=10python3~/t.py|sort|uniq-c 110323488d-7c9c-4244-8fc6-07266124d2f0214151920291266652421415192029126665244 110dfdd431-f9bc-4c90-b246-f2b19d20969c-843959203188636526-8439592031886365264 113695a1c7-0fa6-4fa8-a563-8fd462c04af5512453433556079220751245343355607922077 11506b79bd-e174-4c24-8e39-9410ef7ef1f2-8435934314154906615-84359343141549066155 11637db54f-9932-4d8e-8b87-5c92011578e9-8619377286856168125-86193772868561681255 11689cde3c-6ca4-4ed7-b63a-e114b76650fb909442215520213072790944221552021307277 117a8db973-6a7b-481b-ba80-0afb5594b6cd107785060874670470610778506087467047066 11a7fe06e8-ff26-4ebf-b526-ca7083ccb031-4716484918100210177-47164849181002101773 11b6ec0d69-af49-43d1-b77d-e72da48df2e6-5676381002318020516-56763810023180205164 11bc4084a5-da8e-4673-a214-4b5f5de4b21d410724273300364828141072427330036482811
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。