前言
Hash算法我们可能早就听过,不仅仅应用在密码学领域。由于hash算法所体现的思想十分的满足我们的需求,比如可以把一个十分复杂的东西映射到另外一个较为简单的地方,所以很多地方都有应用。
# 1. 什么是hash算法?
Hash(哈希或散列,Hash Algorithm)算法是信息技术领域非常基础也非常重要的技术。它能任意长度的二进制值(明文)映射为较短的固定长度的二进制值(Hash值),并且不同的明文很难映射为相同的Hash值。
Hash算法的核心思想:基于内容进行编址或者命名。
2. Hash算法的特点
一个优秀的 hash 算法,将能实现:
- 正向快速:给定明文和hash算法,在有限时间和有限资源内能计算出hash值。
-
逆向困难:给定(若干)hash值,在有限时间内很难(基本不可能)逆推出明文。
-
输入敏感:原始输入信息修改一点信息,产生的hash值看起来应该都有很大不同。
- 冲突避免:很难找到两段内容不同的明文,使得它们的hash值一致(发生冲突)。
如果给定一个明文前提下,难以找到碰撞的另一个明文,称为“弱抗碰撞性”;如果难以找到任意两个明文,发生碰撞,则称算法具有“强抗碰撞性”。
3. 流行的hash算法
目前流行的 Hash 算法包括 MD5、SHA-1 和 SHA-2。
MD是Message Digest的缩写。
- MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的,MD 是 Message Digest 的缩写。其输出为 128 位。MD4 已证明不够安全。
- MD5(RFC 1321)是 Rivest 于1991年对 MD4 的改进版本。它对输入仍以 512 位分组,其输出是 128 位。MD5 比 MD4 复杂,并且计算速度要慢一点,更安全一些。MD5 已被证明不具备”强抗碰撞性”(强抗碰撞性参考上面的内容)。
- SHA (Secure Hash Algorithm)是一个 Hash 函数族,由 NIST(National Institute of Standards and Technology)于 1993 年发布第一个算法。目前知名的 SHA-1 在 1995 年面世,它的输出为长度 160 位的 hash 值,因此抗穷举性更好。SHA-1 设计时基于和 MD4 相同原理,并且模仿了该算法。SHA-1 已被证明不具”强抗碰撞性”。
4. hash算法的缺点
一般而言,Hash需要较强的算力资源,所以算力很可能成为hash算法的瓶颈。一般选择进行hash算法的CPU需要较高的主频。
5. Hash算法与数字摘要之间的关系
数字摘要的意思是对内容进行Hash运算,把运算结果作为唯一的值来代表之前的值。
根据前面所学习的内容,我们可以根据前面所学的hash函数的特点之一(抗碰撞性)来解决确保内容没有被篡改的问题。
数字摘要是Hash算法的一个很重要的使用场景。当我们在网络上下载东西的时候,很可能被不法分子篡改,这个时候我们就可以对下载的资源进行数字摘要,这样当我们下载之后,通过把下载的文件进行Hash计算,把结果与数字摘要进行对比,就可以知道文件是否被篡改。
6. 总结
今天我们学习了Hash算法的概念,特点,常用的Hash算法,Hash算法的特点以及Hash算法的应用(数字摘要)等内容。对其有了一个基本的了解。