一、MD5反查基础概念
MD5(Message-Digest Algorithm 5)是一种常用的哈希算法,它将不同长度的信息通过哈希运算,输出定长的哈希值。反查就是通过这个哈希值,找到原来的信息。
MD5的哈希值是一个128位的二进制数,通常用32位的16进制数表示。在应用中,MD5通常用于文件校验、数据校验、口令加密等。
用Python基础库中的hashlib模块可以很容易地实现MD5哈希值的计算:
import hashlib
text = 'hello world'
md5 = hashlib.md5(text.encode()).hexdigest()
print(md5) # 输出5eb63bbbe01eeed093cb22bb8f5acdc3
二、MD5反查实现
当我们拿到一个MD5哈希值时,如果要进行反查,就需要用一个字典来存储哈希值与原文的映射关系。字典中的键为哈希值,值为原文。
这里以破解一个网站用户密码的例子来说明MD5反查的实现。假设我们得到了一个数据库文件,其中存储了用户的用户名和密码的MD5哈希值:
users = [
{'username': 'user1', 'password_md5': '5f4dcc3b5aa765d61d8327deb882cf99'},
{'username': 'user2', 'password_md5': '202cb962ac59075b964b07152d234b70'},
{'username': 'user3', 'password_md5': 'e10adc3949ba59abbe56e057f20f883e'},
{'username': 'user4', 'password_md5': '81dc9bdb52d04dc20036dbd8313ed055'}
]
我们可以先通过字典攻击的方式生成一个含有常用密码的字典文件,然后遍历用户数据进行反查。
下面是字典攻击生成字典文件的代码:
import itertools
def generate_password_dict(length=6):
chars = 'abcdefghijklmnopqrstuvwxyz'
passwords = itertools.product(chars, repeat=length)
with open('password.txt', 'w') as f:
for password in passwords:
f.write(''.join(password)+'\n')
我们可以将密码的长度设置为6位,然后在a~z的字母中生成所有组合,最后将这些密码保存在一个文本文件中。
反查的代码如下:
import hashlib
with open('password.txt', 'r') as f:
passwords = [p.strip() for p in f]
for user in users:
for password in passwords:
if hashlib.md5(password.encode()).hexdigest() == user['password_md5']:
print('{}:{}'.format(user['username'], password))
在这条代码中,我们首先读取生成的密码字典文件,然后遍历所有用户和密码的组合,计算哈希值并与原始密码比较,如果匹配成功,输出用户名和密码。
三、MD5反查的应用场景
MD5反查算法广泛应用于数据安全领域。比如:
- 破解密码:在拿到数据库文件后,可以通过MD5反查算法破解用户密码。
- 数据完整性校验:服务器可以将接收到的数据计算MD5哈希值,然后与客户端发来的哈希值比较,来校验数据的完整性。
- 数字签名:数字签名是一种安全性很高的文件验真方式,它采用的就是哈希算法,将文件的哈希值(数字签名)与信任机构(CA)颁发的数字证书相对比,从而证实文件是未被篡改过的。