Python实现AES加密解密：从原理到实战工具类

📅 2026/7/5 9:49:17 👁️ 阅读次数 📝 编程学习

1. 项目概述

最近在做一个涉及数据传输安全的小项目，不可避免地要和加密算法打交道。在众多对称加密算法里，AES（Advanced Encryption Standard，高级加密标准）绝对是绕不开的明星。它不仅是美国国家标准与技术研究院（NIST）钦定的标准，更是我们日常开发中保护敏感数据，比如用户密码、交易信息、配置文件的首选工具。但说实话，刚开始接触AES时，我也被它那一堆概念搞懵过：ECB、CBC模式是啥？IV偏移量又有什么用？PKCS5和PKCS7填充有啥区别？更别提在Python里实现时，各种bytes类型转换和编码解码的坑了。

这篇文章，我就结合自己踩过的坑和项目实践，带你彻底搞懂AES加密算法的核心原理，并手把手用Python代码实现一个功能完整、健壮的AES加密解密工具类。无论你是刚入门安全领域的新手，还是需要在项目中快速集成加密功能的老手，相信这篇近万字的干货都能让你对AES有一个清晰、透彻的理解，并能直接应用到你的代码里。

2. AES加密算法核心原理深度解析

在动手写代码之前，我们必须先弄清楚AES到底是怎么工作的。知其然更要知其所以然，这样才能在遇到问题时知道从何下手。

2.1 对称加密与AES的诞生

AES属于对称加密算法。对称加密的意思是，加密和解密使用同一把钥匙，这把钥匙我们称之为密钥。这就好比你和朋友约定用同一把钥匙开同一把锁，你锁上箱子（加密），他用同样的钥匙打开（解密）。它的优点是加解密速度快，适合处理大量数据。与之相对的是非对称加密（如RSA），使用公钥和私钥两把钥匙，速度慢但更安全，常用于密钥交换或数字签名。

AES的前身是DES（Data Encryption Standard），但随着计算能力的提升，DES的56位密钥长度已不再安全。于是在1997年，NIST发起征集，最终在2000年选中了比利时密码学家Joan Daemen和Vincent Rijmen设计的Rijndael算法，并将其确定为AES标准。AES之所以能胜出，是因为它在安全性、性能、实现灵活性和资源消耗上取得了最佳平衡。

2.2 AES加密过程：轮函数与状态矩阵

AES加密过程可以看作是对一个“数据块”进行多轮复杂的变换。理解这个过程，是理解其安全性的关键。

密钥与数据块：AES支持三种密钥长度：128位、192位和256位，分别对应AES-128, AES-192, AES-256。密钥越长，安全性越高，但计算量也稍大。它处理的数据也是按块进行的，每个块固定为128位（16字节）。如果你的明文不是16字节的整数倍，就需要用到我们后面会详细讲的“填充模式”。
状态矩阵：加密开始时，16字节的明文块会被排成一个4x4的字节矩阵，这个矩阵称为“状态（State）”。后续的所有操作都是对这个状态矩阵进行的。
轮函数：AES加密的核心在于“轮函数”，它由四个步骤组成，每一轮（除了最后一轮稍有不同）都会按顺序执行：
- SubBytes（字节替换）：通过一个被称为S-Box（替换盒）的非线性查找表，将状态矩阵中的每一个字节替换成另一个字节。这一步是AES提供“混淆”特性的关键，打破了明文与密文之间的线性关系。
- ShiftRows（行移位）：将状态矩阵的每一行进行循环左移。第一行不动，第二行左移1个字节，第三行左移2个字节，第四行左移3个字节。这一步提供了“扩散”特性，让一个字节的变化能影响到更多的输出字节。
- MixColumns（列混合）：将状态矩阵的每一列与一个固定的多项式进行矩阵乘法运算。这一步进一步增强了扩散效果，是AES算法中最复杂的计算步骤。
- AddRoundKey（轮密钥加）：将当前的状态矩阵与一个“轮密钥”进行按位异或（XOR）操作。每一轮使用的轮密钥都不同，它们是由初始密钥通过一个称为“密钥扩展”的算法派生出来的。
加密轮数：加密总共进行的轮数取决于密钥长度：
- AES-128: 10轮
- AES-192: 12轮
- AES-256: 14轮

第一轮开始前会先进行一次AddRoundKey（使用第0个轮密钥），最后一轮则省略掉MixColumns步骤。解密过程就是加密过程的逆序，使用逆变换函数。

注意：对于绝大多数应用开发者，我们不需要手动实现这些底层轮函数。pycryptodome这样的库已经用C语言高效地实现了它们。但理解这个过程，能让你明白为什么AES是安全的，以及在选择密钥长度时心里有底。

2.3 加密模式：ECB与CBC的本质区别

这是AES应用中最容易混淆，也最关键的概念之一。加密模式定义了如何用同一个密钥对多个数据块进行加密。

ECB模式（电子密码本模式）：
- 工作原理：将明文分割成独立的16字节块，每个块用相同的密钥独立加密。就像用同一本密码本给每一句话单独编码。
- 问题：致命的弱点！相同的明文块会生成相同的密文块。对于有规律的数据（如图像），ECB加密后的密文仍可能保留明文的模式，安全性很差。除非万不得已，否则不要使用ECB模式。
CBC模式（密码分组链接模式）：
- 工作原理：引入了一个初始化向量（IV）。加密第一个明文块时，先将其与IV进行XOR操作，然后再用密钥加密。加密第二个块时，则用第一个块的密文作为“新的IV”与第二个明文块XOR，以此类推。每个块的加密都依赖于前一个块。
- 优势：相同的明文块，在不同的位置或使用不同的IV，会生成不同的密文块，消除了ECB的模式泄露问题，安全性高得多。
- 关键点：IV不需要保密，但必须是随机的且不可预测。通常每次加密都生成一个随机IV，并随密文一起存储或传输。解密时需要使用同一个IV。

简单类比：ECB像是给一本书的每一页单独用同一个密码锁上，有相同内容的页，锁看起来也一样。CBC则是用链条把每一页锁起来，第一页的锁扣在IV这个锚点上，第二页的锁扣在第一页上，如此环环相扣，改变任何一页都会影响后续所有页。

3. Python实现AES的关键细节与避坑指南

理论清楚了，我们进入实战环节。用Python实现AES，90%的坑都集中在数据格式、编码和填充上。

3.1 环境搭建与库的选择

Python中最常用的AES库是pycryptodome。它是经典库pycrypto的延续和维护版本，API兼容且更安全。

# 安装命令，务必使用pycryptodome pip install pycryptodome

实操心得：有些旧教程或系统里可能还残留着crypto或pycrypto包，这会导致导入冲突。保险起见，可以先卸载它们：
pip uninstall crypto pycrypto pip install pycryptodome

3.2 数据类型：万事皆`bytes`

这是第一个，也是最重要的一个坑。pycryptodome的AES模块所有输入输出都要求是bytes（字节）类型。这包括：密钥、明文、密文、IV。

# 正确做法：使用 b'' 前缀或 encode() 方法 key = b'my-16byte-key!!!' # 16字节密钥 iv = b'initial-vector!!' # 16字节IV text = b'plain text' # 字节型明文 text = '明文'.encode('utf-8') # 字符串编码为字节

如果你传入了字符串，会得到TypeError: Object type <class 'str'> cannot be passed to C code这样的错误。记住这个错误信息，它几乎肯定意味着你传的数据类型不对。

3.3 填充模式详解与手动实现

AES是块加密，一次处理16字节。但我们的数据长度不可能总是16的倍数。填充（Padding）就是用来解决这个问题的。

常见的填充模式有：

模式	描述	Python实现要点
PKCS7	最常用、最推荐。需要填充N个字节，每个字节的值都是N。例如，如果缺5字节，就填充5个`\x05`。	需要手动实现填充和去填充逻辑。
ZeroPadding	用`\x00`字节填充到块长度。注意：如果原始数据末尾本身就有`\x00`，去填充时会出错，不推荐用于通用场景。	实现简单，但可靠性有隐患。
NoPadding	不填充。要求数据长度必须是块长度的整数倍，否则报错。	仅适用于你能严格控制数据长度的场景。

很多资料说PKCS5和PKCS7在AES场景下是一样的，因为PKCS5原本是为8字节块设计的（如DES），而PKCS7支持1-255字节块。对于16字节的AES块，两者填充方式完全相同，所以我们可以统一用PKCS7的逻辑来处理。

为什么必须手动处理填充？因为pycryptodome的AES.new()默认是不处理填充的（相当于NoPadding）。它只负责加密你给它的字节块。如果数据长度不对齐，它会直接抛出ValueError。因此，我们需要在加密前手动把数据填充到16字节的倍数，在解密后再把填充的字节去掉。

下面是一个PKCS7填充与去填充的通用实现：

def pkcs7_padding(data, block_size=16): """PKCS7填充""" padding_len = block_size - len(data) % block_size # 需要填充的字节数，每个字节的值都是这个数 padding = bytes([padding_len] * padding_len) return data + padding def pkcs7_unpadding(padded_data, block_size=16): """PKCS7去填充""" # 取最后一个字节的值，即为填充的长度 padding_len = padded_data[-1] # 验证填充是否有效 if padding_len < 1 or padding_len > block_size: raise ValueError("Invalid padding length.") # 验证填充字节的值是否正确 if padded_data[-padding_len:] != bytes([padding_len] * padding_len): raise ValueError("Invalid padding bytes.") return padded_data[:-padding_len] # 示例 original = b'Hello AES!' # 长度10 padded = pkcs7_padding(original) # 长度变为16，填充了6个\x06 print(padded) # b'Hello AES!\x06\x06\x06\x06\x06\x06' unpadded = pkcs7_unpadding(padded) print(unpadded) # b'Hello AES!'

注意事项：去填充时一定要做有效性校验（如上面代码中的if判断）。恶意构造的密文可能导致去填充逻辑读取到非法长度，引发错误或潜在的安全问题（如Padding Oracle攻击）。虽然我们这里实现的是基础版本，但良好的校验习惯很重要。

3.4 编码问题：Base64与Hex的运用

加密后的密文是字节串，可能包含不可打印字符。为了在网络传输、存储或日志中方便处理，我们通常对其进行编码。

Base64编码：将3字节（24位）数据编码为4个可打印ASCII字符（A-Z, a-z, 0-9, +, /，末尾可能用=填充）。空间利用率较高（约比原始数据大33%），是最常用的编码方式，尤其在HTTP、JSON等场景。
Hex编码（十六进制）：将1字节数据表示为两个十六进制字符（0-9, a-f）。可读性好，但空间利用率低（数据会膨胀一倍）。

在Python中转换非常方便：

import base64 import binascii # 原始密文（字节） cipher_bytes = b'\x93\x8bN!\xe7~>\xb0M...' # 转换为Base64字符串（便于传输存储） cipher_b64 = base64.b64encode(cipher_bytes).decode('utf-8') # 输出类似：'k4tOIed+PrBN...' # 解码回来 bytes_from_b64 = base64.b64decode(cipher_b64.encode('utf-8')) # 转换为Hex字符串（便于调试查看） cipher_hex = binascii.b2a_hex(cipher_bytes).decode('utf-8') # 输出类似：'938b4e21e77e3eb04d...' # 解码回来 bytes_from_hex = binascii.a2b_hex(cipher_hex)

常见问题：你从某个API拿到一个Base64编码的密文字符串，直接丢给AES解密肯定会报错。正确的流程是：Base64字符串->encode(‘utf-8’)转为字节 ->base64.b64decode()解码为原始密文字节 ->AES解密。

4. 完整可用的AES工具类实现与解析

理解了所有细节后，我们可以封装一个健壮的、支持多种模式和填充的AES工具类。这个类将处理所有繁琐的细节，提供清晰的接口。

from Crypto.Cipher import AES import base64 import binascii from typing import Union class AESCipher: """ 一个功能完整的AES加密解密工具类。 支持CBC和ECB模式，支持PKCS7填充。 """ def __init__(self, key: bytes, mode: int = AES.MODE_CBC, iv: bytes = None): """ 初始化AES cipher。 Args: key: 密钥，必须是16(AES-128), 24(AES-192), 或32(AES-256)字节。 mode: 加密模式，AES.MODE_CBC 或 AES.MODE_ECB。 iv: 初始化向量，CBC模式必须提供且为16字节；ECB模式忽略。 """ if len(key) not in (16, 24, 32): raise ValueError(f"密钥长度必须为16、24或32字节，当前为{len(key)}字节") self.key = key self.mode = mode self.iv = iv if mode == AES.MODE_CBC: if iv is None: raise ValueError("CBC模式必须提供iv参数") if len(iv) != AES.block_size: # AES.block_size == 16 raise ValueError(f"IV长度必须为{AES.block_size}字节，当前为{len(iv)}字节") @staticmethod def _pkcs7_padding(data: bytes) -> bytes: """PKCS7填充""" padding_len = AES.block_size - len(data) % AES.block_size padding = bytes([padding_len] * padding_len) return data + padding @staticmethod def _pkcs7_unpadding(data: bytes) -> bytes: """PKCS7去填充""" padding_len = data[-1] # 简单的有效性检查 if padding_len < 1 or padding_len > AES.block_size: raise ValueError("解密错误或数据损坏：无效的填充长度") if data[-padding_len:] != bytes([padding_len] * padding_len): raise ValueError("解密错误或数据损坏：无效的填充字节") return data[:-padding_len] def encrypt(self, plaintext_bytes: bytes) -> bytes: """ 加密字节数据。 Args: plaintext_bytes: 明文字节数据。 Returns: 密文字节数据。 """ # 1. 填充数据 padded_data = self._pkcs7_padding(plaintext_bytes) # 2. 创建cipher对象并加密 if self.mode == AES.MODE_CBC: cipher = AES.new(self.key, self.mode, self.iv) elif self.mode == AES.MODE_ECB: cipher = AES.new(self.key, self.mode) else: raise NotImplementedError(f"不支持的加密模式: {self.mode}") ciphertext_bytes = cipher.encrypt(padded_data) return ciphertext_bytes def decrypt(self, ciphertext_bytes: bytes) -> bytes: """ 解密密文字节数据。 Args: ciphertext_bytes: 密文字节数据。 Returns: 明文字节数据。 """ # 1. 创建cipher对象并解密（注意：解密对象需要和加密时参数一致） if self.mode == AES.MODE_CBC: cipher = AES.new(self.key, self.mode, self.iv) elif self.mode == AES.MODE_ECB: cipher = AES.new(self.key, self.mode) else: raise NotImplementedError(f"不支持的加密模式: {self.mode}") # 2. 解密得到填充后的明文 padded_plaintext_bytes = cipher.decrypt(ciphertext_bytes) # 3. 去除填充 plaintext_bytes = self._pkcs7_unpadding(padded_plaintext_bytes) return plaintext_bytes def encrypt_to_base64(self, plaintext: str, encoding: str = 'utf-8') -> str: """加密字符串，返回Base64编码的密文""" plaintext_bytes = plaintext.encode(encoding) ciphertext_bytes = self.encrypt(plaintext_bytes) return base64.b64encode(ciphertext_bytes).decode('utf-8') def decrypt_from_base64(self, ciphertext_b64: str, encoding: str = 'utf-8') -> str: """解密Base64编码的密文，返回字符串""" ciphertext_bytes = base64.b64decode(ciphertext_b64.encode('utf-8')) plaintext_bytes = self.decrypt(ciphertext_bytes) return plaintext_bytes.decode(encoding) def encrypt_to_hex(self, plaintext: str, encoding: str = 'utf-8') -> str: """加密字符串，返回Hex编码的密文""" plaintext_bytes = plaintext.encode(encoding) ciphertext_bytes = self.encrypt(plaintext_bytes) return binascii.b2a_hex(ciphertext_bytes).decode('utf-8') def decrypt_from_hex(self, ciphertext_hex: str, encoding: str = 'utf-8') -> str: """解密Hex编码的密文，返回字符串""" ciphertext_bytes = binascii.a2b_hex(ciphertext_hex) plaintext_bytes = self.decrypt(ciphertext_bytes) return plaintext_bytes.decode(encoding)

4.1 工具类使用示例

让我们看看这个类如何简化加密解密流程：

# 示例1: CBC模式加密解密 key = b'ThisIsASecretKey16' # 16字节密钥 iv = b'InitialVector1234' # 16字节IV，实践中应使用随机生成的 cipher = AESCipher(key, AES.MODE_CBC, iv) plaintext = "这是一段需要加密的敏感信息，比如用户手机号13800138000" print(f"原文: {plaintext}") # 加密并输出Base64 encrypted_b64 = cipher.encrypt_to_base64(plaintext) print(f"密文(Base64): {encrypted_b64}") # 解密 decrypted_text = cipher.decrypt_from_base64(encrypted_b64) print(f"解密后: {decrypted_text}") assert plaintext == decrypted_text # 示例2: ECB模式 (不推荐，仅演示) print("\n--- ECB模式示例 ---") key_ecb = b'Another16ByteKey!!' cipher_ecb = AESCipher(key_ecb, AES.MODE_ECB) # ECB模式不需要IV encrypted_hex = cipher_ecb.encrypt_to_hex("重复的明文块") print(f"ECB密文(Hex): {encrypted_hex}")

4.2 关于IV的最佳实践

对于CBC模式，IV至关重要。绝对不要使用固定的IV（如全零），这会让加密的安全性大打折扣。每次加密都应该使用一个密码学安全的随机数作为IV。

from Crypto.Random import get_random_bytes # 生成一个安全的随机IV secure_iv = get_random_bytes(AES.block_size) # 生成16字节随机数据 print(f"生成的随机IV (Hex): {binascii.b2a_hex(secure_iv).decode()}") # 加密时使用这个随机IV cipher_secure = AESCipher(key, AES.MODE_CBC, secure_iv) ciphertext = cipher_secure.encrypt_to_base64(plaintext) # 解密时需要同一个IV！所以通常需要将IV和密文一起存储或传输。 # 常见做法：将IV（不加密）和密文拼接在一起，或者分别存储。 combined_data = secure_iv + base64.b64decode(ciphertext.encode()) # 传输或存储 combined_data # 接收方先取出前16字节作为IV，剩余部分作为密文进行解密。

5. 实战问题排查与进阶技巧

在实际项目中集成AES，你肯定会遇到各种奇怪的问题。这里记录了几个最常见的问题和排查思路。

5.1 常见错误与解决方案速查表

错误现象	可能原因	解决方案
`TypeError: Object type <class 'str'> cannot be passed to C code`	向`AES.new()`或`encrypt/decrypt`方法传入了字符串(`str`)。	确保密钥、IV、明文/密文都是`bytes`类型。使用`b''`或`.encode()`转换。
`ValueError: Data must be padded to 16 byte boundary in CBC mode`	明文长度不是16字节的倍数，且未使用填充。	在加密前对明文进行PKCS7填充。使用我们工具类中的`_pkcs7_padding`方法。
解密后得到乱码或尾部有多余字符	1. 加密解密使用的密钥或IV不一致。 2. 填充模式不匹配（加密用PKCS7，解密用ZeroPadding）。 3. 解密后未正确去除填充。	1. 仔细核对密钥和IV。 2. 确保两端使用相同的填充逻辑。 3. 确认去填充函数正确实现。
`binascii.Error: Incorrect padding`	Base64解码失败。密文字符串可能包含非法字符（如空格、换行）或长度不正确。	检查密文字符串是否完整、无多余字符。可尝试`base64.b64decode(ciphertext_b64.encode(), validate=True)`进行严格验证。
`ValueError: Invalid padding bytes`	去填充时校验失败。密文可能在传输存储中被篡改，或者加密/解密使用的密钥/IV错误导致解密出的数据根本不对。	1. 检查数据完整性。 2.首要怀疑密钥或IV错误。
与其它系统（如Java、PHP）加解密结果不一致	1.编码不同：字符串到字节的编码（UTF-8 vs GBK）。 2.填充模式不同：PKCS5Padding vs PKCS7Padding（AES下通常等价，但需确认）。 3.IV处理不同：是否包含IV，IV是否参与计算。	1. 统一使用UTF-8编码。 2. 明确约定使用PKCS7填充。 3. 确认IV的生成、传递和使用方式完全一致。可先用简单字符串（如”1234567812345678”）和固定IV测试。

5.2 调试技巧：从Hex/B64密文反推

当你遇到跨语言或跨系统加解密不一致时，按以下步骤隔离问题：

固定所有变量：使用一个简单的、长度恰好为16字节的明文（如b'0123456789ABCDEF'），一个固定的16字节密钥和IV（如全零）。
只加密这一个块：关闭填充功能（或确保明文长度对齐），分别在你的Python代码和目标系统（如在线工具、Java程序）中加密。
比较字节输出：将两边生成的密文都转换为Hex字符串进行比较。如果Hex字符串完全一致，说明核心的AES加密算法和模式（ECB/CBC）配置一致。
如果不一致：问题大概率出在密钥/IV的字节表示上。检查对方系统是否对密钥字符串做了额外的处理（如MD5哈希后取前16字节）。这是最常见的坑。
如果一致：再逐步引入填充、编码等复杂因素。

5.3 性能与安全进阶考量

对于生产环境，还有一些进阶要点：

密钥管理：密钥绝对不能硬编码在代码里！应该从环境变量、密钥管理服务（如AWS KMS, HashiCorp Vault）或安全的配置文件中读取。这是安全的第一道防线。
选择AES-256：对于需要长期保护的高敏感数据，建议使用AES-256（32字节密钥）。虽然AES-128目前依然安全，但256位能提供更强的安全余量。
考虑认证加密：CBC模式本身只能保证机密性，不能保证完整性（即密文被篡改后可能无法察觉）。对于高安全要求场景，应考虑使用认证加密模式，如GCM（Galois/Counter Mode），它同时提供机密性、完整性和身份验证。pycryptodome也支持AES.MODE_GCM。
使用HKDF派生密钥：如果你的密钥来源是一个密码（口令），不要直接用它作为AES密钥。应该使用像HKDF（HMAC-based Key Derivation Function）这样的密钥派生函数，从口令生成一个强密码学密钥。

踩过几次坑之后，我的体会是，AES加密本身并不复杂，真正的挑战在于对细节的把握和一致性的维护。尤其是在微服务架构下，不同语言、不同团队编写的服务之间进行加解密交互，提前约定好编码、填充、模式、IV处理等每一个细节，并写成双方都认可的文档或共享SDK，能节省大量的联调时间。希望这个工具类和这些经验，能让你在下次需要用到AES时，更加得心应手。

编程学习技术分享实战经验

资讯详情

Python实现AES加密解密：从原理到实战工具类

1. 项目概述

2. AES加密算法核心原理深度解析

2.1 对称加密与AES的诞生

2.2 AES加密过程：轮函数与状态矩阵

2.3 加密模式：ECB与CBC的本质区别

3. Python实现AES的关键细节与避坑指南

3.1 环境搭建与库的选择

3.2 数据类型：万事皆`bytes`

3.3 填充模式详解与手动实现

3.4 编码问题：Base64与Hex的运用

4. 完整可用的AES工具类实现与解析

4.1 工具类使用示例

4.2 关于IV的最佳实践

5. 实战问题排查与进阶技巧

5.1 常见错误与解决方案速查表

5.2 调试技巧：从Hex/B64密文反推

5.3 性能与安全进阶考量

最新新闻

日新闻

周新闻

月新闻

资讯详情

Python实现AES加密解密：从原理到实战工具类

1. 项目概述

2. AES加密算法核心原理深度解析

2.1 对称加密与AES的诞生

2.2 AES加密过程：轮函数与状态矩阵

2.3 加密模式：ECB与CBC的本质区别

3. Python实现AES的关键细节与避坑指南

3.1 环境搭建与库的选择

3.2 数据类型：万事皆bytes

3.3 填充模式详解与手动实现

3.4 编码问题：Base64与Hex的运用

4. 完整可用的AES工具类实现与解析

4.1 工具类使用示例

4.2 关于IV的最佳实践

5. 实战问题排查与进阶技巧

5.1 常见错误与解决方案速查表

5.2 调试技巧：从Hex/B64密文反推

5.3 性能与安全进阶考量

相关新闻

最新新闻

日新闻

周新闻

月新闻

3.2 数据类型：万事皆`bytes`