采用AVR单片机汇编语言实现AES加密算法及其优化-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

AES是美国高级加密标准算法,将在未来几十年里代替DES在各个领域中得到广泛应用。本文在研究分析AES加密算法原理的基础上,着重说明算法的实现步骤,并结合AVR汇编语言完整地实现AES加密和解密。根据AES原理,提出几种列变化的优化算法,并根据实验结果分析和比较它们的优缺点。

随着对称密码的发展,DES数据加密标准算法由于密钥长度较小(56位),已经不适应当今分布式开放网络对数据加密安全性的要求,因此1997年NIST公开征集新的数据加密标准,即AES[1]。经过三轮的筛选,比利时Joan Daeman和Vincent Rijmen提交的Rijndael算法被提议为AES的最终算法。此算法将成为美国新的数据加密标准而被广泛应用在各个领域中。尽管人们对AES还有不同的看法,但总体来说,AES作为新一代的数据加密标准汇聚了强安全性、高性能、高效率、易用和灵活等优点。AES设计有三个密钥长度:128,192,256位,相对而言,AES的128密钥比DES的56密钥强1021倍[2]。AES算法主要包括三个方面：轮变化、圈数和密钥扩展。本文以128为例,介绍算法的基本原理;结合AVR汇编语言,实现高级数据加密算法AES。

1 AES加密、解密算法原理和AVR实现

AES是分组密钥,算法输入128位数据,密钥长度也是128位。用Nr表示对一个数据分组加密的轮数（加密轮数与密钥长度的关系如表1所列）。每一轮都需要一个与输入分组具有相同长度的扩展密钥Expandedkey(i)的参与。由于外部输入的加密密钥K长度有限,所以在算法中要用一个密钥扩展程序(Keyexpansion)把外部密钥K扩展成更长的比特串,以生成各轮的加密和解密密钥。

1.1 圈变化

　AES每一个圈变换由以下三个层组成:
　　非线性层——进行Subbyte变换;
　　线行混合层——进行ShiftRow和MixColumn运算;
　　密钥加层——进行AddRoundKey运算。

① Subbyte变换是作用在状态中每个字节上的一种非线性字节转换,可以通过计算出来的S盒进行映射。

　　Schange:
　　　　ldi zh,＄01;将指针指向S盒的首地址
　　　　mov zl,r2;将要查找的数据作为指针低地址
　　　　ldtemp,z+;取出这个对应的数据
　　　　mov r2,temp;交换数据完成查表
　　　　…
　　　　ret

② ShiftRow是一个字节换位。它将状态中的行按照不同的偏移量进行循环移位,而这个偏移量也是根据Nb的不同而选择的[3]。

　　shiftrow:;这是一个字节换位的子程序
　　　　mov temp,r3;因为是4×4
　　　　mov r3,r7; r2 r6 r10 r14 r2 r6 r10 r14
　　　　mov r7,r11; r3 r7 r11 r15---r7 r11 r15 r3
　　　　mov r11,r15; r4 r8 r12 r17 r12 r17 r4 r8
　　　　mov r15,temp; r5 r9 r13 r18 r18 r5 r9 r13
　　　　mov temp,r4
　　　　mov temp1,r8
　　　　mov r4,r12
　　　　mov r8,r17
　　　　mov r12,temp
　　　　mov r17,temp1
　　　　mov temp,r18
　　　　mov r18,r13
　　　　mov r13,r9
　　　　mov r9,r5
　　　　mov r5,temp
　　　　ret

③ 在MixColumn变换中,把状态中的每一列看作GF(28)上的多项式a(x)与固定多项式c(x)相乘的结果。b(x)=c(x)*a(x)的系数这样计算:*运算不是普通的乘法运算,而是特殊的运算,即

　　b(x)=c(x)·a(x)(mod x4+1)

对于这个运算

　　b0=02。a0+03。a1+a2+a3

令xtime(a0)=02。a0

其中,符号“。”表示模一个八次不可约多项式的同余乘法[3]。

　　　　mov temp,a0;这是一个mixcolimn子程序
　　　　rcall xtime;调用xtime程序
　　　　mov a0,temp
　　　　mov temp,a1
　　　　rcall xtime
　　　　eor a0,a1
　　　　eor a0,temp
　　　　eor a0,a2
　　　　eor a0,a3;完成b(x)的计算
　　　　…
　　xtime:;这是一个子程序
　　　　ldi temp1,＄1b
　　　　lsl temp
　　　　brcs next1;如果最高位是1,则转移
　　next: ret;否则什么也不变化
　　next1:eor temp,temp1
　　　　rjmp next

对于逆变化,其矩阵C要改变成相应的D,即b(x)=d(x)＊a(x)。

④ 密钥加层运算(addround)是将圈密钥状态中的对应字节按位“异或”。

⑤ 根据线性变化的性质[1],解密运算是加密变化的逆变化。这里不再详细叙述。

1.2 轮变化

对不同的分组长度,其对应的轮变化次数是不同的,如表1所列。

表1 AES类型与基参数的关系

1.3 密钥扩展

AES算法利用外部输入密钥K(密钥串的字数为Nk),通过密钥的扩展程序得到共计4(Nr+1)字的扩展密钥。它涉及如下三个模块:

　　① 位置变换(rotword)——把一个4字节的序列[A,B,C,D]变化成[B,C,D,A];

　　② S盒变换(subword)——对一个4字节进行S盒代替;

　　③ 变换Rcon[i]——Rcon[i]表示32位比特字[xi-1,00,00,00]。这里的x是（02）,如
Rcon[1]=[01000000];Rcon[2]=[02000000];Rcon[3]=[04000000]……

扩展密钥的生成：扩展密钥的前Nk个字就是外部密钥K;以后的字W[[ｉ]]等于它前一个字W[[i-1]]与前第Nk个字W[[i-Nk]]的“异或”,即W[[ｉ]]=W[[i-1]]W[[ｉ- Nk]]。但是若ｉ为Nk的倍数,则W[ｉ]=W[i-Nk]Subword(Rotword(W[[ｉ-1]]))Rcon[i/Nk]。

程序执行的时候,主要调用以上几个子程序,具体实现如下：

　　Keyexpansion:
　　　　rcall rotwoed
　　　　rcall subword
　　　　rcall Rcon
　　　　…
　　　　AES的加密与解密流程如图1所示。

图1 AES的加密和解密流程

2 AES加密、解密算法的优化

由以上算法的流程中可以清楚地看到,整个算法中程序耗时最多的就是圈变化部分,因此对于算法的优化也就在此;而圈变化部分可以优化的也就是列变化。因为列变化是一个模乘同余规则。由于AES加密和解密是不对称的,如果不对其进行优化,会使算法的解密速度远远大于加密的速度[1]。

① 加密运算。对列变换（Mixcolumn）可以通过调用xtime子程序进行优化。具体算法[1]实现如下:

另一种有效的优化方法就是离线构造一个表格,即列变化表格。这样只要通过查表的方式就可以提高加密速度。

② 解密算法的优化。由于解密的列变换的系数分别是09、0E、0B和0D。在AVR单片机上实现以上的乘法显然是需要很多的时间,从而导致了解密的性能降低。

优化方法一：对列变化进行分解使倍乘次数降低。

仔细研究解密矩阵的系数,不难发现解密矩阵和加密矩阵有着一定的联系,即解密矩阵等于加密矩阵和一个矩阵的相乘。通过这样的联系,就可以对算法进行优化：

这样一来,只用几个简单的“异或”就可以实现列变化,使倍乘的次数降低,提高解密的速度。

优化方法二：构造表格。

同加密构造方法一样,可以构造四个表格T[ea]=e×a; T[9a]=9×a;T[9a]=9×a;T[ba]=b×a。这样一来,也只需要进行查表和简单的异或就可以完成解密的任务。虽然这种方法将增加额外的开销,但是它却是一种有效的方法。

3 AES加密与解密的实验仿真

根据以上实验步骤和优化方法得出表2、3所列实验结果。

表2 AES-128不同加密方法性能比较

设主密钥为:000102030405060708090a0b0c0d0e0f(128bit)。
加密明文:00112233445566778899AABBCCDDEEFF。
密文:69C4E0D86A7B0430D8CDB78070B4C55A。
解密密文:69C4E0D86A7B0430D8CDB78070B4C55A。
明文:00112233445566778899AABBCCDDEEFF。

总之,AES密码是一个非对称密码体制,它的解密要比加密复杂和费时。解密优化算法没有增加存储空间的基础上,以列变化为基础进行处理,程序比原始的要小,而且节约了时间。解密优化方法速度最快,效率最高,但要增加系统的存储空间,因此它的程序也是最大的一个。

注：AES-128数据加密解密程序见本刊网站(www.dpj.com.cn)。

结语

AES高级数据加密算法不管是从安全性、效率,还是密钥的灵活性等方面都优于DES数据加密算法,在今后将逐步代替DES而被广泛应用。本文基于AVR的高速计算性能实现了AES算法,并结合汇编语言进行了算法的优化。根据实际应用的具体需要,可以选用相应的方法。

参考文献

1 宋震,等. 密码学. 北京：中国水利水电出版社,2002
2 杨义先.现代密码新理论.北京：科学出版社,2002
3 谷大武,等.高级加密标准（AES）算法—Rijndael的设计.北京：清华大学出版社,2003
4 耿德根,等.AVR单片机应用技术.北京：北京航空航天大学出版社,2002
5 宋建国,等.AVR高速嵌入式单片机原理与应用.北京：北京航空航天大学出版社,2001
6 NIST. Advanced Encryption Standard (AES) .FEDeral Information Processing Standards PublICation,2001

关键字：AVR单片机汇编语言 AES加密算法引用地址：采用AVR单片机汇编语言实现AES加密算法及其优化

上一篇：用ATmega8单片机控制的红外导盲系统设计
下一篇：基于单片机的水声调制解调器的设计及仿真

推荐阅读最新更新时间：2024-03-16 15:57

AVR单片机控制的电动自行车驱动系统

#i nclude #i nclude //电动车双闭环程序，采用双闭环方式控制电机，以得到最好的zh转速性能，并且可以 //限制电机的最大电流。本应用程序用到两个CCP部件，其中CCP1用于PWM输出，以控 //制电机电压；CCP2用于触发AD，定时器TMR2、TMR1，INT中断，RB口电平变化中断， //看门狗以及6个通用I/O口 #define AND 0xe0 //状态采集5，6，7位 #define CURA 0X0a //电流环比例和积分系数之和 #define CURB 0X09 //电流环比例系数 #define THL 0X6400 //

[单片机]

时钟芯片SD2200ELP与AVR单片机的接口设计

　　在提升机制动闸瓦间隙实时在线检测的设计中，需要保存故障时间和故障数据。大部分仪器仪表中都要使用时钟芯片，但是很多的实时时钟芯片（如ＰＣＦ８５６３）没有掉电保护，须外接晶振和电池，比较麻烦。而深圳兴威帆电子技术有限公司生产的ＳＤ２２００ＥＬＰ是内置３２　ＫＢＥ２ＰＲＯＭ的串行实时时钟芯片，不需要外接器件支持，连线简单、可靠，提供的数据精确，断电后也能继续工作。微控制器采用Ａｔｍｅｌ公司的ＡＴｍｅｇａｌ６单片机，利用ＡＴ－ｍｅｇａｉ６的硬件ＴＷＩ接口可直接对ＳＤ２２００ＥＬＰ进行操作，无需软件模拟Ｉ２Ｃ方式，使用方便、可靠。　　１　ＳＤ２２００Ｌ简介　　ＳＤ２２００Ｌ系列（包括ＳＤ２２００Ｂ／Ｃ／Ｄ／Ｅ／ＦＬＰ）是一种

[嵌入式]

基于AVR单片机的负荷缸多路遥控开关编解码实现

负荷缸是船舶电力核心发电机性能的负荷试验必备的重要工装设备，通过负荷试验，可以检验发电机长期工作的性能稳定的情况(静态特性)和对突加突卸负荷的应变能力(动态特性)。 AVR 单片机 " 单片机具有高性能低价格的优点，在本文中利用 AVR 单片机 " 单片机对发电机负荷缸的多路远程遥控开关量进行采集监控并进行数字信号编解码，用2芯的电缆取代原来40芯的粗电缆传输控制信号，有效地解决了工作中遇到的问题。　　1 问题的提出　　我们通过把由发电机供电的通电极板放到负荷缸水电阻中，用充气升降极板和补给水调节水电阻大小的方法控制试验发电机所带负荷的大小，对发电机的性能进行试验。体积庞大的负荷缸一般放置在码头，在船

[单片机]

基于AVR单片机和温度传感器实现智能温控系统的设计

引言在工农业生产和日常生活中，温度的测量及控制越来越重要。传统的温度控制系统采用热敏电阻器或热电偶测量温度，但是由于模拟温度传感器输出的是模拟信号，必须经过A/D转换等环节才能获得数字信号，再加上这种温度采集电路有时需要冷端补偿电路，这样增加了电路的复杂性，且电路易受干扰，使采集到的数据准确性不高。随着技术的发展，目前国际上新型温度传感器已从模拟式向数字式，从集成化向智能化、网络化的方向飞速发展。智能化温度传感器DS18B20将温度传感器、寄存器、接口电路集成在一个芯片中，能直接输出数字信号。本论文设计了以ATmega16单片机和DS18B20为主构成的智能温控系统，该系统的温度启控点可以根据用户需要而自行设定。 1、系统

[单片机]

基于AVR单片机的LED显示屏的灰度设计与实现

　　LED点阵块具有亮度高、发光均匀、可靠性好、拼装方便等优点，能构成各种尺寸的显示屏。目前，LED显示屏已被广泛应用于文字显示并取得了很好的效果，但是大部分仅能显示滚动的文字信息而不能显示图像，并且还存在系统复杂等缺点。本文提出了一种主从式单片机的LED显示屏解决方案，该设计方案利用AVR单片机自身的FLASH ROM和RAM，外部无需任何存储电路，电路结构简单。该系统实现了图像的16阶灰度显示，可广泛用于商场、车站等公共场合。　　 1 AVR单片机简介　　　　 AVR单片机是增强型内置FLASH的RISC(ReducedInstruction Set CPU)精简指令集高速8位单片机，硬件采用哈佛(Harward)结

[工业控制]

如何解决AVR单片机上电复位工作混乱的问题

在单片机应用中经常需要在掉电时（包括人为的关机和偶然的外部电源故障），对运行的数据进行保存。目前，常用的方法是单独给单片机增加一个较大的电容（一般为2000 μf以上，也有用法拉级的），外部掉电后，靠大电容存储的电量缓慢放电，提供单片机向eeprom存储数据所需要的时间。所选的电容小，提供的时间短，存储数据不可靠，所选电容大提供时间长，存储数据可靠。但是随之而来的问题是，掉电后电容放电过程中，单片机的供电电压在缓慢下降，当下将到某个值但还没有降到复位门限电压之前，如果此时再次开机，则单片机不能正常启动，导致单片机重复上电后工作混乱。下面具体分析这一过程并给出解决的办法。我们先了解一下AVR的上电复位特点。上表是AVR数据手册

[单片机]

AVR单片机的CPU内核结构及汇编语言

学单片机那么久了，感觉想要深入，还得看汇编语言，至少得了解单片机内部结构。下面就以ATmega16为例，介绍一下AVR单片机结构和汇编语言。 AVR单片机的CPU内核结构如上两图，左图是虚线框内AVR CPU的内核结构，右图是AVR单片机内核结构的方框图，可以看出AVR单片机的数据总线（CPU字长）是8位的，也就说它是8位单片机。 AVR采用了Harvard结构，具有独立的数据和程序总线，CPU在执行一条指令的同时，就将PC中指定的下一条指令取出，构成了一级流水线运行方式，实现了一个时钟周期执行一条指令，数据吞吐量高达1MIPS/MHz。 AVR CPU内核由几个重要的部分组成，它们分别是： A

[单片机]

AVR单片机一些学习笔记

下面是自己在学习AVR单片机时的学习经验，分享出来给大家，一起学习。 1、 AVR单片机采用RISC架构，8051单片机采用CISC架构。前者速度为后者的2~4倍，为流水线操作指令。 2、 AVR单片机有32个通用寄存器(地址在RAM区从$0000开始到$001F)，其中有6个(最后6个)合并为3个16位的X,Y,Z寄存器，用来存放地址指针，Z寄存器还可以寻址程序存储器。 3、哈佛结构，131条机器指令。 4、延迟开机功能。 5、内部自带RC振荡器，可提供1/2/4/8MHZ的工作时钟。 6、 FLASH+EEPROM+SRAM+SPI+USART+TWI+PWM+RTC+10位ADC+模拟比较器+JTAG。

[单片机]