大约束度Viterbi译码器中路径存储单元的设计-电子工程世界

1 引言

Viterbi译码算法是一种最大似然译码算法，目前广泛应用于各种数据传输系统，特别是卫星通信和移动通信系统中。近年来随着FPGA技术的迅速发展，使得基于FPGA实现Viterbi译码的算法成为研究的热点。

由于Viterbi译码器的复杂性随约束长度k成指数增加，大约束度不但使Viterbi译码器硬件复杂度大为增加，同时也限制了译码速度。而其中以加比选(Add Compareselect，ACS)运算为最主要的瓶颈，的递归运算使流水线结构的应用变得困难。本文以(2，1，9)卷积码为例，用FPGA实现大约束度Viterbi译码器，其中ACS设计采用串并结合的方法来兼顾面积和速度，并用流水线结构来提高译码速度，对路径度量存储则采用同址存储方法，实现了在占用少量硬件资源的前提下，提高译码速度。

2 算法简述及系统结构分析

Viterbi译码原理详见文献[1，2],下面仅作简要说明。

图1为(2，1，9)卷积码的2个状态之间的状态转移图。根据输入路径的不同(图中实线表示输入为0，虚线表示输入为1)，仅仅首位不同的两个状态可转移到仅仅末位不同的两个状态。将所有状态的状态转移图按时间往前衍生，即可得到(2，1，9)卷积码的网格(Trellis)图。Viterbi译码过程就是：根据接收序列，按照最大似然法则，分段地在网格图上计算寻找有最大度量的路径的过程。一般来说，维特比泽码器主要有4个单元所组成，其结构框图如图2所示。

分支度量单元(BMU) 主要是计算分支度量值。所谓分支度量值就是码字与接收码之间的距离。

加-比较-选择单元(ACSU) 主要是做路径度量值与分支度量值的叠加，并决定幸存路径度量值及决定位元(decision bit)。

路径度量存储单元(PMMU) 主要用来存储幸存路径度量值。

幸存路径存储单元(SMU) 主要用来存储决定位元。

如图2所示，接收序列先通过分支度量单元计算出各状态所有分支度量，然后经过ACS单元，将上一时刻的路径度量值与当前时刻的分支度量值作加-比较-选择等运算，计算出当前时刻的幸存路径和路径度量值，并找出决定位元(decision bit)，把新的路径度量值存储到路径度量存储单元(PMMU)，并把相应的幸存路径的决定位元(de-cision bit)存储到幸存路径存储单元(SMU)，当译码到译码深度后，判决输出单元输出译码序列。由此可见：

(1) 每计算一接收序列，所有状态的路径度量都要更新一次。若这些路径度量存储于一块RAM中，则RAM读写的次数为待译卷积码的状态数，当卷积码的约束度比较大时，对RAM的读写周期要求将会很高，很可能成为限制译码速度的瓶颈；

(2) 在ACS单元，要完成路径度量的累加，比较并选择有最大度量的路径，是算法实现的关键电路，也是硬件资源耗费最大的部分。所以ACS单元的数目太多会大大增加译码器的硬件规模，太少则影响译码速度。因此，合理安排ACS单元与路径度量RAM是提高译码速度，减少硬件消耗的关键所在。

针对问题(1)，本文从改进Viterbi译码算法和路径度量RAM分块两方面同时人手。首先，表示Viterbi算法过程的网格图可以进行分解与折叠。图3所示为(2，1，9)卷积码的部分网格图的分解与折叠。可以看出折叠后，ACS计算时由读写状态路径度量，得出一步后的更新结果，变为读写四状态路径度量，得出两步后的更新结果。省去了中间路径度量的读写，减少了RAM的读写次数。

当然，这种分解与折叠很容易扩展为基8或基16的网格图，RAM的读写次数将进一步减少，但此时ACS要同时处理8个或16个路径度量，复杂性几乎成指数增加，其计算速度也可能成为新的瓶颈。综合考虑，本文采用4个基4算法，每次同时处理16个状态。在基于4个基4算法的16个状态路径度量读写中，本文将路径度量RAM分为16块，每块存储16个状态的路径度量。16块RAM并行工作时，对每块RAM的读写周期要求降为原来的1／16。

针对问题(2)，综合考虑资源占用与译码速度，并兼顾基4算法的实现，决定采用4个基4蝶形单元并行工作，每个蝶形单元(ACS)串行处理16个状态的串并结合方式。

在Viterbi译码器的实现过程中，计算当前时刻的路径度量需用到前一时刻的路径度量，所以必须对路径度量加倍缓存。本文提出了一种同址的路径度量存储方法，可以减少存储单元数量，而不影响译码速度。下面将详述该方法的原理及实现过程。

3 路径度量同址存储的原理与实现

Viterbi译码器的复杂性及所需存储器容量随着约束长度K成指数增加，Viterbi译码器每解码一位信息位就需对2K-1=28=256个寄存器进行路径度量，并对相应的存储单元进行读写，这样度量路径的存储管理就成了提高译码速度的一个重要环节。

通常，计算出来的度量路径可以存储在RAM中或者是寄存器中。对于约束度很大的Viterbi译码器而言，在VLSI应用中使用RAM来存储比使用寄存器更节省芯片面积，所以本文采用RAM存储的方式。状态度量的更新有两种模式，一种是ping-pong模式，即乒乓模式，一种是同址存储模式。乒乓模式是使用两块存储器，一块存储前一时刻的路径度量，另一块则存储更新后的路径度量。当前时刻ACS从一块存储器中读取前一时刻的路径度量，然后进行加比选运算，更新完的路径度量存入另一块存储器中。这种模式的缺点是需要两块路径度量存储器，优点是控制电路比较简单。另一种同址存储模式只需要一块路径度量存储器来进行度量的更新，每一次的更新度量都覆盖前一时刻的路径度量。因此这种模式所需的存储器容量只是乒乓模式的一半。

在维特比算法中，译码状态的转移导致路径度量的读出和写人状态不同，这样在用FPGA实现时，可以用双口RAM来实现。同时，为配合4个基4蝶形单元同时读出和写入16个路径度量的需要，应将各个路径状态分组，因此，我们采用16块双口Block RAM。

根据上面分析结果，16块RAM的RAM1～RAM16分别存储状态的路径度量，这里以状态来代替其相应的路径度量。设第n时刻路径度量在各RAM的存储示意如表1所示。

(1) 从n时刻到n+1时刻路径度量更新过程如下：

首先，读表1中RAM1，5，9，13，RAM2，6，10，14，RAM3，7，11，15，RAM4，8，12，16的数据，对应第1～第4个基4；例如从RAM1，5，9，13中读取第0位的状态0，64，128，192，经过第1个基4单元运算后，得到状态0，1，2，3，存入原来的状态0，64，128，192的位置(如表2所示)。这样从第1～16位依次读取数据，经过相应的基4蝶形单元运算，写入RAM1～RAM16中相应的位置，这样，从n时刻到n+1时刻的所有状态的路径度量都得到了更新，但存储于各RAM中的状态位置发生了变化，其路径度量如表2所示。

(2) 从n+l时刻到n+2时刻的路径度量的更新

此时，读表2中RAM1，2，3，4，RAM5，6，7，8，RAM9，10，11，12，RAM13，14，15，16的数据，对应第1～第4个基4。例如读RAM1～4的第0，4，8，2位的状态0，64，128，192，经过第一个基4单元运算后，得到数据0，1，2，3，存入原来的状态0，64，128，192的位置(如表3所示)。读写的过程与写回RAM时的原理同上(同址存储)，不同之处是读写RAM时的地址厕序，其读写地址如表5所示。更新后的n+2时刻的路径度量存储于各RAM的示意图如表3所示。

(3) 从n+2时刻到n+3时刻的路径度量的更新

此时，读表3中RAM1，2，3，4，RAM5，6，7，8，RAM9，10，11，12，RAM13，14，15，16的数据，对应第1～第4个基4。例如读RAM1～4的第0，1，2，3位的状态0，64，128，192，经过第一个基4单元运算后，得到状态0，1，2，3，存入原来的状态0，64，128，192的位置(如表4所示)。读写的过程与写回RAM时的原理同上(同址存储)，不同之处是读写RAM时的地址顺序，其读写地址如表6所示。更新后的n+3时刻的路径度量存储于各RAM的示意图如表3所示。

同理，从n+3时刻到n+4时刻的路径度量的更新可得到如表1所示的形式。可以发现，表4运算后的路径度量在各RAM的存储结构与表1完全相同。也就是说以后的过程只是上面四步的循环而已。

本文在FPGA实现时，路径度量RAM采用了FPGA内的双口Block RAM，故可在同一时间内对存储器执行读和写操作，因此可有效地降低读写次数和提高译码速度。RAM读写地址的产生：RAM1～RAM16的读地址用查找表产生。而RAM1～RAM16的写地址分别为读地址延时1个时钟周期得到，用FPGA实现非常简单。

4 仿真与实现

根据本文提出的结构，用Verilog语言完成上述结构设计，用ModelSim 6.0a对其进行波形仿真，地址产生的波形如图4所示。

选择Xilinx spartan3为目标器件，利用ISE软件完成设计的综合及布局布线等设计流程，图5列出了XilinxISE对本设计提供的综合布线参数。

5 结语

本文重点从FPGA实现的角度对Viterbi译码器的路径度量进行了讨论，从译码速度和硬件资源消耗两方面考虑，探讨了Viterbi译码器的优化，提出了一种串并行结构和同址路径度量存储的方法，显著提高了译码器速度和减小了电路规模，并以(2，1，9)卷积码为例给出了实现过程。该译码器通过了ModelSim 6.0a的功能仿真，并已在ISE 7.1i环境中，用Xilinx的spartan3实现。对实现的结果进行了复杂度分析，发现资源的利用相当合理，其不足之处就是连线较多。

关键字：卷积序列周期硬件引用地址：大约束度Viterbi译码器中路径存储单元的设计

上一篇：基于FPGA的LDPC编码器设计与实现
下一篇：基于FPGA的星地信道模拟系统的研究与设计

推荐阅读最新更新时间：2024-05-13 18:37

MSP430F249硬件I2C查询法读写AT24C02

/****************************************************************** ** ** File : I2C.c | Master Read Write | ** Version : 1.0 ** Description: I2C 查询法读写24C02 ** Author : LightWu ** Date : 2013-4-26

[单片机]

MSP430F249<font color='red'>硬件</font>I2C查询法读写AT24C02

解析工业4.0中的硬件商机

现在，以工业4.0为代表的智能制造正改变着未来制造业的形态。在这新的制造体系中，数据是灵魂性的要素，位于核心地位。不过这并不意味着硬件在工业4.0中会被边缘化，毕竟数据还是需要透过硬件作为载体，进而在现实世界中呈现其价值。因此，智能制造中“数据”的崛起，也会给硬件带来了不少的商机。接下来，从工业4.0“数据流”的走向，可以更了解发掘出各个环节潜藏的硬件“钱途”。传感在工业控制系统中，传感器是数据采集端，它们负责将工业现场的大量非电量的物化参数转化成电信号，再由系统从中解读出关键的数据信息，作为控制决策的依据。智能制造对数据的依赖必然会刺激对传感器的需求，未来工业市场对压力、位移、加速度、角速度、温度、湿度、气体、光敏等多种传感

[嵌入式]

s3c2440 K9F2G08 nandflash支持硬件ECC校验

S3c2440的nandflash K9F2G08是支持硬件ECC的，NandFlash的每一页分为main区和spare区，S3C2440的NandFlash控制器支持这两个区的硬件ECC，这里我们实现main区的硬件ECC。在include/configs/fl2440.h文件中，如果我们定义了nandflash的硬件ECC校验，那么我们就可以控制相应的nandflash寄存器，实现硬件ECC。 nandflash的每一页有两区：main区和spare区，main区用于存储正常的数据，spare区用于存储其他附加信息，其中就包括ECC校验码。当我们在写入数据的时候，我们就计算这一页数据的ECC校验码，然后把校验码

[单片机]

半导体量价齐升上游硅片进入产能扩张周期

半导体设备：行业量价齐升景气度高，上游硅片进入产能扩张周期硅晶圆供不应求到进入涨价周期，行业进入量价齐升的高景气度确定。2012年-2016年硅晶圆的价格非常稳定，但到了2017年Q1涨价10%，Q2硅晶圆价格继续上涨，累计涨幅已超过20%，自7月开始的第3季合约价再调涨10%左右。此轮半导体硅晶圆公司的硅晶圆供给紧张导致的涨价的主要驱动因素有以下几点：1、下游存储器行业公司均投入3DNAND扩产；2、人工智能、汽车电子、物联网、智能手机等新兴行业的发展带来的应用领域扩大；3、全球晶圆厂扩建让需求大幅增长。晶圆是由硅片加工而成，下游硅晶圆的供不应求，也带来硅片行业的产能缺口。全球92%的硅片产能集中在5家公司的手

[半导体设计/制造]

基于Z扫描测量系统的软硬件电路的设计

引言 Z扫描是一种应用于光学非线性测量的方法，使用这种方法可以测量光学材料非线性折射率的大小、正负以及非线性吸收系数。因为通过光学材料的激光能量大小与光电接收器转换后获得的电压幅值成某种比例关系，因此通过测量光电接收器转换后的电压幅值就可以很方便地计算出光学材料的非线性折射率大小、正负以及非线性吸收系数。由于光脉冲的宽度较窄，其宽度约为几个ns，因此通常采用高频数字示波器测量其信号的幅值，然而高频数字示波器虽然能够得到准确的数据，但是其价格昂贵，体积较大，不适合形成一个独立的光学测量系统。本文给出的测量系统，采用高速并行A／D转换的方法，不但能够实时检测出光电转换后的电压幅值的数据，同时通过高速并行比较器基准电压的调节能自动滤除

[测试测量]

基于Z扫描测量系统的软<font color='red'>硬件</font>电路的设计

人工智能硬件技术和软件算法还需要很大的进步空间

早上，王爷爷吃完饭，机器人 “小明”赶紧提醒王爷爷要在半小时之内吃药，吃完药王爷爷坐在电视机前，“小明”告诉王爷爷老花镜在茶几的第一个抽屉中。午休过后，王爷爷要出门散步，“小明”告诉王爷爷外面只有10度，需要穿外套，并拿上伞。以上的情景绝对不只是畅想，随着老龄化和少子化程度的加深，机器人会越来越多走进老年人家庭，成为智能养老小助手。但是每个老人的脾气、性格、需求各不相同，因此要求机器人能够不断学习，理解老人的隐性需求，真正能够陪伴老人。如何满足这些个性化的需求？从人工智能的角度分析，就要让机器人不断学习，认识老人的家庭环境，理解老人的需求，但是目前，不管是从机器视觉方面，还是自然语言理解方面都面临巨大的挑战。在英特尔

[嵌入式]

IPM死区时间调整硬件解决方案

作者Email: gouyujie@sina.com 摘要：针对不同厂家IPM要求的死区时间参数的不同，本文从硬件电路角度出发，提出一种延时电路方案，解决了因参数调整而引起软件的不统一问题，进而为MCU的大批量mask降低成本提供可能。关键词： IPM 死区时间随着现代电力电子技术的飞速发展，以绝缘栅双晶体管（IGBT）为代表的功率器件在越来越多的场合得到广泛地应用。IGBT是VDMOS与双极晶体管的组合器件，集MOSFET与GTR的优点于一身，既具有输入阻抗高，开关速度快，热稳定性好和驱动电路简单的长处，又具有通态电压低，耐压高和承受大电流的优点，特别适合于电机控制。现代逐渐得到普遍推广的变频空调，其内部

[电源管理]

盛大手机硬件:1GHz双核CPU基于STE方案

时间：2012年3月28日 07:56 盛大手机配置单　　新浪科技讯 3月28日凌晨消息，内部人士透露的清单显示，预计二季度发布的盛大手机将采用1GHz双核处理器、夏普4.3寸显示屏等配置。这款产品由盛大旗下果壳电子主导的产品，基于STE解决方案开发而成，目前定价在1199元左右。　　在进军移动互联网的旗帜下，互联网公司纷纷介入智能手机终端的竞争之中。与百度(微博)、阿里巴巴(微博)、腾讯、小米等相比，盛大远非先行者。不过，盛大还是来了。　　年前新浪科技就曾经报道盛大手机即将推出的消息，围绕这款产品的猜测也从来没有停止。近日一位了解该项目的内部人士，向新浪科技披露了盛大手机的硬件清单。而通过新浪微博搜索，也发现有

[手机便携]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■验证并选择心仪MOSFET，探寻选型奥秘！注册、体验双重好礼等你拿~

■评论有奖：元器件采购的秘密法宝，助你做个自带“松弛感”的职场人！

■新栏目器件口碑专辑上线~快来点评吧！

■中星联华直播 | 高速信号完整性分析与测试 — “码”上行动系列线上讲堂