网络封包遗失的信息修补艺术(三)

本文作者:admin       点击: 2007-10-09 00:00
前言:
二、非因果的错误控制

非因果的错误控制着重的焦点,在于下一个GOP的成功传送,关于目前GOP的封包遗失,则会在下一个GOP中以非因果的错误回复方式加以隐藏。同样假设X为GOPi-1中所有Mi-1个封包里所遗失的封包数,即X={L1,L2,…,Lm}。在没有错误控制的情况下,我们只能译码GOPi-1中的(L1-1)Bp位。如果我们安排传送GOPi的Bi位给接收端,并使用非因果错误隐藏方法,则GOPi-1的最大失真可表示为。现在假设Mi为GOPi的最小数目封包,并须在GOPi中经由正规的解码来满足失真限制,以及同时也满足经由错误隐藏中GOPi-1中的失真限制,其中Mi的定义如下:

而此可被转换成最佳化之问题如下:
最小化且限制及
其中的计算(亦同理可算),可由
计算出来。
要解决上述问题,首先我们可以先假设,而m=1,2,…,Mi-1。先找出所需的封包遗失机率,然后再找到最佳的重传次数以及其所对应的能量等级(power levels),以将整个传送所需能量最小化为目的。利用上述的计算结果我们可以知道,我们使用的能量是否高于重传遗失封包所需的能量。如果是,那表示封包在传送前须先经过重新排列。如果否,则传送者只需要传送GOPi中的封包来协助错误隐藏即可。现在有一个问题,在于NCEC的策略与ARQ方式相较之下,孰优孰劣?在2006年的时候,I.V. Bajic做了一些研究,并发现其中有几次的结果里面,NCEC的效能优于ARQ的表现,有兴趣之读者不妨参考看看。

三、传送策略与能量管理策略

有关能量管理问题与2002年Y.Eisenberg及C.E.Luna等人的研究问题相似,都是在最小化传送视频片段所需要的能量,以维持接收的视频能在期待失真值范围内(即是某个Dmax等级以下)。而在传送策略方面,根据视频编码速率、GOP大小、封包大小以及传送速率,我们可以依据实时传送一个GOP所需的间隔每次都配置某数量之封包slot来使用。在许多情况下,为简化对能量控制策略之讨论,其往往假设不需回馈信息的情形,但许多结果发现,其控制机制往往不能对系统或环境的动态变化,实时做出适当调整应变。因此为改善此种系统之缺点,使用回馈信息的机制越来越多被提出来讨论。比较著名的两种方法,一种是基于NCEC方法,另一种是基于ARQ的方式,但这两种策略均使用信息回馈机制。

利用回馈信息,我们可以改变视频封包所需要的能量等级设定,并侦测哪些封包应在冗余的slots中被重复。每个封包的传送能量,都会以新的传送能量需求来计算,但总传送能量的部分,则可能涵盖重复传送封包的部分。如果令表示在译码B bits后GOPi中最大的个别画面,如果,则表示在译码GOPi中所有画面之B个位后,其产生的失真将不会大于Dmax。假设在没有遗失发生的情况下,要满足失真限制(distortion constraint),其中Mi为最小的封包数,且Mi=min{M∈N:}。如果所有GOPi的封包,除了封包m遗失之外其它均有被收到,则GOPi可解码程度可达(m-1)Bp位。令表示GOPi中封包j的遗失机率,并假设封包间的遗失率乃各自为统计上的独立事件,则接收端对GOPi的失真期望值()可表示为。现在假设|GOP|i表示GOPi之画面数,而以f表示画速(frame rate),对一个实时传送而言,我们会有一个秒数之时间间隔(time slot),可传送所有相关GOPi之信息。假设封包的负载区大小为Bp,而仍以表示网络频宽的膨胀因子,在传送速率为Rt之情况下,在一个时间间隔中,GOPi之最大封包数应为,其中表示不大于X的之最大整数值。在一个GOPi的时间间隔里,其在传送上有足够的封包区隔(slots)去满足Mi个封包时,我们称。若不能满足,则会造成Rt太小而无法满足失真限制之要求。如果在传送GOPi的过程中,GOPi中的封包m被重复次(≥1),则译码器(decoder)将可以解码此GOPi直到最后一个复制封包被送来为止,换句话说,在个复制封包未被用尽之前,译码器对其均有解码能力。此会将降低遗失率降低到,而该期待失真率()就会变成
。对每一个GOPi中的封包(m=1,2,…,Mi),找到一个适当的能量等级之及应重复数目,以满足之最小值,并限制与是我们的目的。但因为该问题涵盖了连续变量及整数,所以此乃混合整数(mixed-integer)问题。依据G. L. Nembauserr及L. A. Wosly之看法,多数这种问题乃倾向是一种NP-complete问题,换句话说,要取得可以满足之最小值,且限制与之解法,可能要付出非常昂贵的运算代价。

因此,目前的另一个研究趋势,乃在于其次要解法的可被接受性。首先为了找到中的总传送能量之最小值,就必须要先找到最小化并限制,且对所有m而言,均为。一旦我们找出最佳化的对应封包遗失率,接下来我们就必须找出每个封包所应重复之最佳次数。不过要注意,如果封包m的重复次数为次,其使用的传送能量就会变成,其中每一个的复本之遗失率为,但是有效的封包m遗失机率仍为(因为),而被用来传送所有封包m的复本之能量为。经I. V. Bajic的研究发现,若重复一个封包数次,可以有效减少所欲维持的一定封包遗失率所需要之总能量(尤其是在不高的情况下)。利用此一结果,的寻找可以变为之最小化,并限制。而为了找到的最佳化组合,在实作里通常于所有可行的组合中进行详细的搜寻。当与Mi关联性很接近时,其所花费之运算成本是可被接受的。在找寻最佳化组合之过程中,其往往也包含了要寻找每个封包所对应的传送能量,而当有的任何组合出现时(尤其是的最佳组合)失真限制(即)将会被满足。

四、信道模型(channel model)

网络中的封包遗失问题可利用各种方法加以模型化,例如:K级马可夫链或是Bernoulli处理(Bernoulli process)…等等。在无线信道的模型上面,其大多采用窄频缓慢衰退通道(narrow-band slowly fading channel)并搭配加成性的高斯噪声(Gaussian noise)模型。其运作原理简单的说,以第n个封包而言,若以En表示其平均传送能量而以Pn表示其封包遗失率,另以Hn表示衰退参数(fading parameter)。在此我们假定传送封包过程中,衰退乃属于一种固定参数,也就是说,即使每个封包之间的衰退或许都会非常不同,但其仍不失于结果的独立性并具单一指数分布(即瑞雷(Rayleigh)通道衰退)。故E[Hn]等于常数且等于E[H],依据L. Ozarow等人之研究,有关能力耗损(capacity-outage)所导致的封包遗失率可公式化为,其中而N0表示噪声能量频谱强度,W表示通道频宽而Rt则表示传送速率。若在有线网络方面,我们先对封包遗失模型化,然后再假设一些先决整体环境变量(例如:封包的遗失乃彼此独立事件、遗失率固定或是执行回馈信息时,所造成之迟延唯一固定常数…等等),然后慢慢建置整个环境的仿真系统。当然这其中如果假设的环境参数越单纯,其就越容易产生(或得到)推论结果,但同样的此结果也可能偏离真实环境情况;相反的,将环境影响因子考虑越多近来,虽可使我们的模型越接近真实,但其缺点除导致模型的难以建立或是结果推论的过度复杂化之外,我们对这些参与因子的控制能力或了解有所不足,也可能使系统容易产生伪结论而失去系统对环境的洞察力。

五、前导错误修正(FEC)方法

在网络的应用里面,T.Stockhammer及C. Buchner等人曾考虑使用消除码(erasure code)来回复遗失的封包。在这些方法里面,一个视频串流会先被分成数个区段,每个区段接着会被封包化,假设其封包化后所有区段封包集合为S,在此应用一个区块码(block code)来将整个S集合内的封包套上,并产生一个多余的部分(称为L部分封包)。附随在整个视频(N个封包区块)之后,亦即N=S+L。如果接收者有接收足够数目的区块封包,那接收者就可以回复这些S集合之封包。在大多数的研究里面,消除码多指RS码(Reed-Soloman code),因为其有着好的消除修正属性,故其广被应用在许多实作上面。对一般网络应用而言,信道错误(channel error)通常表示的是一种封包消除(packet erasure)型态,一个RS(N,M)码通常应用交迭封包(across packets)来修正(N-M)遗失封包。前面谈过,RS码的保护能力乃依据区块大小(block size)及码率(code rate)而定,其并藉由额外的FEC延迟引入来作为限制方法,且区块长度N则可藉由端点对端点的系统迟延限制来加以侦测。

六、期望值中的主观因素

我们对于视频质量的评估,常以使用期望值的客观方式为之。经由前述,我们可以知道影响该期望值有3种主要因子,分别是来源端的行为模式(例如:封包化或量化过程)、信道特征以及接收端的行为模式。对来源端而言,一个编码器(encoder)的期望失真值可以计算如下:

不管第k个封包是否有到达接收端,E[DR,k]及E[DL,k]分别被用来表示期望失真值,而则是其封包遗失机率。在使DR,k与DL,k通常表示一种随机变量,此乃因为信道之遗失导致译码器与编码器之Inter coding的参考画面不相一致的结果。在计算DL,k上面,其乃基于特定的解码器所使用的错误隐藏策略。假设使用的是MSE(mean-squared error)方式,则失真的测量部分乃依据2001年M. Gallant及F.Kossentini递归最佳化每个像素评估算法(RoPE),以用于反复计算全部像素失真等级的期望值。至于影响的质量测量,则使用较简单的客观质量测量技术(例如:PSNR),而非使用主观人类视觉模型特征量测技术,而PSNR的使用定义为db。然此客观的测量方法虽满足了原理已知、运算简便等特性,却未必反映出使用者真实主观质量的要求。在信息错误的修补技术上,目前许多质量的维护核心价值在于“大数法则”,只要维持足够多的高质量信息,就有机会提供足够高的服务质量(主观与客观同时满足)。但实务上发现这种大数法则所衍生出来的是庞大的系统资源浪费,虽然较能符合主观质量要求(尤其在视频/影像质量方面),但总觉得方法不够精致(甚至是粗糙)。此原则虽然在有线网络与桌上计算机运算环境中游刃有余,但面对未来无线环境的应用领域,大数法则的研发方向已备受考验,精致又有效率的错误回复方法,将会是取代大数法则的另一波研发趋势。