基于隐马尔可夫预测的非对称信息功率博弈的综

　　0 引言
　　当今无线通信领域的重点与难点是通过提高频谱利用率解决频谱资源缺乏的问题，尤其是当无线网络中节点以竞争的方式使用频谱资源时，如何协调它们的行为（比如发射功率、信道选择等），使资源得到有效利用以满足用户的需求是保障系统正常运行的关键[1-4]。
　　功率控制机制由于能够有效避免对系统间、用户间的干扰，提高频谱和能量效率，是当前相关研究的重点和热点[1]。功率控制机制
　　是在满足用户公平性的基础上，通过有效控制用户的发射功率，以满足用户的通信质量需求。文献[5]提出了能保证非授权用户公平性的双阈值自适应功率控制算法，该算法中非授权用户通过限定最大和最低信噪比，在保证通信质量的前提下减小了功率的消耗；然而该模型需要中心节点向所有非授权用户广播信道状态，增加了信道开销。文献[6]考虑在保证授权用户通信质量的同时，非授权用户以最大传输速率与授权用户共享频谱资源。文献[7]考虑在Ad Hoc网络中采用underlay式频谱共享模型情况下，提出了两种算法实现不同的优化目标，其中REPC算法提高了非授权用户的平均传输速率，EEPC算法降低了非授权用户的功率损耗。文献[8]提出了在Ad Hoc网络中以最大化传输速率为目的的功率控制算法，非授权用户在授权用户未占用信道时会接入信道；但该模型中没有考虑检测误差的影响，其假设非授权用户检测的信道状态信息是准确无误的，而这在目前的无线网络环境中是无法实现的。
　　现有诸如以上的大多数文献中，在设计通信系统功率博弈机制时，都假设参与博弈的网络实体所获取环境信息是同质的，没有考虑用户信息的非对称性，而博弈中的信息对博弈结果有决定性的影响[9-10]。所谓信息的非对称性是指由于用户所处的环境差异和认知能力差异，即对同一个环境对象，用户的认知结果也不一样。本文提出了一种非对称信息环境中的功率博弈机制，以可用无线频域信道作为认知对象，针对不同用户对认知对象的感知差异，提出了一种基于隐马尔可夫的预测模型（Hidden Markov Prediction Model，HMPM）[11]来确保参与博弈的用户获得更多、更准确的关于竞争对手的信息，最终提升用户和系统的能量效率。文中对非合作功率博弈下纳什均衡的存在性与唯一性进行了证明，并通过仿真对算法进行了性能分析。
　　1 系统模型
　　考虑一个码分多址（Code Division Multiple Access，CDMA）制式的中心辐射式网络[12]，该网络的某一小区内有若干授权用户和N个非授权用户。小区内存在两个基站分别为授权用户和非授权用户收发数据。将授权用户的网络建模为分时隙系统（Slotted System），频域信道是否被授权用户占用满足两状态马尔可夫链，频域信道状态在相邻两个时隙内以概率pij进行转移[13]。非授权用户在检测到授权用户未占用频域信道时利用频域信道传输数据。将频域信道状态记为0、1两种状态，且在一个时隙内频域信道的状态不会改变。频域信道状态为1表示授权用户未占用信道，此时非授权用户可以利用信道传输数据；而状态为0则表示频域信道已被授权用户占用，非授权用户不能利用频域信道传输数据。由于网络中的各个非授权用户独自检测信道状态，导致非授权用户对频域信道状态的判决结果存在非对称性。
　　系统帧结构如图1所示，每帧分为若干时隙。分布式功率控制机制可以分为基于干扰测量和基于信道增益估计两类[14]。前者需要经过多次测量值的反馈，以逐时隙或逐帧迭代的方式实现功率的调整和收敛。本文将授权用户建模为分时隙系统，各时隙信道是否被授权用户占用会发生变化。同时由于信息非对称性，各时隙内参与博弈的非授权用户不同。因此，功率控制机制无法以逐时隙迭代的方式收敛。如果将整个功率控制过程在一个时隙内完成，又因为每个时隙的时长有限，完成多次闭环干扰测量和反馈的时间开销相对过大、同步难度高。因此本文采用基于信道增益估计的功率博弈机制，通过时隙内的迭代运算计算出功率博弈的均衡值。在此机制下，各帧中第一个时隙0用于估计每个非授权用户到基站的信道增益和背景噪声，并将这些信息由基站广播给非授权用户。本文通过带外控制信道的信标收发来估计信道增益[15]，为了确保带外控制信道的可靠性，使用一个授权信道作为带外控制信道，非授权用户对该信道的访问不会干扰授权系统[16]。假设非授权用户的移动速度较慢，则一帧时间内信道增益不变。从第1时隙开始，各帧的第一部分用于感知信道是否被授权系统占用。若没有被占用，则进行基于HMPM的功率博弈实现分布式功率调整，接下来完成数据传输。
　　设满意度系数为1.2，非授权用户数为15。图4给出了价格系数变化时容量与功率的比值变化关系。当价格系数增大时，非授权用户的平均容量与平均功率的比值增大。这是因为随着价格系数的增大，非授权用户对发射功率所付出的代价增大，因此非授权用户更加注重单位功率的利用率。由仿真结果可见，在非对称信息环境中，非授权用户应用隐马尔可夫预测竞争对手判决频域信道状态的HMPM方法较MAP方法更能提高其容量与功率的比值，而没有预测功能的NP方法的功率效率最低。也就是说，在非合作功率博弈中非授权用户知道的环境信息越多、越准确，非授权用户选择的策略带来的利益就越有利于其自身。例如在本文中，MAP方法只利用当前时刻的信息进行预测，预测结果无法得到修正，使得正确率较低；而HMPM方法应用观测状态序列进行预测，能够更准确预测参与博弈的用户数，非授权用户的功率效率就更高。
　如图5所示，满意度系数为1.2，价格系数为1.5，随着非授权用户数的增加，系统中平均容量与平均功率的比值逐渐降低。用户数的增加导致在基站处非授权用户相互间的干扰加大，降低了传输容量，因此使得比值逐渐降低。在非对称信息环境中，非授权用户通过应用HMPM预测竞争对手对频域信道状态的判决，较准确判断出将会对其产生干扰的非授权用户，达到通过调整最佳的发射功率而提高功率效率的目的；而预测准确率相对较低的MAP方法和没有预测功能的NP方法的功率效率要低一些。
　　如图6所示，价格系数为1.5，非授权用户数为15，随着满意度系数的增加，非授权用户的平均容量和平均功率的比值逐渐增加。但在保证通信质量的前提下上升趋势在达到一定程度后趋于平缓。可见，当满意度系数较小时，非授权用户的信干比要较高才能满足需求。因此满意度系数较小时发射功率较大，且随着满意度系数的变化发射功率变化较快，使得容量功率比变化较快。当满意度系数较大时，情况正好相反。根据香农公式的特点，容量功率比随着发射功率减小而增大。同时，对于满足用户同样的需求，NP方法的功率效率最低，HMPM方法的功率效率最高，其原因也是因为HMPM方法使博弈用户获取竞争对手的信息更准确。
　　由表1可见在每帧的开始，三种方法的实现都需要交换信道增益h和噪声信息N0，如果信道的变化比较慢，那么信息交换的频率比较低，而且MAP方法和HMPM方法的实现需要知道先验信息，即非授权用户对频域信道状态的判决能力。在NP方法中N个非授权用户只需各自判断当前时隙的频域信道状态即可，而MAP方法还要分别预测其他人的判决状态，则MAP方法的复杂度为O（N2）。HMPM方法在预测时仅需应用t-1时隙的先验概率计算t时隙的后验概率，因此其复杂度也为O（N2）。由此可见，虽然参与博弈的非授权用户获取对手的信息越多、越准确，系统的性能越好，但这是以增加空间和时间复杂度为代价的。
　　6 结语
　　本文提出了一种基于隐马尔可夫预测的功率博弈机制，解决了用户对信道状态的判决结果存在非对称性时最佳发射功率的选取问题。该机制在保证用户通信质量前提下，提高了用户的功率效率，但其实现代价相对较高。在环境信息非对称的情况下，用户如何高效选取最佳的策略值得进一步研究。
　　参考文献：
　　. IEEE Journal of Selected Topics in Signal Processing， 2011， 5（1）： 5-23.
　　. IET Communications， 2012， 6（11）： 1495-1501.
　　. IEEE Transactions on Vehicular Technology， 2013， 62（4）： 1827-1837.
　　. IEEE Journal on Selected Areas in Communications， 2013， 31（3）： 500-513.
　　// GHTCE 2012： Proceedings of the 2012 Global High Tech Congress on Electronics. Piscataway： IEEE， 2012： 91-94.
　　. IEEE Transactions on Wireless Communications， 2008， 7（7）： 2752-2761.
　　. IEEE Signal Processing Letters， 2013， 20（5）： 451-454.
　　// NBiS 2011： Proceedings of the 14th International Conference on Networkbased Information Systems. Piscataway： IEEE， 2011： 30-34.

本文由第一论文网选自《计算机应用》2014年第4期，版权归原作者和期刊所有，如有异议请联系，本站将及时处理。（lunwen. 1kejian.C O M）