1 引言以dna分子作为计算载体的计算方法最早由adleman博士于1994年在生物实验室实现[1]。随后,dna计算取得了很多研究成果。1995年[2],lipton提出了用dna实验解决布尔可满足性问题(sat)的方法。1997年[3],ouyang等人用分子生物技术解决了最大团问题,并相应地建立了六个节点的dna分子计算池。2000年[4],liu等人设计了一个dna计算系统,将计算问题的所有可能候选解编码成一系列dna分子,把这些分子综合起来贴在磁珠的表面。2001年[5],wu分析并改进了前者所采用的基于表面磁珠的方法。这种新颖的计算方式是建立在其高密度信息存储和大量并行计算基础上的,有望在求解np问题、破解密码、疾病诊断、新材料等领域发挥重要作用写作论文。
微流控系统为快速化学反应和生物分析提供了基础。微流控系统作为dna计算的一种平台,已经有了初步的研究成果。2004年[6],ledesma等人提出了一种用微流控系统解决hamilton路径问题的线性dna算法,实现了并行计算。1999年[7],gehani和reif研究了用微流生物分子计算模型解决某个问题在理论上所需要的最少dna序列和最少反应时间,并且提出了反应池之间有效地传送dna序列的方法。2001年[8],mccaskill采用枚举法用dna序列对每个可能子图进行编码。该算法使用了所谓的选择模块(stm)来保留图中所有可能团,然后用排序的方法确定了最大团。2001年[9],chiu等提出了一种新的方法,把子图和图的边分别编译成反应池和缓冲池。www.133229.COM这些反应池和缓冲池带有荧光剂,由通道连接,输出以各个子图所发出的荧光强度不同来区分。2004年[10],livstone和landweber提出一种微反应器用来解决布尔函数“与”和“或”的问题。
随着微机电(mems)技术的快速发展,在生物芯片上集成各种能与电子计算机之间相互通信的传感器是各种功能芯片研究的热点[11]。dna计算的一个严重缺点是操作的不可控,严重影响了dna计算的实用性。本文在微流控平台上,讨论基于生物芯片的dna计算机和电子计算机之间相互通信的层次模型,从而为发展dna计算机和电子计算机相集成的杂合计算机提供一种通信模型和方法。
2 基于电子计算机的dna计算反应器模型为了使电子计算机能够对dna计算进行控制,我们研究并设计了适合于dna计算的反应器。如图1所示,该反应器通过rs232接口与电子计算机连接,人机交互界面的平台是labview。
(1)数据流:在电子计算机软件客户端由用户选择某个np问题,程序开始设计dna计算机,包括:输入符号、终止符号、〈状态,符号〉、转移分子、扩增所需的引物和dna编码;酶的选择;扩增、酶切、酶连的动作选择,针对上述酶设计反应温度和阶段。(2)控制流:设计具体问题的程序输入分子和采用的微流控芯片,芯片的通道数量和通道之间的连接以及通道的形状,设计实验实现的详细步骤:每一步的动作、所需的时间、反应的底物、目标产物、代表的中间变量等。图1 dna计算的反应器模型 电子计算机主机与89c51系列单片机相连,将数据流和控制流同时送到接口端的高精度全方位机械手:分配试剂,根据反馈的图像信号定位芯片反应平台。生化反应的动态结果反映在应用层,包括当前反应所在的通道、该反应所需的时间、已经消耗的时间、通道的切换、反应产物的解释。dna计算反应器与电子计算机通信的系统控制模块、光电检测模块、高压电源模块和温度加热模块与电子计算机之间的连接如图2所示。整个反应器能够实现激光诱导荧光检测、芯片电泳和仅与温度有关的生化反应,如pcr、退火、复性等等。
3 dna计算机与电子计算机之间通信的层次模型 dna计算本质上是以dna分子及生化酶作为物质基础,施以适当的生化操作来解决数学问题的一种新型的计算模式。由于dna计算的处理对象是dna片段,因此运用dna计算求解数学问题时首先需要将实际问题用{a,t,c,g}四个碱基来编码,原理类似电子计算机求解这些问题时需要用二进制编码。然后需要为求解过程设计合适的生化操作,这个完成运算的生化操作序列我们称之为生物算法。dna计算是在分子尺度内进行的,完成计算过程的生化操作的不可控一直制约着dna计算的进一步应用。随着电子计算机技术和传感器技术的发展,二者在dna计算中的结合可实现对生化操作的精确控制,提高dna计算的可靠性,为dna计算进一步走向实用化发挥重要作用。图3给出了电子计算机和dna计算机之间通信的层次模型。图2 dna计算反应器与电子计算机的通信为了便于描述通信过程,将该模型分为六个部分,每一部分的组成和完成功能描述如下。图3 dna计算机和电子计算机的层次通信模型
(1)应用层提供用户与dna计算机之间交互的接口。应用层主要完成两个功能:一是提供用户操纵dna计算机的界面。在这个界面上用户可以完成原始问题到dna碱基域的映射以及完成生物算法的设计。通过这个界面,用户可以像使用office办公软件一样方便地使用dna计算机。另一个功能是接收指令解释层传送的dna计算结果,并将结果可视化。指令解释层传送的结果也是用电子计算机语言来描述的。运算结果的可视化可以帮助直观地对这些结果进行合理的解释。应用层由安装在windows操作系统的电子计算机上的应用程序组成。
(2)指令解释层由于应用层的指令是用户所熟悉的电子计算机语言描述的,而dna计算机的基本指令是具体的生物操作,所处理的对象是dna分子,因此需要将应用层的电子计算机指令解释成dna计算机上具体的生物操作指令(这些生物操作指令是dna计算机的最小执行单位———基本指令),确定这些生物操作的执行顺序,并依次将这些生物操作指令单个传送给编码封装层。另一方面,还需要将编码封装层反馈的dna计算结果解释成计算机语言。指令解释层也是由安装在电子计算机内部的代理程序构成。(3)编码封装层将指令解释层传送的单个生物操作指令封装成dna计算机能直接执行的指令。这里需要考虑每个原子生物操作的实验室实现方法。然后将这个操作的步骤映射成控制传感器和生化仪器的一系列指令,包括对生物芯片上发生该反应的位置信息。编码封装层由操作传感器和生化仪器的接口程序构成。
(4)接口层接口层是传感器和生化仪器的各种信号接口。一方面,将编码封装层中的控制指令转换成控制dna计算机执行生化操作的指令;另一方面,也将dna计算机上的反馈信号转换成电子计算机中的控制指令。接口层之间的通信采用电子计算机的串口通信方式,也可以设计成并口通信方式。(5)反应层dna计算的生化操作在这一层得以物理实现,以完成解释层下达的任务。此层包含有完成生化反应的生物芯片以及控制这些生化反应的各种传感器和生化仪器。(6)反馈层这一层由监控生化反应的传感器构成。反应层的生化操作的执行情况由这些传感器收集,以便反馈给指令解释层。4 通信模型的实例为了更直观地理解本文提出的层次模型,我们以选择操作为例,解释在层次模型下dna计算机上实现选择操作的过程。
dna计算机中的选择操作是用来选择编码特定信息的dna片段。一般是将包含特定模式的探针固定于芯片上,被选择的片段在芯片上与其发生复性(renaturation)操作,最后固定在芯片上的片段就是选择的片段。复性是变性过程的逆过程,即两条完全互补的单链在适当的条件下恢复到天然双螺旋结构的过程。热变性的dna一般经过冷却后即可复性。因此,此过程有时也称退火(annealing)。复性温度一般应该比该dna的解链温度值低20℃~25℃。
对于选择操作,需要将其解释成以下几个独立的生物操作:操作1:选择固定有特定模式探针的生物芯片;操作2:将被选择的片段在该生物芯片上发生复性反应;操作3:在激光诱导荧光检测仪上通过荧光检测判断选择的结果。图4、图5、图6分别为层次模型下以上操作的流程图。图4 操作1流程图动作1.0应用层:用户在接口程序发出选择操作,例如:选择操作符号1。动作2.0指令解释层:逐条解释生物算法中的每一个描述,将其解释成分子实验室中具体的生物操作,包括反应名称和反应条件,然后将单个的生物操作依次发给编码封装层,待编码封装层返回操作的执行状态后再发下一个生物操作,类似于电子计算机中的指令寄存器。动作3.1编码封装层(第3层操作1):发出选择探针芯片的指令。通过选择可寻址的生物芯片来实现。动作4.1接口层(第4层操作1):电子计算机通过rs232与dna计算机进行通信。
动作5.1反应层(第5层操作1):无生化反应。动作6.1反馈层(第6层操作1):相应的传感器接收到确认信息,确认该操作1完成,并将反馈信息返回到接口层,接口层反馈到编码封装层,再发下一个操作。动作3.2编码封装层(第3层操作2):发出复性反应的指令。控制相应的温浴仪器先将温度升高到65℃,然后慢慢冷却,降温到20℃。
动作4.2接口层(第4层操作2):电子计算机通过rs232与dna计算机进行通信。动作5.2反应层(第5层操作2):相应的生化仪器先加热芯片,然后慢慢冷却。动作6.2反馈层(第6层操作2):相应的传感器接收到确认信息,确认该操作2完成,并将确认信息返回到接口层,接口层反馈到编码封装层,再发下一个操作。动作3.3编码封装层(第3层操作3):指示激光诱导荧光生化检测仪工作。 结果优先返回给用户。client request resourcecheck local ldap resource-infoif (valid) reture resultelse {send queryagent to vo global ldap server query the position if satisfies condition if (valid){queryagent copy itself and move to resource of multi-node query local resource of nodereturn resultagent to local ldap server} else {send queryagent to global ldap server of central domain central domain global ldap query and confirms the vo of re-source central domain send queryagent to correlative vo return resultagent to central domain}基于移动agent的资源发现系统本质上是分布式的,但是与传统的基于rpc方式的分布式应用相比,移动agent的迁移不需要保持网络的长时间稳定连接,这可大大减轻网络负荷,避免了大量数据的网络传送,从而显著提高系统执行效率和可靠性。4 性能分析
4.1 资源发现效率和资源质量
教育资源中存在着大量的非文本资源。传统的搜索引擎和主题指南无法对视频、音频等多媒体教育资源进行标引和发现,而元数据通过对资源类型的描述,只要用户在资源检索时对资源类型进行限定即可发现它们。
因特网上存在大量教育资源,这些资源的质量参差不齐,传统的搜索引擎和主题指南没法提供一个质量评估机制。而这正是教育元数据的一个特征,它通过提供教育资源使用者的评估来反映不同资源之间的质量差异,有助于用户发现高质量的教育资源。
4.2 动态性和扩展性
在网格系统中,资源节点的信息是动态变化的,为了保证服务的可用性,进行有效资源查找时必须考虑系统中节点的动态变化。
网络层采用globus mds来组织和管理底层资源,通过调用虚拟组织agent中间件部署的register agent和unreg-ister agent,进行虚拟组织的动态建立并且虚拟组织成员可以随时加入和离开,具有很大的灵活性,实现了动态注册和注销。通过upgrade agent,社区节点周期性地向社区管理节点发送更新信息,将变化动态地反馈给虚拟组织中的ldap服务器。同时,各个虚拟组织vo之间定期将目录服务器上的资源信息通过ldap的异步远程复制机制更新到虚拟组织中心域中的ldap中,这样就实现资源信息的动态收集和资源变化的实时反馈。
结束语 该模型采用教育元数据lom规范来描述教育资源,使用分类元数据的方法,结合移动agent的自治性、智能性等特点,具有较高的资源发现效率和资源质量、良好的动态性和扩展性,基于类别的虚拟社区划分,使得资源发现限定在所属社区范围内,缩小了搜索空间,减少了资源发现的响应时间,提高了资源发现的效率。
参考文献
1虞惠达,朱庆华.元数据在教育资源发现中的应用[j].中国图书馆学报,2005(2)
2 fukuda m,tanaka y,suzuk n.a mobile-agent-based pc grid[a].in: autonomic computing workshop [c]. seattle, usa:[s.n.],2003.142~150