1.通用的研究设计与框架
01 流行病学基础 02 研究现状概述03 研究现状不足 04 新的技术发展 05 数据挖掘意义
Backgroud/Introduction Write or Copy
Methods Just copy it
Results Describe Fig. and Table
Discussion Relations to previous data
discussion: 01概述研究现状 02回顾本文结果 03关联已有研究 04略提不足之处05有待功能研究 06展望研究意义 07综上归纳总结
2.总结:
Background Methods Results Discussion 1. 流行病学基础 2. 研究现状概述 3. 研究现状不足 4. 新的技术发展 5. 数据挖掘意义
methods:1. 数据来源
2. 数据处理及分析 ① 原始处理 ② 差异表达 ③ 功能注释 ④ 分子网络 ⑤ 关键基因
3. 数据利用及关联 ① 生存分析 ② 验证数据
results:1. 差异表达 2. 功能注释 3. 分子网络 4. 关键基因 5. 生存分析 6. 验证数据
discussion: 1. 概述研究现状 2. 回顾本文结果 3. 关联已有研究 4. 略提不足之处 5. 有待功能研究 6. 展望研究意义 7. 综上归纳总结
3.Fig. 1A 三个独立数据集DEG交集的维恩图, 得到共同的差异基因
Fig. 1B 共同差异基因的蛋白互作网络
Fig. 1C 蛋白互作网络中筛选关键基因
Fig. 2A 筛选得到关键基因后,对关键基因构建 共表达网络 mcode
Fig. 2B 对关键基因构建功能网络 bingo
Fig. 2C 构建差异基因在肿瘤样本中的表达热图 ucsc xena
Fig 3A. 前期筛选到的关键基因在肝癌病人中的表达 高低对总体生存率的影响
Fig 3B. 前期筛选到的关键基因在肝癌病人中的表达 高低对无病生存率的影响
Fig. 4A SAGE分析得到TOP2A 在人不同部位肿瘤和 正常组织中的表达谱
Fig. 4B SAGE分析得到CDK1在不同部位肿瘤和正常 组织中的表达谱
Fig 5A. Oncomine分析TOP2A在肿瘤vs正常组 织中的表达差异。 1,2,3,4分别代表4个不 同的study。
Fig 5B. Oncomine分析CDK1在肿瘤vs正常组织 中的表达差异。 1,2,3,4分别代表4个不同 的study。
Oncomine分析TOP2A与肿瘤分级,肝 炎病毒感染状态, 卫星灶, 血管侵犯的相关性。
Table 3. 对筛选到的关键基因进行罗列和功能注释
4.cytoscape 插件
ClueGO
Gene ontology annotationCluePedia
BiNGO
cytoHubba
Seek hub module/gene
MCODE
CytoKegg
Import external databasesstringAPP
ReactomeFI
6.RNASeq/表达谱芯:芯片重注释 • 非编码RNA表达(lncRNA、miRNA、 circRNA) • 共表达网络分析
DNASeq + RNASeq:结构变异与临床表型 • 结构变异与基因表达 • RNA编辑 • eQTL
RNASeq/表达谱芯片 + ChipSeq/甲基化:转录调控 通路/网络
格式
亲爱的XXX(人称):
(内容)
(空两格)祝
_____________________(祝福语顶格)
XXX(姓名)
X年X月X日
在结尾语下面的署名必须亲自签名
书信历史悠久,其格式也几经变化。今天,按通行的习惯,书信格式主要包括五个部分:称呼、正文、结尾、署名和日期。
1.称呼
也称“起首语”,是对收信人的称呼。称呼要在信纸第一行顶格写起,后加“:”,冒号后不再写字。称呼和署名要对应,明确自己和收信人的关系。(具体可参见第四编《应酬称谓》)称呼可用姓名、称谓,还可加修饰语或直接用修饰语作称呼。这里简要说明几条细则:
(1)给长辈的信。若是近亲,就只写称谓,不写名字,如“爸”、“妈”、“哥”、“嫂”等;亲戚关系的,就写关系的称谓,如“姨妈”、“姑妈”等。对非近亲的长辈,可在称谓前加名或姓,如“赵阿姨”、“黄叔叔”等。
(2)给平辈的信。夫妻或恋爱关系,可直接用对方名字,爱称加修饰语或直接用修饰语,如“丽”、“敏华”、“亲爱的”等;同学、同乡、同事、朋友的信,可直接用名字、昵称或加上“同学”、“同志”,如“瑞生”、“老纪”、“小邹”、“三毛”等。
(3)给晚辈的信。一般直接写名字,如“乐毅”、“君平”、“阿明”等;也可在名字后加上辈分称谓,如“李花侄女”等;亦可直接用称谓作称呼,如“孙女”、“儿子”等。
(4)给师长的信,通常只写其性或其名,再加“老师”二字,如“段老师”、“周师傅”、“宏海老师”等。对于十分熟悉的师长,也可单称“老师”、 “师傅”。假如连名带姓,在信首直称“孙松平老师”、“王达夫师傅”,就显得不大自然且欠恭敬。对于学有专长、德高望重的师长,往往在姓后加一“老”字,以示尊重,如“戴老”、“周老”,亦可在姓名后加“先生”二字。为郑重起见,也有以职务相称的,如“董教授”、“陈大夫”、“佟工程师”等。
(5)给一个单位或几个人的信,又不指定姓名的,可写“同志们”、“诸位先生”、“XX等同志”等。给机关团体的信,可直接写机关团体名称。如 “XX委员会”、“XX公司”。致机关团体领导人的信,可直接用姓名,加上“同志”、“先生”或职务作称呼,亦可直接在机关团体称呼之后加上“领导同志”、“负责同志”、“总经理”、“厂长”等。
如果信是同时写给两个人的,两个称呼应上下并排在一起,也可一前一后,尊长者在前。
上述五种场合,有时还可按特殊对象,视情况加上“尊敬的”、“敬爱的”、“亲爱的”等形容词,以表示敬重或亲密之情。当然,这要用得适宜,如对好友称“尊敬的”,反而显得见外,对无特殊关系的年轻女性贸然称呼“亲爱的”,那就有失检点了。
2.正文
正文通常以问候语开头。问候是一种文明礼貌行为,也是对收信人的一种礼节,体现写信人对收信人的关心。问候语最常见的是“您好!”“近好!”依时令节气不同,也常有所变化,如“新年好!”“春节愉快!”问候语写在称呼下一行,前面空两格,常自成一段。
问候语之后,常有几句启始语。如“久未见面,别来无恙。”“近来一切可好?”“久未通信,甚念!”之类。问候语要注意简洁、得体。
接下来便是正文的主要部分——主体文,即写信人要说的话。它可以是禀启、复答、劝谕、抒怀、辞谢、致贺、请托、慰唁,也可以是叙情说理、辩驳论证等。这一部分,动笔之前,就应该成竹在胸,明白写信的主旨,做到有条有理、层次分明。若是信中同时要谈几件事,更要注意主次分明,有头有尾,详略得当,最好是一件事一段落,不要混为一谈。
3.结尾
正文写完后,都要写上表示敬意、祝愿或勉励的话,作为书信的结尾。习惯上,它被称做祝颂语或致敬语,这是对收信人的一种礼貌。祝愿的话可因人、因具体情况选用适当的词,不要乱用。(可参见下节《常用书信用语》的“祝颂语”。)
结尾的习惯写法有两种:
(1)在正文写完之后,转一行空两格写“此致”,再换一行写“敬礼”。
(2)不写“此致”,只是另起一行空两格写“敬礼”、“安好”、“健康”、“平安”等词,一定要另起一行空两格,不得尾缀在正文之后。也可以在正文结尾下另起一行写“祝你”、“敬祝”,再空两格写上“安好”、“健康”等。
4.署名和日期
在书信最后一行,署上写信人的姓名。署名应写在正文结尾后的右方空半行的地方。如果是写给的亲属、朋友,可加上自己的称呼,如儿、弟、兄、侄等,后边写名字,不必写姓。如果是写给组织的信,一定要把姓与名全部写上。而在署名之后,有时还视情加上“恭呈”、“谨上”等,以示尊敬。上述自称,都要和信首的称谓相互吻合。
日期一项,用以注明写完信的时间,写在署名之后或下边。有时写信人还加上自己的所在的地点,尤其是在旅途中写的信,更应如此。
文言书信格式
称谓后附提称语,用于文言书信,如,运使学士阁下(王安石《上杜学士言开河书》)、虹生十四兄亲家年大人情右(龚自珍《与吴虹生书》);再如,某公道席、某先生台鉴、母氏慈鉴、贤弟如晤,等。现将常见提称语列表如下:
足下 古代最初用为下对上的敬称,后来书信中多用于同辈之间。
膝下 旧时子女致父母的信,多以“父母亲大人膝下”起首。人幼时常依于父母膝旁,家书中用“膝下”,既表敬重,又示出对父母的亲爱、眷依之情。
垂鉴 赐鉴 钧鉴 尊鉴 台鉴 鉴,即古代镜子,有审察的意思。用作书信提称语,就是请阅看的客气说法。垂,含居高临下之义。赐,上给予下叫做赐。钩,古以钩陶喻国政,后称宦官多冠以钩宇。垂鉴、赐鉴、钧鉴,多用于对上、致年高德劭者的信中。尊鉴,可用于尊长,也可用乎辈。台鉴适用较广,“台”有“高”义,对熟识或不熟识的尊长、平辈,皆可使用。
勋鉴 道鉴 大鉴 英鉴 伟鉴 雅鉴 惠鉴 对身居高佼、有功勋业绩者,可用“勋鉴”。对道德君子、望重学者,可称“道鉴”。大、英、伟、雅,含高尚、美好、不凡、不俗的意义,宜用于友朋往来书信。“惠鉴”,就是赏阅的意思,但语意分量较“赐鉴”为轻,适用于一般书信,师长对已独立的后辈学子,也可用此客套。
慈鉴 爱鉴 双鉴 芳鉴 致母亲,可称“慈鉴”。夫妻,或情意亲密的男女之间,可用“爱鉴”。给友朋夫妇二人之信,可用“双鉴”。女子间往来书信,可用“芳鉴”。礼鉴 给居丧者信,用“礼鉴”。如,爱国之士李公扑遇害后,周恩来等致其夫人唁函即称“张曼筠女士礼鉴”。
公鉴 共鉴 同鉴 用于致团体或多人的信函,可于所列人名之后,书“诸先生共鉴”等。
道席 讲席 教席 撰席 著席 史席 席,席位。道席,多用为学生对师长的尊称。讲席、教席,也是对从事教育、讲学者的敬称,但用于平辈间,写信人与受信人不必有师生关系。撰席、著席、史席,都用作对文士的敬称,文人间也常互用。撰,即著述。史,指有著作传世垂史。
览阅知悉 一般用于长对幼、前辈对晚辈的称呼之后。
启辞 启辞,就是信文的开场白,或寒暄客套,或提示写信原委等。启辞理应属于信件正文的一部分,由于旧时尺牍中,这部分形成了一系列的套语,在现时书信中还常可以看到,所以将此单独提出,分两类举例以供参考:
(1)表示写信人以诚恳的态度,请受信人阅读信文。如:
敬禀者 写信人自称是恭敬地禀陈事情的人,表示下面是所要禀告的话,用于致父母尊长的信,如“母亲大人膝下,敬禀者”。
跪禀者 义同“敬禀者”,用于子孙对尊长。
即禀者 同上。
敬启者 写信者自谦为恭敬地陈述事情的人,表示请对方允许自己告诉下面所写的内容。既可用于同辈,也可用于下对上。
谨启者 谨,是谨慎、郑重的意思。用于同辈。
径启者 径,这里是直截了当的意思,一般公私书函通用。
拜启者 拜,表敬词。用于友朋往来书信。
敬呈者 与“谨呈者”,皆用于下对上的公私书函。
恳启者 用于平辈,表示下面信文将写求助于对方的内容。
兹启者 兹,这里,现在。兹启,意即今在此陈述。态度客观平和,不含明显敬意。
哀启者 向亲友报丧的书信用此。
复禀者 用于对尊亲或上级的回信复禀。对平辈可用“再启者”。
专启者 用于专谈某实事的书信。
(2)根据具体情况,或作寒暄客套,或提示写信原委等。如:
顷诵华笺,具悉一切。忽奉手教,获悉一是。奉诵钧谕,向往尤深。顷获大示,井所赐物。惠书奉悉,如见故人。幸承明教,茅塞顿开。披诵尺素,谨表葵私。
数获手书,至感厚爱。展读琅函,甚感盛意。接阅华简,幸叨莫逆。捧读德音,喜出望外。手教敬悉,词意深美,一启蓬心。正切驰思,顷奉华翰,快慰莫名。
顷得手示,欣悉康泰,至为宽慰。蒙惠书并赐大著,灿若河汉,拜服之至。迭接来示,因羁琐务,未及奉复,深以为歉。台函奉读多日,未即修复,万望海涵。
大札敬悉,稽复乞谅。欣奉惠书,敬聆喜讯,不胜忭贺。接读手书,知君抱恙欠安,甚为悬念。久慕鸿才,今冒昧致书,以求教诲。别来无恙 久不晤见,甚念贤劳。暌违日久,拳念殊殷。久疏通问,时在念中。一别经年,弥添怀思。日前曾奉一函,谅已
先尘左右。前此一函,想已达览。
其实,写信也是写文章,此类启辞套语,虽可采用,却不必拘泥,尽可以千变万化的。从这个意义上说,启辞套语也是可以省略的。比如,现在不少人写信,习惯于一开头即用“你(您)好”二字,似乎不如此,这封信就没法往下写似的。先向收信者问候致意,原是不错的,然而如果封封信都是如此格局,则未免呆板单调了。
常用语
正文
信的正文,即写信人对收信人说的话,这是书信的主体。正文从信笺的第二行开始写,前面空两字。如果启辞单独成行,正文可在启辞的下一行空两宇开始书写。书信的内容各不相同,写法上也无需一律,以表情达意准确为原则。一般说来,应先谈谈有关对方的事情,表示关切、重视或谢意、敬意,然后再谈自己的事情。正文写好后,如发现内容有遗漏,可补充写在结尾后面;或写在信右下方空白处,并在附言之前加上“另”、“又”等字样;或在附言的后面写上“又及”或“再启”字样。
结语
结语,即信文的结束语,理应属正文的一部分。但与“启辞”相仿,旧式书信中也形成了一系列常用结语套辞,现时各界文化人士的书简中,仍频见使用。这里不妨胪列若干,供参考。
书短意长,不一一细说。
恕不一一。不宣。不悉。
不具。不备。不赘。
书不尽意。不尽欲言。临颖不尽。
余客后叙。余容续陈。客后更谭。
请对方回信:
盼即赐复。翘企示复。伫候明教。时候教言。盼祷拔冗见告。万望不吝赐教。
敬祈不时指政(正)。敢请便示一二。尚祈便中见告。如何之处,恭候卓裁。至盼及时示下,以匡不逮,无任感祷。
告诉对方不用劳神回信:
谨此奉闻,勿烦惠答。敬申寸悃,勿劳赐复。
答复对方询问:
辱蒙垂询,略陈固陋,聊博一粲而已。远承下问,粗述鄙见,尚希进而教之。
上述陋见,难称雅意,亟祈谅宥。姑道一二,未必为是,仅供参考。不揣冒昧,匆此布臆,幸勿见笑。
请人应允:
所请之事,务祈垂许。以上请托,恳盼慨允。诸事费神,伏乞俯俞(允)。
表示关切:
伏惟珍摄。不胜祷企。海天在望,不尽依迟(依依思念)。善自保重,至所盼祷。节劳为盼。节哀顺变(用于唁函)。
表示感谢之情:
诸荷优通,再表谢忱。多劳费心,至纫公谊。高谊厚爱,铭感不已。
祝辞 祝辞,就是书信结尾时,对收信人表示祝愿、钦敬或勉慰的短语,如“即颂近安”、“此致敬礼”、“祝你进步”之类。其中,“即颂”、“此致”、“祝你”等词,紧接正文末尾书写;“近安”、“敬礼”、“进步”等词,另起一行,顶格书写。如果祝颂语的文字较多,也可独立占行,空两字写起,不必分拆成两部分。如果信笺下方余地充分,或者为了突出祝辞,也可将“祝”、“颁”、“此致”等宇样独占一行,空四格书写,而将“安”、“好”、“敬礼”等另行顶格书写。顶格书写的祝辞后一般不加标点符号。祝辞应根据具体情况恰当择用。
以下为常见祝辞:
书信内容主要是谈一件事的,可用:
专此,致 专此,祝 专此即请 专此布达,即颂 专此奉复,并祝(复信用)
一般书信,用于平辈、友朋之间:
即颂 即请 顺效 顺祝
或为:
此候 此请 顺致 顺颂 即候
或为:
祝颂请 问致候
对尊长,可选用:
恭叩 恭淆 恭颂 恭候 敬叩 敬祝 故请 敬颂
平辈间,为强调敬意,也可用:
恭颂 恭请 恭候
为强调郑重其事:
谨祝 谨贺
对晚辈:
此询 顺祝 即问 祝(你)愿(你)盼 望
对祖父,颂祝;
起居永福
对父母辈,颂祝:
金安 福安
对尊长:
康安 钧安 崇安 履福 颐安
对女长辈:
慈安 懿安 坤安 玉安
平辈友朋间,可按四时颂祝:
春社 暑安 秋棋 冬馁
逢年尾岁首,可贺:
新禧(元旦)春禧(春节)年禧 岁祺 节禧(节日通用)新年快乐新春愉快
常时可颂:
近祺 日祉 时吉 时绥 起居安吉 行止佳胜 工作顺利 台安 大安
当日可达之信,颂:
晨安 早安 午安 晚安 刻安
对女性可颂:
淑安 妆安 阃安
对未婚女子,颂:
闺安
对父母健在而承欢膝下的平辈,可颂:
侍安 侍祉
对晚辈后生,祝愿:
学业锐进 工作好 生活愉快 幸福 健康 进步 侍棋 课祉
祝收信人全家:
阔府康泰 全家幸福
祝收信人夫妇:
双安 俪安 俪祉
贺有喜庆事者,道:
喜安 庆祺
贺新婚者:
燕安 燕喜
贺生子者:
麟安
对家居者,颂:
潭安 潭祺 潭祉
对行旅者:
客安 行祺 旅 一帆风顺 旅居康乐
唁丧,请候:
礼安 孝履
问病,祝颂:
早日康复 痊安
对蒙遭意外不幸者,祝祷:
否极泰来
对知识界,可泛颂:
文安 道安 研安 文祺 雅祺
对编辑:
编祺 编安
对写作者:
著祺 撰安 笔健
对教师:
教祺 教安 诲安
对军界:
勋扯 戎安
对政界
政安 勋安 升安 公祺 钧祺 崇祺
对工商实业界:
筹祉 财安 吉利 赢祺 盈祺 发祺 运祉 事业昌隆 宏猷大展 行止佳顺 万事顺
遂 百事称心 诸事如意 盛利久发 财源茂盛 日进斗金
古时书信,颂祝语大都融贯在正文中,至近代才逐渐形成祝辞独立一栏。所以,书信正文中如已包含祝福内容,或者本身就是祝贺信函,那么视辞一项便可省去。还有,信一开头就称“你好”的,如果信末再写祝好之类,便显得累赘了,应注意避免。
署名 署名,就是在正文结尾的右下方签署写信人姓名。如果是写给熟识的亲属友人的,可只写名字,不必写姓;或在名字前面,加上自己的称呼,如:弟、侄、晚等。称呼与名字之间,可略空半字地位;或者将称呼用小字写在名字的左上方。
署名的后面,可加写启禀词,也可不加。常用启禀词如下:
对尊长:
叩 叩上 叩禀 敬禀
对平辈:
上 敬上 谨启 鞠启 顿首 亲笔 手肃
对晚辈:
字 示 白 谕 手白 手谕
在署名或启禀词后面,写上撰信的年月日,也可把日期写在下一行署名的右下方。另外,还可以在日期之后,写上撰信时的处所、氛围、心境等,如“舟中”、“灯下”、“万籁俱寂”之类。
附候或致意 如写信人的家属、近处朋友也和收信人熟悉,署名后一行或加上这些人的附候,如“某人嘱笔问候”。如应向收信人的家属、近邻亲友问候的,可加上“请向某某致意”,倘是长辈,可作“请在某某前四名问安”之类
我们都知道在科研论文中有两大类:一类是研究型论文;另一类是综述型论文。其中,前者主要是以研究为主的行文思路,根据研究发现的不同发表在不同级别的杂志上;而后者多是本身没有新的研究发现,主要是对前人的研究结果进行评价综述。然而,这两种分类都是针对以实验为主论文分类,那么这两年生信为主的文章发文量逐年增加,是否也有这样的分类呢?
Immugent今天就来解读特别的一类生信文章,姑且把它称为“生信综述”吧,因为我人微言轻,并不会我把它叫什么,以后都是这种叫法,就不绞尽脑汁想这个名字了。
这类“生信综述”文章已经有很多年的发展史了,主要都是围绕对各种火爆一时(引领科研)的重大技术来展开,比如近些年火热的单细胞测序技术。那么今天我就来以单细胞测序为主题,来解读一下如何利用此类思路发表高分文章,注意全都是一分钱没花的那种!
我先讲的第一篇是2021年发表在J Am Soc Nephrol(IF:10.12)的篇名为“How to Get Started with Single Cell RNA Sequencing Data Analysis”的文章。好吧,看了一下日历,今年已经2022年了,就不吐槽这个文章时效性的问题了。但全文真的很简单,就是介绍了一下单细胞测序数据分析的基本流程。
来看看它的摘要:在过去的5年里,单细胞方法已经能够在一个实验中监测数千个单个细胞的基因和蛋白质表达、遗传和表观遗传变化。随着测量方法的改进以及反应和测序成本的降低,这些数据集的大小正在迅速增加。关键的瓶颈仍然是对单细胞实验产生的丰富信息的分析。在这篇综述中,我们对分析管道进行了一个简化的概述,因为它们通常在该领域中使用。我们的目标是使研究人员开始单细胞分析,以获得挑战和最常用的分析工具的概述。此外,我们希望能够帮助其他人了解单细胞数据集的典型读数在已发表的文献中是如何呈现的。好吧,确实是一篇综述!
全文虽然有7副图,但大多都是那种最基础的绘图,想必大家都会。但是这里Immugent想说的是这篇文章虽然是综述类,但其实比真正的综述好写多了。类比这篇文章,等到下一次再出现类似于单细胞测序这种现象级技术,是不是有的小伙伴也整一篇类似的呢!
接下来要讲的第二篇是2020年发表在Comput Struct Biotechnol J (IF:7.27)的篇名为“Benchmarking algorithms for pathway activity transformation of single-cell RNA-seq data”的文章。这类文章就比上一类有些技术含量了,起码像综述的感觉了!
就像这篇是总结了对单细胞数据进行通路评分的各种算法,并使用已经发表的数据对各类算法的优缺点进行了比较,并在最后给出了自己的见解。嗯,怎么说呢!还是比一般的综述好写一点,比纯算法开发类文章好开发一些。那么如果这类算法在不久的将来出现了更多,那么是不是就科研考虑写一个更新版的呢?
接下来要讲的第三篇是2021年发表在Genome Biol(IF:13.58)的篇名为“Over 1000 tools reveal trends in the singlecell RNA-seq analysis landscape”的文章。这个文章作为汇总类综述,真的不是吹的了,一篇文章总结了1000+种分析单细胞数据的工具,我对这个作者也是膜拜之至。
并且作者还开发了一个网站: ,并这个网站收录的工具还会一直更新,这真是圈内的劳模啊。
这类文章虽然需要耗费一些时间,但思路还是很简洁的,但是主要是得掌握住时效性,而且最好是自己研究的领域,那样能提出自己的一些思考,就能给文章增色不少。
第四篇是2020年,同样发表在Genome Biol(IF:13.58)的篇名为“A benchmark of batch-effect correction methods for single-cell RNA sequencing data”的文章。作者对当时存在的14种对不同来源的单细胞数据进行去批次处理的算法进行比较,深入揭示它们之间的优缺点和功能表现。
全文的图做的都是很精美的,而且从数据处理的效果来看,这应该是一个大型生信实验室的作品。建议大家有时间都读一下这篇文章,将会有助于以后在处理不同来源的单细胞数据时选择最合适的算法。
放在最后一篇的文章当然是压轴出场了,那就是在2019年发表在Nat Biotechnol(IF:54.91)杂志上,篇名为“A comparison of single-cell trajectory inference methods”的文章。对来自数千个单细胞的全基因组组学数据进行轨迹分析,目前已有很多算法来推断这些细胞沿着发展轨迹的分布。基于这些结果,作者开发了一套指导方针,以帮助用户为他们的数据集选择最佳的方法。
事实上,虽然到目前已经开发了70多种推断单细胞轨迹的工具,但比较它们的性能是具有挑战性的,因为它们需要的输入和产生的输出模型差异很大。在这篇文章中,作者在110个真实数据集和229个合成数据集上对其中的45种方法进行了基准测试,以了解细胞排序、拓扑结构、可伸缩性和可用性。结果表明了现有的一些工具之间的互补性,方法的选择应该主要取决于数据集的维度和轨迹拓扑。
最后,作者还免费提供了多种单细胞数据轨迹分析的评估网站( ),这将有助于开发更多轨迹分析的工具,用于探索日益庞大和复杂的单细胞数据集。对于这篇文章,我不做过多评述,只想着大家有时间都要去读一下,其中无论是对数据的处理还是对结果的讨论上都是前面文章无法媲美的,是难得的优质文章。
如今科技发展日新月异,在21世纪做出有价值的科研成果往往缺的不是技术,而是对热点的灵敏嗅觉以及对时局的掌控。张泽民,汤富酬,郭国骥老师均是凭借单细胞测序技术跻身世界一流领域的科学家,就是因为他们把控住了时局。
同样的,上述几类“生信综述”的着力点均是当时迫切需要解决的单细胞测序技术热点问题,才得以不花费半毛钱发表一系列高分文章。而且,因为是热点科学问题,这些文章截止到目前的引用率都很高,后面肯定还会持续升高。如果说单细胞测序是一个制高点,倒不如说是起点,因为此类技术在未来还会有很多,希望本篇推文能给大家带来一些思考,欢迎有推荐类似生信文章的小伙伴通过后台与我们联系。
就有人问,生信的文章能发到多少分?如果你是像华科薛宇教授一样的大牛,弄一套算法,编一个生信分析工具,十几分妥妥的,引用量杠杠的。但是,那是大牛,一般来说,按「常规套路」出牌的这种生信分析文章分值在 0-2 分之间。但也有些不做实验的生信分析文章能发到个 4-5 分,那么生信分析的文章怎么样能达到一个比较高的层次呢?
这里,我们给大家分享两篇文章来说一说一些进阶的文章思路,一篇是发表在我们的老朋友「Oncotarget」上的,另一篇是发表在「Journal of Proteome Research」(IF = 4.1)上的。
先看 Oncotarget 这篇「Genomic expression differences between cutaneous cells from red hair color individuals and black hair color individuals based on bioinformatic analysis」,文章是做的黑色素瘤的两种不同表型的个体的差异基因的生信分析。
Abstract 里说到 MC1R 这个基因的突变会导致高患癌率的 RHC 表型两种不同的表型,其中 RHC 表型会增加皮肤癌的发生率,那么 MC1R 的突变究竟影响了哪些基因?文章通过 PPI 网络分析,分别对比分析两个不同表型(RHC 和 BHC)的正常皮肤细胞和癌细胞中的差异基因。结果表明,在癌细胞的对比中没有差异,而在正常皮肤细胞中筛选出 23 个 hub 基因,并且其中 8 个基因异常表达,这一结果提示这 8 个基因的异常表达可能是 RHC 表型患癌风险提高的重要原因。
这篇文章利用了 3 个数据包进行综合分析,从而得到了一个 novel 的结论,文章利用 GSE44805 中的差异基因构建 PPI 网络筛选 hub 基因,再利用别的数据包中的测序结果验证这些基因确实存在异常表达,多方验证说明自己生信分析结果是可靠的。虽然作者一点实验也没有做,但是从数据量还有可靠性上来说,可能比自己辛辛苦苦地做小样本量测序还要靠谱。
文章中的分析方法(差异基因以及 PPI 分析)都是我们非常熟悉的。筛选出差异基因,将上调和下调的基因分别构建 PPI 网络,得到文中的 4 张图(不管怎么说,这图的颜值比上一期套路中分析的文章要高得多)。
这张图的构建方法这里不再赘述
小结
这篇文章的方法完全是可以借鉴和复制的,难点在于找到足够多的具有相似性和可比性的数据结果,以及找到一个合适的切入点得到一个相对 novel 的结论。
下面看 Journal of Proteome Research 上的这篇文章「Weighted Protein Interaction Network Analysis of Frontotemporal Dementia」。
一看这流程图就觉得这文章是生信专业的人做的文章。(本宫上学的时候,就觉得我们生命学院的学生都是码农,生物信息专业、生物医疗工程、生物科学这些专业的人天天都在编代码,完全感受不出生物专业的气息。)
这文章讲得啥咧,就是先选出 13 个种子基因,然后根据 PPI 数据库中蛋白质互作关系构建这 13 个种子基因的第一层网络结构。
再以第一层网络为种子构建第二层网络结构(然后电脑就死机了)。
然后分析第二层网络的拓扑学结构,从中筛选出 hub 基因(图中绿点表示最初的 13 个种子基因,蓝点表示第一层的基因)。在构建过程中,随着基因数量的不断增加,最先选出的 13 个种子基因未必就是后来的 hub 基因。文中还设置了对照组,并详细讲述了这 13 个种子基因的筛选方法。因为整个分析过程都是建立在生信分析的基础上,属于完全架空的,所以整个研究过程十分讲究逻辑上的严谨性。
小结
之所向大家介绍这篇文章,是觉得这种思路在生信分析的文章中可以借鉴,种子基因的选择可以通过临床上疾病中基因突变的概率来进行筛选,然后构建两层 PPI 网络,进行 GO,KEGG 分析,从而预测新的未知的疾病相关基因,如果后续能从别的数据包中得到表达量的验证或者是自己在临床样本中进行验证,那么整个文章的内容将会更加丰富。
局限性:PPI 数据库中其实很多蛋白质互作结果是没有意义的,因为在实际生物体中很多蛋白质互作情况是不可能发生的,只有在实验人为干预情况下才会发生。