首页医学论文 机器学习医学论文解读

机器学习医学论文解读

机器学习医学论文机器学习医学论文解读医学论文机器学习

云里雨里大太阳 2023-12-09 04:11:09

共2条回答177浏览

陈达文文

1小时前发布
- 来了来了，TA又来了！每天播报最新新闻的深空小编又来了！小编整理了半天，给大家带来了这篇文章。在医疗保健中一些最重要，最困难的对话是在严重且危及生命的疾病中发生的对话。对于在最脆弱点与人打交道且可能无法完全理解未来的医生和护士，在这些情况下讨论治疗方案和预后是一个微妙的平衡。现在，佛蒙特大学佛蒙特大学对话实验室的研究人员已经使用机器学习和自然语言处理来更好地理解这些对话的模样，最终可以帮助医疗保健提供者改善生命周期的交流。领导这项研究的UVM的拉纳医学院的实验室主任罗伯特格拉姆林说：我们想理解这种称为对话的复杂事物。该论文于12月9日发表在《患者教育与咨询》杂志上。我们的主要目标是扩大对话的规模，以便我们可以重新设计医疗保健系统以更好地沟通。Gramling和他的同事们想了解人们关于严重疾病的对话类型，以识别他们具有的共同特征并确定他们是否遵循共同的故事情节。为此，他们借用了小说研究中使用的技术，其中机器学习算法分析小说手稿的语言以识别不同类型的故事。Gramling的团队采用了这种方法来分析姑息治疗传播研究计划收集的354次姑息治疗谈话记录，涉及纽约和加利福尼亚的231名患者。他们将每个对话分为10个部分，每个部分中的单词数相等，并检查了表示时间，疾病术语，情感以及表示可能性和期望度的单词在每个十分位数之间的变化频率和分布情况。我们收到了一些强烈的信号，格拉姆林说。谈话往往从谈论过去到谈论未来，以及从悲伤到快乐的进步。有相当多的范围内，他们从很伤心去了很高兴， Gramling说。讨论也从谈话开始时谈论症状发展到中间的治疗方案和最后的预后。随着会话的进行，情态动词的使用的使用也有所增加。最后，评估胜于描述， Gramling说。Gramling说，多次对话中一致的结果表明人们从医疗保健中的故事中获得了多少意义。他说：我们发现，叙事在医学中的重要性。Gramling说，这项工作的更多实际应用还差得远。目前，他的团队专注于使用它作为一种工具来识别医疗保健中可能发生的不同类型的对话。他说：我认为，这将成为我们潜在的重要研究工具，使我们开始增进对已有对话分类法的理解，以便我们可以开始学习如何改进每种类型的对话。这些知识最终可以帮助医疗保健从业者了解是什么使关于姑息治疗的良好对话以及不同类型的对话可能需要不同的应对方式。这可以帮助创建与对话表明患者最需要的干预措施相匹配的干预措施。欲要知晓更多《机器学习可以帮助我们理解关于死亡的对话》的更多资讯，请持续关注深空的科技资讯栏目，深空小编将持续为您更新更多的科技资讯。王者之心2点击试玩
245 评论
2012骏马飞驰

9小时前发布
- 随着高通量组学平台的发展，生物医学研究大多采取了多组学技术结合的方法，不同组学来源（如遗传学、蛋白质组学和代谢组学）的数据可以通过基于机器学习（Machine Learning，ML）的预测算法进行整合，以揭示系统生物学的复杂工作。 ML提供了整合和分析各种组学数据的新技术，从而发现新的生物标记物。来自英国的研究人员在《 Biotechnology Advances 》发表综述文章，探讨了多组学的数据整合机器学习方法及其应用（被用来深入了解正常生理功能和疾病存在时的生物系统），为计划在多组学研究中使用ML方法的跨学科专业人士提供见解和建议。此篇综述关注ML中的两种主要学习策略，即有监督和无监督，这两种策略通常在多组学整合的背景下使用。基于串联的整合方法考虑使用联合数据矩阵来开发模型，该联合数据矩阵是通过组合多组学数据集形成的。如上图基于串联的整合方法的一般流程为：阶段1包括来自单独组学（例如基因组学、蛋白质组学和代谢组学）的原始数据以及相应的表型信息。通常基于串联的整合不需要任何预处理，因此没有阶段2。在第3阶段，将来自各个组学的数据连接起来，形成多组学数据的单个大型矩阵。最后，在第4阶段，联合矩阵用于监督或非监督分析。使用基于串联的方法的主要优点是，一旦完成所有单个组学的串联，就可以简单地使用ML分析连续或分类数据。这些方法平等地使用所有连接的特征，并且可以为给定表型选择最具辨别力的特征。不同的基于串联的监督学习方法已被用于表型预测。串联的多组学数据（以联合矩阵的形式）作为不同经典ML方法的输入，如DT（decision tree）、NB（naive Bayes）、ANN（artificial neural networks）、SVM（support vector machine）、KNN（k-nearest neighbors）、RF（random forest）和k-Star。例如，多组学特征（包括基因表达、拷贝数变异和突变）的联合矩阵与经典RF和SVM一起用于预测抗癌药物反应。同样，多变量的LASSO模型也被研究过。此外，Boosted trees和SVR（support vector regression）也被用于寻找血糖健康的纵向预测因素。除了经典的ML算法外，深度神经网络也被广泛用于分析串联的多组分数据。各种基于串联的无监督方法已用于聚类和关联分析。近年来基于矩阵分解的方法已经发展起来，联合NMF（non-negative matrix factorisation）被提出来整合具有非负值的多组学数据。iCluster框架使用了类似于NMF的原理，但允许集成具有负值的数据集。iCluster+框架提供了对iCluster框架的重大改进，iCluster+ 框架可以以发现模式并结合一系列具有二元、分类和连续值的组学，并通过结合来自结肠直肠癌数据集的基因组数据得到证明。NMF的另一个适应性被评估为JIVE（Joint and Individual Variation Explained），它捕获了集成数据类型之间的联合变化和每种数据类型的结构变化以及残余噪声。MoCluster使用多区块多变量分析来突出不同输入组学数据的模式，然后找到其中的联合聚类。MoCluster通过整合蛋白质组学和转录组学数据进行验证，与Cluster和iCluster+相比，MoCluster显示出明显更高的聚类精度和更低的计算成本。LRAcluster被开发用于整合高维多组学数据。此外，还有最近提出的iClusterBayes，一种完全贝叶斯潜变量模型。它克服了iCluster+在统计推断和计算速度方面的局限性。基于模型的整合方法为不同的组学数据创建多个中间模型，然后从各种中间模型构建最终模型。如上图基于模型的整合方法的一般流程为：第1阶段建立单独组的原始数据以及相应的表型信息。在第2阶段，为每个组学开发单独的模型，这些模型随后在第3阶段集成到联合模型中。在第4阶段中，对关节模型进行分析。基于模型的集成方法的主要优点是，它们可以用于合并基于不同组学类型的模型，其中每个模型是从具有相同疾病信息的不同患者组开发的。基于模型的监督学习方法包括用于开发模型的各种框架，如多数投票算法（majority-based voting）、分层分类器（hierarchical classifiers）、基于集成的方法如XGBoost 和KNN。基于模型的监督学习也采用了深度学习方法，例如MOLI、DFNForest框架、Chaudhary等。ATHENA（Analysis Tool for Heritable and Environmental Network Associations）被开发用于分析多组学数据，其使用grammatical evolution neural networks以及Biofilter和Random Jungl来研究不同的分类和定量变量，并开发预测模型。最近，还开发了用于泛癌分析的MOSAE。目前已经实现了各种基于模型的无监督学习方法。 PSDF (Patient-Specific Data Fusion)是一种非参数贝叶斯模型，通过结合基因表达和拷贝数变异数据对预测癌症亚型进行聚类。类似地，CONEXIC还使用BN整合肿瘤样本的基因表达和拷贝数变化，以识别驱动突变。另一方面，诸如 FCA（(Formal Concept Analysis）共识聚类、MDI（Multiple Dataset Integration）、PINS（Perturbation clustering for data integration and disease subtyping）、PINS+ 和 BCC（Bayesian consensus clustering）等聚类方法更加灵活，允许后期的聚类整合。不同的基于网络的方法也可用于关联分析，例如Lemon Tree和SNF(Similarity Network Fusion)等。基于转换的整合方法首先将每个组学数据集转换为图形或核矩阵，然后在构建模型之前将所有数据集合并为一个。如上图基于转换的整合方法的一般流程为：第1阶段建立单独组的原始数据以及相应的表型信息。在第2阶段，为每个组学开发单独的转换（以图形或内核关系的形式），这些转换随后在第3阶段集成到联合转换中。最后，在第4阶段对其进行分析。基于转换的整合方法的主要优点是，如果唯一信息（例如患者 ID）可用，它们可用于组合广泛的组学研究。之前提出的基于转换的监督学习方法大多数是基于内核和基于图的算法，其中基于内核的算法有SDP-SVM (Semi-Definite Programming SVM)、FSMKL (Multiple Kernel Learning with Feature Selection)、RVM (Relevance Vector Machine)和Ada-boost RVM等。此外，fMKL-DR (fast multiple kernel learning for dimensionality reduction)已与SVM一起用于基因表达、miRNA表达和DNA甲基化数据。基于图的算法有SSL(semi-supervised learning )、graph sharpening、composite network和BN等。总体而言，从文献中可以明显看出，基于内核的算法比基于图的方法具有更好的性能。最近，引入了MORONET(Multi-Omics gRaph cOnvolutional NETworks) ，它利用组学特征和患者之间的关联使用图卷积网络来获得更好的分类结果。基于转换的无监督方法，例如rMKL LPP(regularised multiple kernel learning for Locality Preserving Projections)被用于聚类分析。类似地，PAMOGK也是利用图核、SmSPK(smoothed shortest path graph kernel)将多组学数据与通路整合起来。Meta-SVM (Meta-analytic SVM)整合了多种组学数据，能够检测与乳腺癌和特发性肺纤维化等疾病相关的一致基因。最近，NEMO(NEighborhood based Multi-Omics clustering)被引入，使用基于患者间相似性矩阵的距离度量来单独评估输入组学数据集。然后将这些组学矩阵组合成一个矩阵，使用基于光谱的聚类进行分析。高通量组学的可用性提供了一个独特的机会来探索不同组学和表型目标之间的复杂关系。研究团队总结了已发表的基于表型目标的不同多组学研究，发现大多数多组学研究集中于不同形式的癌症。特别是与乳腺癌和卵巢癌相关的多组学研究突出了科学界在这些领域的研究重点。许多组学内部研究已经成功地探索了基因表达和DNA甲基化的整合。LASSO的方法已分别应用于急性髓系白血病和乳腺癌，也被用于癌症预后。同样，分别使用Neural Fuzzy Network对结直肠癌、SVM对胰腺癌和RF对心脏组织老化和卵巢癌进行mRNA–miRNA整合研究。SVM还通过整合不同的转录组学（即mRNA、miRNA和IncRNA），用于口腔鳞状细胞癌的研究。代谢组学和蛋白质组学已使用RF进行整合，用于分析前列腺癌和甲状腺功能。同样，代谢组学与mRNA相结合，用于研究溃疡性结肠炎和癌症存活率。另一方面，糖组学和表观基因组学仅在多组学环境中出现过一次（连同mRNA和代谢组学），相关研究使用RF的图形变体研究与年龄相关的合并症。最近，代谢组学和蛋白质组学也与脂质组学相结合，使用PLS-DA和Extra Trees来评估COVID-19患者。在植物（马铃薯）和动物（如犬心脏病）中也成功地进行了多组学研究。总的来说，最近不同的多组学研究强调了整合方法在理解不同疾病的复杂性和从大量生成的多组学数据中发现潜在异常方面的优势。 *文献原文中表8汇总了已发表的基于表型目标的不同多组学研究，可通过文献原文获取详细信息。为了便于方法选择过程，研究人员提出了推荐流程图，显示了为给定场景选择适当方法（或方法系列）所需的各种决策步骤。例如，要选择一种方法来整合两个组学进行无监督学习，如果两个组学是基因表达和CNV，则可以选择基于模型的方法，如“PSDF或Lemon-Tree”，否则可以使用“MDI或SNF”。类似地，“NEMO”可用于数据集部分重叠的场景，并且需要转换方法。因此，它可以用于生物医学分析，包括诊断、预后和生物标志物识别，将其作为有监督或无监督的学习问题。首发公号：国家基因库大数据平台参考文献Reel P S, Reel S, Pearson E, et al. Using machine learning approaches for multi-omics data analysis: A review[J]. Biotechnology Advances, 2021: 107739.
286 评论

相关问题

热门问题