三维时空组学Cell、Nature、Science论文数据分析汇总

时空组学技术的出现,能够准确反映细胞的空间排布和RNA的原位表达,帮助科研人员从时间和空间维度上认知每个基因、每个细胞,有望带来生命科学领域的第三次科技革命,成为重新认知器官结构、生命发育、物种演化和定义疾病的底层工具。
对于时空组学技术生产的原始数据,需结合算法工具进行处理、分析,进而找到在空间分布上具有意义的细胞和基因表达。
2024年11月4日,中国科学院动物研究所刘光慧团队等在 Cell 期刊发表了题为:Spatial Transcriptomic Landscape Unveils Immunoglobin-associated Senescence as a Hallmark of Aging 的论文
该研究利用时空组学技术,构建了全球首个多器官衰老时空图谱(Gerontological Geography),揭示了组织结构失序和细胞身份丢失是多器官衰老的普遍特征。该研究不仅精确定位了多个器官中衰老的核心区域,还发现了免疫球蛋白积累是衰老的一个关键特征和驱动因素。这一发现加深了我们对衰老生物学机制的理解,找到了可用于衰老预警和评估的新型生物学标志物,并为进一步探索衰老的干预策略奠定了理论基础。
图片
2024年11月21日,瑞典卡罗林斯卡医学院的研究人员在 Science 期刊发表了题为:Whole-brain spatialtranscriptional analysis at cellular resolution 的研究论文。
该研究开发了一种有效的组织清除方法,用于全脑空间三维(3D)RNA成像。TRISCO解决了几个关键问题,包括保持RNA的完整性、实现均匀的RNA标记和提高组织透明度,它能捕获全面的转录本阵列,从而揭示整个大脑的转录景观。TRISCO有望成为单细胞、全脑三维成像的强大工具,可对整个大脑进行全面的转录空间分析。
图片
2024年10月30日,华盛顿大学医学院丁莉团队在 Nature 期刊发表了题为:Tumour evolution and microenvironment interactions in 2D and 3D space 的研究论文。
该研究通过整合来自16个样本的48个连续ST切片,成功重建了3D肿瘤结构,为我们带来了对肿瘤空间组织和异质性的深刻洞察。在研究过程中,团队运用无监督深度学习算法,结合ST和CODEX数据,发现了3D亚克隆周围的免疫热邻域和冷邻域,进一步加强了对免疫耗竭标志物的认识。这些结果不仅揭示了肿瘤在2D和3D空间中与局部微环境的复杂相互作用,更为我们带来了对空间肿瘤进化的新理解,为肿瘤生物学领域带来了宝贵的启示。

图片



CNS文章时空数据分析 



第一节:Python编程语言入门

1.Spyder和Anaconda安装

2.环境配置;基本语法、数据类型等

3.Python控制流与函数(条件语句、循环语句、函数定义、返回值)

第二节:Python数据结构进阶

1.列表、元组、字典、集合高级用法

2.Python常用的包(numpy、pandas、matplotlib等)

3.了解Shell,基础命令学习(文件操作、权限管理)

第三节:空间转录组在CNS文章应用

1.空间转录组CNS文章思路解析

2.空间转录组技术在科研领域的应用

3.空间转录组技术在不同科学等领域的研究内容及思路及常见图形解读

第四节:以Nature Genetics文章源代码为例,系统学习squidpy和scanpy的系统分析

1.常规空间转录组数据读取

2.数据质控--scrublet去除双细胞

3.归一化处理、PCA降维、聚类、UMAP
图片

第五节:反卷积算法--空间注释-【Science】源代码

1.CCA锚定算法--【Nature】源代码

2.非负矩阵分解和非负最小二乘 

3.深度学习框架--Tangram

第六节:Cell2location采用贝叶斯层次框架--整合单细胞和空转数据--【Cell】源代码

1.计算单细胞细胞类型的表达特征

2.训练模型--【Sci Transl Med】源代码

第七节:Hotspot识别空间数据集中信息基因(和基因模块)探索空间组织微环境【Nat Genet】

     1.计算 KNN 图--【Nat Genet】源代码

     2.查找信息基因,将基因分组到模块

3.评估成对基因关联

4.其他文章解读--【Nat Med】源代码

第八节:Banksy--深入地理解细胞间的相互作用和组织构造【Science】

1.空转数据分析之生态位聚类算法Banksy

2.空间转录组学数据中细胞邻居依赖性基因表达的新方法【Neuron】

3.根据微环境对细胞进行分类,CellNeighborEX 使用直接细胞定位

第九节:表达增强:BayesSpace--利用空间转录组数据中的邻域结构来增加子点级别分辨率的计算方法【Nat Commun】

1.TESLA--利用神经网络CNN算法提高空间转录组的分辨率【Cell】

2.分辨率增强的聚类可以识别重要的生物结构

图片

第十节:Giotto|| 空间表达数据分析工具箱【Mol Cell】

1.PAGE--单细胞数据注释空转的spot

2.spatital patterns 提取连续的空间表达模式分析【Nature】

3.cell neighborhood 空间和配受体表达计算细胞空间相互作用

第十一节:空间转录组数据三大矩阵分析(重点讲解niche矩阵)

1.基因表达矩阵【Nature Metab】

2..细胞类型矩阵【Nature Aging】

3.细胞生态位矩阵【Cancer Cell】

第十二节:空间分子生态位差异分析---Niche-DE以【Cancer Cell】源代码

1.空转数据中的生态位差异基因表达分析

2.可识别上下文依赖性细胞间相互作用

3.Effective Niche Calculation

第十三节:空间基因模式  系统学习三类识别空间高变基因的方法--【Nat Methods】

1.基于Python的SpatialDE

2.基于R语言的trendsceek 【Nature】

3.SPARK-X--广义线性空间模型

图片

第十四节:空间转录组的轨迹分析--【Cancer Cell】源代码

1.stlearn:基于全组织SME均一化的PAGA轨迹分析【Immunity】

2.SPATA:空间背景下不同表达的基因和基因集轨迹变化【Cell】

3.CytoTRACE进行发育起点推断

第十五节:MISTy--空间细胞共定位

1.MISTy不仅可以做细胞-细胞之间的dependency【Nat Med】

2.基因和基因之间、细胞和通路之间的dependency【Immunity】

第十六节:COMMOT--细胞间通讯

1.利用最优运输进行空间转录组细胞间通讯分析【Cell】

2.推断的信号传导与已知下游基因活性相关性【Nat Genet】

第十七节:空间转录组速率分析--SIRV以【Nat Med】源代码

1.单细胞分辨率推断空间 RNA 速度

2.空间转换张量方法重建空间数据中的细胞吸引子【Cell】

第十八节:空间细胞网络构建--cell degree以Cell源代码讲解

1.构建空间近邻网络【Nat Commun】

2.在空间领域展示细胞网络【Cell】

图片

第十九节:肿瘤克隆空间演化--空间肿瘤细胞CNV--【Nature】

1. siCNV 分析并构建了克隆进化树

2.空间克隆分布与 Gleason 分级相关性

3.CopyKAT肿瘤推断个性化展示【JCI】

第二十节:空间区域组织模块发现以【Nat Med】源代码

1.深度学习框架的人工智能算法 SPACE

2.能够从空间转录组数据中识别空间细胞类型和发现组织模块

第二十一节:细胞互作分析 -- NicheNet、CellChat

1.CellChat各种图形可视化【Cell】

2.NicheNet分析配体对下游基因调控

3.cellphoneDB多形式可视化

图片

第二十二节:MIA---多模态数据取交集方法进行单细胞和空间转录组联合分析

1.针对Spot Cluster 水平上利用单细胞注释信息来对ST-Spot聚类结果进行细胞类型注释。【Nature Metab】
第二十三节:空转数据可视化semla以【Nature】源代码

第二十四节:利用pyVIPER算法来定量单细胞蛋白的活性【Cell】

1.检查谱系特异性基因调控网络

2.基因表达特征转换为蛋白质活性矩阵

3.在蛋白质活性水平上分析单细胞

第二十五节:GeneTrajectory算法的单细胞基因轨迹推断【Science】

1.构建一个细胞到细胞的 kNN 图

2.计算基因分布之间基于成对图的 Wasserstein 距离

3.基因-基因 Wasserstein 距离矩阵,确定基因沿每个基因轨迹的顺序

第二十六节:系统学习pySCENIC转录调控网络,网络特异性评分,转录调控网络和轨迹联合分析【Cell Stem Cell】

1.以Cell文章系统讲解pySCENIC源代码

2.以Nat Med多形式可视化调控单元

图片

第二十七节:Visium HD空转数据在R和Python中的运行【Science】源代码

1.Python的scanpy分析Visium HD数据

2.R语言的Seurat分析Visium HD数据

第二十八节:实践课一(课程总结,带领学员使用自测数据完成整体分析流程)

1.实战答疑

2.课程大总结


01

数据分析普及计划(第一批)

生命科学基础研究的范式正在经历从“假设驱动”向“数据驱动”的重大转变。传统的假设驱动研究依赖于预设的已知信息,容易导致认知偏差,限制了对生物系统的全面理解。而数据驱动的研究方法则不预设影响变量,能够揭示更加全面的生物学现象。然而,海量数据对科学家的人力处理能力提出了极高的要求。

为了提高科研工作者对数据的处理能力通过分析复杂数据,辅助研究者发现隐藏的生物学特征,从而将其转变为可以被认知的研究数据,为研究人员提供了全新维度的科研发现的可能性,加速了科学发现的进程。为此,我们举办了生命科学数据分析技能普及计划。

技能普及目标

1.带领生命科学领域的科研工作者从零基础学会代码编程,能够个性化分析多组学数据

2.系统学习多组学分析包括机器学习(临床预后模型)、转录组(RNAseq)、单细胞测序、表观遗传(Chipseq、ATACseq)、时空测序,一次学到位
3.将CNS文章数据分析内容全部学懂理解)、学会(会敲代码分析)、学透彻(课题顶层设计和思路挖掘)、学以致用(用到标书申请和文章发表中)
4.掌握生命科学领域多组学分析,在大数据分析技术的加持下做出更有价值的科研成果!

►►►

技能普及计划质量保证

1.从19年开始到现在,我们在生信教育领域深耕五年之久时间是最好的证明

图片

2.一对一指导、包教包会是我们开培训班五年来一贯的宗旨。我们敢承诺包教会的底气是来自多年的讲课经验和认真负责的态度。课程结束,答疑不结束!

3.五年来华哥培训班的学员发表Cell、Nature、Science主刊文章7篇,子刊及一区文章累计超过90篇!部分学员成果展示如下:

图片

►►►

数据分析技能普及计划特色

1.一个月时间掌握基本的CNS文章数据分析
2.排除价格顾虑!参加普及计划的费用为3880
3.授课方式采用线上线下相结合,同步进行。线上腾讯会议直播课互动答疑线下在南京,现场教学更踏实
图片

4.深入剖析二十篇CNS文章分析思路和分析方法,按照CNS文章源代码讲解,以文章的fig为例进行代码演示和复现学习,个性化分析。

►►►

普及内容

第一节:编程基础学习--R语言 

1.R和Rstudio的安装、环境配置

2.R语言简单语法及常见命令

3.以Cell文章方法描述学习R包的安装及使用

4.以Nature文章源代码学习重点函数基础代码

第二节:编程基础知识---数据结构

1.向量、矩阵、数据框和列表的创建和索引

2.多种数据结构的合并【Cell】

3.自定义Function函数构建

4.for循环、字符型数据的处理【Cell】

第三节:以Nature文章源代码学习转录组数据表达矩阵处理基本处理

1.重复基因和缺失值的删除

2.不同分组样本的批量归类【Nature】

3.多个样本的表达矩阵合并

4.芯片探针基因名字的转换【Nature】
图片

第四节:以Cell文章源代码学习生存曲线

1.临床预后信息的批量整理

2.创建生存对象、拟合曲线【Cell】

3.特定基因的筛选构建预后分组

4.combat算法不同数据集的批次处理

第五节:差异分析 RNAseq数据分析

1.芯片数据上游分析【Cancer Discovery】

2.多个样本的数据归一化处理

3.分组矩阵系统讲解【Nature】

4.Deseq2分析流程【Science】

5.EdgeR差异分析系统讲解
图片

第六节:以多篇CNS文章源代码学习画图

1.ggplot体系画图包括热图 

2.火山图 箱线图 小提琴图【Nature】

3.多分组显著性p值添加方法【Nat Med】

4.三维pca图展示差异特征【Science】

5.层次聚类算法区分不同样本特征

第七节:基因集富集分析 

1.over representation

2.GSEA 富集 【Cancer Cell】

3.包括自定义基因集的富集分析

4.富集通路网络图【Nat Genet】

5.蛋白互作网络构建【Nature】
图片

第八节:以Nature文章为例系统讲解单细胞转录组基本分析

1.单细胞在CNS文章思路解析及常见图形解读

2.数据质控、数据放缩、PCA降维、聚类

3.三维tSNE、UMAP可视化【Science】

4.单细胞多组学分析思路和方法【Nature】

第九节 :单细胞转录组拟时序分析

1.monocle拟时序分析 【Nature】

2.细胞排序,构造一棵生成树

3.基因随轨迹分析变化热图【Cell】

4.BEAM轨迹分支分析【Nature】

5.自测和挖掘单细胞项目思路归纳总结

图片

第十节:空间转录组理论及分析内容

1.空间转录组技术发展历程和原理介绍

2.空间转录组CNS文章思路解析及常见图解读

3.10x Visium 基本分析流程【Cancer Cell】

4.空间数据与单细胞整合分析思路

第十一节课:高分辨空间转录组分析

1.Xenium 空转数据分析【Nature】

2.Visium HD空转数据分析【Cell】

3.Stereo-seq “亚细胞级分辨率”测序介绍

4.空间测序多截面3D邻域重建【Nature】

图片

第十二节课:机器学习基础理论

1.随机森林和支持向量机(SVM)

2.弹性网络回归算法Enet【Cell】

3.广义提升回归模型(GBM)

第十三节课:表观遗传研究

1.ChIP-seq、ATAC-seq在CNS文章中应用

2.ChIP-seq数据分析峰值可视化【Nature】

3.ATAC-seq数据peak注释【Cancer Cell】

4.峰值在外显子、内含子、启动子的分布计算
图片

第十四节:加权基因共表达网络分析 (WGCNA)算法系统讲解以Nature文章为例 

1.构建邻接矩阵和拓扑重叠矩阵

2.无尺度网络模型【Nature】

3.共表达调控网络【Cell】

第十五节:免疫浸润计算

1.CIBERSORT反卷积算法,以TCGA数据为例

2.非监督共识聚类算法【Science】

3.转录因子富集【Cell Stem Cell】

4.Mfuzz、 BioNet调控网络构建
图片

第十六节:大数据分析在基金申请中应用

第十七节:实践课(课程总结,带领学员使用自测数据完成整体分析流程

主讲老师


主讲老师华哥:中山大学博士,师从加州大学终身教授,一直钻研于单细胞多组学数据分析和机器学习算法研究,发表过多篇CNS子刊,参与过多项国自然重点、国家重大专项、孔雀计划等项目申报,在国内多家著名医院担任国自然标书指导老师,与多位院士团队和国外Top实验室合作,指导过多篇CNS文章生信分析。


技能普及计划安排

会议时间:
12月8日开始第一节课一个月时间彻底掌握CNS文章基本数据分析

周六下午2:30--5:30、周日上午9:00--12:00、

周日晚上7:00--9:00  

每周三节课,每节课三小时(时间全部在六日,不耽误工作日正常上班
授课方式线上线下结合,同步进行

线上:腾讯会议线上直播

线下:在南京举办线下(南京市江宁区融汇时代中心)
人数限制
为了保证技能普及计划质量和一对一指导服务,每一批只招五十人!
主办单位
华哥科研平台
承办单位
广州百奥信息科技有限公司
广州华哥信息科技有限公司
会议费用:

每人:¥3880元可开会务费 、培训费、数据分析费、测试费、测序技术服务费等发票

汇款账号
A:对公汇款:
户     名:广州华哥信息科技有限公司
开 户 行:工行广州华南支行  
B:信用卡或公务卡支付
招生老师联系方式

同期举办:单细胞多组学班和空间转录组班连报优惠待议优惠价格联系招生老师

图片