基本信息
文件名称:第12讲 包系统课件.ppt
文件大小:1.27 MB
总页数:35 页
更新时间:2025-06-19
总字数:约4.62千字
文档摘要

第十二讲Bioconductor

一系列的包系统,用来处理生物方面的数据;1、Bioconductor是一个开源和开放式软件开发项目。

2、该项目起始于2001年秋季,核心成员是哈佛医学院/哈佛公共卫生学院的DanaFarber癌症研究所生物统计组。

3、Bioconductor软件包

DNA微阵列数据的处理、分析、注释及可视化;

通用分析工具(被广泛用于基因组数据库的分析,如分析基因组序列、SNP数据、SAGE数据、蛋白质组数据等。)

;主页;安装Bioconductor软件包;2、安装特定的xxxx包

source(“”)连到包的数据库中

biocLite(“xxxx”)#biocLite(“affy”)微阵列预处理

3、菜单栏-程序包

设定CRAN镜像

选择软件库

安装程序包

;4、从本地zip文件安装程序包

();第12讲包系统;数据库访问(databaseinteraction)

Rdbi;RdbiPgSQL;SAGElyzer

图形及用户接口(graphicsuserinterface)

widgetTools;tkWidgets;geneplotter;hexbin;limmaGUI;affylmGUI;webbioc

图结构(garphs)

Graphs;RBGL;Rgraphviz;SNAData

通用工具(generaltools)

reposTools;Biobase;Biostrings;DynDoc;Ruuid;ctc;convert;Icense;exprExternal;externalVector

注释(annotation)

Annotate;AnnaBuilder;Resourcer;SNPtools;Datapackages

基因本体学(ontologies)

goTools;ontoTools;GOstats

微阵列数据预处理(pre-processing)

affy;affycomp;affypdnm;affyPLM;gcrma;makecdfenv;annaffy;marray;matchprobes;vsn

数据分析(analysis)

daMA;edd;factDesign;genefilter;globaltest;gpls;multtest;pamr;MeasurementError.cor;Limma;ROC;Siggenes;Splicegear;RMAGEML

微阵列比较基因组杂交(arrayCGH)

aCGH;DNAcopy

蛋白质组学(proteomics)

PROcess;Gpls;apComplex;下载包affy,并查看其功能;

1、高密度寡核苷酸阵列

每个微阵列产生一个探针水平数据集,一些探针检测特异的全匹配寡核苷酸(PM),另一些检测非特异的失匹配寡核苷酸(MM)。

2、cDNA微阵列

每个微阵列产生两个探针水平数据集(红色和绿色通道);高密度寡核苷酸阵列;cDNA微阵列;一次微阵列试验能获得细胞在某种条件下的全基因组表达数据,包含成千上万个基因在细胞中的相对或绝对丰度。不同条件(细胞周期的不同阶段、药物作用的不同时间、不同肿瘤类型、不同病人等)下的基因表达数据构成一个GXN的数据矩阵M,其中G??表基因的数目,N代表条件的个数,通常情况下GN。矩阵M的每个元素xij表示第i个基因在第j个条件下的表达水平值。;AnalysisofMicroarrays;三、高密度寡核苷酸阵列的预处理;预处理概述;1.2任务

图像分析、数据导入、背景校正、归一化、汇总、特定探针校正

①图像分析(imageanalysis)

将扫描图像中的像素强度转换成探针水平数据(probe-leveldata)。

②数据导入(dataimport)

因为数据以不同的格式输入,需要有灵活的数据导入方法,数据常位于不同的文件或数据库表中。;③背景校正(backgroundadjustment)

被检测的探针强度取决于非特异性杂交和光学检测系统的噪声,通过对观察强度的校正来给出特异杂交的精确检测。

④归一化(normalization)

对不同来源的不同杂交阵列进行比较(逆转录、加标记、杂交反应的不同效果、阵列的物理问题、反应物批量效应和实验环境),校正系统阵列间的差异。;⑤汇总(summarization)

有些平台,转录物由多重探针表示。对于每个基因,校正后的背景和归一化的强度需要汇总成一个总数,估计RNA转录物数量比例。

⑥特定探针校正(