湖北組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)售后分析

來(lái)源: 發(fā)布時(shí)間:2021-10-22

    Adonis(置換多元方差分析,分析不同分組或環(huán)境因子對(duì)樣品差異的解釋度):ADONIS置換多元方差分析(Permutationalmultivariateanalysisofvariance,PERMANOVA),又稱(chēng)非參數(shù)多因素方差分析(nonparametricmultivariateanalysisofvariance)、或者ADONIS分析。使用PERMANOVA可分析不同分組因素對(duì)樣品差異的解釋度,并使用置換檢驗(yàn)進(jìn)行***性統(tǒng)計(jì)?;驹恚褐脫Q多元方差分析(PERMANOVA,Adonis)是一種基于F統(tǒng)計(jì)的方差分析,依據(jù)距離矩陣對(duì)總方差進(jìn)行分解的非參數(shù)多元方差分析方法。基本步驟是基于OTU豐度表,計(jì)算樣本間樣本間Bray-curtis距離,然后adonis分析生成結(jié)果,繪圖展示。術(shù)語(yǔ)解讀:OTU:operationaltaxonomicunits,分類(lèi)單元Df:自由度,其值=所比較的分組數(shù)量-1;SumsOfSqs:即Sumsofsquares,總方差,又稱(chēng)離差平方和;MeanSqs:即Meansquares,均方(差);FModel:F檢驗(yàn)值;R2:即Variation(R2),方差貢獻(xiàn),表示不同分組對(duì)樣品差異的解釋度,即分組方差與總方差的比值,R2越大表示分組對(duì)差異的解釋度越高;Pr(>F):***性p值,小于***。數(shù)據(jù)要求:OTU豐度表或者樣本距離矩陣。 實(shí)驗(yàn)室致病類(lèi)病原微生物數(shù)據(jù)分析平臺(tái)。湖北組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)售后分析

    STEM基因表達(dá)趨勢(shì)分析數(shù)據(jù)要求表達(dá)譜芯片或測(cè)序數(shù)據(jù)(已經(jīng)過(guò)預(yù)處理)下游分析得到***富集的時(shí)間表達(dá)模式之后的分析有:1.時(shí)間表達(dá)模式中基因的功能富集2.時(shí)間表達(dá)模式中基因表達(dá)與性狀之間的相關(guān)性挖掘模塊的關(guān)鍵信息:1.找到時(shí)間表達(dá)模式中的**基因2.利用關(guān)系預(yù)測(cè)該時(shí)間表達(dá)模式功能文獻(xiàn)1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月發(fā)表在GenesDev.,影響因子)EBF1動(dòng)態(tài)占據(jù)在B細(xì)胞中對(duì)序列表觀遺傳和轉(zhuǎn)錄過(guò)程的影響該文獻(xiàn)采用基因表達(dá)趨勢(shì)分析,探尋了EBF1誘導(dǎo)前后25kb轉(zhuǎn)錄起始位點(diǎn)內(nèi)基因轉(zhuǎn)錄水平的差異,來(lái)尋找EBF1對(duì)特定功能基因的影響以及造成影響的時(shí)間節(jié)點(diǎn)。文獻(xiàn)2:ComprehensivetranscriptionalprofilingofNaCl-stressedArabidopsisrootsrevealsnovelclassesofresponsivegenes(于2016年10月發(fā)表在BMCPlantBiol.,影響因子)該文獻(xiàn)采用基因表達(dá)趨勢(shì)分析,研究了高濃度鹽水作用不同時(shí)間下擬南芥根的基因表達(dá)差異,來(lái)探尋在遇到高濃度鹽水時(shí)擬南芥在基因?qū)用嫔系膽?yīng)對(duì)方式。 廣東數(shù)據(jù)科學(xué)售后服務(wù)處理生物醫(yī)學(xué)科研領(lǐng)域的組學(xué)數(shù)據(jù)處理、數(shù)據(jù)庫(kù)建設(shè)。

    GSVA算法接受的輸入為基因表達(dá)矩陣(經(jīng)過(guò)log2標(biāo)準(zhǔn)化的芯片數(shù)據(jù)或者RNA-seqcount數(shù)數(shù)據(jù))以及特定基因集。**步,算法會(huì)對(duì)表達(dá)數(shù)據(jù)進(jìn)行核密度估計(jì);第二部,基于**步的結(jié)果對(duì)樣本進(jìn)行表達(dá)水平排序;第三步,對(duì)于每一個(gè)基因集進(jìn)行類(lèi)似K-S檢驗(yàn)的秩統(tǒng)計(jì)量計(jì)算;第四步,獲取GSVA富集分?jǐn)?shù)。**終輸出為以每個(gè)基因集對(duì)應(yīng)每個(gè)樣本的數(shù)據(jù)矩陣。無(wú)監(jiān)督算法無(wú)監(jiān)督算法常常被用于數(shù)據(jù)挖掘,用于在大量無(wú)標(biāo)簽數(shù)據(jù)中發(fā)現(xiàn)些什么。它的訓(xùn)練數(shù)據(jù)是無(wú)標(biāo)簽的,訓(xùn)練目標(biāo)是能對(duì)觀察值進(jìn)行分類(lèi)或區(qū)分等。核密度估計(jì)核密度估計(jì)(kerneldensityestimation)在概率論中用來(lái)估計(jì)未知的密度函數(shù),屬于非參數(shù)檢驗(yàn)方法之一。數(shù)據(jù)要求1、特定感興趣的基因集(如信號(hào)通路,GO條目等),列出基因集中基因2、基因表達(dá)矩陣,為經(jīng)過(guò)log2標(biāo)準(zhǔn)化的芯片數(shù)據(jù)或者RNA-seqcount數(shù)數(shù)據(jù)(基因名形式與基因集對(duì)應(yīng))下游分析1、基因集(如信號(hào)通路)的生存分析2、基因集(如信號(hào)通路)的差異表達(dá)分析3、基因集。

    pancancer泛**圖譜泛*研究是通過(guò)整合不同**類(lèi)型、不同組織起源的**表達(dá)數(shù)據(jù),查找**之間的共性或者差異的過(guò)程。通常使用**數(shù)據(jù)信息較為***的TCGA數(shù)據(jù),通過(guò)分裂小提琴圖展示某個(gè)基因在TCGA**和正常組織中的表達(dá)差異。分裂小提琴圖(ViolinPlot)結(jié)合了箱形圖和密度圖的特征,主要用來(lái)顯示數(shù)據(jù)的分布形狀,它一般應(yīng)用于對(duì)比某一基因在TCGA**組織和正常組織基因表達(dá)量TPM值或其它表達(dá)量數(shù)據(jù)。基本原理:小提琴圖(ViolinPlot)使用一組數(shù)據(jù)中的最小值、**四分位數(shù)、中位數(shù)、第三四分位數(shù)和**值來(lái)反映數(shù)據(jù)分布的中心位置和散布范圍,將多組數(shù)據(jù)的小提琴圖畫(huà)在同一坐標(biāo)上,可以清晰地顯示各組數(shù)據(jù)的分布差異。分裂小提琴圖在小提琴圖的基礎(chǔ)上又加入了分組對(duì)比項(xiàng),便于觀察多**類(lèi)型在某一基因上的表達(dá)分布情況,或者某一基因在某一**上,其疾病與正常的對(duì)比表達(dá)差異情況。 乳腺類(lèi)疾病預(yù)后相關(guān)信性基因突變研究數(shù)據(jù)包。

    GSEA分析:GSEA全名為GeneSetEnrichmentAnalysis(基因集富集分析)。用以分析特定基因集(如關(guān)注的GO條目或KEGGPathway)在兩個(gè)生物學(xué)狀態(tài)(如**與對(duì)照,高齡與低齡)中是否存在差異。能夠研究基因變化的生物學(xué)意義。普通GO/KEGG富集的思路是先篩選差異基因,然后確定這些差異基因的GO/KEGG注釋?zhuān)缓笸ㄟ^(guò)超幾何分布計(jì)算出哪些通路富集到了,再通過(guò)p值或FDR等閾值進(jìn)行篩選。挑選用于富集的基因有一定的主觀性,沒(méi)有關(guān)注到的基因的信息會(huì)被忽視,所以有一定的局限性。在這種情況下有了GSEA(GeneSetEnrichmentAnalysis),其思路是發(fā)表于2005年的Genesetenrichmentanalysis:aknowledge-basedapproachforinterpretinggenome-wideexpressionprofiles。主要是要有兩個(gè)概念:預(yù)先定義的基因集S(基于先驗(yàn)知識(shí)的基因注釋信息)和待分析基因集L(一般初始輸入是表達(dá)矩陣);然后GSEA目的就是為了判斷S基因集中的基因是隨機(jī)分布于L(按差異表達(dá)程度對(duì)基因進(jìn)行排序),還是聚集分布在L的頂部或者底部(也就是存在差異性富集)。如果基因集中的基因***富集在L的頂部或者底部,這說(shuō)明這些基因的表達(dá)對(duì)定義的分組(預(yù)先分組)的差異有***影響(一致性)。在富集分析的理論中。 數(shù)據(jù)庫(kù)建設(shè)、公共數(shù)據(jù)庫(kù)挖掘。湖北組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)售后分析

早期肝疾病的預(yù)后基因panel研究。湖北組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)售后分析

Inmmune gene

免疫學(xué)研究是目前科研領(lǐng)域爭(zhēng)相研究的熱點(diǎn),**免疫細(xì)胞浸潤(rùn)是其中一種。**免疫細(xì)胞浸潤(rùn)是指免疫細(xì)胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤(rùn)免疫細(xì)胞含量,計(jì)算基因與浸潤(rùn)免疫細(xì)胞含量的相關(guān)性,篩選出影響免疫浸潤(rùn)的候選基因。

基本原理:

從基因矩陣數(shù)據(jù)中提取免疫細(xì)胞含量,生成免疫細(xì)胞含量矩陣;

計(jì)算目標(biāo)基因與浸潤(rùn)免疫細(xì)胞含量的相關(guān)性,篩選與浸潤(rùn)免疫細(xì)胞含量高度相關(guān)的基因。

術(shù)語(yǔ)解讀:

相關(guān)性系數(shù)(pearson,spearman, kendall)反應(yīng)兩個(gè)變量之間變化趨勢(shì)的方向以及程度。相關(guān)系數(shù)范圍為-1到+1。0表示兩個(gè)變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強(qiáng)。

數(shù)據(jù)要求:

**數(shù)據(jù)表達(dá)矩陣 湖北組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)售后分析