Red de conocimiento de divisas - Preguntas y respuestas sobre contabilidad - Métodos para detectar genes diferenciales

Métodos para detectar genes diferenciales

El método SAM fue propuesto por primera vez por Tusher, Tibshirani y Chu en 2001. Es un método de análisis estadístico para detectar genes expresados ​​diferencialmente a partir de datos de perfil de expresión génica de microarrays. El método SAM es adecuado para detectar genes expresados ​​diferencialmente en datos de microarrays de diferentes diseños y tipos de datos. El método SAM generalmente utiliza un algoritmo de permutación para estimar la tasa de descubrimiento falso (FDR), controlando así la tasa de error de múltiples pruebas. Storey (2001) propuso una nueva tasa de descubrimiento falso positivo (PFDR) para el análisis estadístico de los datos del perfil de expresión génica y demostró la racionalidad de esta medida. Storey (2002) mejoró el método para controlar la tasa de error test-retest y propuso un método directo, que consiste en fijar primero la región de rechazo a través de la experiencia y luego estimar pFDR. Un gen se considera expresado diferencialmente si su pFDR es menor que el nivel de prueba. Para controlar la tasa de error familiar (FWER) o FDR general, varias pruebas pueden calcular los valores P corregidos mediante varios métodos. PFDR tiene una definición similar, que Story define como valor Q. El valor q del estadístico de prueba T = t se define como:

valor q (t) = INF {γα:t∈γα} pFDR(γα)

donde γ α es la región de rechazo. Como puede verse en la fórmula anterior, el valor q es el error mínimo de Tipo I producido cuando la hipótesis acaba de ser rechazada. Prueba de hipótesis M hipótesis idénticas H1, H2,..., Hm, T1, T2, T3,..., t M es el estadístico de prueba, Ti está distribuido de forma independiente e idéntica y la región de rechazo es γ, entonces el estadístico de prueba T = q valor de t Se puede expresar como:

valor q (T) = INF {γα:T∈γα} pr(H = 0 | T∈γα).

Y el valor de p se define como:

valor p (T) = INF {γα:T∈γα} pr(T∈γα| H = 0)

Puede Se puede observar que el valor q y el valor p son muy similares. Bajo la condición de distribución independiente e idéntica, el valor Q es la versión bayesiana del valor P, llamado valor P bayesiano posterior. El método SAM utiliza valores q

El primer paso: calcular los valores P correspondientes a M pruebas de hipótesis.

Paso 2: Según el tamaño del valor P original, P(1)≤P(2)≤...≤P(m), las hipótesis de prueba correspondientes son H0 (1), H0 (2), …, H0 (m).

Paso 3: Supongamos k=max {k: P(k)≤α/(m-k+1)}, comenzando desde k = m, luego k =m-1, hasta que el primero satisfaga P(k)≤α/(m-k+1. Si no hay K que satisfaga la condición, no se pueden rechazar todas las hipótesis originales.

El valor de p corregido por el método de Hochberg es: . p (i) = mink = i,…,m {min ((m-k+1) p (k), 1)}. Usar FWER como primera medida de error de tipo es demasiado conservador, por lo que Benjamini y Hochberg (1995) A Se propuso una nueva medida de error, FDR. Benjamini y Hochberg (1995) propusieron un método para controlar FDR en el nivel m0α/m (en adelante denominado método BH) bajo la condición de que las estadísticas de prueba sean independientes entre sí y tengan. distribución continua, es decir, los valores P originales son independientes entre sí y obedecen a la distribución uniforme U [0, 1]. El método BH es el siguiente:

Primer paso: Calcular los valores p. correspondiente a m pruebas de hipótesis.

Segundo paso: Según el tamaño del valor P original, podemos obtener: P(1)≤P(2)≤…≤ P(m), y el las hipótesis de prueba correspondientes son H0 (1), H0 (2),…,

H0 (Hombre).

Paso 3: Estimar k = max {k: p (k) ≤ kα/m} de P(m)

Paso 4: Si existe k, rechazar todas las hipótesis originales correspondientes a p (1), p (2),..., p (k). no hay K que satisfaga la condición, no se pueden rechazar todas las hipótesis originales.

El valor de p después de la corrección por el método BH es: p (I) = mink = I,…, m {min (MP). (k)/k, 1)}.

Benjamini y Yekutieli (2001) encontraron que cuando existe una estructura de dependencia entre los estadísticos de prueba, es decir, cuando el estadístico de prueba tiene PRDS (dependencia de regresión positiva-ención univariante) sobre el conjunto de estadísticos correspondientes al Hipótesis nula: el método BH aún puede controlar el FDR al nivel de M0α/m. Este hallazgo tiene un importante valor de aplicación práctica, porque en problemas prácticos, a menudo existen estructuras de dependencia entre estadísticas.

El método de corrección de Bonferroni, el método de corrección de Sidak, el método de Hochberg y el método BH utilizan el valor p corregido. Pi

上篇: Pago de la seguridad social, debes conocer estos puntos para evitar que te estafen. 下篇: ¿Qué tal la Institución de Educación y Capacitación Qinhuangdao Shanxiang?
Artículos populares