Análisis de datos de chips de microarrays
La ventaja de los chips de microarrays es que pueden escanear una gran cantidad de genes de interés al mismo tiempo, pero este es también el cuello de botella de su investigación. Un experimento generará una gran cantidad de datos. Cómo analizar estos datos y sacar conclusiones biológicamente significativas es una cuestión importante para el desarrollo y la mejora de la tecnología de chips de microarrays. En este sentido, se necesitan tecnología informática y una variedad de métodos estadísticos. Aún no se ha realizado un estudio comparativo a gran escala entre los diversos modelos matemáticos utilizados actualmente, por lo que su desempeño no puede evaluarse de manera completa y exhaustiva.
En la actualidad, en la investigación médica, los métodos de análisis de datos generalmente se dividen en dos categorías: análisis de conglomerados no monitoreado y análisis de conglomerados monitoreados. El primero es una agrupación de genes relativamente simple basada en la similitud en la expresión genética desde una perspectiva matemática, lo que ayuda a descubrir nuevos genes diana o proporcionar nueva información sobre enfermedades, como nuevas clasificaciones, factores que afectan el pronóstico, etc. Este último debe analizarse en combinación con los conocimientos profesionales existentes y es adecuado para la clasificación de enfermedades. Este es un complemento útil a los métodos de diagnóstico tradicionales.
Además, en muchos estudios actuales de chips de microarrays, el número de genes estudiados cada vez es grande y el número de muestras que participan en el experimento es pequeño. Este fenómeno no favorece la obtención de resultados experimentales estables y reproducibles.