Felicitaciones al nuevo Doctor, Jorge Párraga Álava

13 de marzo, 2018

Durante el año 2017 se graduó como Doctor en Ciencias de la Ingeniería Mención en Informática  Jorge Párraga Álava. El nuevo Doctor realizó la tesis “Clustering Difuso Multi-Objetivo de Genes basado en Información Biológica Externa y Datos de Expresión Génica” bajo la tutela del  Dr. Mario Inostroza Ponta, académico del Departamento en Ingeniería Informática.

El Dr. Párraga estudio el doctorado con una beca de la SENESCYT del Ecuador que tenía entre los programas habilitados el impartido por la Universidad de Santiago de Chile. Indica que seleccionó este programa “porque me interesaba realizar un doctorado en informática de índole aplicado y en una línea no tan tradicional como la que ofertaban otros doctorados de calidad en Chile y en otros países de habla hispana”. Por ello se dedicó a una investigación que tenía como finalidad encontrar grupos difusos de genes a través de la optimización simultánea de criterios basados en información de anotaciones biológicas y datos de expresión génica para comprender sus funciones e interacción en diversos procesos biológicos y así facilitar, por ejemplo, la inferencia de desórdenes metabólicos, influencia de genes en el desarrollo de enfermedades o grupos de genes que responden similarmente a un medicamento.

Las proyecciones del Dr. Párraga son continuar una carrera académica en Ecuador. Su expectativa es poder contibuir al área de la bioinformática aplicando el modelo construido sobre datos de la  expresión génica de la población ecuatoriana con el fin de mejorar la comprensión de funciones génicas y procesos celulares, lo que sin duda alguna va a proporcionar un conocimiento útil y más preciso a los biólogos sobre todo cuando realizan estudios relacionados a la comprensión de la genómica funcional.

De su paso por el Doctorado destaca el alto nivel de investigación aplicada ofrecida por el programa, además de las interacciones efectivas con investigadores de otras universidades chilenos y de diversos países donde también se realiza investigación informática de vanguardia. “Esto es un gran plus por que permite generar redes de investigación que a futuro permitirán desarrollar de mejor forma los diversos proyectos en los que trabaje” señala el Dr. Párraga.

Realizar una formación doctoral tiene sus propios desafío y así lo hace ver Jorge, quien destaca entre sus agradecimientos  “el apoyo familiar fue de vital ayuda durante mi formación doctoral. Por ello agradezco a mi familia por todas las palabras de ánimo brindadas. Dentro del DIINF, agradecería a todos los profesores que compartieron su experiencia en investigación aplicada. De manera especial, a mi Profesor Guía Mario Inostroza-Ponta por su acertada orientación para la realización exitosa de mi investigación doctoral. Finalmente agradecer a la SENESCYT (Secretaría de Educación Superior, Ciencia, Tecnología e Innovación) del Ecuador por su apoyo financiero a través de una beca para realizar estos estudios doctorales”.

Tesis Doctoral

Título: Clustering Difuso Multi-Objetivo de Genes basado en Información Biológica Externa y Datos de Expresión Génica

Autor: Dr. Jorge Párraga Álava

Profesor Guía:  Dr. Mario Inostroza Ponta

Comisión Examinadora:​ Dr. Mario Inostroza Ponta, Dr. Gonzalo Acuña Leiva, Dr. Pablo Román Asenjo, Dra. María Cristina Riff

Resumen:​ 

Uno de los principales objetivos de las investigaciones en biología es comprender los antecedentes genéticos de enfermedades, trastornos metabólicos o cualquier otra alteración sistémica. Con el fin de lograr aquello, los algoritmos de clustering se han vuelto populares entre los biólogos, debido a la facilidad para descubrir grupos de genes con funciones celulares similares y con ello la posibilidad de inferir funciones biológicas, antecedentes sobre redes reguladoras, el descubrimiento de nuevos subtipos de células, o cualquier otro hallazgo que permita entender el comportamiento y desarrollo de los organismos vivos.

La mayoría de los estudios que aplican el clustering de genes realiza la asignación de los genes a los distintos grupos de forma disjunta y consideran dicha tarea como un problema de optimización, donde se optimiza un índice de calidad. Sin embargo, el problema de encontrar grupos es normalmente multi-dimensional, lo que hace necesario abordar al clustering como un problema multi-objetivo donde simultáneamente varios índices de calidad se optimizan. Por lo general, tales índices se basan en criterios como homogeneidad y separación de los grupos, lo cual puede no ser suficiente, ya que no pueden garantizar la identificación de grupos con coherencia biológica y patrones de expresión similares, y mucho menos, la identificación de genes traslapados en varios procesos celulares y funciones biológicas.

El objetivo de esta tesis es diseñar un algoritmo de clustering difuso multi-objetivo de genes que combine simultáneamente criterios basados en información biológica externa y datos de expresión génica, para identificar grupos de genes coherentes biológicamente, con altos niveles de co-expresión, homogeneidad y separación, y que, además, representen la participación de los genes en diversos procesos biológicos. Para lograr esto, se evalúan enfoques que combinan la información biológica externa y datos de expresión génica en tres partes distintas del clustering multi-objetivo de genes. Al mejor de tales enfoques se le incorpora la propiedad difusa, con la finalidad de representar la participación de los genes en varios procesos biológicos, dando lugar al enfoque de clustering difuso multi-objetivo. El mismo fue exitosamente probado con cuatro bases de datos de expresión génica disponibles en la literatura y sobre una base de datos que contenía 1227 genes relacionadas a la enfermedad de Alzheimer. En todos estos casos, los tests estadísticos, visuales y de significancia biológica, demostraron que el algoritmo diseñado en esta tesis es capaz de identificar grupos con mejores niveles de homogeneidad, separación, co-expresión y coherencia biológica que los métodos existentes. Además, la incorporación de la propiedad difusa permite emular de forma idónea la naturaleza de incertidumbre de los genes en cuanto a la posibilidad de estar asociado con más de un grupo funcional.

Palabras Clave: Clustering; Optimización Multi-Objetivo; Expresión Génica; Conocimiento Biológico Externo; Difuso.

Publicaciones asociadas:

  1. Párraga-Álava, J., Dorn, M., Inostroza-Ponta, M. 2017. “A multi-objective gene clustering algorithm guided by a-priori biological knowledge with intensification and diversification strategies”. [Journal Paper].  BioData Mining (En revisión)
  2. Párraga-Álava, J. Inostroza-Ponta, M. 2017. “A Bi-Objective Clustering Algorithm for Gene Expression Data”. [Journal Paper]. CLEI Electronic Journal, vol. 20, no. 2, pp. 1-17. ISSN: 0717- 5000.
  3. Párraga-Álava, J., Dorn, M., Inostroza-Ponta, M. 2017. “Using Local Search Strategies to Improve the Performance of NSGA-II for the Multi-Criteria Minimum Spanning Tree Problem”. [Conference Paper]. IEEE Congress on Evolutionary Computation 2017. San Sebastián, España. Junio 2017.
  4. Párraga-Álava, J., Inostroza-Ponta, M. 2016. “A Bi-Objective model for Gene Clustering Combining Expression Data and External Biological Knowledge”. [Conference Paper]. XLII Latin American Computing Conference (CLEI). Valparaiso, Chile. Octubre 2016.