Charla: Búsqueda en texto comprimido

28 de octubre, 2010

En el marco del Ciclo de Charlas 2010 organizado por el Departamento de Ingeniería en Informática, el Sr. Diego Arroyuelo presentará el tema “Búsqueda en texto comprimido”. El evento se llevará a cabo el día miércoles 3 de Noviembre a las 11:30 horas en la Sala de Posgrado del Departamento.

En esta charla se presentará el estado del arte actual del área de los auto índices comprimidos para texto, estableciendo una comparación práctica entre los mejores métodos existentes y los diversos tipos de consultas de interés. Además, se mostrarán resultados recientes, que tienden a proponer este tipo de índices como alternativas para la indexación de colecciones de documentos, logrando, de esta forma, usar espacio comprimido y soportar consultas típicas sobre la colección, tales como las consultas conjuntivas o de tipo AND.

Considerando que las búsquedas en texto son un problema clásico en Ciencias de la Computación, el tema mantiene su vigencia debido a la abundante cantidad de información textual disponible hoy en día (documentos gubernamentales y de compañías, biología, datos de sensores y satélites, documentos XML, etc.). El objetivo principal siempre ha sido soportar búsquedas eficientes en relación a grandes bases de datos textuales. Sin embargo, y debido a la jerarquía de memoria presente en la mayoría de los computadores actuales, el uso eficiente del espacio de memoria también se ha tornado un aspecto importante.

En síntesis, en esta charla, se mostrarán los auto índices comprimidos como la solución actual para indexar textos y poder almacenarlos lo más alto posible con respecto a la jerarquía de memoria.

Sobre el expositor

Diego Arroyuelo obtuvo su Licenciatura en Ciencias de la Computación en la Universidad Nacional de San Luis, Argentina, y su Doctorado en Ciencias de la Computación en la Universidad de Chile. Posteriormente, realizó estudios postdoctorales en la David R. Cheriton School of Computer Science, University of Waterloo, Canadá.

Su registro de publicaciones incluye artículos en revistas como “Algorithmica” (Springer) y “ACM Journal of Experimental Algorithmics” (ACM). Además, ha publicado varios artículos en conferencias de primer nivel internacional, tales como: “Combinatorial Pattern Matching” (CPM), “International Symposium on Algorithms and Computation” (ISAAC), “IEEE International Conference on Data Engineering” (ICDE), “Algorithm Engineering and Experiments” (ALENEX), y “String Processing and Information Retrieval” (SPIRE).