Observatorios Escalables de la Web en Tiempo Real

01 de marzo, 2011
Estado: Realizado

Director e investigador principal: Mauricio Marin

Investigador asociado: Carolina Bonacic Castro

FONDEF código D09I1185

Marzo 2011 – Febrero 2014

Resumen

El concepto de observatorios de la Web es genérico y de interés para una amplia variedad de personas y empresas. Solamente en Chile, en los últimos cinco años, han surgido decenas de observatorios dedicados a detectar información relevante para una amplia gama del quehacer nacional que es comunicada a sus usuarios. Estos sistemas clasifican la información de manera manual y presentan los contenidos de manera estática, y las técnicas de búsqueda de contenido siguen siendo basadas en palabras claves, lo cual limita la utilidad de la información acopiada por el observatorio.

Este proyecto propone mejorar la experiencia de los usuarios de observatorios proporcionando herramientas de software que permitan observar la dinámica de la Web mediante la combinación de técnicas de bases de datos espacio-temporales y estrategias recientes de minería de la Web tales como detección de tópicos y comunidades sociales emergentes, entre otras. La componente de innovación del proyecto radica en la proyección en el tiempo y el espacio (fuentes de publicación y/o lugares geográficos) de las distintas vistas de la información detectada en la Web, así como también, de la trazas detectadas en las interacciones que realizan los usuarios con aplicaciones de empresas nacionales que atraen a millones de usuarios.

Básicamente, el modelo de negocio del proyecto tiene los siguientes componentes: (a) Un portal Web \”Observatorios\” escalable a millones de usuarios y configurable a dominios múltiples, según las necesidades de usuarios individuales o corporativos, y donde la financiación proviene por la vía de pago de suscripción y descarga de plug-ins para computadores personales, y (b) un sistema avanzado en base a módulos que pueden ser instalados en el centro de datos de las organizaciones y empresas interesadas en observar la Web y entender mejor a sus usuarios.

Abstract

The concept of observatories on the Web is generic and of interest to a wide variety of individuals and businesses. Only in Chile, over the past five years, there have been dozens of observatories dedicated to discovering information relevant to a wide range of national affairs that is communicated to its users. These systems classify information manually and present content in a static way, and techniques for content search are still based on keywords, which limits the usefulness of the information collected by the observatory.

This project aims to improve the user experience of observatories providing software tools that allow us to observe the dynamics of the Web by combining techniques of spatio-temporal databases and recent strategies for web mining such as topics detection and emerging social communities, among others. The innovative component of the project lies in the projection in time and space (sources of publication and / or geographic locations) of the different views of the detected information on the Web, as well as, the traces detected in the interactions by the users of national companies with applications that attract millions of users.

Basically, the business model of the project has the following components: (a) A Web portal “Observatories” scalable to millions of users and configurable to multiple domains, according to the needs of individual and corporate users, and where the funding comes via payment of subscription and download plug-ins for personal computers, and (b) an advanced system based on modules that can be installed in the data center of business organizations interested in monitoring the Web and better understand their users.