Observatorio Elecciones Colombia 2010
March 5, 2010 – 6:42 pmTags: adobe flex 3, Arcgis Server Flex API, colombia, elecciones, elecciones2010, Information Visualization, mashup, visualización de Información
Nuevo:
- Twitter: Sigue todas las noticias de las elecciones con nuestro bot de Twitter @elcolbot

- Estadísticas: Aquí puedes consultar diferentes estadísticas y gráficos generados con la información recopilada por el Observatorio Electoral: Estadísticas Observatorio Electoral
- Consulta Interactiva: http://elecciones.gkudos.com/ (Puede realizar consultas interactivas de las noticias por Candidato, Partido Político, Temas Principales, Temas polémicos, Departamento, Fecha de publicación y Fuente que publica la información)
Descripción:
La aplicación “Observatorio Elecciones Colombia 2010” combina diferentes fuentes de información de la Web que publican noticias acerca de acontecimientos políticos colombianos relacionados con los candidatos y precandidatos presidenciales. Para su representación en el mapa, la aplicación extrae la ubicación geográfica de cada una de las noticias, el nombre del candidato, su afiliación política y temas mencionadas por los candidatos en sus intervenciones públicas o colocadas en redes sociales como Twitter y Facebook o en sus páginas personales.
Con toda la información extraída, el usuario puede realizar un sin numero de combinaciones que le permiten realizar varios tipos de análisis tales como: los temas que mas recurrentes de cada uno de los precandidatos, los canales de comunicación que mas noticias publican al respecto, los posibles itinerarios de los candidatos y precandidatos durante su campaña política, los candidatos y precandidatos que mas van a un determinado departamento, entre otros.
Detalles Técnicos de la Aplicación
La aplicación fué desarrollada según las necesidades de cada una de las fases descritas a continuación:
Integración y Recopilación de Información
Para la recopilación de información que sirve como insumo para este sistema se tomaron alrededor de 70 fuentes RSS con noticias e información relacionadas con Colombia y el proceso electoral
que se está desarrollando actualmente en Colombia.
Entre dichas fuentes de noticias se encuentran los principales diarios del país, revistas, noticieros, programas radiales, blogs, cuentas de twitter y facebook de los diferentes candidatos, sitios oficiales de las campañas y entidades gubernamentales del país.
Se crearon diferentes componentes que periódicamente están extrayendo las nuevas noticias que cada uno de los medios va publicando día a día en su sitio web.
Selección, limpieza y transformación de datos.
Dada la diversidad de formatos RSS y formas de codificación de la información existente, fué necesario realizar un proceso de limpieza y transformación de los datos que facilitara los procesos posteriores de análisis y extracción de información específica.
Este paso permite generar un modelo unificado de información que se almacena en un repositorio de datos específico para este sistema.
Análisis y Minería de Datos
En esta fase de extracción de información para su conversión en conocimiento se realizan principalmente 2 tareas:
- Clasificación de las Noticias según temas:
- Se realiza una clasificación de los documentos almacenados en el sistema según los siguientes criterios: Personajes políticos relacionados con las elecciones, Partidos Polìticos, Temas principales para la toma de decisión del votante (Ejm: Educación, Salud, Seguridad), Temas polémicos que pueden influir en la elección (Ejm: Corrupción, Compra de Votos, Plan Colombia) y otros temas de interés (Ejm: Abstención, Encuesta, Entrevista). Este proceso de clasificación de información y extracción de palabras claves se realiza gracias a herramientas que permiten identificar temas utilizando un vocabulario controlado por Ontología específica definida para el tema de las elecciones presidenciales de Colombia en el año 2010.
- Georreferenciación:
- La georreferenciación consiste en el proceso de asignar una coordenada geográfica a cada uno de los documentos existentes en el sistema. Para realizar este proceso fué necesario recurrir a recursos y actividades como los que se enuncian a continuación:
- Base de Datos de Gacetero (http://en.wikipedia.org/wiki/Gazetteer) de Colombia.
- Reconocimiento de Entidades Geográficas a través de técnicas de Procesamiento del Lenguaje Natural e Inteligencia Artificial. Para este proceso se incluyeron también listas de sinónimos de términos geográficos y listas de nombres comunes en el idioma español. Este tipo de listas permiten resolver problemas de ambiguedad de términos y palabras comunes que generan resultados erróneos.
- Detección y corrección de Coordenadas no Válidas a través de procesos de análisis espacial.
- Asignación de Departamentos y Munipios para cada uno de los artículos utilizando técnicas de Análisis Espacial.
- Transformación de coordenadas utilizando procesos de análisis espacial ejecutados en el motor de base de datos.
- La georreferenciación consiste en el proceso de asignar una coordenada geográfica a cada uno de los documentos existentes en el sistema. Para realizar este proceso fué necesario recurrir a recursos y actividades como los que se enuncian a continuación:
Difusión y Uso
Para la visualización y consulta interactiva de la información se implementó una aplicación geográfica enriquecida para internet (RIA) con componentes geográficos.
Esta aplicación permite visualizar de forma interactiva los eventos de noticias utilizando un mapa enriquecido con componentes que permiten descubrir las diferentes noticias utilizando opciones de búsqueda por tema, lugar, fecha o palabra clave en general.
Para la implementación de esta aplicación se utilizaron herramientas tales como las siguientes:
- Esri ArcGis Server Flex API
- Esri ArcGis Online Basemaps
- Adobe Flex 3
- BlazeDs
- Spring Framework
- Hibernate
- Servicio empresarial de búsquedas de texto completo
Listado de fuentes de información Utilizadas:
(Nota: Se incluirán nuevas fuentes de información según se encuentren)
- Alvaro Leyva – Twitter
- Andrés Felipe Arias – Facebook
- Andres Felipe Arias – Twitter
- Antanas Mockus – Facebook
- Antanas Mockus – Twitter Feed
- Cambio
- Canal Institucional
- Caracol.com.co
- Centro de Medios Independientes de Colombia
- Cinep
- City TV – Elecciones 2010
- CityTV Twitter
- Cm& Twitter
- Crónica del Quindío
- Diario de Occidente
- Dinero
- El Colombiano – Política
- Elecciones 2010 – Blogspot
- El Espectador – Principal
- El Liberal
- El Meridiano de Córdoba
- El Nuevo Día
- El País
- El tiempo – Elecciones 2010
- El tiempo – Política
- El tiempo – Titulares
- El universal – Política
- Enrique Peñalosa – Twitter
- Gacetilla – Colombia
- Germán Vargas Lleras – Facebook
- Germán Vargas Lleras – Twitter
- Google News Destacadas
- Google News Nacional
- Gustavo Petro – Blog
- Gustavo Petro – Facebook
- Gustavo Petro – Twitter
- Jose Galat – Twitter
- LaFm Noticias
- La Opinión
- La Palabra Digital
- La República
- La Silla Vacía – Historias
- Leyva Presidente
- Lucho Garzon – Facebook
- Lucho Garzón – Twitter
- Martha Lucía Ramírez
- Martha Lucía Ramírez – Twitter
- Noemí Sanín – Facebook
- Noemi Sanin – Prensa
- Noticias Uno – Twitter
- Portafolio
- Radio Santafé – Elecciones
- Radio Santafé – Principal
- Rafael Pardo Rueda – Facebook
- Rafael Pardo – Twitter
- Rcn Canal Noticias
- Rcn Radio
- Registraduría
- Semana.com
- Sergio Fajardo – Facebook
- Sergio Fajardo – Twitter
- Terra Noticias
- TransparenciaColombia.org.co
- Vanguardia Liberal – Política
- Vanguardia Liberal – Principal
- Vote Bien – Twitter Feed
- WRadio
- Youtube – Elecciones 2010 Colombia
Galería de Imágenes
- Búsqueda por Político
- Observatorio Elecciones Colombia 2010
- Resultado de Consulta – Diagrama de Barras
- Gráficos Estadísticos
- Gráfico estadístico de resultados por tema principal
- Búsqueda por Departamento
- Búsqueda por Medio de Comunicación
- Búsqueda por Partido















6 Trackback(s)