|
SEMILLERO DE INVESTIGACIÓN - GESTIÓN DE INFORMACIÓN NO ESTRUCTURADA (SIRI)
Coordinadores: Juan Guillermo Lalinde Pulido Maria Celeste Álvarez Vásquez Correo Electrónico: malvar22@eafit.edu.co Vinculado al grupo: Grupo de Investigación en redes y sistemas distribuídos (GIRSD) Área: Ingenierías
|
Temática de estudio o investigación: |
|
El uso de la información no estructurada y semiestructurada para generar conocimiento que soporte de manera efectiva los procesos de toma de decisiones de las organizaciones. Por información no estructurada entendemos toda aquella que no tiene asociado ningún esquema que de información sobre su semántica. La información semiestructurada es aquella en la cual se tiene un esquema pero que no proporciona toda la semántica asociada con los datos. |
- Ana Cristina Pérez Ramírez
- Gustavo Adolfo Blanco Tenorio
- Laura Juliana Ramírez Gutiérrez
- Luz María Agudelo Mejía
- Natalia Andrea Muñoz Quiroz
Objetivo general
|
Diseñar, analizar, validar e implementar técnicas de análisis de información no estructurada que sean aplicables en entornos empresariales. |
Objetivos específicos
-
Desarrollar un motor de búsqueda genérico que permita hacer uso eficiente de información no estructurada.
-
Diseñar, analizar, validar e implementar técnicas de procesamiento de lenguaje natural para manipular información no estructurada en forma de textos.
-
Diseñar, analizar, validar e implementar técnicas de procesamiento de señales para manipular información en forma de señales (audio, video, speech, imágenes, etc.).
-
Diseñar, analizar, validar e implementar técnicas de inferencia automática para analizar las relaciones entre diversos tipos de información. |
|
Uno de los principales problemas que se afrontan en la actualidad es la abundancia de información. ¿Cómo extraer conocimiento a partir de grandes volúmenes de información? Hay dos aproximaciones para esta pregunta: desde la perspectiva de la gestión del conocimiento y desde la perspectiva de la infraestructura tecnológica. El semillero se aproxima a esta pregunta desde la perspectiva tecnológica, haciendo énfasis en la relación que existe entre la semántica de la información y el contexto en el cual se crea. En el caso colombiano está el factor particular del idioma español, para el cual se han hecho pocos desarrollos.
Con el fin de poder garantizar la coherencia de los desarrollos tecnológicos con la visión global de la gestión del conocimiento, el trabajo del semillero se realiza en coordinación permanentemente con el área de sistemas de información y el área de gestión del conocimiento del departamento de informática y sistemas de la universidad. |
-
Analizar las mejores prácticas y las técnicas más utilizadas en procesamiento de lenguaje natural.
-
Implantar las herramientas más utilizadas para la gestión de la información no estructurada e integrarlas en una plataforma unificada de gestión de información no estructurada.
-
Implantar web-bots que sean fuente de información para analizar en la plataforma diseñada.
-
Desarrollar un motor de búsquedas avanzadas integrado a la plataforma.
-
Definir ontologías para etiquetar información no estructurada. |
|