Investigación sobre grafo de conocimientos con emociones

1.- 1.- Estado del proyecto de prácticas (Introducir explicación: por ejemplo, señale si el plan de trabajo se está cumpliendo de forma adecuada, según lo establecido, o sólo de manera parcial cuyo caso explique los motivos de ello).

Teniendo en cuenta, que el desarrollo del proyecto cuando comenzó era prácticamente de cero, el proyecto esta avanzando a buen paso. Al comienzo, la mayor parte del tiempo de desarrollo fue de aprendizaje sobre la propia naturaleza del estudio sobre los grafos de conocimiento, como funcionan y desarrollan, además de para que sirven.

Una vez estudiado la base principal del proyecto, era necesario comenzar a hacer pequeñas pruebas, podemos afirmar que fue aquí cuando comenzó el desarrollo real del proyecto. 

Actualmente, el proyecto ya tiene desarrollado un primer grafo de conocimiento preliminar, que sabe identificar de manera más o menos consistentes frases simples. A espera de estudiar cuales son los pasos a seguir, el estado del proyecto, aunque sea todavía muy temprano, avanza a muy buen ritmo.

2.- 2.- Riesgos identificados (Señale las dificultades para poner en marchar las actividades u objetivos -o alguno de ellos- establecidos en el plan de trabajo).

Podemos definir y detallar algunos de los riesgos o problemas con los que nos hemos ido encontrando a lo largo del desarrollo.

  1. Desconocimiento de los grafos de conocimiento

De manera evidente, el primer problema con el que nos topamos al iniciar el proyecto era la identificación sobre la naturaleza del grafo de conocimiento, que necesitábamos para empezar a desarrollarlo y, sobre todo, entenderlo. Este paso no fue demasiado arduo, ya que encontramos muy buena documentación y pudimos comenzar el desarrollo y las pruebas sin mucha demora, aunque actualmente, tenemos muchas cosas que aprender sobre estos, por lo tanto, esta dificultad aún sigue vigente.

  1. Identificación de entidades en el lenguaje castellano

La mayoría de la identificación de entidades de frases para el desarrollo de grafos de conocimientos son realizadas en inglés. Esto era muy conveniente, ya que, por la propia naturaleza de la lengua anglosajona, encontrar ciertas entidades como el sujeto de una oración, es una tarea muy sencilla, extrapolar esto al castellano, no fue tan sencillo.

Nuestra lengua, es una de las más difícil de analizar de entre todas ellas, encontrar el sujeto en una oración, por poner un ejemplo, no es nada trivial y es algo totalmente indispensable para el desarrollo de nuestros grafos de conocimiento.

  1. Falta de datos de entrenamiento

Al no disponer de frases experimentales para desarrollar y probar nuestro grafo de conocimiento, no estamos tratando frases reales que puede llegar a recibir la aplicación a la que va a ir aplicado este proyecto. Por lo tanto, hemos inventado una serie de frases, siendo unas mas útiles que otras, pero al no tener un número representativo de frases, la fase de desarrollo de identificación de variables esta capada y probada en estas muestras tan pequeñas.

  1. Modelo entrenado de identificación de palabras

Para el desarrollo, se utiliza una librería que se centra en identificar la naturaleza de cada palabra de una frase, el problema principal de esta librería es que se trata de un modelo de inteligencia artificial entrenado con muestras extraídas de periódicos y noticias, algo no muy conveniente para nuestro campo de estudio. Las noticias y periódicos están, normalmente, escritos en tercera persona, mientras que la mayoría de las frases a estudiar están en primera persona. 

Este es un problema bastante serio, ya que es difícil que algunas frases identifiquen bien, muchas veces, cosas tan simples como un verbo. Este problema se está pensando en solventarse, creando nosotros mismos el modelo, aunque para ello necesitaríamos muchas más frases de entrenamiento.

3.- Modificaciones al plan de prácticas (señale las modificaciones o cambios que se han producido en el plan de trabajo).

Desde que comencé las prácticas, no ha habido ninguna modificación o cambio en el desarrollo de las mismas, siempre se ha avanzado basándonos en pequeños objetivos y todo ha ido desarrollándose correctamente.

4.- Análisis crítico del trabajo realizado hasta ahora (realice de una valoración crítica del desarrollo del plan de trabajo).

El desarrollo del plan de trabajo es excelente, y va a muy buen ritmo para las horas que podemos trabajar en él. Es evidente, que el proyecto iría con mucha la afluencia si se dedicara las horas necesarias para ello. Aunque destacando que se trabaja de media 8 horas semanales, tanto el desarrollo como la planificación se cumple cada semana, y para sorpresa del equipo involucrado avanzamos a bastante velocidad y con resultados de calidad.

En resumen, el desarrollo va realmente bien, por ahora todos los inconvenientes que nos hemos ido encontrando a lo largo del desarrollo hemos sabido solventarlos e ir construyendo poco a poco este proyecto en algo consistente.

 

Alberto José Gutiérrez – Máster en análisis y visualización de datos masivos.