Propuestas Educativas: Análisis Computacional del Discurso

Los datos que se presentan a continuación son el resultado del análisis informático de las propuestas en materia de educación presentes en los programas electorales de los principales partídos políticos del Estado español.

Los scripts de Python empleados para llevar a cabo el análisis se encuentra disponible en Github. Los análisis de conectividad y de enriquecimiento de términos se llevó acabo mediante la plataforma voyant-tools.org.

Análisis de conectividad

El análisis de la conectividad permite identifical visualmente, mendiante su representación en un grafo, los términos que aparecen en proximidad con más frecuencia. El análisis también incluye los términos clave que aparecen asociados a la red de conectividad principal.

redes
Figura 1. Análisis de conectividad de los términos. Los nodos verdes representan los términso con mayor conectividad y los rojos a los términso asociados. El panel A se corresponde con los datos del PSOE, el panel B con los de Podemos, el panel C con los de Ciudadanos, y el panel D se corresponde con los datos del Partido Popular.

En el panel A de la figura 1, correspondiente al documento del PSOE, es posible apreciar que entre los términos con mayor conectividad se encuentran varios con connotaciones sociales, tales como ‘comunidad’, ‘equidad’, ‘social’ y ‘pública’. Otro aspecto a destacar es presenta una intensidad en las relaciones y una densidad de red medias. El panel B, en el que se representan los datos del programa de PODEMOS, destaca por ser el que presenta mayor intensidad en las confluencias de términos así como por ser una de las redes con mayor densidad. Ello rebelaría una mayor coherencia en el discurso y unas propuestas más homogeneas.

Entre los términos destacados podríamos incluir ‘participación’, ‘aprendizaje’, ‘escolar’ y ‘social’. En lo referente a los datos del panel C, correspondiente a los datos de Ciudadanos, uno de los aspectos a destacar es la importancia de términos tales como ‘internacional’, ‘evaluación’, ‘financiación’, ‘externa’ y ‘transparente’, los cuales se ajustan con bastante precisión a su perfíl de tecnócratas economistas. Es llamativo, en lo referente a la intensidad de las relaciones, del dominio de un pequeño conjunto de términos, en detrimento del resto. Por último en el caso los datos correspondientes al Partido Popular destaca el llamativo predominio de la pareja de términos ‘formación’ y ‘profesional’. En lo referente a las características globales de la red, destaca su escasa densidad, lo cual podría ser reflejo de un texto poco coherente.

terminos
Figura 2. Análisis de frecuencia de términos. El panel A se corresponde con los datos del PSOE, el panel B con los de Podemos, el panel C con los de Ciudadanos y el panel D se corresponde con los datos del Partido Popular. 

Análisis de enriquecimiento de términos

Para poder estudiar la riqueda de términos se procedió a la selección de los 35 de mayor frecuencia en cada uno de los textos y a su representación mediante nubes de palabras. En la figura 2 es fácilmente apreciable qué conceptos dominan el universo del discurso en cada uno de los programas electorales.

Un análisis superficial permite identificar la omnicresencia de algunos términos, tales como ‘educación’, ‘formación’ y ‘profesional’. En este caso, la parte más informativa es aportada por los términos esclusivos de cada uno de los programas. Así en el programa del PSOE (panel A) podríamos destacar ‘diversidad’ y ‘social’, en el de PODEMOS (panel B) ‘aprendizaje’ y ‘reforma’, en el programa de Ciudadanos (panel C) ‘internacional’ y ‘científica’, y del programa del Partido Popular remarcar ‘digital’ y ‘movilidad’.

Análsis de términos clave

Con el objetivo de definir el marco de trabajo de los diversos partidos póliticos en materia de educación dedicimos llevar a cabo el análisis de distribución de una serie de términos que consideramos esenciales, en base a las corrientes ideológicas que forman parte del actual sistema de gobierno del Estado español.

Entre los patrones de distribución más llamativos se encuentran la importancia del término ‘alumnado’ en el universo del discurso de Podemos y el PSOE, estando completamente ausentes en los restantes partidos. Otro patrón destacable es el predominio de los términos con connotaciones sociales en los programas de Podemos y el PSOE. En el caso del Partido Popular destacan los términos ‘docente’, ‘calidad’, ‘innovación’ y ‘mercado’. Por último, en el discurso de ciudadanos tienen un papel destacado los términos ‘pública’, ‘calidad’, ‘inversión’ y ‘docente’.

 

palabras_clave2.png
Figura 3. Análisis de la frecuencia relativa de términos clave.

 

 

analisis_discurso
Figura 4. Análisis linguístico del programa electoral de los partidos mayoritarios. Polaridad hace referencia a si transmiten sensaciones negativas o positivas (-1 indica negatividad y +1 postividad). Subjetividad se refiere a la objetividad de los argumentos empleados (0 indica completa subjetividad, y 1 completa objetividad). Certeza se refiere a la confianza que transmiten los enunciados (el valor 0 indica poca fiabilidad y 1 completa fiabilidad).

Análisis linguistico del discurso

El analisis de sentimientos trata de clasificar los documentos en funcion de la polaridad de la opinion que expresa su autor (Martinez Cámara et al. 2011). Entre las diversas alternativas existentes para llevar a cabo el análisis, en el actual trabajo se optó por el estudio semántico. Los textos escritos pueden ser, a grandes rasgos, categorizados en dos tipos: hechos y opiniónes. Las opiniones implican una mayor influencia de sentimientos y sensaciones. De este modo, mediante el análisis semántico del texto es posible medir la polaridad de los sentimientos (positivos o negativos) y el grado de subjetividad (es decir, el grado en el que el texto está impregnado de sentimientos). Así mismo, mediante el análisis gramatical es posible identificar el grado de confianza que el emisor tiene en el mensaje.

Este tipo de análsis se basa en la presencia de determinas construcciones gramaticales, tales como la presencia de verbos auxiliares (p.e. podría, sería) o adverbios (p.e. definitivamente, probablemente). En la figura 4 se recogen los resultados obtenidos del análisis linguistico.

Un análisis comparativo permite poner de manifiesto que el partido que tiene una menor confianza en sus propuestas es el PSOE (0.58). El discurso que transmite una mayor positividad es el correspondiente al programa del Partido Popular (0.16), encontrándose Podemos en el polo opuesto (0.11). Por su parte, en lo referente a la objetividad, son Podemos (0.362) y el Partido Popular (0.369) los que reflejan una menor emotividad en el discurso.

 

resultados
Tabla 1. Valoración de los términos definitorios. La tabla recoge los términos más importantes de acuerdo con el índice TF-IDF (Term Frequency, Inverse Document Frequency).

Identificación de términos importantes mediante TF-IDF

El método TF-IDF (Term Frequency, Inverse Document Frequency) es una estrategia para evaluar la importancia de los términos en un documento en base a su frecuencia de aparición en otros documentos. Así, si una palabra aparece frecuente en un documento, será considerada con una puntuación elevada si, además, es poco frecuente en el resto de los documentos con los que se lleva a cabo la evaluación cruzada.

En la tabla 1 aparece el resultado obtenido al aplicar el método actualmente descrito a las propuestas sobre educación presentes en los programas electorales. En base a ellos es posible obtener una visión panorámica de cuales son los intereses distintivos de cada una de las formaciones políticas. Así, en el caso de Ciudadanos es evidente su inclinación hacia la mercantilización de la educación, dado el predominio de términos con connotación económica. En el caso de Podemos predominan los términos con vertiente social, tales como ‘participativa’, ‘familiar’ y ‘conciliación’. En el caso del PSOE es destacable la presencia de los términos ‘singularidades’ y ‘sexualidad’. Por último, en el caso del Partido Popular destacan términos como ‘comunicación’, ‘libertad’, ‘empleabilidad’ y ‘mobilidad’.

Bibliografía

Análisis de sentimientos (2011). Martínez Cámara et al. istemas Inteligentes de Acceso a la Informacion.

Pattern (2016). Computational Linguistics & Psycholinguistics Research Center. Web page: http://www.clips.ua.ac.be/pattern

Topic modeling in Python (2016). Dr. Wolfram Horstmann.  Web page: https://de.dariah.eu/tatom/topic_model_python.html

Tutorial: Finding Important Words in Text Using TF-IDF (2013). Steven Loria. Web page: http://stevenloria.com/finding-important-words-in-a-document-using-tf-idf

Voyant (2016). Stéfan Sinclair & Geoffrey Rockwell. Web page: https://voyant-tools.org

One comment

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s