Contacte con nosotros

¿Qué quieres buscar?

Análisis

La minería de datos analiza los discursos de Sánchez sobre COVID-19

Se puede apreciar que las palabras más frecuentes son bastante lógicas: medidas, sanitarios, hacer, trabajar, país, todos/as, virus, público, social, etc.

Manuel Terrádez Gurrea, UOC – Universitat Oberta de Catalunya

Mucho se ha hablado sobre la exposición pública del presidente del Gobierno de España, Pedro Sánchez, en las últimas semanas, y también del estilo (¿épico? ¿bélico?) de sus intervenciones, frente a los discursos más contenidos de otros líderes europeos. La minería de textos nos permite analizar estos discursos y comprobar similitudes y diferencias entre unos y otros según el foro de intervención.

Se preguntarán: ¿qué es la minería de textos? Se trata de una rama de la minería de datos que analiza la información de tipo textual. Es una disciplina transversal y de creciente interés, cuyas aplicaciones son múltiples. Entre otras: indexación de documentos, traducción automática, resumen automático de textos, reconocimiento de voz o identificación de la autoría de textos.

También se ha utilizado en más de una ocasión para analizar discursos de diversas personalidades, con el objetivo de interpretar su estilo o sus cambios a lo largo del tiempo. Su aplicación más habitual y sencilla es la nube de etiquetas (figura donde cada palabra se representa en un tamaño proporcional a su frecuencia de aparición), presente desde hace tiempo en los medios de comunicación. Pero las diversas técnicas disponibles nos permiten ir más allá.

Publicidad.

Y ahora vayamos con el presidente español. Hasta mediados de abril, Pedro Sánchez había realizado siete intervenciones relacionadas con la crisis sanitaria: cuatro ruedas de prensa (21, 22, y 28 de marzo, y 5 de abril) y tres comparecencias en el Congreso de los Diputados (18 y 25 de marzo, y 9 de abril).

Análisis descriptivo

Veamos primero un análisis puramente descriptivo de la extensión y complejidad de los discursos. Como se puede comprobar en las figuras 1 y 2, tanto la extensión (medida mediante el número de palabras utilizadas) como la complejidad (medida mediante la extensión media de las palabras o el porcentaje de palabras largas, es decir, de siete o más letras) es, en general, superior en los discursos del Congreso (CD) que en los de las ruedas de prensa (RP).

Sin embargo, el porcentaje de palabras únicas es similar, con diferencias entre los discursos pero sin un patrón claro.

Publicidad.
Figura 1.
Figura 2.

Términos más frecuentes

En segundo lugar, vamos a visualizar la nube de etiquetas conjunta de los siete discursos (figura 3) y las dos que surgen de diferenciar según el foro de intervención (figuras 4 y 5). Se han seleccionado las 50 palabras más frecuentes en cada caso (las etiquetas están lematizadas, es decir, recortadas para representar la raíz común de palabras relacionadas. Por ejemplo, tod representa la suma de apariciones de las palabras todo, toda, todos y todas. Además, se han eliminado palabras vacías como preposiciones, conjunciones o artículos; estos tratamientos son comunes en análisis de textos).

Figura 3.

En la nube conjunta se puede apreciar que las palabras más frecuentes son bastante lógicas: medidas, sanitarios, hacer, trabajar, país, todos/as, virus, público, social, etc.

Una primera característica que se puede apreciar en la comparativa según el foro es que en el Congreso hay unas pocas palabras dominantes, mientras que en las ruedas de prensa esa preponderancia queda más diluida, porque hay un conjunto amplio de palabras con un peso similar. En términos técnicos, esto se mide mediante la sparsity, que en el primer caso es del 27%, y en el segundo del 46%, confirmando que en el Congreso los discursos son más homogéneos que en las ruedas de prensa.

Figura 4-CD.
Figura 5-RP.

En la comparativa según el foro también se puede comprobar que hay palabras frecuentes en ambos (España/españoles, personas), otras que siendo comunes se utilizan algo más en uno u otro entorno (por ejemplo, social o medidas se utilizan más en el Congreso que en las ruedas de prensa, y al revés ocurre con virus o país), y otras claramente diferenciadoras: en el Congreso se hace mayor uso que en las ruedas de prensa de las palabras señorías (por motivos obvios), crisis, salud o servicios, mientras que lo contrario sucede con palabras como días, Europa o vida.

No obstante, como decíamos antes, las diferentes técnicas de minería de texto (text-mining) nos permiten profundizar un poco más en el análisis y localizar aquellos términos que, aun no siendo muy frecuentes, son más específicos o diferenciadores entre los dos foros.

La tabla 1 muestra los diez términos más específicos en cada caso.

Publicidad.
Tabla 1.

Y es aquí donde quizás sí se aventuren algunas de las diferencias que comentábamos al inicio, con un uso de términos más pragmáticos (euros, servicios, aprobar) en el Congreso frente a otros algo más emocionales (vidas, desgracia) en las ruedas de prensa. Si bien las diferencias tampoco parecen excesivas.

Este artículo fue publicado originalmente en The Conversation. Lea el original.

COMPARTE


EMBÁRCATE EN LA LUCHA CONTRARREVOLUCIONARIA:

Si quieres defender la cristiandad y la hispanidad, envíanos tus artículos comentando la actualidad de tu país hispano desde una perspectiva tradicionalista, y nosotros los publicaremos. También puedes enviarnos artículos sobre la fe católica y la cultura, entendiendo cultura como amor a la verdad y la belleza, reseñas de libros, artículos de opinión … Ya somos más de 9.000.000 de lectores en todo el mundo, únete a nuestro equipo de voluntarios y difunde la verdad compartiendo en redes sociales, o remitiendo tus colaboraciones a redaccion@tradicionviva.es

Publicidad.

Te necesitamos

Somos un espacio de análisis lejos de los dogmas de la corrección política; puedes colaborar haciendo una DONACIÓN.

 

Te puede interesar:

Click para comentar

También puedes comentar con facebook:

Leave a Reply

Tu dirección de correo electrónico no será publicada.

BOLETÍN GRATUITO

Recibirá nuestros artículos en su correo.

Gracias por suscribirse.

Algo ha fallado.

EL NUEVO ORDEN MUNDIAL (NOM)

Publicidad

Revista Soberanía Social

Reciba gratuitamente la revista cuatrimestral "Soberanía Social", y semanalmente la selección de artículos del editor.

Podcast

Publicidad

LIBRO

Carlismo para principiantes
Publicidad

Análisis

"El diablo y Karl Marx: la larga marcha de la muerte, el engaño y la infiltración del comunismo" de Paul Kengor, un libro esclarecedor.

Análisis

En El Estado servil, Hilaire Belloc retrata con clarividencia pasmosa la íntima comunión de capitalismo y comunismo que a la postre ha instaurado una...

Análisis

Ni nuestras sociedades son estrictamente democráticas, ni estamos en un paraíso, sino que son partitocráticas, y últimamente todo apunta a que estamos viviendo unos...

Actualidad

¿Pero por qué un individuo que sostiene un nivel de vida que le ha permitido comprar una casa valorada en más de dos millones...

Publicidad

Copyright © 2020. Creado por la Asociación Editorial Tradicionalista - redaccion@tradicionviva.es Revista de historia, actualidad y análisis tradicionalista. Editada en Madrid (Spain). Fundación: 2010. - ISSN 2253-8569 - Director: Carlos Pérez- Roldán Suanzes. Director honorario: Jose Antonio Pérez- Roldán y Rojas. TradicionViva.es un espacio de resistencia civil que pretende crear estados de opinión, análisis y debate en donde las imposiciones políticas no existen. Garantizar esta libertad de pensamiento depende de ti, querido lector. Por ello te pedimos que difundas nuestra publicación, y colabores remitiéndonos artículos y estudios que no tienen cabida en otros medios de comunicación.