Artículos

Agrupación de una red social medieval por SOM usando una medida de distancia basada en kernel

Agrupación de una red social medieval por SOM usando una medida de distancia basada en kernel



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Agrupación de una red social medieval por SOM usando una medida de distancia basada en kernel

Por Nathalie Villa y Romain Boulet

Actas de ESANN 2007 (Brujas, 2007)

Introducción: Las redes sociales se han estudiado intensamente a través de gráficos durante los últimos años: se dan ejemplos de tales estudios para World Wide Web, redes científicas o redes P2P. La mayoría de estos gráficos provienen de las redes sociales modernas, mientras que aquí nos proponemos analizar la organización social de una comunidad campesina medieval antes de la Guerra de los Cien Años. Esta red social se ha construido a partir de un corpus de contratos agrarios.

Un primer estudio investiga este problema mediante el uso de las propiedades algebraicas de una gráfica no ponderada. Proponemos aquí un nuevo enfoque, utilizando un método neuronal automático y más precisamente una adaptación del Mapa de Autoorganización de Kohonen (SOM) sobre datos descritos por una matriz de disimilitud. El algoritmo SOM, introducido por primera vez por Kohonen, es un método no supervisado que permite tanto la agrupación como la visualización. Los datos originales, que por lo general viven en un espacio de alta dimensión, se proyectan de forma no lineal en un espacio de baja dimensión (generalmente, la dimensión de proyección se establece en 1 o 2) llamado mapa; se dividen en varios clústeres conservando su topología inicial. Este algoritmo se ha adaptado recientemente a datos no vectoriales; nos centramos aquí en la adaptación propuesta en; se ha introducido una variante de este SOM de disimilitud (o SOM medio) y se ha utilizado para la minería de uso web en y luego se describe una versión más rápida en. El algoritmo que proponemos es el que se describe en, pero estamos utilizando una distancia definida en un gráfico por el núcleo de difusión.

El documento está organizado de la siguiente manera. En la sección 2, recordamos el algoritmo SOM de disimilitud (sección 2.1) y describimos cómo se pueden usar las distancias basadas en un kernel para producir un algoritmo de clasificación no supervisado para gráficos ponderados (sección 2.2). En la sección 3, nos enfocamos en el conjunto de datos medievales: después de describirlo (sección 3.1), explicamos cómo aplicamos nuestro método de manera eficiente y cómo construimos una clasificación final (sección 3.2). Finalmente, en la sección 3.3, comparamos esta clasificación con el conocimiento previo algebraico o histórico: algunas similitudes demuestran que los resultados son consistentes con trabajos previos.

El gráfico en el que probamos nuestro enfoque se ha obtenido de una base de datos de aproximadamente 10 000 contratos agrarios de cuatro señorías del Lot y del Tarn-et-Garonne (suroeste de Francia). Estos contratos se establecieron entre 1240 y 1520. Los historiadores se preocupan principalmente por el análisis de la sociabilidad del país durante la Edad Media, pero la base de datos es demasiado grande para un estudio exhaustivo, por lo que se requieren herramientas de minería de datos.

Aquí nos centramos en una parte de esta base de datos, basada en el señorío de Castelnau-Montratier (Lot) entre 1240 y 1350 (antes de la Guerra de los Cien Años). Con base en esta base de datos, construimos un gráfico ponderado que tiene 226 vértices (los campesinos) que se vinculan entre sí si aparecen en el mismo contrato. Los pesos eran simplemente el número de contratos comunes en los que aparecían dos campesinos juntos. Limpiamos el gráfico eliminando las noblezas porque estaban mencionadas en casi todos los contratos (como las autoridades legales).


Ver el vídeo: Musica Épica - Victory (Agosto 2022).