Un tesauro es una herramienta de control terminológico utilizada para llevar cabo la transposición a un lenguaje controlado el lenguaje natural utilizado en los documentos. Vocabulario controlado y dinámico de términos que establecen entre ellos relaciones semánticas.
Paralelamente a la automatización de la documentación archivística, el departamento de Gestión Documental de la Diputación tomó la decisión de elaborar esta herramienta de normalización del lenguaje natural para facilitar el trabajo de los profesionales en los procesos de indización y recuperación y de los investigadores para realizar búsquedas de la información contenida en las bases de datos.
A pesar de disponer de bases de datos que posibilitan las búsquedas a texto completo y por cualquier tipo de campo, la utilización del tesauro de archivos evita la exhaustividad en las respuestas que se obtiene con este tipo de búsquedas. A esto hay que añadir que se ha incorporado la gestión del tesauro a la base de datos teniendo la posibilidad de navegar a través de él y visualizar y escoger los términos más apropiados en la consulta.
El presente tesauro es fruto del trabajo de colaboración entre M. José García Murcia, Documentalista, y las técnicos de archivo Mari Carmen Otero, María Victoria Blázquez y Lourdes Villaplana, todas ellas del Departamento de Gestión Documental, Registros e Información de la Diputación de Alicante, a propuesta de la responsable del Departamento, M. Angeles Martínez Micó.
2. OBJETIVOS
La realización del tesauro de ARCHIVOS tiene la finalidad de disponer de una herramienta para el tratamiento de la información relacionada con la documentación archivística. Este instrumento será utilizado tanto en el proceso de indización de los documentos como en el de búsquedas retrospectivas de la información.
3. COBERTURA TEMATICA
El tesauro abarca la terminología de la documentación del Archivo de la Diputación y de los ayuntamientos de la provincia de Alicante adscritos al Plan de Ayuda a Archivos Municipales de la Diputación de Alicante. Estas instituciones producen documentos referentes a cualquier temática y períodos históricos, por lo que podemos decir que estamos ante un tesauro multidisciplinar.
4. DATOS ESTADÍSTICOS
Descriptores: 2.428
No descriptores: 600
Notas de aplicación 285
5. METODOLOGÍA DE CONSTRUCCIÓN
5.1 Elección de las fuentes terminológicas y tratamiento de los términos:
Método analítico: extracción de términos mediante un análisis previo de los documentos de archivo:
Método sintético
5.2 Listado de microdisciplinas o microtesauros:
Después de estudiar la lista de términos, hemos dividido el campo semántico en los siguientes microtesauros:
02. Sector agropecuario
03. Asistencia Social y Beneficencia
04. Obras y Urbanismo
05. Educación y Cultura
06. Gobierno y Legislación
07. Presupuesto, Economía y Hacienda
08. Industria y Comercio
09. Justicia
10. Patrimonio
11. Población y Territorio
12. Ejército y Seguridad
13. Elecciones
14. Medio Ambiente
15. Sanidad
16. Trabajo y Personal
17. Transporte y Comunicaciones
18. Iglesia
20. Identificadores
A continuación se han incluido cada uno de los términos en su familia correspondiente.
5.3 Elaboración de las relaciones semánticas:
Una vez agrupados los términos, hemos estudiado cada uno de ellos para establecer las relaciones de equivalencia.
Cuando hemos descubierto los términos que tienen un significado similar hemos decidido el que mejor expresa el concepto y los otros los hemos designado como no descriptores (USE/UP).
El siguiente paso consiste en estudiar por separado cada uno de los grupos para establecer las relaciones jerárquicas, seleccionando los términos que representan conceptos más genéricos (TG) que engloban a su vez términos específicos (TE).
Al mismo tiempo que establecemos las relaciones de jerarquía nos hemos encontrado con términos que no son equivalentes pero tienen una gran relación o que evocan a otros términos que están ubicados en otros microtesauros, o en cadenas jerárquicas distintas, nos referimos a las relaciones de asociación representadas por los términos relacionados (TR).
Dado que la documentación que se maneja en los archivos aparece con mucha frecuencia nombres propios de personas, organismos e instituciones hemos determinado la necesidad de crear un MT denominado identificadores (20). La estructura no presenta relaciones de jerarquía pero sí de carácter asociativo y de equivalencia.
5.4 Automatización
Finalmente se procedió a la introducción de los términos en el módulo de gestión Tesauros de la base de datos del CIDAPA (Centro de información documental y archivística de la provincia de Alicante) gestionada por el aplicativo LORIS.
5.5 Edición 0 y test de evaluación.
La primera edición se somete a un periodo de prueba en el que determinamos la idoneidad de los términos incluidos en el tesauro. El resultado de este estudio es la eliminación de aquellos términos que no han aparecido nunca en los documentos que han sido indizados durante el primer año de uso del tesauro. Posteriormente se realiza la primera versión del Tesauro de Archivos en la que todos los términos tienen registros asociados.
6. PRESENTACIÓN DEL TESAURO
6.1 Presentación jerárquica
Listado jerárquico general: Relación alfabética de todos los Top Term o términos cabecera del tesauro desarrollados jerárquicamente. Los descriptores se ordenan por campos semánticos. Dentro de cada campo se estructuran los términos según el grado de generalidad o especificidad, haciendo un sangrado mayor según su nivel jerárquico. Dentro de un mismo nivel de jerarquía los términos mantienen el orden alfabético.
En esta representación solo se incluyen los descriptores.
Listado jerárquico por Micro Tesauros o familias. La misma presentación que la anterior pero de cada una de las familias por separado:
6.2 Presentación alfabética
Lista alfabética de los descriptores con todas sus relaciones semánticas, y de los no descriptores con sus reenvíos correspondientes:
Descriptor
Na: Nota de Alcance
MT: Microtesauro al que pertenece
UP: Término/os equivalentes
TG: Término genérico o inmediatamente anterior jerárquico
TE: Términos específicos del escalón jerárquico inmediatamente inferior.
TR: Término relacionado
Ejemplos:
Casas de Beneficencia
MT Asistencia Social y Beneficencia
UP Residencia provincial de adultos y casa del niño
TG institución asistencial
TE nodriza
TE refugiada
TR maternidad
Obras particulares
NA obras de titularidad particular que necesitan de permiso o fiscalización municipal
MT Obras y Urbanismo
TG obras
TE obra mayor
TE obra menor
Centro de enseñanza
MT Educación y Cultura
UP centro de educación
TG educación
TE colegio
TE conservatorio
TE escuela de magisterio
TE guardería
TE instituto de bachillerato
TE universidad
TR Escuela Industrial de Alcoy
6.3 Otros índices
La base de datos que gestiona el tesauro proporciona también índices KWIC Y KWOC.
7. ACTUALIZACIÓN DEL LENGUAJE
Como todo tesauro, y especialmente este por su contenido multidisciplinar e histórico, ha de actualizarse. Para ello, actualmente se ha creado un grupo de trabajo formado por técnicos que habitualmente realizan trabajos de indización que tiene una doble finalidad, por una parte trabajar y analizar la coherencia en la indización y por otra aportar nuevos términos que se estudian y finalmente se incorporan o rechazan según convenga. El resultado del trabajo del grupo se plasmará en una nueva versión, la tercera de este tesauro de archivos cuya primera data del año 2003.
8. ELEMENTOS NORMALIZADOS
Se han tenido en cuenta las normas ISO 2788-1986 que corresponde a la norma española UNE 50-106-90 “Directrices para el establecimiento y desarrollo de Tesauros Monolingües”
Salvo en algunos casos se ha elegido la forma singular para representar los descriptores.
En cuanto a las Siglas y acrónimos hemos designado descriptor los términos desarrollados, dejando las siglas como términos equivalentes.
9. CONCLUSIONES
Lo que hemos pretendido con este trabajo es ayudar al analista en el tratamiento de la información relacionada con la documentación de los archivos dotándole de una herramienta normalizadota que nos ayude tanto de los trabajos de análisis de contenido como en la búsqueda de información. De esta manera será igualmente mucho más fácil su recuperación retrospectiva evitando los problemas de silencio y ruido documental que nos presenta el lenguaje natural.
ACCESO AL TESAURO DE ARCHIVOS
Listado jerárquico general
No incluimos en este listado el MT de identificadores por tratarse de nombres propios, de personas o instituciones. Este es consultable a través de la WEB
Listado jerárquico por Micro Tesauros
03. Asistencia Social y Beneficencia
07. Presupuesto, Economía y Hacienda
09. Justicia
13. Elecciones
14. Medio Ambiente
15. Sanidad
17. Transporte y Comunicaciones
18. Iglesia
20. Identificadores
Se accede a la base de datos del archivos.
Pulsa el comando y después el icono del campo descriptores de materias.
Solo se accede a la búsqueda a través de descriptores, no con sinónimos.
Se puede efectuar el truncado de términos con el símbolo “%”
TESAURO GEOGRÁFICO DE LA PROVINCIA DE ALICANTE
Bajo las mismas premisas y estructura que el Tesauro de Archivos, y con el mismo objetivo de facilitar la descripción documental y la búsqueda de información archivística, hemos elaborado el tesauro de topónimos. Aunque la mayor parte de la documentación que se analiza tiene un alcance geográfico dentro del entorno de nuestra provincia, también hay otros documentos que hacen referencia a otras ciudades, municipios e incluso, en menor medida, a diferentes países. Para poder dar cabida a cualquier término geográfico hemos optado por dividir el tesauro de topónimos en tres familias, dominios o micro tesauros: MT de la provincia de Alicante, MT de Comunidades autónomas y MT de Países.
Relaciones semánticas entre los términos en el MT de la Provincia de Alicante.
Se han establecido dos clases de relaciones: de jerarquía y equivalencia. Las primeras responden a la estructura territorial de nuestra provincia que va desde el término más genérico que es la provincia al núcleo de población o accidente geográfico más pequeño: provincia, comarca, municipio, entidad local menor, barrio, accidente geográfico etc.
En cuanto a las relaciones de equivalencia tienen dos aspectos: la lingüística debido a que los municipios de nuestra provincia pueden tener una denominación oficial en lengua castellana, valenciano, o bilingüe. También se ha tenido en cuenta la equivalencia de carácter histórica determinada en base al análisis de los diferentes estudios sobre toponimia de los municipios de la provincia de Alicante.
Ejem.:
Orihuela
MT Provincia de Alicante
UP Oriola
UP Aureola
UP Oriole
UP Horigüela
UP Horihuela
TG Bajo Segura
TE Torremendo
MT COMUNIDADES AUTONOMAS Y PAIS
El objetivo de estos dos MT es poder incorporar cualquier término geográfico que no se encuentre en la provincia de Alicante.
Si bien el MT de topónimos la provincia de Alicante se a creado a priori, sin tener en cuenta si aparecen o no en la documentación municipal y de la Diputación , los términos de estas dos familias se van incorporando a posteriori es decir al tiempo que son citados en los documentos analizados.
El MT de Comunidades autónomas tiene una estructura jerárquica basada en la estructura territorial: Comunidad Autónoma, Provincia, Municipio. Para diferenciar el nombre de una provincia del de su capital se ha optado por introducir su nombre seguido de la palabra provincia.
Ejem:
TT Castilla-La Mancha
TE1 Albacete, Provincia
TE2 Albacete
TE2 Caudete
TE1 Ciudad Real
TE2 Campo de Criptana
TE1 Guadalajara
TT Italia
TE1 Roma
Se accede a la base de datos del archivo. Pulsa el comando y después el icono del campo descriptores toponímicos
BIBLIOGRAFÍA
Amat Noguera, Núria. Documentación científica y nuevas tecnologías de la información. Madrid: Ediciones Pirámide, 1987
Van Slype, Georges. Los lenguajes de indización. Concepción, construcción y utilización en los sistemas documentales. Fundación Germán Sánchez Ruiperez
Tesauro Eurovoc. Oficina de Publicaciones Oficiales de las Comunidades Europeas, 1995
Materiales para un tesauro de archivos municipales. Grupo de Archiveros Municipales de Madrid
Juan Luis Román del Cerro, Mikel de Epalza y colaboradores. “Toponimia mayor y menor de la Provincia de Alicante”.- Alicante: Caja de Ahorros Provincial de Alicante, 1983.
Vicente Martínez Morellá. Toponimia árabe de la Provincia de Alicante. Ayuntamiento de Alicante, 1952
Normas
UNE 50-106-90 “Directrices para el establecimiento y desarrollo de Tesauros Monolingües”