Conference Agenda
Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).
|
Session Overview |
| Session | ||
4.04. Rewriting the Rules: What Happens When Archives Go Intelligent?
| ||
| Presentations | ||
Aplicaciones de la Inteligencia Artificial en Archivística: clasificador automático de documentos 1Ufes, Brazil; 2Prodest, Brazil; 3APEES, Brazil Short Description La Inteligencia Artificial tiene su base en una variedad de disciplinas, y actualmente ha sido utilizada en las más diversas áreas del conocimiento. En este contexto, este artículo tiene como objetivo presentar un clasificador automático de documentos que utiliza Procesamiento del Lenguaje Natural y Redes Neuronales. Los principales resultados presentan el clasificador automático de documentos como una primera aplicación de un conjunto de soluciones que utilizan Inteligencia Artificial. Abstract Si bien es un tema cada vez más presente en la ciencia y la sociedad, el primer trabajo reconocido hoy como IA fue realizado por Warren McCulloch y Walter Pitts, en 1943, inspirados en la modelación matemática de Nicolas Rashevsky, a través del cual propusieron un modelo de neuronas artificiales. Sin embargo, el término “Inteligencia Artificial” fue acuñado por John McCarthy en la Conferencia de Dartmouth en 1956, siendo considerado el hito inicial de la IA como campo de estudio. La IA se puede aplicar en varios subcampos y diversas áreas del conocimiento, como Educación, Ingeniería, Medicina, Ciencias del Clima, Agricultura, Arquitectura, Entretenimiento y Medios, Gestión de documentos y datos, entre otros. En este sentido, este artículo tiene como objetivo presentar una herramienta de clasificación automática de documentos. La clasificación de documentos de archivo mediante IA surgió de la necesidad de identificar el destino final de 5,6 millones de procesos administrativos registrados en el Sistema de Protocolo Electrónico (SEP), en producción desde 1986 y que atiende a casi todos los órganos del Poder Ejecutivo Estatal del Estado de Espírito Santo en Brasil. En las discusiones iniciales participaron varios equipos y expertos que analizaron diferentes métodos y tecnologías que podrían utilizarse. Como resultado de estas discusiones, se formó un grupo de interés dedicado al proyecto y se inició la búsqueda de socios externos para realizar una prueba de concepto [Proof of Concept (PoC)]. A partir del PoC se logró desarrollar internamente un Producto Mínimo Viable [Mínimo Viable Product (MVP)], que tras la entrega demostró la viabilidad de utilizar IA para la clasificación de procesos. La entrega exitosa del MVP impulsó la siguiente fase del proyecto: construir una biblioteca para estandarizar la publicación de modelos de aprendizaje automático. Después de finalizar este entorno y publicar el modelo algorítmico definitivo, el equipo llevó a cabo una capacitación exhaustiva utilizando un volumen de 500 mil procesos. Esta capacitación a gran escala fue esencial para afinar y optimizar la solución, garantizando que fuera sólida y efectiva. Se espera que el sistema presentado sea el primero de muchas aplicaciones de IA es una cooperación técnica entre la Universidad Federal de Espírito Santo, el Instituto de Tecnologías de la Información y las Comunicaciones del Estado de Espírito Santo y el Archivo Público del estado de Espírito Santo. AI Adoption In provincial Archives in China: Effects,Challenges and Prospects Renmin University of China, China Short Description This study explores AI implementation in Chinese provincial archives, drawing on questionnaires, online surveys, and semi-structured interviews to assess adoption rates, usage scenarios, outcomes, and challenges. It also examines archives’ awareness and use of large language models (LLMs), investigating concerns among those yet to adopt AI. The results combine quantitative and qualitative data, offering theoretical and practical guidance for integrating AI into archival management. Abstract The rapid advancement of artificial intelligence (AI), particularly large language models (LLMs), is significantly transforming operations across various industries, including archival management. In recent years, archives in China, similar to those globally, have begun employing AI tools to enhance efficiency and user experience in tasks such as accessioning, classification, appraisal, and utilization. This paper provides a comprehensive overview of AI technology adoption in China's provincial archives, examining practical outcomes across different regions and operational stages, as well as potential future developments. Employing both quantitative and qualitative methodologies, this study conducted questionnaires, online surveys, and semi-structured interviews with archives from all 34 provincial-level administrative regions in China. The findings offer a detailed analysis of current AI utilization in archival management, supported by clear visualizations of the survey data. Specifically, this research addresses four primary questions: (1) What is the rate of AI tool adoption in provincial archives across China, and are there notable regional variations? (2) What are the specific application scenarios of AI tools, and what benefits and challenges do they present? (3) How do provincial archives perceive and utilize large language models? (4) What are the main concerns among archives that have yet to adopt AI technologies? Building on an assessment of current practices, this paper further explores the experiences and lessons learned from AI applications in Chinese archives, analyzes the challenges, and envisions future development directions. The findings provide practical examples and data-driven insights for professionals in archival management and serve as a strategic reference for fostering deeper integration of AI technologies within archival practices. GeoExpedient BCN Ajuntament de Barcelona - Arxiu Municipal de Barcelona, Espanya Short Description Aquest projecte recull, transforma i geocodifica informació de 231.000 expedients d’obra privada, generant 4,6 milions de dades de qualitat i fiables. L’objectiu és crear noves vies de comunicació amb els usuaris i oferir una aproximació visual tant de la informació gràfica com textual. Reutilitzar les dades permet generar productes propis de difusió, alimentar els portals d’Informació Urbanística i de dades obertes de l’Ajuntament, així com enriquir el catàleg en línia de l’Arxiu Municipal, etc Abstract El projecte neix amb la voluntat de posar a l’abast de tothom, en un sol clic, les dades relacionades amb la documentació d’obra privada. S’origina davant l’increment de consultes en línia, i esdevé una oportunitat per obrir noves vies de comunicació amb les usuàries de l’Arxiu. L’any 2023 es va analitzar la documentació més consultada dels últims cinc anys, concloent que el 70% de les consultes estaven relacionades amb expedients de sol·licitud d’obra privada. També es va detectar que alguns instruments de descripció estaven incomplets, desfasats o contenien errors, dificultant la recuperació de la informació i endarrerint la resolució de consultes. Davant d’aquest escenari, des de l’Arxiu Municipal Contemporani de Barcelona impulsem un projecte que situa les persones usuàries al centre, per respondre a les seves necessitats reals i arribar al màxim de beneficiàries. Com ho fem? A través del treball col·laboratiu hem dissenyat una metodologia replicable a altres sèries documentals, basada en: buidatge i reutilització de dades, ús de llenguatge controlat, creació de productes de suport, georeferenciació de cartografia històrica, aplicació de Sistemes d’Informació Geogràfica i intel·ligència artificial. Què estem aconseguint? 1. Recollir la informació continguda en 231.000 expedients d’obra privada i transformar-la en 4,6 milions de dades de qualitat, fiables i reutilitzables per crear noves vies de comunicació amb els usuaris. 2. Generar productes propis de difusió, presentar la informació gràfica i textual geocodificada de manera visual, oferir plànols georeferenciats, crear un banc de dades urbanístiques, alimentar el catàleg en línia de l’Arxiu Municipal de Barcelona i digitalitzar massivament la documentació. 3. Alimentar eines corporatives com el Portal d’Informació Urbanística (amb un milió d’usuaris anuals), i col·laborar amb productes d’altres departaments o institucions, com la Carta Històrica de Barcelona del Museu d’Història de la Ciutat i el GeoPortal. IA - Aplicacion de Tecnicas de Recuperacion, Enriquecimiento y Generacion (RAG) en archivos historicos. ITS S.A., Argentina Short Description Este trabajo aborda el uso de la tecnología RAG (Retrieval Augmented Generation) como una herramienta para la exploración y análisis de documentos. En primer lugar, se describirá, con un perfil no técnico, en que consiste el RAG, con el fin de que se comprenda su funcionamiento. En segundo lugar, se presentarán casos concretos de implementación, utilizando un desarrollo propio con el objetivo de ajustar y adaptar los parámetros de un RAG al tipo de documentación presente en un archivo. Abstract La gestión eficiente de información archivística es esencial para preservar la memoria colectiva, fomentar el acceso al conocimiento y apoyar la investigación académica. En tal sentido, la digitalización y posterior transcripción de la documentación es un paso fundamental para preservar el patrimonio documental y hacerlo accesible a un público mas amplio. Sin embargo, obtenida la documentación transcripta y depurada en un formato entendible por una computadora, surge el desafío, -para profesionales de archivos como también para sus usuarios-, de cómo explorar y analizar de manera eficiente este vasto volumen de información que en muchos casos puede contener miles o decenas de miles de páginas. Las búsquedas tradicionales basadas en palabras clave resultan insuficientes ya que pueden excluir información relevante. Es aquí donde entre uno de los casos de uso mas populares de la IA Generativa y los LLMS (Large Language Models), emerge la tecnología RAG (Retrieval Augmented Generation) como una solución poderosa que puede asistirnos en este proceso ofreciendo una forma más inteligente de explorar y analizar los documentos. Este trabajo aborda el surgimiento de esta tecnología y como transforma la búsqueda y el análisis documental, poniendo especial énfasis en los beneficios de su aplicación, pero también en sus limitaciones. En primer lugar, se describirán en forma detallada y simple, con un perfil no técnico, los diferentes componentes de un RAG y las diversas variantes a considerar dentro de cada componente, con el objetivo de que el usuario final tenga cabal compresión de su funcionamiento y de esa manera interactuar de manera mas eficiente y obtener los mejores resultados que hoy puede ofrecer esta tecnología. En segundo lugar, y junto a la descripción técnica, se presentarán casos concretos de implementación, utilizando un desarrollo propio que permite prototipar diferentes escenarios y estrategias con el objetivo de ajustar los parámetros de un RAG al tipo de documentación presente en un archivo. | ||