Conference Agenda
Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).
|
Session Overview |
| Session | ||
Colab 4.7. Tools for archival accessibility
| ||
| Presentations | ||
THE USE OF ARTIFICIAL INTELLIGENCE (AI) FOR AUTOMATED PALEOGRAPHIC TRANSCRIPTION OF ARCHIVAL DOCUMENTS AT NATIONAL ARCHIVES Arquivo Nacional do Brasil, Brazil Short Description The project aims to identify in Brazil's vast archival funds which documents can be used for automated reading for transcription and subsequent description by the institution's paleographers and technicians. Abstract The digital world takes center stage in the information that is processed, recorded and communicated in archives. The impact of Artificial Intelligence - AI on archives and libraries is a reality that will increase in the coming years. Digital technologies and AI bring new challenges to information professionals and archives must respond and adapt to this reality. Within the scope of research in Digital Humanities, the aim is to deepen the dialog between digital paleography and archives by applying artificial intelligence to paleographic reading, transcription and description of handwritten documents from certain archival funds/collections (Brazil). To this end, the Transkribus software/platform could be used as a case study for recognizing certain writings in Portuguese, allowing for the automated transcription of these documents. Therefore, part of Brazilian history could be transcribed and described by using AI in archives through Transkribus, which offers archivists a new way of transcribing and researching their historical documents. Transrkibus is a comprehensive platform for digitization, text recognition with AI technology, transcription and research of historical documents - from anywhere, at any time and in any language. This platform has two versions. Transkribus can thus enhance and improve the technical processing of records, bringing their information to society and broadening the range of applications, uses and users. The use of these technologies aims to facilitate the practice of paleographic transcription, based on the automated recognition of those documents that require more attention due to their writing. In this way, the project aims to identify which of Brazil's vast archival collections can be used for automated reading for transcription and subsequent description by the institution's paleographers and technicians. As a methodological procedure, the models available in Portuguese on the platform will be tested. Since the most precise operation of the Transkribus software/platform depends on the creation of templates for each script. In order to create the template, Transkribus needs to be fed with document transcriptions so that it “learns” to transcribe. These transcriptions could then help researchers to better search for words or phrases among the millions of pages stored in archives in the future, in funds and collections from the 17th, 18th and 19th centuries, for example. The results are expected to be a significant increase in technical processing and access to the documents of the National Archives of Brazil. La significación archivística de los constructos tecnológicos: reflexionando sobre el tratamiento archivístico de aplicaciones y bases de datos 1Universitat de Barcelona; 2Associació de Professionals de l’Arxivística i la Gestió de Documents de Catalunya (AAC-GD) Short Description Aplicación informática o base de datos son conceptos tecnológicos que carecen de una correspondencia directa con conceptos archivísticos equivalentes, como puedan ser los conceptos de función o serie documental. En esta ponencia se presentará el resultado de un estudio doctoral llevado a cabo en la Universidad de Barcelona, en el que se ha buscado la correspondencia entre los conceptos tecnológicos y los archivísticos, contribuyendo a la reflexión entre los profesionales de los archivos. Abstract Aplicación informática o base de datos son conceptos tecnológicos que carecen de una correspondencia directa con conceptos archivísticos equivalentes, como puedan ser los conceptos de clase, función o serie documental. Pero desde el momento en que son contenedores de información (básicamente información estructurada, o datos) se convierten en sujeto de la aplicación de políticas de gestión documental. Así, las aplicaciones informáticas y bases de datos son actualmente objeto de preservación, de aplicación de políticas de retención, o incluso de clasificación. No existe un corpus doctrinal que haya trabajado con sistemática esta correspondencia, y los modelos de descripción archivísticos han pasado de puntillas sobre este debate, considerando estos constructos tecnológicos meras herramientas o mecanismos de apoyo a la gestión. Pero su impacto es cada vez más relevante, teniendo presente por ejemplo que se están preservando digitalmente, o bien publicando en portales de transparencia, "bases de datos" sin atribuirles ninguna significación archivística concreta, o en todo caso equivalente en las agrupaciones documentales tradicionales. En esta ponencia se presentará el resultado de un estudio doctoral llevado a cabo en la Universidad de Barcelona, en el que se ha buscado la correspondencia entre los conceptos tecnológicos y los archivísticos, llegando a conclusiones que podrían ser aplicables en muchos entornos funcionales. El objetivo de la ponencia es, por tanto, compartir estas conclusiones a través de un modelo de equivalencias, que pueda ser objeto de debate y reflexión conjunta entre los asistentes al Congreso. | ||