Conference Agenda
Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).
|
Session Overview |
| Session | ||
Colab 4.1. Redefining Archives: Innovation, Integrity, and Access in a Digital World
| ||
| Presentations | ||
Un portail Web d'accès à deux siècles de recensements archivés et geo-référencés CNRS/ CEDEJ, France Short Description Ancré sur un partenariat entre le CEDEJ/CNRS et l’institut officiel égyptien de statistique (le CAPMAS), le projet a pour objectif la création d’un portail interactif et collaboratif en libre accès, cedejcapmas.org, qui présente l’intégralité des 14 recensements égyptiens sur deux siècles (1882-2017), en trois langues arabe, français, anglais. Des cartes interactives et dynamiques peuvent être créées et des comparaisons diachroniques opérées, grâce à un calcul en temps réel des données massives. Abstract Troisième pays du continent africain après le Nigeria et l’Éthiopie et premier pays d’Afrique du Nord par son poids démographique (97 millions d’habitants en 2017), l’Égypte est l’un des rares pays au sud de la Méditerranée à disposer d’un recensement intégral et régulier de sa population depuis le XIXe siècle (Alleaume et Fargues, 1998). C’est à l’époque de Méhémet Ali Pasha que l’Égypte effectue le premier comptage de la population et plus précisément en 1846. Les deux premiers recensements publiés datent de 1882 et 1897. À partir de cette date, les recensements s’échelonnent quasiment tous les dix ans jusqu’à aujourd’hui : celui de 2017 est le quatorzième. Ils livrent un ensemble précieux d’indicateurs démographiques, sociaux et économiques. Le niveau de spatialisation des résultats de ces quatorze recensements est d’une constance et d’une finesse remarquables. Ils recèlent 20 millions de données démographiques et socio-économiques, offrant une collection patrimoniale exceptionnelle de statistiques. Le projet a pour objectif la création d’un portail web interactif en libre accès de cartographie dynamique, archivant en trois langues (français, anglais et arabe) l’intégralité des quatorze recensements égyptiens menés depuis 1882. Il s’agit de proposer aux utilisateurs l’extraction de tableaux de données statistiques issues des recensements, des graphiques, et des notices historiques sur toutes les entités administratives (au total 5779 villages et quartiers urbains) mais également des cartes thématiques. personnalisées à toutes les échelles administratives (gouvernorat, canton, village ou quartier). À partir du croisement de ces données massives et de leur traitement statistique des comparaisons diachroniques peuvent être opérées malgré les remaniements administratifs, grâce à un calcul en temps réel. L’objectif de la plateforme web est non seulement de préserver et de partager un patrimoine de statistiques sur l’Égypte, mais aussi d’offrir un instrument d’exploitation de ce corpus diversifié et multi-échelle de données massives à référence spatiale. Il s’agit d’un outil innovant en ce qu’il partage une base de données à la fois démographiques et socio-économiques, et en ce qu’il procède à un travail de géocodage de chaque entité administrative selon le dernier recensement de 2017. Son originalité réside ainsi dans le suivi temporel des localités sur deux siècles, et dans l’outil interactif de cartographie dynamique. Ce travail s’inscrit dans ce que l’on dénomme actuellement à juste titre : « les humanités numériques ». Elles associent deux fonctions complémentaires : celle qui concerne l’utilisation des outils du numérique par la communauté scientifique qui travaille dans le domaine des humanités et celle concernant les sources des connaissances issues du savoir d’érudition. Cette fonction nécessite de nouvelles méthodes, de nouveaux traitements, de nouvelles définitions d’algorithmes et bien sûr d’outils. Ceci ne peut se construire qu’en synergie totale entre les spécialistes garants des connaissances accumulées à travers le temps et les spécialistes de la recherche mathématique, informatique, statistique garantissant la conservation de l’ensemble des données, leur validité, leur traitement, leur interopérabilité, enfin leur accessibilité. En tout cas elle permettra que les plus belles empreintes des peuples ne soient jamais effacées Projecte d’aplicació d’Intel·ligència Artificial en la cerca i recuperació d’anuncis del Butlletí Oficial de la Província de Barcelona de 1833 a 1997 Diputació de Barcelona, Espanya Short Description El Butlletí Oficial de la Província és una publicació periòdica sorgida el 1833 que arriba a l’actualitat. Manca per incorporar al cercador web 164 anys de la publicació. Amb l’arribada de les tecnologies d’Intel·ligència Artificial s’ha pogut abordar el gran volum d’informació de la publicació. S’ha realitzat la partició dels butlletins en 2.708.872 anuncis i s’han extret metadades que permeten localitzar l’anunci, identificar l’anunciant, i l’assumpte i elaborar un resum automàtic. Abstract El Butlletí Oficial de la Província és una publicació periòdica sorgida el 1833 que arriba a l’actualitat. S’hi publiquen anuncis del govern central, els meso governs i els governs locals, així com informacions sobre l’administració de justícia i alguns anuncis de particulars. El 2008 es deixa de publicar en format paper. En suport digital es publica per anuncis a partir d’una estructura de dades, a la qual s’integren els anuncis en el format paper fins a l’any 1998. En una primera fase del projecte es parteixen els butlletins del 1833 al 1997 en anuncis; procurant obtenir una estructura de dades com la dels BOPBs actuals. Cosa que implica treballar amb 52.945 diaris de 164 anys; que signifiquen 2.708.872 d’anuncis. Els resultats d’aquesta fase permeten disposar de: - extracció de tots els textos dels anuncis; - localització de l’anunci; - estructura de dates i l’apunt del document digitalitzat, - anunciant en -com a mínim- un primer nivell jeràrquic. Tot i aplicar eines d’intel·ligència artificial en fase de proves pel que fa a les matèries i als resums automàtics, s’han obtingut resultats millorables, cosa que fa pensar en la necessitat de refinar els resultats. Amb els 3 milions d’anuncis partits es treballa amb eines IA per fer el refinament de les dades per tal d’obtenir: - Indexació dels anunciants: aplicant taules d’equivalència pels diferents períodes històrics; - Indexació de les matèries dels anuncis. Cal entrenar l’eina facilitant inicialment les taules d’equivalències dels noms dels anunciants per poder establir els períodes en què els noms dels anunciants tenien denominacions diferents. A partir d’aquí amb els llistats dels anunciats extrets de la primera fase s’ha pogut anar refinant la indexació d’anunciants. El principal repte en l’aplicació d’IA han estat els resums automàtics, per tal que siguin comprensibles i que compleixin criteris d’anonimització de dades especialment protegides, per poder-los publicar en obert. En aquest cas es faran proves pilot, ja que no es té la certesa que les eines actuals permetin obtenir un text final publicable. En la posada en funcionament del cercador web s’opta per disposar d’un cercador històric per recuperar els anuncis fins a 1979, per reduir el soroll informatiu en cerques del BOPB actual. Declassification of Historical Records in the Digital Age: Harnessing Artificial Intelligence World Bank Group, United States of America Short Description The World Bank Group (WBG) Archives declassifies records over 20 years old under its ATI Policy, promoting transparency and accountability. However, the manual review process is strained by growing data and transparency demands, making traditional methods inadequate. AI offers transformative potential. This Co-Lab session will explore WBG Archives’ AI initiatives, share insights, and encourage idea exchange on leveraging AI to assist in reviewing historical records for declassification. Abstract Under the World Bank Access to Information Policy, the World Bank Group (WBG) Archives has the authority to declassify historical records that are over 20 years old. This landmark policy promotes accountability, transparency, enriched historical understanding, public trust and lessons from the past. However, the manual declassification review and administrative process is both demanding and laborious. Since the policy’s implementation in 2010, there has been rapid growth of data and increasing calls for transparency which have made traditional manual methods of record declassification inadequate for handling the challenges of speed, accuracy, and scale. Artificial intelligence (AI) has the potential to revolutionize the digital archival process in the WBG Archives' declassification efforts improving methods to accelerate access to records to meet growing demand. This Co-Lab Session will present the status of the WBG Archives’ exploration of AI and will share insights into how we intend to use cutting-edge technologies to review large amounts of records in line with the Policy. Designed as an interactive session, it will also serve as an opportunity to exchange ideas and learn from peers. The co-lab session will discuss how the World Bank Group Archives has mapped a traditional manual declassification process to a modernized approach. The session will highlight real-life examples: 1) the experience of process mapping and the language required for technical IT specialists to translate a manual process into a digital process; 2) using natural language processing (NLP) that identifies and analyzes sensitive content; 3) discuss long-term future possibilities, and 4) address challenges such as maintaining data security, ensuring algorithmic accountability, and balancing all of this in line with the World Bank’s Access to Information Policy. This presentation format is ideal to share an interactive discussion and get feedback from those who are seeking innovative solutions to modernize the review of large amounts of records. Participants will be engaged with an icebreaker, a case study, and an interactive challenge. The outcome of the session will be to learn from others around the world who are considering or have used AI to successfully streamline the process of historical record review. | ||