Portal oficial del Gobierno de Puerto Rico. 
Un sitio web oficial .pr.gov pertenece a una organización oficial del Gobierno de Puerto Rico.
Los sitios web seguros .pr.gov usan HTTPS, lo que significa que usted se conectó de forma segura a un sitio web.

Proyecto de Digitalización

Archivo General de Puerto Rico (AGPR) ha invertido en la adquisición de nuevas tecnologías para la digitalización gradual de sus recursos, no solo con miras a preservar los objetos históricos, sino también para facilitar su acceso y ampliar los servicios a la comunidad. Gracias al apoyo de la Fundación Andrew W. Mellon y sus iniciativas presidenciales, en julio de 2020 iniciamos un amplio proyecto institucional que atiende desde la preservación física hasta la preservación digital de nuestras colecciones. Utilizamos tecnologías diseñadas para trabajar de forma segura con el patrimonio cultural y llevando a cabo las distintas fases según guías y estándares internacionales. El proyecto, a su vez, facilitó la adquisición de servidores y el desarrollo de una plataforma de acceso que permitirá a nuestras comunidades disfrutar de nuestras valiosas colecciones.

¿Qué hace diferente nuestro enfoque?
En la actualidad, se emplean dos enfoques comunes en proyectos de digitalización. El primero se centra en proporcionar acceso a recursos, mientras que el segundo prioriza la preservación digital. Si bien nuestra orientación se fundamenta en la preservación digital, en ocasiones hemos adoptado el enfoque de acceso, según los recursos disponibles en determinadas iniciativas. El enfoque centrado en la preservación digital no se limita simplemente a la captura digital de objetos analógicos. El producto digital resultante cumple con especificaciones que, según las proyecciones tecnológicas actuales, asegurarán su uso y reproducción en la próxima década.

Además, este producto digital ofrece una experiencia similar a la manipulación de objetos o materiales históricos en persona, lo que resulta crucial para satisfacer nuestra meta de preservar el patrimonio documental para las generaciones actuales y futuras. Este enfoque también ayuda a minimizar la manipulación excesiva, especialmente de objetos que han estado fuera de consulta debido a su delicada conservación. Pero, el mismo requiere una inversión económica continua de diversos recursos para llevar a cabo las tareas esenciales dentro del flujo de trabajo. Gracias al apoyo de la Fundación Andrew W. Mellon y otras oportunidades de financiamiento externo, hemos podido llevar a cabo nuestro proyecto de preservación digital. A continuación, se detallan los procesos necesarios para hacer realidad el mismo.

Etapas

Aunque cada colección y objeto tiene sus particularidades, hemos establecido un flujo de trabajo con el fin de sistematizar y mejorar nuestros protocolos de digitalización. Cada etapa implica tareas específicas que contribuyen al objetivo principal: preservar nuestras colecciones tanto en su formato físico como digital, y asegurar su disponibilidad para su consulta. Las etapas que seguimos son las siguientes: selección y rastreo, preservación, conservación, digitalización, control de calidad, metadatos, acceso y preservación digital.

Selección y Rastreo

Esta etapa inicial es tan fundamental como desafiante. Su objetivo es equilibrar el acceso tanto a los recursos en deterioro (fuera de consulta o delicados), con un alto potencial de uso debido a su contenido, como a los recursos que son ampliamente consultados por la comunidad y se encuentran en mejores condiciones. Conseguir este equilibrio requiere: analizar el estado de conservación de cada recurso, gestionar las tareas necesarias para su preparación, proponer instrucciones específicas para su digitalización (captura) y su procesamiento. Como parte de las estrategias de preservación digital, asignamos un código único que permite identificar el objeto a lo largo de la cadena de trabajo.

Dada la complejidad de cada etapa y para asegurar que ningún objeto se pierda en el proceso, hemos diseñado una hoja de rastreo. En ella se documenta la ubicación del objeto, la etapa en la que se encuentra y los metadatos técnicos, administrativos y de preservación que serán útiles para comprender en el futuro qué intervenciones observó el recurso y cómo se realizaron. Contamos con una aplicación web, en calidad de prototipo, que ha facilitado la implementación del proceso de rastreo de forma automatizada. Aspiramos a implementar su uso a largo plazo en los proyectos de digitalización del AGPR. Para más información sobre este prototipo, véase el artículo: “How It All Came Together: Building a Local App to Keep Track of the Digitization Workflow”, disponible como parte de las actas de la conferencia Archiving, celebrada en 2023: https://doi.org/10.2352/issn.2168-3204.2023.20.1.12

Preservación

La fase de preservación es crucial para asegurar que el resto del flujo de trabajo se desarrolle sin problemas. Consta de varias tareas importantes. Lo primero que se verifica es que los objetos hayan sido previamente procesados, es decir, organizados y con un inventario mínimo. Luego, se revisa que el orden de los materiales sea el correcto en comparación con su inventario, ya que, al ser materiales en consulta, podría haberse alterado.

Una vez que los materiales están en orden, se procede a realizar una limpieza superficial en seco. Es posible que esta tarea ya se haya realizado durante el proceso de preparación, pero dado que los objetos siempre liberan partículas, es importante repetirla justo antes de la digitalización. Utilizando brochas de cerdas suaves y goma de borrar, se elimina cualquier acumulación de polvo o suciedad. También, en caso de que haya presencia de hongos, se eliminan las esporas es una cabina de bioseguridad.

Para los documentos cosidos o sujetos con grapas o presillas, en esta fase se procede a retirarlos con mucha delicadeza, utilizando herramientas adecuadas como micro espátulas. Esta remoción facilita una digitalización segura y que todo el contenido sea visible sin obstáculos. Después de asegurarse de que los materiales estén en orden, se revisa si necesitan ser foliados. Esta tarea consiste en asignar un número a cada página para mantener el orden y verificar que todas hayan sido capturadas.

Finalmente, se revisan los contenedores y, si es necesario, se reemplazan por unos de calidad archivística, libres de ácido y otras impurezas. En esta etapa, se decide si alguno de los materiales necesita ir al taller de cconservación para su estabilización. De no ser así, están listos para entrar directamente al flujo de trabajo para su digitalización.

Conservación

En la etapa de conservación solo se procesan objetos que necesitan estabilización. Estos son aquellos que, debido a sus condiciones delicadas, requieren tratamientos para asegurar su manipulación y almacenamiento de forma segura. Muchos de los daños observados en documentos de papel están relacionados con plagas, dobleces u ondulaciones, oxidación de tintas ferrogálicas o deterioro natural debido a su naturaleza orgánica. Cada objeto es evaluado por un especialista en conservación para diseñar el tratamiento adecuado según el daño. Los tratamientos comunes incluyen lavado y de acidificación, remoción de adhesivos, encapsulación para crear soporte adicional, y reparaciones utilizando papel japonés y metilcelulosa. También se aplanan documentos con dobleces u ondulaciones. Para más información sobre tratamientos de conservación, véase la exhibición virtual "Actas del Cabildo de la Ciudad de San Juan Bautista, 1722-1730" en este enlace: https://ca.icp.pr.gov/omeka/s/ExhibicionesAGPR/page/ActaCabildo-1.

En el caso de negativos o fotografías, pueden presentar soportes rígidos y quebradizos, emulsión craquelada, encogimiento u ondulaciones, lo que requiere un tratamiento diferente. La limpieza se realiza utilizando un blower manual para retirar el polvo superficial, y en casos de suciedad adherida, se utilizan paños sin pelusa con una solución de alcohol. Una vez preparados, los materiales ingresan al flujo de trabajo para digitalización.

Digitalización

En esta fase, se evalúa el tamaño de los materiales para establecer cual de los equipos de digitalización es el adecuado. En el AGPR, gracias a la iniciativa Mellon, se adquirieron dos sistemas de reprografía (a base de cámara) elaborados por la compañía Digital Transitions: los sistemas son el DT Atom y el DT Titan. Ambos cuentan con cámaras Phase One, el programa CaptureOne y monitores Eizo calibrados. Para garantizar la preservación digital, nos basamos en la siguiente guía: “Technical Guidelines for Digitizing Cultural Heritage Materials. Creation of Raster Image Files”, elaborada por el Grupo de Trabajo de Imágenes Fijas de la Iniciativa de Directrices Digitales de Agencias Federales (FADGI). Estas directrices establecen las mejores prácticas para la digitalización de patrimonio cultural. En el AGPR, utilizamos además, herramientas como el programa Golden Thread y el objetivo FADGI 19264, ambos desarrollados por el Image Science Associates (ISA), para evaluar el cumplimiento con las guías.

Una vez se determina cuál sistema de digitalización se utilizará para manejar cada recurso, se procede con su ubicación en los módulos correspondientes, los cuales facilitan la captura segura según las necesidades de preservación de cada objeto. Por ejemplo, un encuadernado que necesita soporte en la espina y el lomo, para evitar daños, requiere un módulo que permita su captura a noventa grados. Una fotografía ondulada requiere un módulo que le provea soporte en todo el borde para mantenerla en su lugar sin dañar la emulsión. Un documento en buenas condiciones podría requerir un soporte leve en las esquinas utilizando pesas, tiras de poliéster o algodón. Un negativo requiere un módulo con luz inferior para capturar la imagen. En esta fase, contamos siempre con el apoyo de especialistas en conservación para ofrecer recomendaciones y asegurar la captura segura de cada objeto.

Antes de iniciar los trabajos, se procede con la calibración del equipo utilizando herramientas para corroborar el cumplimiento con FADGI y crear el archivo de preservación. Nuestro objetivo es alcanzar el estándar de tres estrellas, permitiendo que la captura sea versátil para múltiples usos. Desde el programa de captura, se crean sesiones con instrucciones, perfil de color y los nombres correspondientes a los archivos digitales. Es nuestra práctica capturar la totalidad de cada objeto, incluyendo portadas de encuadernados y cartapacios para documentos sueltos. Mientras se realiza la digitalización, se hace una primera evaluación de calidad para asegurar que el objeto esté enfocado y que todas las páginas estén incluidas. Una vez capturado en su totalidad, pasa a la fase de control de calidad y post procesamiento.

Control de Calidad

Esta fase comienza con una inspección visual de los materiales digitalizados en comparación con el objeto físico. Se observa el color y las características del recurso y se corrobora que la imagen digital sea lo más parecida posible al objeto original. Se confirma que la imagen tenga un nivel adecuado de exposición, que esté enfocada y derecha, y que no tenga elementos extraños como polvo, cabellos o fibras de textiles. Además, se verifica que cumpla con las especificaciones de FADGI en términos de resolución, color y formato de preservación, y que tenga los metadatos debidamente integrados. Si se necesita una recaptura, el objeto regresa a la fase de digitalización con las instrucciones correspondientes. Si pasa la inspección visual, se procede con el postprocesamiento, sin realizar correcciones de color, estéticas o de imperfecciones, procurando que la representación del objeto sea lo más realista posible.

En cuanto a los derivados, se produce un archivo de preservación en formato TIFF, un archivo intermedio en JPEG y un archivo de acceso en PDF. Si el documento es textual y puede aplicarse el reconocimiento de caracteres (OCR), se realiza utilizando la aplicación de código abierto Tesseract.

Durante esta fase, también se corrobora que todos los metadatos técnicos, administrativos y de preservación se hayan capturado en la hoja de rastreo y que la documentación relacionada con el cumplimiento con FADGI se encuentre en las carpetas correspondientes.

Metadatos

La penúltima fase del flujo de trabajo es la preparación de los metadatos. Esta etapa requiere compilar la información de cada objeto digital para facilitar su recuperación. Exceptuando los audios, fotografías y audiovisuales, los documentos no se describen a nivel de objeto, solo se realiza un inventario hasta el nivel de serie y, de requerirse, se prepara un inventario básico por cartapacio.

Utilizando el esquema de metadatos Dublin Core (DC), se compila información específica para recuperar el contenido digital de documentos textuales e imágenes. El esquema de metadatos PBCore se utiliza para registrar los campos adicionales para los archivos audiovisuales y de audio. Además, se añaden campos locales necesarios, que pueden se diferencian de los otros dos esquemas para facilitar separalos en caso de participar en proyectos de agregación de datos.  

Para compilar la información, se diseñó una hoja de datos con campos de texto libre y campos de contenido estandarizado. Además, se diseñó una guía de aplicación del esquema para proyectos internos del AGPR de DC, y pronto se culminará la guía de implementación del esquema de metadatos PBCore. En esta fase también se hace una revisión de contenido o elaboración de guías descriptivas, las cuales proveen información contextual de los objetos digitales y los ubican en tiempo, espacio y relación con otros materiales. El contenido de las guías sigue las directrices del manual: "Describing Archives: A Content Standard (DACS)", desarrollado por el Society of American Archivists y modelado según la Norma Internacional General de Descripción, mejor conocida como ISAD(G), según sus siglas en inglés.

Una vez listas las guías descriptivas y completados los metadatos, se preparan los sets de datos para su importación al repositorio digital y al servidor de resguardo. Este set de datos se compone de la hoja de datos y de una carpeta con todos los archivos digitales correspondientes.

Preparación y digitalización de audiovisuales

La conservación y digitalización de formatos fílmicos y videos análogos implican varios pasos detallados para asegurar su preservación y acceso. El proceso de digitalización desde una perspectiva de la preservación digital de recursos audiovisuales ha sido uno de los más retantes y ambiciosas debido a la vulnerabilidad típica de los materiales originales, la complejidad de los formatos, la meticulosidad requerida en la captura de imágenes y la cantidad de recursos de almacenamiento necesarios para culminar debidamente el proceso de digitalización de este tipo de recursos. En esta fase nos hemos enfocado en trabajar con fílmicos de 16mm y 35mm y videos en formato VHS.

El procesamiento de los fílmicos requiere una inspección del material para identificar el elemento adecuado y corroborar si es necesaria su reparación. Luego, la película se limpia con una solución de alcohol y una bayeta que no libere particulado, se rebobina y se cambian las latas de metal y núcleos a materiales de preservación. Para la digitalización, se utiliza el equipo Blackmagic Cintel 2 y el programa Davinci Resolve. La primera tarea requiere la calibración del escáner y colocar la película en el riel correspondiente. Durante el proceso de captura se digitaliza fotograma por fotograma, lo que puede implicar horas de trabajo visual para asegurar que el contenido se hace correctamente. Para asegurar la versatilidad de la digitalización se exportan cuatro tipos de archivos digitales: uno de preservación (DPX), uno intermedio (QuickTime ProRess 422 HQ), uno de referencia (MP4) y uno de acceso web (320 x 240 MP4). Por su parte, para los videos análogos, durante el proceso de selección se evalúa el estado de la cinta y se limpia ya sea manualmente o utilizando un equipo especializado y se realmacenan en cajas libres de ácido. Para la digitalización se utiliza un VHS player para reproducir el video y se captura utilizando una tarjeta BlackMagic junto al programa Media Express. En este caso se exportan tres tipos de archivos digitales: uno de preservación (QuickTime sin compresión, 10 bit, 422 YUV y el audio a 48khz/24bit PCM), uno intermedio (QuickTime sin compresión, 8 bit, 422 YUV y el audio a 48kHz/16bit PCM) y uno de acceso web (MP4 H.264, 720 x 480 y el audio a 44kHz, 16 bit AAC).

Acceso y Preservación Digital

Para asegurar el acceso final a los contenidos digitales, utilizamos la plataforma de código abierto Collective Access. Se diseñó un portal sencillo y fácil de navegar, que permite búsquedas por texto y búsquedas facetadas según filtros de tipo, fechas, idiomas, materias, etc. Además, la calidad de imagen permite acercar los objetos para una mejor visibilidad del contenido.

Para ejecutar el proceso de importación, primero se sube la hoja de datos. Una vez publicados los datos, se procede a la importación de los archivos digitales, en conjuntos que no ocupen más de 1 GB de memoria para asegurar un procesamiento sin inconvenientes. Collective Access convierte los archivos PDF a JPGs y realiza la indexación de los archivos con reconocimiento de carácteres. Una vez finalizado el procesamiento, se publican automáticamente para el uso de la comunidad.

Finalmente, todos los archivos digitales pasan por un último proceso de evaluación para preparar los paquetes de importación que irán al servidor de resguardo. Durante este proceso, se hace una copia en cintas LTO que se almacenan en una bóveda fuera del AGPR.

Equipo de Trabajo

La labor descrita en cada fase de trabajo ha requerido múltiples recursos, especialmente humanos, cuyo compromiso y dedicación han sido fundamentales para la realización de este gran proyecto en continuo desarrollo. A continuación, y como muestra de agradecimiento, destacamos el trabajo de todas las personas que han colaborado durante los últimos años para que hoy podamos disfrutar de las Colecciones Digitales del AGPR.

Administración
Carlos Ruiz Cortés
Director Ejecutivo del ICP
Hilda T. Ayala González
Archivera General
Archivo General de Puerto Rico
Adalberto Rodríguez
Servicios Generales
Carlos Ribot
Servicios Generales
Daniel Encarnación
Auxiliar en Sistemas de Oficina
Edgardo Morales
Oficial Administrativo
Guillermo Duriex
Servicios Generales
Ivette Santana (Retirada)
Jaime Danois
Custodio
José Charón Rivera
Archivero
Juan Carlos Román
Archivero
Leida Santiago
Especialista en Asuntos Culturales
Marcos Nieves
Archivero
Marisel Flores
Archivera
María I. Rodríguez
Archivera
Natanael Álvarez
Servicios Generales
Orlando Abreu
Archivero
Pedro J. Roig
Archivero
Ángel Negrón
Custodio
Iniciativa Mellon y Aliados (activos y pasados integrantes)
AVP
Preservación Digital
Alberto A. Sánchez
Digitalización
Alberto Toro
Voluntario - procesamiento
Alfredo J. López Nieves
Digitalización de audiovisuales
Almairy Morales
Voluntaria - procesamiento
Angel A. Espinosa
Digitalización de audiovisuales
Annie Y. Saldana
Digitalización
Carline Gutierrez
Preservación y conservación
Carmen E. González
Voluntaria - procesamiento
Chris Gregory Rivera
Voluntario - digitalización
Dr. Arnaldo I. Ramos
Infraestructura tecnologica
Emely Torres
Digitalización/ Líder de digitalización
Erika Rodríguez
Voluntaria – digitalización
Franchesca Ortiz
Preservación
Isabel Rosa
Redacción de propuestas
Isabelle Ramos
Metadatos
Ivan David Nieves
Digitalización de audiovisuales
Jean Bonilla
Digitalización y Control de calidad
Jessica Rivera Batiz
Metadatos
Jose Marti
Preservación y conservación
José Julio Jorge Gerena
Rastreo
Karen Net
Digitalización y Control de calidad
Kevin Mejías
Rastreo/Gerente de proyecto
Kiomarie Zapata
Preservación
Lic. Enrique Castellanos
Derechos de autoría
Loraine Rosado
Procesamiento
Maria Hidalgo
Voluntaria - procesamiento
Maria de Lourdes Rodriguez
Preservación y conservación
Maricelis Nogueras
Edición
Miriam Centeno
Líder de preservación
Natalia Hernández
Gerente de proyecto/Evaluación
Natalia Rivera
Apoyo administrativo
Natalia de la Rosa
Control de calidad
Odalis Gómez
Control de calidad
Paulo Rodríguez
Digitalización y Control de calidad
Roberto C. Rivera
Programación
Roberto G. Rivera
Voluntario - digitalización
Rosa M. Santos
Voluntaria - procesamiento
Rosadel Santos
Metadatos
Sabine Ojeda
Preservación
Sabrina Huertas
Rastreo
Sahir Santiago
Digitalización y Control de calidad
Sara Santos
Digitalización y Control de calidad
Sofia Feliciano
Preservación
Victor Ramirez
Programación
Viviana Van Vliet
Conservadora
Yanira Del Toro Rivera
Metadatos
Yvonne Santiago
Control de calidad
Zayra J. Maldonado
Preservación
Colaboradores
Alberto Pomales
enlace PRITS
Ben Cort y Joseph King
Técnicos de Digital Transitions
Don Williams
Image Science Associates
ImageMuse
Jean Carlos Hurtado
Antiguo OPI
Julie Sara and Kendall
National Geographic
Kristin Phelps
Biblioteca del Congreso
Martina Hoffmann
Especialista en control de calidad
PRITS
Puerto Rico Innovation & Technology Service
Tom Rieger
Biblioteca del Congreso