Pemex al filo del abismo: 68 % de su archivo petrolero sigue atrapado en papel y amenaza futuras reservas

El rezago digital de Pemex pone en riesgo décadas de información clave sobre pozos y yacimientos; conoce las cifras, las causas y el plan urgente para salvar estos datos vitales antes de que sea demasiado tarde.

Pemex al filo del abismo: 68 % de su archivo petrolero sigue atrapado en papel y amenaza futuras reservas

La preservación de los datos históricos de Petróleos Mexicanos (Pemex) atraviesa una crisis silenciosa pero crítica. Décadas de información sobre pozos, yacimientos, sísmica y operaciones yacen en papel o en formatos digitales obsoletos, dificultando su uso y poniendo en riesgo su conservación. Según datos oficiales, aproximadamente 68 % de la información histórica de Pemex sigue sin digitalizarse o en formatos obsoletos. Esto significa que solo cerca de un tercio del acervo está disponible en sistemas modernos para consulta y análisis.

En las siguientes secciones se analizan a fondo las implicaciones técnicas y económicas de este rezago, se revisan casos emblemáticos (como el intento fallido de digitalizar el archivo de Cantarell entre 2019 y 2022) e incluyen estadísticas recientes sobre el estado del archivo físico y digital de Pemex. También se exploran estándares internacionales (por ejemplo, OSDU) y experiencias de otros países (Brasil y Noruega) para extraer lecciones, además de proponer un plan estratégico viable con acciones concretas y un cronograma para resolver esta problemática.

El archivo histórico de Pemex: estado actual y retos

Pemex acumula más de ocho décadas de datos petroleros—registros de perforación de pozos, perfiles geofísicos, reportes de producción y reservas. Gran parte de este acervo se generó antes de la era digital y, aunque la compañía ha intentado modernizar sus archivos, los avances han sido limitados. De acuerdo con la CNH, 68 % de la información histórica de Pemex permanece en formatos físicos u obsoletos: documentos en papel, microfilmes, cintas magnéticas y archivos electrónicos antiguos que ya no cuentan con software o hardware disponible.

En contraste, solo 32 % del acervo histórico se encuentra digitalizado. Esta minoría corresponde principalmente a datos más recientes o proyectos puntuales de digitalización, lo que genera un “archivo dual”: enormes bodegas con documentos y cintas antiguas, y bases de datos modernas con información fragmentada. Incluso dentro de los datos digitales hay problemas de accesibilidad; muchos son PDF escaneados sin texto reconocido, lo que impide búsquedas automatizadas.

El riesgo de pérdida de información es elevado. Pemex ha reconocido que la falta de equipo adecuado—por ejemplo, escáneres de gran volumen—pone en peligro la información digital de su Archivo Histórico. Soportes magnéticos de los años setenta y ochenta pueden haberse degradado sin respaldo suficiente. Aun cuando Pemex transfirió 11.5 PB de datos digitales históricos y 9 millones de muestras físicas al CNIH entre 2014 y 2016, gran parte de la información anterior sigue existiendo solo en físico.

Otro reto grave son los silos de datos y la inconsistencia de formatos. Pemex maneja actualmente hasta catorce formatos distintos para datos técnicos, lo que dificulta la integración. Además, eventos como el ciberataque de ransomware de 2019 mostraron vulnerabilidades en la seguridad de la información digital.

Intento fallido: digitalización de pozos históricos de Cantarell (2019–2022)

En 2019, Pemex lanzó un proyecto para escanear y digitalizar los legajos técnicos de Cantarell—bitácoras de perforación, análisis de núcleos y planos de infraestructura. Para 2022 el avance era mínimo. Fuentes internas y auditorías señalaron:

  • Falta de planificación y continuidad administrativa.
  • Escasez de personal capacitado y problemas con el contratista de escaneo.
  • Limitaciones presupuestales y ausencia de escáneres especializados.
  • Logística compleja: traslado de material desde Campeche a centros con capacidad de digitalización.

Ingenieros en Cantarell invierten hasta 70 % de su tiempo recopilando y validando datos manualmente en lugar de analizarlos. Sin una base digital central, la consulta de información clave puede tomar semanas.

Impacto técnico y económico de la no digitalización

  • Oportunidades de exploración perdidas: reinterpretar sísmica antigua o analizar pozos secos podría revelar yacimientos omitidos, pero los datos siguen en papel.
  • Decisiones operativas subóptimas: la CNH estima que Pemex perfora 22 % más lento y gasta 40 % más en mantenimiento que el estándar internacional debido a ineficiencia de datos.
  • Sanciones y cumplimiento regulatorio: la falta de registros digitales completos ha generado multas (por ejemplo, 24.18 millones de pesos en 2019 por el caso Xanab).
  • Costos laborales y pérdida de talento: técnicos jóvenes se frustran ante un entorno analógico, mientras el conocimiento tácito de expertos jubilados se pierde sin un archivo digital apropiado.

La falta de digitalización es un lastre estructural que reduce productividad y eleva costos. Rescatar la información histórica es imprescindible para mejorar eficiencia y rentabilidad.

Estándares internacionales y experiencias de Brasil y Noruega

Noruega estableció en 1995 el repositorio Diskos, obligando a todas las empresas a cargar datos en formatos estándar; hoy almacena unos 8 PB de información accesible. Brasil, a través de Petrobras y el BDEP, digitalizó datos masivos y aplica IA en 34 % de sus campos, logrando eficiencia y reservas adicionales. Un estándar emergente es OSDU (Open Subsurface Data Universe), respaldado por Shell, Chevron y Equinor, que permite unificar datos viejos y nuevos en un entorno abierto y seguro.

Empresas como KIO Networks, Nukk Labs y Google Cloud México ofrecen soluciones de digitalización, IA y nube que podrían acelerar la modernización del archivo Pemex.

Plan estratégico propuesto: rescate digital de Pemex

  1. Corto plazo (0–12 meses): “Emergencia documental”
    • Inventario crítico y medidas de choque para frenar el deterioro.
    • Compra de escáneres de alto volumen e instalación de estaciones regionales.
    • Backups diarios y refuerzo inmediato de ciberseguridad.
  2. Mediano plazo (1–3 años): “Plataforma unificada Pemex Data”
    • Adopción de una solución SIGA/OSDU para centralizar datos.
    • Digitalización masiva por fases y recuperación de formatos obsoletos.
    • Creación de la Gerencia de Administración de Datos Petroleros y capacitación de 50 especialistas.
  3. Largo plazo (3–5 años): “Explotación y mantenimiento”
    • Políticas born digital para que ningún dato nuevo quede fuera del sistema.
    • Proyectos de analítica de big data y machine learning para extraer valor de los archivos históricos.
    • Difusión parcial de datos, transparencia y presupuesto recurrente para mantener la infraestructura.

La inversión estimada—unos 200 millones de pesos a lo largo de cinco años—equivale a pocos días de operación y puede pagarse con un solo descubrimiento derivado del uso de datos históricos.

Dato final

Sin datos no hay petróleo. La historia escondida en los archivos de Pemex podría contener la clave para nuevos descubrimientos y mayor eficiencia. Digitalizar y analizar su legado es ineludible si México quiere extraer todo el valor posible. El tiempo apremia: cada año de retraso degrada información, provoca pérdida de talento y desperdicia oportunidades. Las tecnologías, estándares y casos de éxito existen; solo falta que Pemex dé el paso decisivo.

Fuentes: CNH, SENER, Pemex (PADA 2023-2024), ASF, AI Regula Solutions, Reuters, El Economista, entre otros.

Compartir Post:

Deja un comentario

Todos los campos son obligatorios *