El rezago digital de Pemex pone en riesgo décadas de información clave sobre pozos y yacimientos; conoce las cifras, las causas y el plan urgente para salvar estos datos vitales antes de que sea demasiado tarde.
La preservación de los datos históricos de Petróleos Mexicanos (Pemex) atraviesa una crisis silenciosa pero crítica. Décadas de información sobre pozos, yacimientos, sísmica y operaciones yacen en papel o en formatos digitales obsoletos, dificultando su uso y poniendo en riesgo su conservación. Según datos oficiales, aproximadamente 68 % de la información histórica de Pemex sigue sin digitalizarse o en formatos obsoletos. Esto significa que solo cerca de un tercio del acervo está disponible en sistemas modernos para consulta y análisis.
En las siguientes secciones se analizan a fondo las implicaciones técnicas y económicas de este rezago, se revisan casos emblemáticos (como el intento fallido de digitalizar el archivo de Cantarell entre 2019 y 2022) e incluyen estadísticas recientes sobre el estado del archivo físico y digital de Pemex. También se exploran estándares internacionales (por ejemplo, OSDU) y experiencias de otros países (Brasil y Noruega) para extraer lecciones, además de proponer un plan estratégico viable con acciones concretas y un cronograma para resolver esta problemática.
Pemex acumula más de ocho décadas de datos petroleros—registros de perforación de pozos, perfiles geofísicos, reportes de producción y reservas. Gran parte de este acervo se generó antes de la era digital y, aunque la compañía ha intentado modernizar sus archivos, los avances han sido limitados. De acuerdo con la CNH, 68 % de la información histórica de Pemex permanece en formatos físicos u obsoletos: documentos en papel, microfilmes, cintas magnéticas y archivos electrónicos antiguos que ya no cuentan con software o hardware disponible.
En contraste, solo 32 % del acervo histórico se encuentra digitalizado. Esta minoría corresponde principalmente a datos más recientes o proyectos puntuales de digitalización, lo que genera un “archivo dual”: enormes bodegas con documentos y cintas antiguas, y bases de datos modernas con información fragmentada. Incluso dentro de los datos digitales hay problemas de accesibilidad; muchos son PDF escaneados sin texto reconocido, lo que impide búsquedas automatizadas.
El riesgo de pérdida de información es elevado. Pemex ha reconocido que la falta de equipo adecuado—por ejemplo, escáneres de gran volumen—pone en peligro la información digital de su Archivo Histórico. Soportes magnéticos de los años setenta y ochenta pueden haberse degradado sin respaldo suficiente. Aun cuando Pemex transfirió 11.5 PB de datos digitales históricos y 9 millones de muestras físicas al CNIH entre 2014 y 2016, gran parte de la información anterior sigue existiendo solo en físico.
Otro reto grave son los silos de datos y la inconsistencia de formatos. Pemex maneja actualmente hasta catorce formatos distintos para datos técnicos, lo que dificulta la integración. Además, eventos como el ciberataque de ransomware de 2019 mostraron vulnerabilidades en la seguridad de la información digital.
En 2019, Pemex lanzó un proyecto para escanear y digitalizar los legajos técnicos de Cantarell—bitácoras de perforación, análisis de núcleos y planos de infraestructura. Para 2022 el avance era mínimo. Fuentes internas y auditorías señalaron:
Ingenieros en Cantarell invierten hasta 70 % de su tiempo recopilando y validando datos manualmente en lugar de analizarlos. Sin una base digital central, la consulta de información clave puede tomar semanas.
La falta de digitalización es un lastre estructural que reduce productividad y eleva costos. Rescatar la información histórica es imprescindible para mejorar eficiencia y rentabilidad.
Noruega estableció en 1995 el repositorio Diskos, obligando a todas las empresas a cargar datos en formatos estándar; hoy almacena unos 8 PB de información accesible. Brasil, a través de Petrobras y el BDEP, digitalizó datos masivos y aplica IA en 34 % de sus campos, logrando eficiencia y reservas adicionales. Un estándar emergente es OSDU (Open Subsurface Data Universe), respaldado por Shell, Chevron y Equinor, que permite unificar datos viejos y nuevos en un entorno abierto y seguro.
Empresas como KIO Networks, Nukk Labs y Google Cloud México ofrecen soluciones de digitalización, IA y nube que podrían acelerar la modernización del archivo Pemex.
La inversión estimada—unos 200 millones de pesos a lo largo de cinco años—equivale a pocos días de operación y puede pagarse con un solo descubrimiento derivado del uso de datos históricos.
Sin datos no hay petróleo. La historia escondida en los archivos de Pemex podría contener la clave para nuevos descubrimientos y mayor eficiencia. Digitalizar y analizar su legado es ineludible si México quiere extraer todo el valor posible. El tiempo apremia: cada año de retraso degrada información, provoca pérdida de talento y desperdicia oportunidades. Las tecnologías, estándares y casos de éxito existen; solo falta que Pemex dé el paso decisivo.
Fuentes: CNH, SENER, Pemex (PADA 2023-2024), ASF, AI Regula Solutions, Reuters, El Economista, entre otros.
Todos los campos son obligatorios *