¿Hay alguna posibilidad de crear estructuras de datos internamente en un documento PDF?

Iniciado por fileteruso, 28 Marzo 2021, 20:44 PM

0 Miembros y 1 Visitante están viendo este tema.

fileteruso

Estoy haciendo un proyecto y necesito almacenar de manera interna en un documento PDF pequeños datasets que luego puedan ser extraídos. Estos datos pueden ser de tipo entero, real, booleano y cadenas de texto. A nivel de guardado creo que PDF trae de manera básica arrays donde podría almacenar esos datos, pero me surgen dudas respecto a la extracción, sobre todo en cuanto a la identificación de esos datos.

¡Si alguien tiene alguna idea estaría muy agradecido de que la compartiera!

ACTUALIZACIÓN (07/04):
He visto que existen ciertos objetos internos en PDF que se llaman diccionarios y que a su vez podrían contener otros objetos de tipo array que pueden servir para mi propósito. El problema que tengo ahora es todo el tema de identificación del objeto, tanto al guardar como al extraer.

ACTUALIZACIÓN (16/04):
Finalmente he visto que es posible usar la librería iText para Java que permite manipular documentos PDF. Estoy guardando datos en el objeto PDF Catalog que viene de manera predeterminada en todos los documentos PDF para evitar problemas de identificación ya que mediante el uso de iText el acceso y modificación de este objeto PDF Catalog es trivial.


fileteruso

Ya le estuve echando un ojo, el problema que trae es que, aparte de ser muy extensa, viene cuál es la estructura interna de un documento PDF pero no cómo manipular esa estructura. Finalmente, como he puesto en la última actualización del hilo, me he decantado por usar la librería iText para Java para hacerlo.

Cita de: marax en  8 Abril 2021, 18:25 PM
Si te gusta la manera exhaustiva... Leyendo esto puedes hacer eso y mucho mas

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf