Trastear con pdfs en Linux
Publicado por jurelillo en Agosto 13, 2009
Circunstancias indirectas aunque no demasiado ajenas me han obligado a bichear dos procedimientos en los que intervenían documentos pdf. Cosas de la e-administración…
El caso es que me encontraba ante la disyuntiva de tener que instalar sw para la edición de documentos escaneados en la máquina virtual de WXP o buscarme la manera desde Linux. Es obvio que ya sabes por qué me terminé decantando.
Googleando -todavía no les he dicho nada a estas criaturas, ni a los bonstruos de yahoo tampoco, sobre lo que pienso de su política en paises como China…me reservo un post más adelante pero ya desde aquí les cubro con toda la mala baba que puedo- conseguí conocer 2 herramientas la mar de útiles: imagemagick y pdftk, ambas para su ejecución en modo consola.
imagemagick es una aplicación que sirve para crear, editar y componer imágenes. Puede además leer, convertir y guardar imágenes en una gran variedad de formatos, y esto último es lo que me interesaba. Pero es mucho más que eso, pues es capaz de crear, editar, componer y transformar archivos de mapas de bits. Además, proporciona APIs para la mayoría de los lenguajes de programación más usuales. Se puede ver más info aquí
Dado que se encuentra en el repositorio de Ubuntu, para los usuarios de ese sabor de Linux es aún más sencillo: tan solo hay que descargarlo además de GhostScript:
sudo apt-get install imagemagick gs
Para poder convertir un jpg en pdf, an sólo hay que ejecutar:
convert miImagen.jpg miPdf.pdf /* No es mu complicao, verdad?*/
Repito: imagemagick es muucho más que esto, y hay que bichearlo con detenimiento, pero quédate en la cabeza la asociación de modificación de una o varias imágenes con este set de herramientas. Puedes ver ejemplos aquí.
La otra herramienta, pdftk -también disponible en el Canonical de Ubuntu- es muy sencilla de utilizar:
pdftk pdf1.pdf pdf2.pdf pdf3.pdf…pdfN.pdf output pdfSalida.pdf
Crea un nuevo pdf a partir de la secuencia de parámetros de entrada, pero cosa curiosa: si somos cuidadosos y nombramos a nuestros pds de origen de manera secuencial, se puede emplear una variante que el comando reconoce y produce una salida ordenada. Suponiendo los nombres de los pdfs de entrada de antes:
senegalensis:~$ cd carpetaConLosPdfs
senegalensis:~/carpetaConLosPdfs$ pdftk *.pdf output pdfSalida.pdf
La salida es un pdf construido según el sufijo ordinal de los pdfs de la carpeta en cuestión.
Saludos calamares.



Pablo escribió
La verdad es que están muy bien, a mi me han sacado de un apuro varias veces. Es increible que en muchas ocasiones herramientas de comandos realizan tareas de una forma tan sencilla y elegante, tareas que hoy día la mayoría tenemos asociadas a grandes herramientas de diseño. En este caso herramientas como el Adobe Distiller etc..