Skip to content

Convetir un sitio web a pdf en Ubuntu

febrero 26, 2011

Llevo una temporada persiguiendo la idea de aprender Vala. ¿Porque? Pues la verdad es que a pesar de que me gusta Python, quiero algo más rápido y que consuma menos recursos. Así que he pensado en hacer algunas pruebas y ver como se comporta Vala. Todo ello junto a mi carácter procrastinador, hacen fácilmente comprensible mi actuación.

Lo primero y necesario era localizar un manual y un libro de referencia de Vala. La primera referencia la encontré, evidentemente en ladocumentación de Vala. Ahora bien, tengo que reconocer que me gusta tener la documentación impresa, ya se que esto ni es ecológico ni tecnológico, pero cuando se trata de documentación de uso constante, es necesario disponer de ella.

Así que no corto ni perezoso, me he dirigido a Google en busca de una solución, y tras un buen rato de busqueda, la desesperación se ha cebado en mi. Si que he localizado aplicaciones como wkhtmltopdf, sin embargo hace uso de librería qt, y a mi no me gusta mezclar las churras con las merinas.

Lo siguiente ha sido recurrir al TODOPODEROSO terminal. Ya se que para los que comienzan, se les hace bastante cuesta arriba, pero cuando lo conoces te das cuenta de su potencial y todo lo que puedes hacer con el. Primero he pensado en descargar la página al sitio, utilizando wget. Pero luego, ¿como convertirla en pdf?. Pues la solución la he encontrado en html2ps, que se encarga de hacer toda la operación.

Html2ps es un convertidor, implementado en perl, de html a postscript. Algunas de las características de esta aplicación:

  • Permite configurar la apariencia del postscript generado, utilizando para ello archivos de configuración.
  • Soporte para proceso de multiples documentos.
  • Soporte para conversión recursiva a partir de enlaces.
  • Permite generar una tabla de contenidos.
  • Tanto el encabezado como el pie de página son configurables (número de página, título, nombre del documento)
  • Si una vez convertido el archivo html a postscript, lo convertimos a pdf, se mantienen los enlaces en el documento pdf. Esto es verdaderamente interesante, porque si tienes el documento en tu equipo, y quieres consultar cualquier parte del mismo, puedes acceder a ella rápidamente.

En fin, como ves es una herramienta verdaderamente potente y con grandes posibilidades. Instalación y uso:

 

Instalación

html2ps se encuentra en los repositorios de Ubuntu, con lo que su instalación es realmente sencilla, simplemente recurrir al terminal y:

1
sudo apt-get install html2ps

Uso

La siguiente operación ha sido leer un poco sobre el uso de la herramienta y localizar donde se hace la operación para convertir incluidos los enlaces:

1
html2ps -W a http://www.vala-project.org/doc/vala/ > file.ps

Aquí es donde se encuentra el truco del asunto: “-W a”. Esta opción se encargar de procesar una web y obtener y procesarla recursivamente. Hay que tener un poco de cuidado a la hora de procesar la página, porque se puede convertir en un documento monstruoso:

Las opciones son las siguientes:

  • “-W a” sigue todos los enlaces
  • “-W b” sigue los enlaces que están en el mismo documento
  • “-W l” sigue los enlaces especificados con “<LINK rel=NEXT>”
  • “-W p” pregunta por cada documento remoto.
  • “-W r” solo sigue enlaces relativos
  • “-W s” solo sigue los enlaces en el mismo servidor

En fin como ves las opciones son muchas. Hay que tener cuidado a la hora de procesar, para no llevarnos una desagradable sorpresa.

A pdf

Por último, nos queda pasar a pdf, pero esto ya es muy sencillo:

1
ps2pdf file.ps

Así ya tienes tu manual de Vala. Mira como queda la cosa:

Descargar (PDF, 53.79KB)

 

Anuncios

From → soft

Dejar un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: