Linux - Quick tip - Descargar paginas html como texto
July 4th, 2007Si deseas descargar paginas html, php, htm etc de la red y guardarlas directamente como texto en tu HD tan solo utiliza:
$lynx --dump http://dominio.com/la_pagina_a_descargar.html > texto.dump
ademas estes comando lo puedes utilizar de forma local para convertir algunas paginas que tengas guardadas a texto plano
| #!/bin/sh
| ###### html2txt ######
| lynx -dump $1 > $1.txt
| exit
o Guarda el script como html2txt
o chmod +x html2txt
o Uso html2txt archivo.html
o Archivo salida: archivo.html.txt
Nota: las paginas php se guardan tal y como el navegador las ve no creas que puedes bajar el codigo ![]()





Posted by El techno!


















