Tener Wi-Fi universal, 3G o acceso a internet por cable es excelente, pero ¿confiamos demasiado en la conectividad??

¿Qué debe hacer cuando sabe que necesitará obtener información vital en un lugar al que no puede conectarse o si sabe que una conexión inestable lo va a obstaculizar??

La información estará fuera del alcance hasta que pueda regresar a algún lugar con una conexión a internet decente.

La solución podría ser HTTrack. Replica temporalmente todo o parte de un sitio web en su PC para que el contenido esté disponible cuando no haya conexión. También puede reanudar una descarga que se interrumpió previamente por una conexión de Internet dudosa.

Sitio de espejo

El principio que usaremos se llama duplicación, que se reduce a capturar todos los archivos de un sitio web en un solo movimiento. Sin embargo, mientras nos preparamos para atascarnos y descubrir cómo se hace, hay algunas sutilezas sociales que debemos observar..

Antes de comenzar a descargar sitios en serio, piensa en otras personas. Es posible que los sitios web pequeños no utilicen los servicios de alojamiento más robustos, y puede inundar el servidor web bombardeando con solicitudes de información..

Otro problema es que algunos sitios tienen límites de ancho de banda mensuales. Si sus actividades de descarga superan estos límites, el sitio no estará disponible para todos. Por lo tanto, en los casos en que desee descargar el sitio web privado de alguien, primero debe preguntar si está bien..

La otra cosa a tener en cuenta es que, con una gran cantidad de espacio libre en el disco, puede sentirse tentado a descargar muchos sitios en la remota posibilidad de que puedan ser útiles. Intente resistir este impulso, ya que los sitios web grandes pueden tardar un poco en descargarse, comen en el espacio libre en el disco y enlazan el ancho de banda.

Algunos sitios comerciales grandes prohíben que los programas de duplicación accedan a ellos. Si bien pueden detectar sus intentos posteriores de navegación según el contenido de una cookie que se borra fácilmente, si el sitio que desea reflejar requiere que inicie sesión con un nombre de usuario y una contraseña, podría descubrir que su cuenta está prohibida..

Si bien le mostraremos cómo modificar la ID del navegador utilizada por HTTrack para ayudar a solucionar esto, siempre es mejor seguir las reglas y reducir la velocidad a la que HTTrack solicita información..

Con esas condiciones en mente, comencemos.

Seguimiento HT básico

En el momento de escribir este artículo, la versión actual de HTTrack es 3.43-9. Se ejecuta en todas las versiones recientes de Windows, y la página de descargas en el sitio del proyecto también tiene paquetes para una variedad de distribuciones de Linux y Mac OS X.

Para uso de Windows, descargue la versión con un instalador y ejecute el ejecutable. Cuando aparezca el asistente de instalación, haga clic en 'Siguiente'. Acepte el acuerdo de licencia y haga clic en 'Siguiente' nuevamente. Acepte el directorio de instalación y presione 'Siguiente' para aceptar el acceso directo del escritorio antes de presionar 'Siguiente' nuevamente. La página resultante confirma las opciones de instalación que realizó. Haga clic en 'Siguiente' y luego en 'Instalar'.

Una vez completado, haga clic en 'Finalizar' para ejecutar HTTrack. Cuando aparezca el programa, seleccione su idioma predeterminado y haga clic en "Aceptar". Aparecerá un asistente. Esto lo guiará a través del proceso de creación de un nuevo proyecto, en el que descargará un sitio web..

Al igual que con prácticamente todos los asistentes, este proceso comienza presionando 'Siguiente'. Ingrese un nombre para su proyecto y una categoría. Más adelante, las categorías anteriores estarán disponibles en el menú desplegable asociado. Haga clic en Siguiente para continuar.

Ahora seleccione una acción a realizar con respecto a la URL asegurándose de que el menú desplegable Acción esté configurado en 'Descargar sitio (s) web'. Elija el sitio Haga clic en 'Agregar URL' y aparecerá un cuadro de entrada. Ingrese la URL del sitio web que desea reflejar (sin 'http: //'). También ingrese el nombre de usuario y la contraseña que usaría normalmente para acceder al sitio, si corresponde.

Puede proporcionar una subpágina para un sitio en lugar de solo el nombre de dominio si solo está interesado en una parte en particular. Esta es también una buena manera de familiarizarse con el funcionamiento de HTTrack sin llenar todo el espacio libre en su disco. Haga clic en 'Siguiente' una vez más.

En el cuadro 'Conexión remota', deje el menú desplegable en 'No usar conexión de acceso remoto'. Esta es una reliquia de los viejos días de acceso telefónico cuando se conectó, descargó información y luego volvió a caer la línea para reducir los costos telefónicos. Ahora haga clic en 'Finalizar' y comenzará el proceso de creación de reflejo..

Dependiendo de la complejidad del sitio web, este proceso puede durar desde menos de un minuto hasta varias horas. Si su conexión falla, o si tiene que cancelar debido a problemas de tiempo o ancho de banda, quedará con un sitio incompleto. Por suerte, HTTrack puede recuperarse de esto. Si cancela una descarga, volverá a la pantalla de bienvenida..

Para reanudar la creación de reflejo, haga clic en 'Siguiente', seleccione el proyecto interrumpido de la lista desplegable y haga clic en 'Siguiente' nuevamente. La siguiente pantalla muestra que HTTrack sabe que se interrumpió la descarga. El selector de acción ahora está configurado como 'Continuar descarga interrumpida'. Haga clic en 'Siguiente' y luego en 'Finalizar'.