La mejor herramienta de compresión de Linux 8 utilidades probadas
NoticiasEn los años 80 y principios de los 90, la compresión era el rey. Mientras luchaba por conectarse a un BBS (sistema de tablón de anuncios) con las últimas utilidades de Amiga, soñaba con que las cosas serían más rápidas y no tendría que gastar tanto tiempo en descomprimir los archivos para descargarlos..
Avancemos unas décadas y el tamaño de los archivos de datos con los que trabajamos es bastante impresionante. Muchos han construido en algún tipo de compresión. El ancho de banda ya no es un problema de este tipo, y en algunos aspectos tampoco lo es el espacio en disco, pero aún así sería bueno si hubiera una forma rápida y conveniente de recuperar algunos GB aquí o allá, o no tener que esperar tanto tiempo cuando subir archivos adjuntos de correo electrónico.
Mientras tanto, las tecnologías de compresión han avanzado, pero tal vez no tanto como se podría esperar, porque estamos luchando contra una curva exponencial de hasta qué punto se pueden compactar las cosas. Muchos formatos de datos son casi incompresibles, porque ya han eliminado las redundancias.
Sin embargo, hay algunas herramientas disponibles que aprovechan nuestras CPU ultrarrápidas y reservas de memoria gigantescas para probar algunos nuevos trucos. En esta prueba, veremos una selección de herramientas antiguas y nuevas disponibles actualmente.
Algunos no reciben una revisión, pero están incluidos en nuestros datos tabulados, que encontrará aquí en forma recortada y en una versión completa de en línea: gzip está ahí para fines comparativos, por ejemplo..
Nuestra seleccion
bzip2
rar
7zip
lbzip2
xz
lrzip
PeaZip
arj
RAR 4.00 beta
Lanzado originalmente en 1993, el formato RAR ha pasado por varias revisiones y ajustes mientras tanto. El autor original, Eugene Roshal, otorgó la licencia del software a una compañía de software alemana que ahora produce la variante WinRAR y las opciones de línea de comando para plataformas que no son Windows.
En el lado de la descompresión, RAR admite una gran cantidad de formatos, incluidos los inusuales, como los archivos ISO y los archivos CAB. El formato es mucho más popular en la plataforma Windows, y generalmente se usa para dividir archivos grandes en fragmentos utilizables. Esto lo hace popular para publicar archivos grandes en grupos de usenet, y la utilidad WinRAR para Windows está muy bien utilizada..
La generación de archivos de paridad y volumen junto con los fragmentos facilita la corrección de errores menores de transmisión y se asegura de tener una copia perfecta de lo que se envió. Sin embargo, en los sistemas Unix, el formato RAR nativo es prácticamente inexistente.
En términos de rendimiento, lo hace mejor de lo esperado. Aunque es más lento que la mayoría de las herramientas en prueba, en realidad administra algunos ahorros de espacio razonables en los diferentes tipos de archivos. Los algoritmos de compresión generalmente se centran en algún tipo de datos en particular, y es posible que se registren mejores ahorros de espacio mediante la prueba de los tipos de archivos que generalmente se encuentran en un sistema Windows..
No estaba particularmente preocupado por los archivos de imagen prácticamente incompresibles, y funcionó razonablemente bien con imágenes de disco grandes y la selección genérica del sistema de archivos..
Sin embargo, como una herramienta patentada de línea de comandos para Linux, sus usos son limitados y probablemente se guardan mejor para las ocasiones en que se requiere la interoperabilidad con las plataformas Windows.
Veredicto
RAR
Versión: 4.00 beta
Web: www.rarlab.com
Precio: 29 euros
Al igual que con ARJ, solo es realmente útil para intercambiar archivos con usuarios de Windows..
Clasificación: 5/10
Bzip2
Julian Seward lanzó el bzip2 original en 1997 bajo una licencia BSD. En caso de que se esté preguntando, hubo un bzip antes de eso, pero el autor lo retiró después de que surgieran posibles preocupaciones de patentes amenazadoras (ah, patentes de software, ¿no las amamos a todas?).
Sin embargo, no se preocupe, porque bzip2 es mejor que eso de todos modos. Usando una combinación de diferentes algoritmos, como la codificación de longitud de ejecución (RLE), la transformada Burrows-Wheeler y otros trucos astutos, inmediatamente se hizo notable en los círculos de Unix debido a la impresionante compresión lograda en comparación con la utilidad estándar del día. gzip.
Codificado de forma astuta para ser casi idéntico en términos de uso, bzip2 pronto se convirtió en un sustituto para todos los tipos de archivos. En particular, se envió mucho código fuente usando una combinación tar / bzip2 en lugar de la combinación usual tar / gzip de la época.
Es un tanto decepcionante que en los 14 años intermedios, más o menos, bzip2 no haya reemplazado por completo a gzip. Cambiar los hábitos de los usuarios de Unix es obviamente como tratar de dirigir una plataforma continental particularmente gorda o algo así..
Sin embargo, para grandes volúmenes de archivo, parece que la compensación entre el ahorro de espacio y el tiempo de cómputo no siempre vale la pena. Las cifras que generamos para la Prueba 3 muestran que bzip2 ejecutándose en la compresión máxima reduce un poco el tamaño del archivo, pero a expensas de tomar unas cuatro veces más..
Entonces, si la velocidad es de suma importancia para usted, gzip sigue siendo una mejor opción ... Esperen, antes de que digamos eso, deben revisar la revisión de lbzip2.
Veredicto
bzip2
Versión: 1.0.6
Web: http://bzip.org
Precio: Libre (GPL)
Es rápido y ampliamente utilizado, pero cambia a lbzip2 para aumentar la velocidad.
Clasificación: 5/10
lbzip2
Este es un contendiente intrigante para la era moderna. Usando subprocesos POSIX, esta herramienta paraleliza las rutinas de compresión para que puedan ejecutarse en más de un proceso y luego combinarse. Nos preocupa esto porque muchas máquinas ahora tienen un procesador multi-core.
El bzip estándar y, de hecho, muchas de las otras herramientas en prueba solo son capaces de ejecutarse en un solo hilo. Eso significa que si tiene un procesador de doble núcleo, como el que usamos para las pruebas, solo se está utilizando uno para el trabajo duro de comprimir, mientras que otros están inactivos. Por supuesto, los otros núcleos pueden hacerse cargo de la sobrecarga del sistema, pero es un desperdicio.
La paralelización de la tarea incluye un poco de sobrecarga en términos de tiempo de procesador, porque tiene que haber un componente "despachador" que asigna tareas a los subprocesos y combina sus resultados al final. Aun así, en una máquina de doble núcleo debería ver una reducción en el tiempo que toma alrededor del 40%, dependiendo de la tarea real.
Esto se confirma por nuestros resultados: con la misma configuración, el tiempo tomado por lbzip es entre 35 y 45% más rápido. Lo importante es que, en general, es el mismo proceso, y debería terminar con casi exactamente los mismos archivos. Sin embargo, en nuestras pruebas, los tamaños de archivo resultantes estaban a unos pocos bytes de distancia en cualquier dirección, lo que puede deberse simplemente a una aplicación ligeramente diferente de los algoritmos.
Es importante destacar que los archivos creados con lbzip2 son archivos bzip2 válidos; el formato no ha cambiado, por lo que pueden ser distribuidos y descomprimidos por aquellos que usan bzip2. Lbzip2 está disponible en algunos repositorios, y algunos trimestres sugieren que solo debe tener un alias a los comandos bzip2 estándar, no existe una desventaja real, ni siquiera en un solo núcleo..
Veredicto
lbzip2
Versión: 0.23
Web: http://lacos.hu
Precio: Libre (GPL)
Esta es una versión más rápida del antiguo favorito de Unix..
Clasificación: 7/10
7zip
Lanzado en 1999, 7zip (alias 7z o 7za) es relativamente nuevo en compresión. Fue escrito por Igor Pavlov, quien también diseñó el algoritmo LZMA que forma el modo de compresión predeterminado..
El código 7zip también incluye otros métodos de compresión, como bzip2, por lo que puede admitir formatos distintos al predeterminado .7z.
Aunque es de código abierto, el foco principal de desarrollo está en la plataforma Windows, donde 7z goza de gran popularidad, y el código viene con un front-end elegante. El código fuente básico ha sido ajustado por algunos, mientras que otros proyectos han utilizado el SDK de LZMA para producir variantes muy similares. Uno de estos es xz, y otros incluyen p7zip. Para esta prueba compilamos desde el código fuente original..
Viendo los resultados de las pruebas, es fácil pensar que 7z no está haciendo uso de los múltiples núcleos que se ofrecen. De hecho, es una aplicación de subprocesos, pero aún así toma un poco más de tiempo que el archivador bzip2 de un solo subproceso, y el doble de largo que lbzip2. Podríamos hacer algunas concesiones para este código, ya que está compilado desde la fuente genérica en lugar de estar orientado para funcionar en Linux, pero funciona mejor que pxz, la versión paralelizada del compresor derivado xz.
Un área en la que este algoritmo tiene un buen desempeño es la descompresión, ya que esto y las utilidades xz tienen un mejor desempeño que el resto del paquete (aparte de gzip, que no está tan comprimido para comenzar).
7z es sin duda una herramienta útil, y puede ser más valiosa en máquinas más rápidas, o en los casos en que desea que la compresión sea buena, pero la descompresión sea rápida (como la distribución de aplicaciones y datos).
Veredicto
7zip
Versión: 9.13 beta
Web: www.7-zip.org
Precio: Libre (GPL)
La acción LZMA pura funciona mejor que algunos de los derivados
Clasificación: 7/10