el 2005-03-10 03:19:00 - Secciones: - Enlace permanente: 365Los códigos de Huffman son posiblemente la variante más conocida de los compresores estadísticos, que aprovechan las características estadísticas de los datos de entrada asignando códigos más cortos a los datos que mas se repiten, logrando así un efecto compresor.
Para lograrlo, el compresor debe recorrer una vez el vector con la información entrante para crear una tabla con la frecuencia de cada carácter, y luego otra vez para traducir la fuente en los códigos adecuados. Esta doble pasada no siempre es posible, y aquí es donde entran las variantes adaptativas, que son capaces de generar la compresión en una sola pasada, al ir modificando los códigos de salida conforme van llegando nuevos códigos a la entrada.
El algoritmo
Como ya mencioné anteriormente, la compresión Huffman adaptativa se diferencia de la normal en que los datos estadísticos se generan en la misma pasada que se envían los códigos de salida, y esto tiene un problema evidente: ¿cómo se envía un dato que aún no ha sido registrado en la tabla de símbolos? ¡Reconstruir la tabla con cada carácter nuevo requeriría muchísimo tiempo de CPU!
Por ello, lo que se hace es modificar el árbol binario del algoritmo Huffman añadiendo un valor especial llamado NYT, not yet transmitted, que servirá como marcador de nuevo carácter, es decir, si tenemos la entrada “arañar”, la salida seria “NYT a NYT r CODIGO(a) NYT ñ CODIGO(a) CODIGO(r)”.
Otro problema que surge es el de la optimalidad de los códigos, ya que si simplemente vamos añadiendo caracteres al árbol estadístico conforme aparecen en la entrada, se perderían las ventajas de la compresión Huffman. Por ello, cada vez que se lee un carácter hay que actualizar el árbol, que pasa a ser bastante mas complejo que el algoritmo no adaptativo, de una manera determinada, dependiendo de si es un nuevo carácter o si ya estaba en el árbol.

Fig.
1. Árbol de ejemplo, conteniendo la palabra “abra”
Los nuevos elementos que podemos advertir en el árbol binario del algoritmo adaptativo frente al clásico son la presencia del código NYT, la numeración de los nodos y un contador de cada carácter. Con este contador llevamos la cuenta de cuantas veces ha aparecido el valor, y es lo que definirá en que posición del árbol pondremos al carácter en caso de reorganización, mientras que la numeración nos servirá para decidir que nodos deben intercambiar su posición.
Un ejemplo paso a paso
Veamos con un ejemplo como funciona el algoritmo, usando la palabra “abracadabra”.

Fig.
2. Árbol vacío
Comenzamos con un árbol vacío, al que le llega el primer carácter, “a”.

Fig.
3. Árbol para “a”
Con la llegada del primer dato, el algoritmo envía el dato tal cual, “a” y después genera los primeros nodos del árbol, es decir, el nodo para el NYT, con el contador a cero, y el del propio dato, con el contador a uno, y el nodo padre, el raíz en este caso, con la suma de los contadores de sus hijos.

Fig.
4. Árbol para “ab”
Tenemos un nuevo dato, así que enviamos el NYT para comunicárselo al destino, seguido del propio dato, por lo que el mensaje enviado completo por el momento es “a 0b”. Este mensaje realmente se compone de los ocho bits del símbolo “a”, seguido del bit 0 y de los ocho de “b”, por lo que es importante que tanto compresor como receptor estén de acuerdo en el tamaño del dato base, que en el programa que nos ocupa es de ocho bits.
Una vez enviados los nuevos códigos, se reestructura el árbol añadiendo el nuevo carácter “b” como hijo derecho del NYT, y creando un nuevo NYT como hijo izquierdo, y actualizando los contadores en cascada hacia la raíz, efectivamente creando un árbol balanceado.

Fig. 5a. Árbol para “abr” no actualizado
Con el nuevo carácter “r” llegamos a un punto crucial del algoritmo: la actualización del árbol. Primero, se manda el NYT y el dato r, con lo que el mensaje comprimido es ahora “a 0b 00r” (recordemos que siempre se mandan los NYT de antes de meter el nuevo carácter en el árbol). Lo introducimos en el lugar del NYT y llegamos a una posición en la que no se cumple la posición de balanceo del árbol, ya que el nodo 49 tiene el valor 2, suma de los valores de sus dos hijos, mientras que su hermano 50 tiene el valor 1, ya que el carácter “a” solo ha aparecido una vez hasta ahora. Por lo tanto, los intercambiamos, en un ajuste de balanceo que en este algoritmo es llamado simplemente proceso de ajuste del árbol.

Fig.
5b. Árbol para “abr” actualizado
Otro carácter “a”, que como ya está en el árbol es enviado comprimido, con lo que tenemos “a 0b 00r 0”.

Fig.
6. Árbol para “abra”
Ahora es el turno del dato “c”, que como no está en el árbol, mandamos el NYT y el dato en claro: “a 0b 00r 0 100c”. Después lo añadimos al árbol.

Fig. 7a. Árbol para “abrac” no actualizado
De nuevo el árbol necesita ser actualizado, ya que los nodos 47 y 48 han dejado de cumplir la condición de balanceo.

Fig.
7b. Árbol para “abrac” actualizado
Otra “a”, con lo que el mensaje completo es ahora “a 0b 00r 0 100c 0”.

Fig.
8. Árbol para “abraca”
El dato “d” es nuevo, así que lo enviamos (“ a 0b 00r 0 100c 0 1100d ”)y expandimos el nodo de NYT para acomodarlo. Además, va a desequilibrar el árbol, que necesitará un ajuste.

Fig.
9a. Árbol para “abracad” antes de actualizar

Fig.
9b. Árbol para “abracad” balanceado
La tercera “a”, con lo que el mensaje comprimido es ahora “a 0b 00r 0 100c 0 1100d 0”.

Fig.
10. Árbol para “abracada”
El siguiente carácter “b”, aunque ya está en el árbol y podría parecer que simplemente bastaría con aumentar su contador y enviar su código, en realidad va a generar un proceso interesante que podría cambiar el árbol casi por completo: una actualización en cascada.

Fig.
11a. Árbol para “abracadab” sin actualizar
Primero, los nodos 45 y 46 deben ser intercambiados, ya al aumentar el contador de b, su nodo tiene mas “peso” que su hermano derecho.

Fig.
11b. Árbol para “abracadab” actualizándose
Intercambiados los nodos, aumentamos el valor de “b” y de los padres hasta la raíz, verificando en cada nodo si es necesaria una nueva actualización, aunque en este ejemplo no se da el caso.

Fig. 11c. Árbol para “abracadab” actualizado
Los dos caracteres que faltan, “r” y “a”, no tienen mucha historia, simplemente enviamos el código y actualizamos los contadores correspondientes, con lo que el código final es “a 0b 00r 0 100c 0 1100d 0 110 110 0”, es decir, 60 bits, frente a los 88 que harían falta para mandar el mensaje sin comprimir.

Fig.
12. Árbol para “abracadabr”

Fig.
13. Árbol para “abracadabra”
La descompresión
Ahora veamos un ejemplo de descompresión. Tenemos la cadena “a 0b 00r 0 100c 0 1100d 0 110 110 0” (de nuevo, imaginemos que en vez de los caracteres tenemos grupos de 8 bits con la representación ascii de dichos caracteres). Leemos los primeros ocho bits, ya que forzosamente el primer carácter debe estar sin codificar, con lo que ya tenemos la “a”, y la introducimos en el árbol. El siguiente dato, o bien es un uno si es otra vez la “a”, o es un cero para indicar el valor NYT. En nuestro caso, es un cero, así que lo leemos y los siguientes ocho bits, con lo que ya tenemos “ab”.
Ahora el descompresor tendría en su memoria un árbol análogo al de la figura 4, por lo que al leer un cero sabemos que debemos leer al menos un bit más. Efectivamente, nos llega otro cero, con lo que tenemos un NYT. Leemos otros ocho bits y ya tenemos “abr”. Actualizamos el árbol, igual que hacíamos en la compresión, y leemos un cero, lo que nos indica que tenemos otra “a”.
Leemos un bit y tenemos un uno, que no es ningún código conocido, leemos otro y tenemos uno-cero, que sigue siendo desconocido. Volvemos a leer y tenemos uno-cero-cero, que en la disposición actual del árbol ( fig 6 ) es un NYT. Leemos ocho bits más, tenemos “abrac”. Sacamos un cero de la cadena, y como sabemos por el árbol que es una “a”, tenemos “abraca”.
Se lee bit a bit hasta que tenemos una combinación con significado, y en este caso, se trata de nuevo de un NYT, acompañado de los ocho bits de la “d”, con lo que el código hasta ahora es “abracad”. Hasta el final, tenemos caracteres sueltos que completan el mensaje, que es, claro esta, “abracadabra”.
|
Quisiera ver si es posible obtener el codigo de Huffman Adaptativo escrito en un lenguajes de alto nivel no importa cual sea. Que es estrictamente necesario obtenerlo para un trabajo que tengo que realizar. El algoritmo ea un poco complicado de entender pero mucho mas de implementar. quisiera que porfavor me puedan ayudar Gracias... Javier Prieto.. De Maracaibo Venezuela... |
|
Bien, veamos, aquí tienes unos cuantos enlaces, en Java, en C [1] y [2]; y en C#. |
|
Buenas a todos, necesito el codigo de huffman en pascal, y que este en castellano si es posible. Contestenme si son tan amables a la direccion de correo siguiente: jmvm17@hotmail.com. Gracias- |
|
<? echo "hola"; echo "hola"; echo "hola"; echo "hola"; echo "hola";echo "hola";echo "hola";echo "hola";echo "hola"; ?> |
|
hola Me gustaria saber como puedo hacer el codigo de un arbol binario balanceado, para eliminar nodos e imprimirlos. Si es posible que me manden el codigo se los adgradeceria. Gracias |
|
00101101 00101110 00100000 00101110 00101101 00100000 00101101 00101101 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00100000 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00101101 00101110 00101101 00100000 00101110 00101110 00101110 00101110 00100000 00101101 00100000 00101101 00101101 00100000 |
|
00101101 00101110 00100000 00101110 00101101 00100000 00101101 00101101 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00100000 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00101101 00101110 00101101 00100000 00101110 00101110 00101110 00101110 00100000 00101101 00100000 00101101 00101101 00100000 |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 saben lo qe significa.??? |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 caverna!!!! |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
hola Quisiera ver si es posible obtener el codigo de Huffman Adaptativo escrito en un java Que es estrictamente necesario obtenerlo para un trabajo que tengo que realizar. El algoritmo ea un poco complicado de entender pero mucho mas de implementar. quisiera que porfavor me puedan ayudar Gracias...katy |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
no tengo ni idea de como habeis llegado a la solución de caverna, pero me ha servido para ponerlo en el tool-chile.com en el nivel 8 |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 0010001 |
|
como descifraron caverna!? alguien ponga una explicacion para ilustrarnos |
|
PORFAVOOOOOORRRRRRRR.. que alguien nos explique como llegaron a "caverna".. me sirvió para el "tercerojo" de tool-chile.com, pero me frustra un pococ no saber como consiguieron la respuesta... porfaaaaa jajajaja... Saludos! |
|
Hola, no sé si tiene algo ke ver, pero necesito decodificar esto 00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 pero no sé como =S Alguna ayuda? |
por favor como puede codificar el algoritmo de huffman en pyrhon? alguien ayudeme |
|
Ningún problema, aqui teneis una copia: Python Huffman Encoding. |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
Buenas gente, Veo que estamos en el mismo tema. He encontrado codigo del algoritmo de Huffman en vb.net pero creo q no está bien del todo. Me gustaria saber si es posible conseguirlo o en C#.NET si no hay más remedio. Un saludo gracias. Urgente ![]() |
|
Gracias a las típicas injusticias de la universidad, de entre muchas y muy graves, quiso la diosa fortuna que, por una vez, esta fuera a mi favor, y el profesor creyó que yo era de los que deben aprobar por decreto y actuó en consecuencia. Grave error, yo soy de la lista B, y para cuando se dió cuenta ya estaban las actas firmadas. |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
hi; un favor si me podrian enviar un programa en java sobre el balanceo de un arbol binario y el borrado de un nodo garx |
|
Google al rescate: "java arbol binario" devuelve 28.000 resultados, de los que, en un vistazo rápido, yo empezaria por revisar este y este. |
|
quiero que me manden el codigo en java de huffman, para comprimir archivos. |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 q alguien me tradusca eso porfa...lo agradeceria |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
POR QUE ES CAVERNA?? POR QUE ES CAVERNA?? POR QUE ES CAVERNA?? POR QUE ES CAVERNA?? POR QUE ES CAVERNA?? |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 porqueeso es caverna, ya converti el binario y no di como llegaron a caverna, alguien me podria decir????? |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
KISIERA SABER SI ESTE KODIGO ME |
|
Hola Necesito ayuda urgentemete antes de las doce Nenecesito el algoritmo de arbol Huffman en haskell podeis ayudarme porfavor? |
|
PORFAVOR AYUDENME NECESITO EL CODIGO DEL ARBOL DE HUFFMAN EN HASKEEL ES MI UNA DE MIS CALIFICACIONES FINALES PORFAS AYUDENME |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 |
|
que tal gente? tengo un problema el cual es: tomo un texto de pantalla (ingresado por el usuario), creo un arbol de huffman con su tabla de frecuencias y lo codifico ahora mi pregunta es: que tengo que guardar en un archivo en el disco para despues abrirlo y poder decodificar lo que esta ahi? tengo que guardar la tabla de frecuencias? que no comprennndo! gracias_ |
|
Uhm hace muchisimo tiempo que no me dedico a esas cosas, pero juraria que debes guardar una tabla con las equivalencias entre cada caracter y su codigo, y luego la conversion del texto a cada codigo. |
|
00101101 00101110 00101101 00101110 00100000 00101110 00101101 00100000 00101110 00101110 00101110 00101101 00100000 00101110 00100000 00101110 00101101 00101110 00100000 00101101 00101110 00100000 00101110 00101101 00100000 En binario eso significa "-.-. .- ...- . .-. -. .-" Y esto en codigo morse es "caverna" |
|
ahi dios dios no saben el codigo mira primero tienen que poner binario despue de eso les aparesera una frase que es caberna a ver si usamoos la cabesiita pendejitos. ![]() |
|
Hola a todos!! Alguien puede ayudarme a encontrar el codigo de Huffman para Shell/Linux?? Gracias!!! |
Saiyine recommends the easiest way to earn money with your web: get paid just by having some links! Click this button to check it out.
