(solucionado..) Tengo una duda sobre el checksum (CRC32) para expertos!

Iniciado por Eleкtro, 17 Diciembre 2011, 05:48 AM

0 Miembros y 3 Visitantes están viendo este tema.

Eleкtro

Buenas!

No se nada de este tema, y tengo varias preguntas...

Para empezar, Tengo una carpeta en Windows con 44.999 archivos de todo tipo, escaneé el checksum en CRC32 con el programa Object Monitor y guardé la lista, luego copié esa misma carpeta a otro disco duro para hacer un backup, y con la lista de antes, escaneé estos nuevos archivos, de entre esos archivos, Uno tenía el checksum distinto...

...Era un archivo mp3, así que inspeccioné el archivo en los 2 HDD para comprobar si realmente estaba corrupto o no, me escuché la canción entera, comprobé el tamaño del archivo, la fecha de modificación, incluso los abrí en el SoundForge para comprobar los picos, y la ganancia del archivo, el archivo mp3 tampoco tenía signos raros en el nombre como para dar error de ese tipo, y también usé el programa MP3Val que busca errores en los archivos mp3, Pero resulta que no había ninguna diferencia entre esos 2 archivos...

Entonces mi pregunta es, ¿Que tán efectivo es comprobar los archivos en CRC32? ¿Porque me ha fallado en la comprobación de ese archivo mp3?

¿Y cual consideran que es el chesksum más eficaz y fiable de esta imagen? ¿O quizás todos son igual? ¿Si todos fuesen igual, Cual es el más rápido? (Supongo que el CRC de 16 bit o el de "Size")



Un saludo.








Randomize

Te voy a decir una tontería, pásale al HDD el HDD Regenerator  ;)

burbu_1

antes de nada, aclarar que no soy ningún experto  :-X (disculpas  :-\)

puedes leer en la wikipedia en qué consiste la Comprobación de Redundancia Cíclica... y sus limitaciones

para el uso que le quieres dar (verificar la integridad de una copia), creo que es más que suficiente... y que de 49.999 (curioso nº) archivos solo haya fallado 1, creo que no está mal.

Lo que te debe de quedar claro, es  que aunque el mp3 siga sonando igual, el archivo NO ES EL MISMO,  tal vez haya copiado un byte con un valor una unidad mayor y tu oido no perciba ese agudo..... :laugh: :laugh: :laugh:


Eleкtro

#3
Cita de: Randomize en 17 Diciembre 2011, 22:24 PM
Te voy a decir una tontería, pásale al HDD el HDD Regenerator  ;)
el hdd es nuevo! lo usé por 2º vez solamente para hacer el backup de un hdd a este nuevo
de todas formas probaré tu consejo, solo espero que el hdd regenerator tenga una opción así como de "Solo verificar", sin que me haga reparaciones automáticas ni nada raro, que no la quiero liar xD.

Cita de: burbu_1 en 17 Diciembre 2011, 23:39 PM
que de 49.999 archivos solo haya fallado 1, creo que no está mal.
Gracias por el link, no lo he entendido todo pero según he leido ahí el CRC no es muy efectivo

Lo que me preocupa es pensar que al no ser un sistema eficaz, quizás ha podido fallar más de un solo archivo, me explico:

Esto es lo que me ha pasado:
44.999 archivos > comprobar CRC32 > 1 archivo no ha pasado el CRC (Aunque ese archivo no ha sido modificado en ningún sentido!)


Pues por esa regla de trés, a mi me preocupa que haya podido pasar esto:
44.999 archivos > comprobar CRC32 > Todos los archivos han pasado el CRC correctamente (Pero en realidad 1.000 archivos son falsos positivos y están corruptos.)


Esa es la cuestión.

Cita de: burbu_1 en 17 Diciembre 2011, 23:39 PM
aunque el mp3 siga sonando igual, el archivo NO ES EL MISMO,  tal vez haya copiado un byte con un valor una unidad mayor
comparé el tamaño del archivo (Me fijé en el número entero, en todos los bytes) incluso usé un programa desde la cmd (Compare.exe) para compararlos, pero nada!
Estoy totalmente convencido de que ese archivo que falló es exactamente igual en las 2 ubicaciones y no tiene el menor cambio, lo siento.

Lo que me ha quedado claro es que debo usar otro método de los que hay en esa lista en el primer comentario, lo que no se es cual :xD

gracias a los 2, Un saludo!








burbu_1

me parece muy raro, por no decir imposible, que 2 archivos idénticos te generen CRCs distintos  :rolleyes: :rolleyes:

en la captura del programa que pones en tu primer post, tienes ordenados los algoritmos de menor a mayor seguridad.

pero creo que un md5 o sha, no te van a dar ningún problema con errores aleatorios y serían suficiente.

En esta web puedes calcular los hashes de un archivo con distintos algoritmos, podrías mandar esos 2 archivos para asegurarte.

P.D. ya dije que no era experto  ;D, igual el tema habría ido mejor en el foro de criptografía

saludos.

Randomize

Tomo nota.


Por otro lado... Eso de perder el tiempo viendo el CRC de 4.000 y pico archivos  :silbar:

Eleкtro

#6
Cita de: burbu_1 en 18 Diciembre 2011, 12:26 PM
en la captura del programa que pones en tu primer post, tienes ordenados los algoritmos de menor a mayor seguridad.
Perfecto es la info que necesito ;D gracias

Cita de: Randomize en 18 Diciembre 2011, 16:50 PM
Eso de perder el tiempo viendo el CRC de 4.000 y pico archivos  :silbar:
44.999 archivos, ni más ni menos!!! 698 GB, unas cuantas horas para que se haga un checkeo en crc32.

Yo es que desde que hice un chkdsk hace un par de años en un disco que me fallaba un poco... me acabó trastocando (Porque no me los borró ni reparó) la mitad de los archivos dejandolos inservibles pero con el mismo tamaño que tenían antes!...que ahí ya no sabes ni cual está corrupto ni cual no (Si no tienes un perfil del crc original de ese archivo puf) Creeme que si te pasa eso ya no piensas que pasarle un CRC o un MD5 al disco entero de vez en cuando es perder el tiempo, mejor prevenir xD.

Ale ya no le doy más vueltas a este tema, solucionado xD








Randomize