adn de archivos de video para buscar duplicados

Iniciado por Rinformatic, 8 Marzo 2014, 16:42 PM

0 Miembros y 1 Visitante están viendo este tema.

Rinformatic

hola no se si entendereis mi pregunta xk es un poco rara y no se vereis yo lo que quiero saber es si cada video o archivo que se crea tiene como una especie de adn que puedas buscar ese mismo video en todos los sitios que este alojado, no se si me explico como cuando un mismo video lo ves el mismo en varias paginas web ?

un saludo.

topomanuel

Si creo que tenga cada vídeo su propio ADN, lo que no se es si exista un programa o buscador que sea capaz de identificar ese ADN para buscarlo en cualquier sitio así le hayan cambiado el nombre...

Saludos.

Eleкtro

#2
Si por ADN te refieres a una palabra mágica que te diga si dos videos son iguales al instante entonces NO, no existe ningún 'ADN' mágico que te diga si dos archivos de video son iguales.


Para determinar si un archivo multimedia es idéntico a otro se utilizan métodos de comparación, entre los cuales ahora mismo se me ocurren algunos de menor a mayor dificultad (según mi criterio), y lo mejor es usar una combinación de todos los métodos que se te ocurran ...para mayor seguridad:


· Puedes calcular y comparar el Checksum (CRC32), o un Hash (SHA1, MD5) de 2 archivo de video,
 si dos Hashes coinciden, en teoría se trata del mismo video duplicado;
 Aunque hay muchas cosas a tener en cuenta aquí (si cambias un byte en los metadatos del archivo seguirá siendo el mismo archivo de video pero dará distinto Hash),
 y un video puede dar el mismo Hash que otro que no sea igual, aunque las posibilidades de que esto ocurra son ínfimas,
 pero bueno, este método es el más facil, y existen infinidad de herramientas para la comparación de CRC, MD5, etc y en fin buscar duplicados.


· Puedes comparar los metadatos (tags) de un archivo de video, entre los que destacarían el título, el año, la descripción, los codecs utilizado, etc, si dos videos tienen los mismos tags, óbviamente debe tratarse del mismo video.
 Ojo, un video no tiene porque contener Tags, es un archivo multimedia y como cualquier otro archivo multimedia ...los tags se pueden eliminar.
 También hay que tener en cuenta que los tags se pueden modificar, así qu dos videos distintos pueden contener exáctamente todos los Tags iguales.


· Puedes comparar las dimensiones del video (Ancho x Alto), junto a la duración del video, y comparar los fotogramas iniciales y finales con los demás videos, considero esto el método más seguro.


PD: Para identificar archivos de videos duplicados te recomiendo cualquiera de las siguientes aplicaciones:

· Vistanita Duplicate Finder
  http://download.cnet.com/Vistanita-Duplicate-Finder/3000-2248_4-10668209.html

· Duplicate Finder 2009
  http://www.duplicate-finder-pro.com/index.htm


Saludos








Rinformatic

entonces en el momento k tu haces un video x ejemplo en mi movil ya crea un hash md5 etc?¿ es k no me acabo de enterar

Eleкtro

#4
No, un Hash es (más o menos) un algoritmo criptográfico para calcular un valor que sirve como identificador único de un archivo, basándose en los bytes de dicho archivo,
el Hash no se crea, no es un valor estático (como ya dije, 2 archivos distintos pueden dar como resultado el mismo hash), el Hash es algo que se calcula.

Si intentas grabar metódicamente dos videos iguales con el movil, los fotogramas de uno y del otro nunca van a ser 100% idénticos (movimiento de cámara, particulas de polvo por el aire, la luz del Sol o del entorno, etc)... pero de todas formas, los frames podrían llegar a ser muy parecidos como para poder comparar diferencias y buscar similitudes con un algoritmo en cada fotograma y generar así un porcentaje para determinar si el video se debe considerar como un duplicado o no,
y además, el software de grabación del movil graba en una resolución específica, en un formato determinado, y generarando unos metadatos específicos para ese formato/video, cosas que se pueden comparar con otros videos para identificar videos parecidos o casi iguales.

Como ya dije, no existe un 'ADN' mágico, se utilizan algoritmos de comparación, básicos o avanzados.

Para calcular y comparar Hashes y Checksums te recomiendo la aplicación:

· Object Monitor
 http://sourceforge.net/projects/objectmonitor/

Saludos








engel lex

por resumir un poco la idea de los hashes... imagina que tu video es una sopa, tu lo prebas y dices "wow, sabe a BF4164A2", al otro día te sirven una sopa de nuevo, pruebas y dices "ahh esta es la sopa de ayer que sabia  a BF4164A2" pero un dia llega la cocinera y decide agregarle un poco más de sal porque le parecia mejor y te la sirven y dices ":( buh esta sopa sabe a 1B27718F, pero a mi me gustaba BF4164A2, no son la misma ya"

eso pasa con los archivos... si suma de comprobacion por ejemplo da BF4164A2, pero si cambias 1 solo bit, puede ser 1B27718F... los videos se tienen a reencode cuando se suben a los servicios online, eso canbia sus bits, por lo tanto, su hash

mi metodo para comprobar si el video es el mismo, seria algo como si alto, ancho y largo es el mismo, comprobar pixel x de y cuadros, si el color es 95% parecido, entonces, puede ser el mismo (repetir para seguridad)
El problema con la sociedad actualmente radica en que todos creen que tienen el derecho de tener una opinión, y que esa opinión sea validada por todos, cuando lo correcto es que todos tengan derecho a una opinión, siempre y cuando esa opinión pueda ser ignorada, cuestionada, e incluso ser sujeta a burla, particularmente cuando no tiene sentido alguno.