descargar archivos de internet desde bat usando wget error con los captcha

Iniciado por binario010101, 1 Diciembre 2013, 18:51 PM

0 Miembros y 1 Visitante están viendo este tema.

binario010101

hola amigos ya se que existen muchos gestores de descargas que pueden saltarse o resolver los captcha pero yo estoy usando wget y un bat para realizar mis descargas el problema no e podido resolver los captcha.


wget -b --limit-rate=20k -cv -Ep  -i enlaces.txt

tengo el wget en la misma carpeta que el bat y el archivo enlaces.txt con los enlaces de descargas. funciona bien

en internet dicen que se puede hacer con Python o con  l pero no encuentro un lugar donde lo expliquen?

http://blog.rodrigorega.es/tag/captcha/
https://groups.google.com/forum/#!topic/linux.debian.user/iVf1QhbSXWM
binario010101@hotmail.com
no soy ing estudio sicologia

Eleкtro

#1
Ni siquiera especificas el tipo de imagen captcha del que se trata, pero desde luego, con puro Batch no vas a poder.

Si son Captchas simples como los de la imagen del primer enlace entonces puedes utilizar cualquier motor OCR commandline como por ejemplo el archi-conocido Tesseract, o cualquier otro de estos.

Si se trata de imágenes RE-captcha de Google, o figuras como circulos, lo tienes más dificil, y en ese caso debes acudir a servicios de pago como este, el cual ofrece todo tipo de Plugins/API/Herramienta commandline, los créditos de uso también los puedes ganar de forma manual.

Saludos








binario010101

son captcha de letras y numeros, son los mas usados pero igual me sirve uno mas avanzado. y efectivamente se que nesesito una aplicacion externa el problema es que no se como usarla ni cual.
binario010101@hotmail.com
no soy ing estudio sicologia

Eleкtro

#3
Cita de: binario010101 en  1 Diciembre 2013, 19:21 PMson captcha de letras y numeros, son los mas usados

No es una respuesta lo suficientemente clarificadora, deberías postear una imagen del captcha para saber de que tipo de servicio se trata y así aconsejarte mejor,
de todas formas te he indicado lo que deberías usar en cada caso de servicio captcha.

Tessaract es muy facil de usar, aquí tienes un manual, pero no vas a conseguir ni un 1% de aciertos si se tratan de re-captchas de Google, ese tipo de captchas deben ser resueltos de forma humana, el servicio 9kw que te indiqué es perfecto para esa tarea, aunque hay varios más como CaptchaBrotherHood, pero no se si disponen de herramientas commandline para usar en proyectos Batch.

Saludos