Como hago scraping a los audios MP3 de Forvo.com

Iniciado por bacanzito, 12 Febrero 2017, 16:33 PM

0 Miembros y 1 Visitante están viendo este tema.

bacanzito

 de forma automatica  en cada idioma  y si es posible que detecte en modo alfabetico las mejores pronunciaciones pronunciadas en cada idioma :huh: ya que no tiene esa opccion   de descargar los paquetes de cada idioma para el uso offline con ankidriod :silbar:

 forvo recopila la ponunciacion de voces naturales  nativas  en todos los idiomas

solo encontre esto en internet pero no se como se usa

forvo_scraper.sh
#!/bin/bash
# Forvo scraper
language=${FORVO_LANG:-fr}
BASEURL="http://forvo.com/search/"
AUDIOURL="http://audio.forvo.com/mp3/"
word=$1

if [[ -z $word ]]; then
 echo "usage: "
 echo "FORVO_LANG=languagecode ./forvo_scraper.sh myword"
 echo "for example: "
 echo "FORVO_LANG=fr ./forvo_scraper.sh chien"
 echo "will save a single file named 'chien.mp3' in the current folder"
 exit
fi

url="${BASEURL}${word}/${language}"
playurl="${BASEURL}${word}/#${language}"
file="$(wget -qO- "${url}" | grep 'onclick="Play(' | head -1 | sed "s/^.*Play(.*,'\([^']*\)','.*$/\1/g" | base64 -d)"
wget -qO"${word}.mp3" "${AUDIOURL}${file}"