Como esta hoy en dia lo de mandar ordenes por voz?

Iniciado por $Edu$, 1 Enero 2013, 22:03 PM

0 Miembros y 2 Visitantes están viendo este tema.

$Edu$

Quiero saber si hoy en dia se puede crear una aplicacion en .NET tal vez que capte sonidos emitidos por nosotros en el microfono, para poder crear aplicaciones bots por ejemplo que desde el microfono ordenes "abrir foro elhacker" y te habra el foro.

Se que hay, pero quiero mas que nada saber la calidad, si funciona bien al 100% sin muchos errores. Porque sabia algo de que con HTML5 se podia hacer eso y Google estaba trabajando con eso, una vez lo probe pero tenia que hablar demasiado lento y muyyy claro para que mas o menos me entienda, es decir, le faltaba aun mucho, pero hoy en dia tal vez no.

Si se pudiera hacer en .NET ya mismo me pondria a programar algun bot o algo xD

spiritdead

Cita de: $Edu$ en  1 Enero 2013, 22:03 PM
Quiero saber si hoy en dia se puede crear una aplicacion en .NET tal vez que capte sonidos emitidos por nosotros en el microfono, para poder crear aplicaciones bots por ejemplo que desde el microfono ordenes "abrir foro elhacker" y te habra el foro.

Se que hay, pero quiero mas que nada saber la calidad, si funciona bien al 100% sin muchos errores. Porque sabia algo de que con HTML5 se podia hacer eso y Google estaba trabajando con eso, una vez lo probe pero tenia que hablar demasiado lento y muyyy claro para que mas o menos me entienda, es decir, le faltaba aun mucho, pero hoy en dia tal vez no.

Si se pudiera hacer en .NET ya mismo me pondria a programar algun bot o algo xD

tengo un proyecto bastante avanzado en reconocimiento de voz, pero me falta aun mejorarle la logica o red neronal :S
Facilitador De Tareas - Task Simplifier (FDT)

$Edu$

Pero no existe algo en .NET que me permita trabajarlo? es decir, una clase o como sea.

Código (csharp) [Seleccionar]

ListenVoice lv = new Listen Voice;
string orden;

while (lv.Listen() == null) Aplication.DoEvents();

orden = lv.Listen();

if (orden == "abrir foro el hacker") AbrirWeb("foro.elhacker.net");


Me encanta soñar, lo se. xD

spiritdead

Cita de: $Edu$ en  2 Enero 2013, 01:19 AM
Pero no existe algo en .NET que me permita trabajarlo? es decir, una clase o como sea.

Código (csharp) [Seleccionar]

ListenVoice lv = new Listen Voice;
string orden;

while (lv.Listen() == null) Aplication.DoEvents();

orden = lv.Listen();

if (orden == "abrir foro el hacker") AbrirWeb("foro.elhacker.net");


Me encanta soñar, lo se. xD

nop :P yo hasta uso BD en access para los comandos y metodos dinamicos para que el soft detecte q comando le hablo. capas lo muestro por aca

uso voces de loquendo,etc
Facilitador De Tareas - Task Simplifier (FDT)

$Edu$

Entonces a esperar que avanzen en esto, yo no pienso hacer un soft para detectar mis comandos, quiero que ya este creado por una empresa buena como Microsoft para su .NET y que yo pueda programar de la forma que puse mi codigo xD

Habra que esperar un tiempo entonces :P

spiritdead

Cita de: $Edu$ en  2 Enero 2013, 16:49 PM
Entonces a esperar que avanzen en esto, yo no pienso hacer un soft para detectar mis comandos, quiero que ya este creado por una empresa buena como Microsoft para su .NET y que yo pueda programar de la forma que puse mi codigo xD

Habra que esperar un tiempo entonces :P

xD busca 1 buena silla :P y un buen vaso de refresco =D

si yo supiera realizar la descomposicion de las frecuencias de sonido y la voz, uff lo q haria
Facilitador De Tareas - Task Simplifier (FDT)

Novlucker

Contribuye con la limpieza del foro, reporta los "casos perdidos" a un MOD XD

"Hay dos cosas infinitas: el Universo y la estupidez  humana. Y de la primera no estoy muy seguro."
Albert Einstein

$Edu$

Ah es verdad, un amigo tiene la Kinect y con el Fifa 13 dice que se puede hablar y decir "formacion - 4-4-2" y te cambia la formacion, es decir, cada vez mas real porque es como si sos el director tecnico en tiempo real, sin poner pausa y formacion xD

Pero solo aparatos externos logran hacer esto? un software para pc no podria captar las voces? como lo que dije del HTML5 pero con mejor calidad :P

Novlucker

Hay varias para reconocimiento de voz ...

http://www.codeplex.com/site/search?query=speech

... de cualquier modo hay algo que debes de tener en cuenta, a día de hoy se han decantado por no intentar que tu pc o gadget favorito reconozca lo que dices (si los hay pero de manera muy limitados). La API de google por ejemplo, o Siri de Apple que tanto ha dado que hablar, lo que hacen es simplemente grabar, enviar el audio a los servidores de estas empresas, "reconocer" y enviar la respuesta en texto, el trabajo real esta casi todo en la nube.

Saludos


Contribuye con la limpieza del foro, reporta los "casos perdidos" a un MOD XD

"Hay dos cosas infinitas: el Universo y la estupidez  humana. Y de la primera no estoy muy seguro."
Albert Einstein

spiritdead

Cita de: Novlucker en  4 Enero 2013, 00:15 AM
Hay varias para reconocimiento de voz ...

http://www.codeplex.com/site/search?query=speech

... de cualquier modo hay algo que debes de tener en cuenta, a día de hoy se han decantado por no intentar que tu pc o gadget favorito reconozca lo que dices (si los hay pero de manera muy limitados). La API de google por ejemplo, o Siri de Apple que tanto ha dado que hablar, lo que hacen es simplemente grabar, enviar el audio a los servidores de estas empresas, "reconocer" y enviar la respuesta en texto, el trabajo real esta casi todo en la nube.

Saludos




por eso intentaba crear 1 algoritmo :/ pero es muy complejo sino tengo acceso al sistema de system.recognize y sus algoritmos de fourier :S
Facilitador De Tareas - Task Simplifier (FDT)