Aquellos que han probado el Nexus One se han asombrado de la capacidad que tiene el teléfono para aislar la voz humana y que solo se oiga el sonido de esas voces, y no todo el resto de ruidos que suelen estar presentes en una conversación telefónica.
Buena parte de la mejora en este sentido se debe al procesador de voz Audience A1026, un chip del que ya hablaron en un post sobre el Nexus One el día del lanzamiento. Parece que el teléfono no solo destaca por su interfaz y su plataforma Android, sino por algo que parece haberse olvidado entre la mayoría de los fabricantes: la calidad de las conversaciones de voz.
En la página oficial de Audience existen tests A/B para tratar de evaluar la diferencia en la calidad de sonido de varias muestras reproducidas con y sin este chip, y es singular la forma en la que este microprocesador es capaz de aislar la voz humana para que se oiga de una forma clara y potente.
vINQulos



Vaya gente que hace móviles y se preocupa que el sonido de las llamadas sea bueno, estaré soñando.
Y yo que pensaba que el móvil era solo para tener widgets, para hacer fotos, para vacilar … pero eso de llamar ni loco que es un móvil, no un teléfono.
En fin, menos mal que todavía hay algún fabricante que sabe, que sabe cual es la función primordial de un móvil, llamar por él.
#J1
Coincido. Ya iba siendo hora de que alguien se centrase en los aspectos fundamentales del teléfono, por más extras molones que lleve. Bien por Google.
Un diez para Google, ya que con los chips tan potentes que hay en la actualidad, se pueden llevar a cabo perfectamente cosas como estas.
A ver que tal estará este telefono, ademas de la calidad de las llamdas, cosa primordial, a ver que takl estará su S.O., y si tendrá muchas aplicaciones de calidad.
El nexus one tiene un microfono delante y otro detras, usando ambos microfonos y varios algoritmos de inteligencia artificial es capaz de calcular el ruido de donde estemos y con el Audience A1026 lo elimina, de esta manera aunque estemos en un bar lleno de gente podremos hablar por telefono, usar los comandos de voz, escribir un sms con la voz etc.
Más que Google, yo diría HTC…
#Jos
¿Inteligencia artificial para aislar ruido en un teléfono?
#Jos –> “varios algoritmos de inteligencia artificial”
hombre, se agradece la info de los dos micrófonos, pero … xDDDDD
Me recuerda a esos auriculares que tiene un micrófono cuya funcionalidad es captar el ruido ambiente para contrarestarlo.
Yo los he probado y son muy interesantes. Conozco a un chico que los usa cuando va en avión y dice que llega mucho menos cansado. Parece que el ruido en los aviones es agotador para los tripulantes.
Tecnología de IA se usa en mucho software y hardware de forma normal hoy en día, en más de los que la gente se cree …
# tuseeketh
Por supuesto, el sistema tiene que ser inteligente para diferenciar lo que es ruido de lo que no lo es, mas concretamente se usan técnicas de arboles como el Algoritmo ID3. o Algoritmo C4.5 y Modelos estadísticos.
Eliminar el ruido correctamente no es tan sencillo como parece
# tuseeketh
Además no solo distingue lo que es ruido de lo que es voz humana, es capaz de diferenciar la voz de la conversación principal de el resto de voces humanas que aparezcan en el audio.
En la página no da detalles de que algoritmos se utilizan peo los habituales para este tipo de cosas son ID3, C4.5, bayesianos y mas maquinas de soporte de vectores SVM.
Si se discrimara el ruido usando un algoritmo de redes neuronales, por ejemplo, se podría decir que se usa tecnología de IA. Yo no lo veo tan descabellado, sobre todo porque permitiría que el telefono “aprenda” el ruido ambiente y porque una red sencilla no necesita tanta potencia de cálculo.
#Jos
Interesante. Mi pregunta es, ¿qué consumo tiene eso? Un terminal en llamada consume muchísimo, si además le sumamos complejos algoritmos estadísticos durante toda la conversación…
Y si le añadimos la capacidad para coger virus que ha demostrado Android …
http://mobile.slashdot.org/story/10/01/10/2036222/Malicious-App-In-Android-Market?from=rss&utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Slashdot%2Fslashdot+%28Slashdot%29
#Jos
Tuseeketh es un poco lento, piensa que IA sólo tiene que ver con robots y esas cosas que ve en las películas.
#Cervantes
Lo siento pero soy ingeniero, y como tal he estudiado IA. Probablemente no con la profundidad que la estudiaste tú, que debes tener el doctorado, pero lo suficiente como para saber que es pura estadística. Y aun así me ha parecido sorprendente que se usaran este tipo de algoritmos durante una llamada.
Amigo, no todos somos tan ignorantes como tú. Que entras aquí a ver qué tontería sueltas contra Android y como no hay donde rascar te metes conmigo. ¿No te das pena?
#tuseeketh
Si, Inteligencia artificial para determinar que es ruido y que no.
Eliminarlo despues es simplemente aplicar un filtro.
No es inteligencia artificial, es procesado digital de señal. Seguramente es un algoritmo adaptativo tipo LMS (least mean square).
Se trata en esencia de una inversion de fase, con un micro toman la voz + ambiente con el otro casi nada de voz (por eso la ubicacion es importante) y + de ambiemte pero este ultimo micro esta en desfase con respecto al primero, entonces en la mezcla final tenemos como resultante una cancelación de fase del ruido de ambiente y con algunos algoritmos lo han de pulir aun mas para tener un mejor resultado
#Raul y jorge
Según vuestros comentarios, que parecen provenir de auténticos telecos si no me equivoco, la inteligencia artificial no tiene nada que decir en este algoritmo.
Todos sabemos que la IA (capacidad una máquina de razonar como una persona) todavía no existe. Sin embargo, algunos listos de Ciencias de la Compu-ación llaman IA a cualquier algoritmo de búsqueda que no sea exhaustivo.
¡Vaya con el filtro: Compu-ación!
El metodo de inversión de fase se utilza desde hace años en los x eje. cables de micros con conectores xlr o canon (de tres patitas) donde tenemos un una malla y 2 vivos que al entrar en la consola uno de ellos entra en inversion de fase para evitar inducción de ruidos, es muy efectivo. tambien se utliza este mismo concepto en monitoreo (de audio) de campo cercano y mediano. El concepto está hace decadas solo que los de audience lo pulieron para aplicarlo de una forma que se agradece
@ J1
Bien dicho.
aya gente que hace móviles y se preocupa que el sonido de las llamadas sea bueno, estaré soñando.
Y yo que pensaba que el móvil era solo para tener widgets, para hacer fotos, para vacilar … pero eso de llamar ni loco que es un móvil, no un teléfono.
En fin, menos mal que todavía hay algún fabricante que sabe, que sabe cual es la función primordial de un móvil, llamar por él.
* por J1
* 11 Ene 2010, 11:28
#J1
Coincido. Ya iba siendo hora de que alguien se centrase en los aspectos fundamentales del teléfono, por más extras molones que lleve. Bien por Google.
* por tuseeketh
* 11 Ene 2010, 11:39
Un diez para Google, ya que con los chips tan potentes que hay en la actualidad, se pueden llevar a cabo perfectamente cosas como estas.
A ver que tal estará este telefono, ademas de la calidad de las llamdas, cosa primordial, a ver que takl estará su S.O., y si tendrá muchas aplicaciones de calidad.
* por David
* 11 Ene 2010, 12:11
El nexus one tiene un microfono delante y otro detras, usando ambos microfonos y varios algoritmos de inteligencia artificial es capaz de calcular el ruido de donde estemos y con el Audience A1026 lo elimina, de esta manera aunque estemos en un bar lleno de gente podremos hablar por telefono, usar los comandos de voz, escribir un sms con la voz etc.
* por Jos
* 11 Ene 2010, 12:19
Más que Google, yo diría HTC…
* por asd
* 11 Ene 2010, 12:21
#Jos
¿Inteligencia artificial para aislar ruido en un teléfono?
* por tuseeketh
* 11 Ene 2010, 12:38
Pues yo estudio inteligencia artificial (me examino el miércoles) y si algo nos han dejado claro es que definir ‘inteligencia’ no es tarea trivial, y ahonda más en cuestiones metafísicas que técnicas (el test de tourin por ejemplo no es un argumento sólido, aunque muy extendido, que algo parezca inteligente no quiere decir que lo sea). ¿Es más inteligente una mosca que yo? ¿Según que criterio? ¿Hacer integrales? ¿Volar? Los algoritmos de estabilidad para aviones son complejos y una mosca parece que lo hace muy bien. Por otra parte, la estadística no es en ningún caso IA como afirman por ahí arriba, coincido en que podría clasificarse como procesado de señal y punto.
Es tan simple como captar sólo los db mas altos en el espectro de la frecuencia de la voz humana (los del emisor) y anular los mas bajos (murmullos, etc…). Eso lo llevaba haciendo años atrás con las Sensaura en los estudios de grabación. Eso si es increíble que se haya conseguido adaptar esa tecnología a un terminal móvil sin repercutir demasiado en la autonomía ni en el rendimiento, ademas del retardo de la llamada.
debe de ser que estan mejorando el condensador de fluzo capacitivo con algoritmos parmesianos desoxirribonucleicos XVM y gracias a ello han conseguido que la IA del subprocesador cuantico de triple fase activa desentarabicuadriquine los cuartos descendentes de la modulacion de onda de la señal interfiriente de ejes hiperbolicos acetilsalicilicos…
vamos… que el nexus one es una maravilla hoyga XDD
No se como harán lo del ruido, yo lo he intentado, dejar solo la voz, con programas de audio como el SoundForge y no es nada fácil y no consigues una voz nitida como hacen en el CSI. Por otra parte use los algoritmos que se use podria calificar se la técnica dentro de la inteligencia artificial, segun la wikipedia :”Por lo tanto, y de manera más específica la inteligencia artificial es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura física producen acciones o resultados que maximizan una medida de rendimiento determinada, basándose en la secuencia de entradas percibidas y en el conocimiento almacenado en tal arquitectura.”
http://es.wikipedia.org/wiki/Inteligencia_artificial
Yo opino igual que jorge: no hace falta complicarse tanto desarrollando algoritmos complejísimos para hacer algo que en cualquier estudio de grabación se hace con una simple caja de inyección directa.
Jasto, estarás conmigo en que la definición es como poco bastante ambigüa, ya que viene a decir que es algo construido con hardware, y que dada una entrada cualquiera produce una salida ‘óptima’ en función de su ‘estado’. En fin es una discusión un tanto absurda, aunque siempre es grato charlar de estas cosas.