¿Mary Meeker acaba de confirmar el comienzo de la revolución de Voice First?

Sí, de hecho lo hizo.

La primera revolución de la voz comenzó y pocos se dieron cuenta

Mary Meeker es una leyenda en Silicon Valley. Ella tiene una designación tan merecida como ser precisa sobre la dirección de los eventos futuros. Calculo que millones de dólares por año se mueven en la dirección de su informe anual y presentación de diapositivas. Todo comenzó con The Internet Report en 1995, donde previó correctamente el surgimiento del World Wide Web e Internet Commerce.

Muchos de los que han seguido mi trabajo aquí en Quora saben que he estado trabajando con la voz desde que produje el primer tablero de voz para un Commodore 64 y luego escribí un manifiesto de voz en 1989 que se ha convertido en más de 800 páginas. También soy el que señaló en algunos premios Quora Knowledge Prize que pierden respuestas, para la opinión opuesta de los ganadores de dichos premios, que la revolución de Voice First ha comenzado e incluso algunas de las mejores mentes no lo entienden. Mary Meeker lo entiende, creo que habría perdido este Premio Quora Knowledge:

¿Amazon Echo (y / o Siri y otros asistentes de voz) es realmente útil, o es solo una novedad? ¿Están creciendo el uso y la retención de estos productos?

El 1 de junio de 2016, Mary dio el Informe de Tendencias de Internet 2016 y en 213 diapositivas, es exhaustivo y sincero sobre todos los elementos de los muchos satélites que orbitan Internet.

La presentación de diapositivas cautivó la conferencia anual organizada por Kara Swisher y Walt Mossberg, ahora llamada Code Conference by Recode [1].

Como investigador que ha estado estudiando y construyendo en torno a la voz desde la década de 1980, quería ver algunas de las diapositivas de Mary que se relacionan con lo que llamo la Voz Primera Revolución y presentar algunas de mis propias ideas.


De hecho, desde los primeros sistemas de voz de los Laboratorios Bell en la década de 1950 hasta hace unos 5 años, el reconocimiento de voz independiente del hablante era inexacto y propenso a errores.

Los humanos han estado tratando de adaptarse a las limitaciones de las máquinas que creamos. Incluso el iPhone más avanzado requiere niveles de habilidades aprendidas que tendemos a dar por sentado y generalmente se olvida.

Desde que comencé mi trabajo, mi tesis es que la evolución ha pasado unos pocos millones de años optimizando el habla humana para convertirse en un sistema de intercambio de datos muy preciso.

Este es un truismo críticamente importante y que a menudo se pasa por alto en Voice, el reconocimiento de palabras ha aumentado de aproximadamente 100,000 palabras en 2000 a 1 millón de palabras en 2010 a más de 10 millones de palabras para fines de 2016. En el camino, la precisión ha superado el percentil 95.

El crecimiento sin precedentes de los sistemas de voz de teléfonos inteligentes de primera generación, bastante limitados, todavía ha llevado el uso a más del 65% en 2015 y para finales de 2016 ese número será superior al 75%, incluso si nada cambia con los sistemas existentes.

El dispositivo pionero de Voice Mass a escala masiva es el Amazon Echo. Las citas principales en este estudio realmente no tienen en cuenta gran parte de los casos de uso de Echo y se relacionan más con Voice como un apéndice del sistema operativo como los servicios relacionados con Siri y Google. La configuración de uso es bastante interesante. He usado un Echo en el automóvil, la cocina, el dormitorio, el baño y la oficina. Los dispositivos Voice First definen un espacio físico y claramente comienza en el hogar y el automóvil. Pero curiosamente menos útil sobre la marcha. Tengo muchos estudios que exploran las razones por las cuales.

Claramente, una de las razones fundamentales por las que Amazon creó Echo fue para ayudar al comercio. Llamo a esto Comercio de voz y no hay absolutamente ninguna duda de que la carga cognitiva y la carga mecánica sobre nosotros es significativamente menor cuando usamos nuestra voz. Este elemento único no solo definirá la plataforma Alexa, sino que también definirá Siri2, Viv y otros sistemas. Voice Commerce reemplaza a la publicidad.

El arco de crecimiento para la plataforma Alexa es asombroso. Con aproximadamente el 5% de un dispositivo, podemos ver que un efecto de red se impondrá muy pronto. Predigo que esto tendrá lugar a fines de 2016, cuando aproximadamente el 15% de los clientes de Amazon poseerán un dispositivo que tenga incorporado Alexa. En el camino, el sistema se convertirá en un orden de magnitud más potente.

Mary estima unos 6 millones de dispositivos Echo enviados hasta ahora. Podemos ver el crecimiento en comparación con los primeros años del iPhone. Estoy de acuerdo en que, en conjunto, en 10 años, el crecimiento combinado de todos los dispositivos Voice First superará las tasas de crecimiento de los teléfonos inteligentes.

Los legendarios Tech.pinions me pidieron que escribiera una descripción completa [2] después de que se rechazó la respuesta al Premio Quora Knowledge porque necesitaba “trabajo”. Puede leerlo aquí: hay una revolución por delante y tiene una voz.

Así es como se ve cuando un cambio masivo está sobre nosotros. Así es como se ve cuando incluso las personas que trabajan en IA y Voz no lo entienden. Aquí es donde comenzó oficialmente la revolución de Voice First.

Si esto no tiene sentido, aquí hay una versión simple:


[1] http://www.recode.net/2016/6/1/1…

[2] Hay una revolución por delante y tiene una voz