Cuando pienso en las interfaces de comandos de voz, pienso en cuatro cosas:
- Primero, pienso en Star Trek.
- Segundo, cómo uso Google Now y Siri.
- Tercero, pienso en el producto con el que jugué, traté de desarrollarlo y finalmente no pude encontrar un caso de uso para Ubi. No, ya no existe como producto independiente.
- Tostadoras
Primero, piense en Star Trek. Lo que estoy pensando de Star Trek es el puente:
O puente un poco más viejo:
O puente derivado:
O puente clásico:
Fanáticos de Star Trek, lo sé, extrañé algunos de sus puentes favoritos. Cuatro es más que suficiente para esta publicación.
En términos de tecnología, ¿qué ves en TODAS esas fotos?
Pantallas Teclados. Botones. Pantallas táctiles.
Cuando el Capitán habla con la computadora, generalmente es algo así como “Computadora, Registro del Capitán, Fecha de Estrella [lo que sea]” o “Computadora, lea toda la lista de la tripulación para la Enterprise” o “Té, Earl Grey, caliente “(Fuente: Next Generation). O la computadora les dice algo como, “Advertencia. Deformar la ruptura del núcleo en 45 segundos ”(Voyager).
Siempre hay una maldita ruptura del núcleo warp.
Sacando mi cerebro (e Internet), la única película algo reciente que encontré con una computadora que está en todas partes con la que hablas todo el tiempo estaba en iRobot … y allí, no funcionó bien para las personas, y muchas esos robots están diseñados para parecerse a las personas, de todos modos.
Incluso los escritores de ciencia ficción pensaban que el control por voz era una llamada y respuesta inmediata, o como alertas. No se usó para largas conversaciones. Deben haber pensado que, por alguna razón, no queremos tener una conversación con una caja o una tostadora. Queremos que funcione, y que funcione rápidamente, y es más rápido y más eficiente simplemente presionar un botón en lugar de tener una conversación.
Los consumidores se preocupan por la conveniencia, no por la interfaz. Vamos a usar lo que sea que nos haga moderadamente más fácil hacer algo.
Casi todo este entretenimiento salió antes de que realmente tuviéramos comandos de voz en nuestro bolsillo.
Uso mucho mi software actual controlado por voz, en el automóvil. Dice así: “Ok, Google. Tráfico “. Y luego obtengo un mapa con tráfico. Preferiría que me dijera el tráfico para no tener que mirar la pantalla. Es conveniente.
A mi hijo le encanta hablar con Siri. Está constantemente agarrando el teléfono de mi esposa y diciendo: “Oye, Siri, muéstrame fotos de tiburones”. Es un niño pequeño, y Siri no puede entenderlo, y ponemos el teléfono lejos de él. Pero él no sabe leer ni escribir, por lo que el comando de voz es mucho más conveniente para él.
Echo es muchísimo más útil que Siri o Google Now, porque Alexa tiene que responderte. Pero ella todavía no es genial todavía.
Cuando salió el Ubi hace un par de años, compré dos. Si no sabes qué era el Ubi, fue un precursor y competidor de Echo el que enchufaste a la pared, y se veía así:
Estaba realmente emocionado de intentar hacer un producto que le leyera una historia: en mi empresa, contamos historias para vivir, y pensé que tener una aplicación que le leyera una de nuestras historias sería increíble. Así que los conectamos y comenzamos a jugar con algunas de las aplicaciones integradas.
Fue divertido durante aproximadamente un minuto. La gente entraba constantemente a mi oficina y gritaba: “Ok, Ubi, ¿por qué apestan los Jets?” O “Ok, Ubi, ¿por qué te equivocaste sobre el clima?”
Ubi se esforzó por responder a estas preguntas, y a menudo lo hizo bien. Pero se sentía … torpe. Si bien Ubi era súper inteligente y, en realidad, se podía hacer casi cualquier pregunta y obtener una respuesta razonable, nos repetíamos constantemente. Y, si mira en Amazon, comenzará a ver reseñas como esta de cinco estrellas para el Echo (esta fue la tercera revisión que vi en Amazon, después de una de una persona que está sola en casa todo el tiempo y otra de un persona que está discapacitada, pero encontré muchos otros con un sentimiento similar):
Solicité un Echo (Alexa) a fines de 2014 y Amazon me envió una invitación para comprar uno en febrero. Lo he usado a diario desde entonces. Esta revisión va a sonar un poco contradictoria. La amo. La odio, la amo. Permítanme comenzar diciendo que Alexa, aunque la amo, a veces es aproximadamente un 50% más inteligente que un bulldog. Su coeficiente intelectual está entre 25 y 160, según lo que le hayas preguntado. Aprenderá muy rápidamente cómo hablar con ella de una manera que ella entienda y no es diferente a hablar con un niño pequeño y frustrante. Alexa, ¿cuándo nació George Washington? George Washington nació … bla, bla, Alexa, para. Hubo rumores de que sus dientes eran de madera pero estos resultaron ser falsos, ¡ALEXA deja de hablar!
Ese crítico, y alrededor de 31,000 más, aman su Echo. Y lo usan para … tocar música. Leyendo audiolibros. Encendiendo las luces de su casa.
Me molesta la idea de que hablar con un niño pequeño es frustrante. Lo es, pero también lo sacas de ellos (de nuestra feria local, en su primera montaña rusa. Sí, le dije que era más divertido tener las manos en alto todo el tiempo, lo cual hizo. del viaje para mantenerlo en su asiento, pero no en esta foto):
Alexa nunca sentirá esa alegría.
El caso de uso de Echo es para cosas para las que ya hay una interfaz. Cuando queremos reproducir música o libros en casa, activamos Pandora y se transmite a través de un altavoz independiente (que no necesita ser enchufado) que obtuve de forma gratuita cuando compré mi teléfono. Pero estoy de acuerdo, hablar con Alexa y tocar música es más fácil.
Realmente no creo que sea más fácil usar Echo que encender un interruptor de luz. Los interruptores de luz generalmente están junto a la puerta y están ahí cuando entras. Supongo que hay un caso de uso en el que llevas bolsas de comestibles y no quieres bajarlas para encender la luz … pero eso es un Realmente menor comodidad.
No hay duda de que Echo hace que estas cosas sean más convenientes para algunas personas, especialmente las personas con discapacidad, y que hace lo que hace muy, muy bien. Y tampoco hay duda de que muchas comodidades menores se suman rápidamente para convertirse en una gran comodidad, y ese parece ser el plan de negocios de Echo.
Lo que vuelve a mi experiencia con The Ubi. Originalmente teníamos la intención de crear una aplicación que nos contara una de nuestras historias. Pero, entonces, comenzamos a encontrarnos con problemas importantes de interfaz, especialmente en comparación con el estándar de oro en ese campo, Audible (que es propiedad de Amazon). Específicamente, tenemos 101 historias por libro, y descubrimos que las personas querían que el comando de voz hiciera cosas como “Encuéntrame una buena historia sobre gatos”.
Tenemos miles de historias sobre gatos. ¿Qué hace una buena? Como lo valoras? ¿Cómo construimos una IA cruda que conozca tus gustos?
Todas estas cosas tenían solución. Pero el problema era que no podíamos averiguar quién estaba resolviendo esos problemas.
Nuestra audiencia ya descarga una tonelada de audiolibros de Audible. Ciertamente no estábamos tratando de competir con ellos.
Ya teníamos opciones de accesibilidad en los libros electrónicos y en nuestro sitio web que permitía a los lectores de pantalla leer a las personas con discapacidad.
Pudimos ver cómo Ubi podría facilitar esto, pero también nos quedó claro que cosas como Echo y Google Now resolverían esto antes y más rápido de lo que lo haríamos. E incluso entonces, no estábamos seguros de que la gente quisiera usar nuestra aplicación para leer nuestras historias en lugar de, por ejemplo, obtener una aplicación de Audible que leyera todo su catálogo. Eso nos pareció una mejor idea. Así que esperamos, y ese día está aquí.
Y aquí es donde está el problema con estos productos. Porque, aunque puedo pensar en algunas aplicaciones de juegos divertidas (a la Zork, pero solo de voz en lugar de solo de texto), al final del día, todo lo que está haciendo es agregar una pequeña cantidad de conveniencia, mucho en el Del mismo modo, una tostadora facilita tostar pan.
Por cierto, si nunca has tostado pan en el horno o en una sartén, debes probarlo. Obtiene la ventaja de derretir la mantequilla directamente en el pan, y es más capaz de controlar qué tan dorado es el pan tostado. Nos toma unos 3 minutos tostar algo en la estufa versus cinco minutos en tostadora, pero no tenemos que prestarle atención a la tostadora, lo que hace que gane la mayor parte del tiempo.
Clasifico las tostadoras como un artículo de lujo menor. Son agradables de tener, pero, realmente, puedes vivir sin ellos con bastante facilidad. Viví sin uno durante unos 15 años. Pero tengo uno ahora, y está bien.
Y creo que eso es lo que Amazon Echo y otras interfaces de voz terminarán siendo: un artículo de lujo agradable y menor.
Por ejemplo, Amazon actualmente le ofrece un 20% de descuento para ordenar pañales a través de su cuenta Prime. Todo lo que dices es: “Alexa, pide pañales”. Y los pañales están en camino.
Eso es bastante asombroso. Será increíble incluso cuando detengan esta promoción.
Pero, es una conveniencia menor. Quiero decir, para algo como pañales, generalmente ya tenemos eso en el envío automático. No tengo que hablar con Amazon en absoluto. Solo se envía. O puedo pasar aproximadamente un minuto en el sitio para comprar pañales con un solo clic, y Amazon tal vez tenga la oportunidad de venderme más o recordarme que también necesito toallitas y bolsas de basura, y cualquier otra cosa que haya olvidado. Tengo que pensar más, lo que siempre es desagradable, pero no es un gran problema.
La gente que ama a Echo señalará que es una maravilla técnica y que soy injusto cuando lo comparo con una tostadora. Cuando salió la primera tostadora emergente en casa en 1926, también fue una maravilla técnica, y costó alrededor de $ 12.50, que son $ 165.17 en dólares de hoy. Eso no es tan diferente de los $ 179 que el Echo cuesta hoy. ¿Sabía que hay al menos 56 tostadoras que son más caras que Echo en Amazon? Y eso es ser generoso y detener mi búsqueda en tostadoras de $ 195 para darme un búfer de $ 15 para cualquier descuento futuro.
La mayoría de los hogares estadounidenses tienen una tostadora. Creo que, con el tiempo, la mayoría de los hogares estadounidenses también tendrán un asistente de voz, y ese asistente de voz se conectará a su automóvil y su teléfono y cualquier otro dispositivo que exista. Pero creo que la novedad desaparecerá rápidamente, y comenzaremos a pensar en estos dispositivos como si fueran tostadoras con bastante rapidez. Solo serán otro electrodoméstico que tenga en su hogar que le haga la vida un poco más fácil (a menos que esté discapacitado, en cuyo caso, puedo ver que esto es un cambio total de juego para la accesibilidad).
Ese es un mercado bastante grande. Eso es, como, 125 millones de clientes potenciales para el Echo, además de la cantidad de habitaciones que la gente ha multiplicado por el Amazon Echo Dot, la hermana pequeña de Alexa. Pero, como una tostadora, realmente no importará si tienes Amazon Echo o Google, lo que sea que terminen llamándolo, Viv o Siri o quien sea. Simplemente será lo que tienes en tu casa, y esperarás que funcione, y la marca se desvanecerá bastante rápido.
Para 1936, había muchas alternativas viables a la tostadora emergente original, por ejemplo, había 18 tostadoras revisadas por Consumer Reports ese año. Eso es 10 años después de la introducción de la tostadora emergente, que estaba protegida por patentes.
Siri debutó en 2010 y, para todos los efectos, es el comienzo de este género de asistente personal. Sí, las cosas como la voz automatizada para cosas como el servicio al cliente habían existido por más de 20 años en ese momento, pero Siri fue la primera en general. Estamos a seis años de esta revolución, y los jugadores están tratando de descubrir quién dominará. Amazon está haciendo un juego muy fuerte con Echo para hacer eso, y ser el Toastmaster de facto de esta industria.
Entonces, ¿qué tan grande podría ser? Tan grande como las tostadoras. Pero no será solo el Echo. Habrá docenas de estos dispositivos en poco tiempo.
Gracias por el A2A, Sabrina.