¿En qué tipos de búsqueda falla más claramente Google? ¿Y qué vías y sitios abordan estos problemas mejor o más prometedora?

El fracaso de Google es más obvio para las consultas en las que Google no responde correctamente al lenguaje natural. Algunos ejemplos:

[páginas web con títulos mal escritos]
http://www.google.com/search?q=w…

Desafortunadamente, esta búsqueda solo devuelve páginas web con títulos correctos, a pesar de que hay millones de respuestas aceptables. Google no comprende la naturaleza “meta” de esta solicitud, sino que trata las palabras como palabras clave.

[la red social como myspace pero más grande]
http://www.google.com/search?q=t…

En general, Google no puede resolver consultas formuladas como una pregunta de lenguaje natural a menos que exista una página web que haga y responda la pregunta.

[de qué color es la hierba en Cincinnati, Ohio]
http://www.google.com/search?q=w…

La parte “cincinnati ohio” de la consulta es irrelevante para la respuesta y debe ignorarse. Esto es difícil de entender para Google, ya que casi siempre la palabra “cincinnati” es bastante importante para la consulta.

Búsquedas en tiempo real de productos y servicios locales . Tiene que quedar un enorme dinero sobre la mesa porque no puedo hacer una búsqueda para averiguar dónde puedo comprar [insertar un artículo de cola larga esotérica] en un radio de X millas en este momento . Las búsquedas en la web invariablemente conducen a vendedores electrónicos, lo cual es excelente si estoy dispuesto a ordenar en línea, usar una tarjeta de crédito, esperar al menos uno o dos días para recibir lo que sea que se entregue y hacer arreglos para estar en casa (o en el trabajo). ) para aceptar la entrega. Pero si necesito una batería extra para mi modelo específico de cámara digital hoy, incluso en una ciudad enorme como SF o LA, no hay una manera fácil de encontrarla y comprarla ahora en persona.

Puntos de bonificación si son las 9 pm y la búsqueda podría decirme qué tiendas están abiertas hasta las 10. Duplicar puntos de bonificación adicionales para comparar precios y distancias para que pueda optimizar la decisión de compra (es decir, la tienda X cobra $ 2 más pero está 15 minutos más cerca). En cambio, o la compra se retrasa o estoy atrapado haciendo lo mismo que hubiera hecho en 1951 en lugar de 2011: llamando o visitando cada tienda local (electrónica o cámaras en este ejemplo) para ver si tienen la batería almacenada, cuánto cobran, y si tienen alguno actualmente en inventario.

Los servicios son similares. Es domingo de pascua; ¿Qué cafeterías locales independientes están abiertas en Berkeley? (Un verdadero ejemplo del fin de semana pasado). ¿O qué peluquerías están abiertas para ese corte de pelo en un día festivo, y cuánto dura la espera? ¿Qué tintorerías o lavanderías están abiertas las horas más largas en el vecindario y cómo se comparan sus precios? Y así.

Hay todo un ámbito de búsqueda que va más allá de la búsqueda de palabras clave y la recuperación de documentos basada en PageRank. Google es poderoso cuando puede rastrear una gran Web y aprovechar la escala de PageRank, pero no funciona dentro de la empresa, que no tiene la escala de la Web pública.

La búsqueda empresarial es un hueso duro de roer. Pero hay muchos ejemplos de otros tipos de búsqueda en la Web pública que hacen cosas que Google no hace. Aquí hay una pareja que hace cosas interesantes. Cuando trabajan, obtienen respuestas específicas, no una lista de resultados de la página:

1) TrueKnowledge ( http://www.trueknowledge.com/ ) está en la categoría de aprendizaje automático; Puede darle respuestas específicas a las preguntas. Depende de bases de conocimiento curadas. TrueKnowledge puede aprovechar más de 433 millones de datos y su base de conocimiento está en constante crecimiento a medida que los usuarios ingresan información. Por ejemplo, solo le pregunté: “¿Cuántos reactores nucleares hay en Japón?” Google sirvió un sitio con una respuesta bien documentada a esta pregunta. Introduje la información y el enlace en TrueKnowledge, TrueKnowledge ya tiene una buena respuesta a “¿Cuántos equipos de las grandes ligas de béisbol hay?

2) Wolfram | Alpha ( http://www.wolframalpha.com ) también podría considerarse aprendizaje automático, pero parece más intensivo en computación que TrueKnowledge. Stephen Wolfram da una buena descripción de lo que Wolfram | Alpha hace en http: // blog .stephenwolfram.com / 2 …. Una de las cosas que dice: “…
lo que hace Wolfram | Alpha es convertir el lenguaje natural en un preciso
forma interna computable Y luego toma esta forma y utiliza su conocimiento computable para calcular una respuesta a la pregunta “. Compara W | A con IBM Watson de esta manera:
Fuente; http://blog.stephenwolfram.com/d