Previous month:
abril 2009
Next month:
octubre 2009

Wolfram Alpha, Post Scriptum

Resumen

  • Las expectativas están jugando en contra de Wolfram Alpha en este lanzamiento.
  • Stephen Wolfram desea controlar qué datos.

Wolfram Alpha - I'm afraid I cannot do that

Expectativas

Ayer se lanzó oficialmente Wolfram Alpha, después del fin de semana de pruebas en abierto. Durante estos días he intercambiado impresiones sobre el invento. Salvo el caso de mi hermano, en general la recepción de mis conocidos ha sido más tibia que la mía. Sospecho que en parte es por que hasta el jueves no había prestado mucha atención a los artículos sobre Alpha, y ya comentaba en la entrada anterior que el buzz podría jugar en su contra. Algunos titulares aparecidos estas horas: Un google para encontrar la respuesta exacta (Público), eWolfram Alpha, el buscador que te entiende (eWeek), wolframalpha, ¿el verdugo de Google? (Abc.es). Este artículo escrito por Paula Gil para EFE resume bien la situación, Llega a la red Wolfram Alpha, apodado el "asesino potencial" de Google:

«Fruto de varios años de trabajo del matemático Stephen Wolfram y su equipo, Wolfram Alpha quiere llevar las búsquedas de Internet a un nuevo plano y, más que proporcionar listas de resultados, intenta entender lo que el usuario está preguntando. [...] Los críticos se han deshecho en elogios sobre Wolfram Alpha, especialmente por su capacidad de entender lo que el usuario está preguntando. [...] El término "Barack Obama" nos ofrece el lugar y fecha de nacimiento del presidente de EE.UU., pero nada más».

Desconozco de quién ha sido el error, pero haber posicionado a Wolfram Alpha como un compeditor de Google está frustando a los nuevos usuarios. Sospecho que un buen porcentaje de las consultas son del tipo que se hacen habitualmente en Google, buscando una comparación directa, y los usuarios esperan obtener resultados similares (como en el caso de la periodista, que busca "Barack Obama" y "Agencia Efe Noticias"). Y claro, la decepción es enorme: ¿cómo puede ser que Google devuelva 2 millones de resultados y este cacharro ninguno? Pues porque Alpha no es un buscador, y tampoco es omnipotente.

El segundo error de márketing, y éste no es culpa de la prensa, ha sido vender Alpha como un intérprete inteligente. Tras probar con varias consultas, está claro que Alpha tiene muchas limitaciones para entender el lenguaje natural. Prueba de ello es que hay preguntas que Alpha es capaz de responder, pero solo si se realizan con la sintaxis adecuada.

El screencast del que hablaba en la entrada anterior y los vídeos donde Stephen Wolfram mostraba la herramienta daban a entender que el nuevo servicio era capaz de contestar casi a cualquier pregunta, y que por tanto disponía de una cantidad ilimitada de información. Esto ya lo sospechábamos: Mathematica y sus conjuntos de datos eran la base del producto, a los que se les ha añadido un interfaz web. Alguien hablaba de que Alpha fuera vaporware. En mi opinión, la heramienta es sencillamente impresionante, pero hay que aprender a usarla. En lugar de utilizar a ciegas la casilla de búsqueda, lo mejor que podemos hacer es navegar por el índice de ejemplos, que más que ejemplos son tutoriales de uso. Los ejemplos nos indican los dominios de conocimiento de Alpha, sus límites y la sintaxis más adecuada para realizar consultas.

En definitiva. En algún punto, la campaña promocional se les fue de las manos, y esto va a jugar en su contra, al menos hasta que se disipe la polvareda del lanzamiento.

Los talones de Aquiles de Wolfram Alpha

Me reitero un poco, pero sigo opinando que Wolfram Alpha es un regalo para la web semántica. El problema es que poner datos semánticos en Internet no es fácil ni sencillo, razón por la cual su adopción ha sido tan limitada. Alpha ha creado la necesidad de acceder a grandes cantidades de datos, especialmente numéricos, para así analizarlos de una forma sencilla. A pesar de que disponen ya de una gran cantidad, no podemos esperar a que tengan acceso a todos los datos imaginables de cualquier parte del mundo. Al menos, no de momento. Google es capaz de sentarse casi con cualquier ministro del mundo para solicitar la exportación de datos en tal o cual formato; Wolfram, no. Ayer mismo lanzaron la Comunidad Wolfram Alpha, para obtener retroalimentación (un clon de meneame, Pligg): se insiste en saber qué hacer para integrar datos externos.  O bien crecen a un ritmo endiablado para llegar donde no llegan, o bien abren su plataforma.

Y aquí llegamos al quid de la cuestión. Stephen Wolfram ha reiterado, una y otra vez, que los datos de Wolfram Alpha son y serán revisados por sus especialistas, no cree en que cualquier persona esté toqueteando los datos o los algoritmos. Esto es una importante limitación para el desarrollo de la plataforma, y en mi opinión podría resultar una decisión mortal. La semana pasada, Stephen Wolfram realizó una presentación de Wolfram Alpha en la Universidad de Harvard. En el turno de preguntas durante la presentación en Harvard le pidieron su opinión sobre la posible aparición de un competidor libre: su respuesta fue que este era un sistema muy complejo, que la Wikipedia es útil pero más bien enfocada a qué cosas son populares, que Alpha ya es gratuito, que están bien preparados tecnológicamente para aceptar gran cantidad de datos, que si se ven desbordados por las peticiones para mostrar datos, ya verán...

En definitiva, Stephen Wolfram ignora la lección las enciclopedias. A pesar de todos los esfuerzos, la Enciclopedia Britannica no ha podido competir cantidad, calidad y rapidez con la Wikipedia. Un proyecto de software libre que compita con Wolfram Alpha y sea más permisivo a la hora de aceptar colaboraciones lo relegaría rápidamente. La pasión de Wolfram son los números, pero no todos los internautas comparten esa pasión. Tiene razón en que la Wikipedia adolece de irregular calidad en muchos artículos, pero ninguna empresa es capaz de producir tal cantidad de conocimiento en tantos dominios diferentes. Y eso sin tener en cuenta el crítico asunto de la fiabilidad, tanto de las fuentes de datos como de los algoritmos. Veo casi imposible que Wolfram llegue a liberar el código fuente de Wolfram Alpha, que vendría a ser casi lo mismo que publicar el de Mathematica. (Llegado el momento lo más sencillo sería aceptar fuentes de datos no revisadas, pero podría ser demasiado tarde).

Así que Google tiene ahí una oportunidad para desquitarse. Google sabe pensar a lo grande: en red. Quizás le dé un par de vueltas a la idea para que otras personas podamos hacer nuestros propios Alphas y usar los datos que más nos apetezcan.

Sea como sea, estoy convencido de que las propuestas de Wolfram Alpha sobrevevirán a sus creadores.

Más información


Wolfram Alpha: Algo completamente diferente

Resumen

  • Wolfram Alpha no es un buscador, ni es una enciclopedia
  • Es un web que mezcla conceptos de bases de datos y análisis computacionales

Cada ciertos años uno ve una nueva aplicación que no se parece en nada a lo que habías visto antes, aunque solo sea en aparencia, y sabes que habrá un antes y un después. Ocurrió con Internet, con los navegadores, con Google... Pues bien, como decían los Monty Python, And now for something completely different: Wolfram Alpha. Como todavía no está en línea, es imprescindible ver esta presentación:

¿Lo has visto? ¿Te has quedado tan boquiabierto como yo? En los últimos meses se habían publicado algunas noticias sobre este buscador: en general los medios lo situaban como un competidor de Google. Sin embargo, si has visto la demostración, está claro que Wolfram Alpha no es Google, ni lo pretende ser.

A continuación comento algunas cosas que me parecen destacables.

Alpha es Mathematica

Para entender el origen de esta herramienta quizás es bueno recordar que es un proyecto de Stephen Wolfram, creador de Mathematica y autor del controvertido libro A New Kind of Science. Mathematica es una herramienta de análisis computacional, bastante popular entre ingenieros y científicos. Entre otras muchas cosas, este programa ofrece una serie de datos para utilizar: astronómicos, químicos, geopolíticos, financieros, matemáticos, de idiomas, biomédicos, climatológicos... Son, justamente, los tipos de datos que aparecen en la presentación. Por ejemplo, si echamos un vistazo a la página de Mathematica sobre esos datos geopolíticos vemos que podemos obtener una gráfica del PIB de Francia entre 1970 y 2005. Para ello hay que llamar a varias funciones, con una serie de parámetros:

20090514wolfram-mathematica  


En la presentación de Wolfram Alpha obtienen datos parecidos:

20090514wolfram-alpha-gdp


Como vemos Alpha muestra los mismos datos sobre Francia. La diferencia con Mathematica es que es un sitio web, no un software de escritorio. Y la forma de obtener los datos mezcla las búsquedas por palabras clave y el lenguaje natural -o algo que se le acerca: gdp france, what is the gdp of france. A primera vista impresiona el procesamiento de lenguaje natural, pero gdp france es mucho más corto que what is the gdp of france. ¿La lección? El uso de consultas con cierta estructura evita ambigüedades y ahorra tiempo.

((Alpha vs Google) vs Wikipedia)

¿Todavía hay alguien que piensa que el buscador de Google tiene algo que ver con Wolfram Alpha? Si es así, aquí van algunos argumentos. Hay ciertas similitudes entre Alpha y Google.

  • La página principal de Alpha, con su caja de búsqueda, es un gran homenaje a Google.
  • En Google y Alpha se introducen una serie de palabras y se obtienen unos resultados ;-P
  • Alpha es también un proyecto novedoso y ambicioso, al estilo de Google (uno hubiera esperado que un invento como este saliera de sus laboratorios).
  • Google y Alpha miman mucho la presentación de los datos, intentando ser minimalistas, claros y funcionales.

Pero a partir de ahí, las diferencias son grandes.

  • Google rastrea e indexa documentos que están en Internet, documentos principalmente en HTML, sin estructura.
  • Alpha controla cuáles son las fuentes de datos que utiliza, y son datos con estructura: series temporales de datos, fórmulas matemáticas, símbolos químicos, etc.
  • Alpha intenta realizar una interpretación de las consultas. En el buscador de Google, por lo general, se usan las palabras clave para consultar los índices (aunque también usan algo de procesamiento de lenguajes naturales).
  • Para cada tipo de búsqueda, Alpha presenta diferentes tipos de datos.

Sí es cierto que Google anda trabajando en cuestiones paralelas a Alpha. Google es capaz de realizar sencillas operaciones matemáticas en sus consultas. En 2007 adquirió Gapminder, un visualizador de estadísticas sobre los países. Más recientemente han estado trabajando en la publicación de datos públicos.

Algunos comparan Alpha con la Wikipedia. Tampoco creo que sea acertada esa comparación. La Wikipedia no realiza cálculos, y no almacena series de datos. Sí es un sitio donde se compila el conocimiento, pero en general no es información computable. Sí que han habido esfuerzos para extraer contenido semántico de la Wikipedia y utilizar el lenguaje natural para realizar las consultas. Es el caso de Powerset, adquirida por Microsoft.

Las claves de Alpha

Según Stephen Wolfram, los pilares de Alpha son cuatro:

  • Conservación de los datos. La información está obtenida por lugares públicos y privavdos, y validados por expertos.
  • Algoritmos. Entre 5 y 6 millones de líneas de código de Mathematica con modelos, ecuaciones y métodos.
  • Lenguaje. Las preguntas en lenguaje natural se interpretan simbólicamente para su procesamiento.
  • Representación automática. Los resultados se presentan de forma útil para la gente.

Según Wolfram, en el desarrollo de Alpha han participado 100 personas. El día del lanzamiento, han querido ser capaces de responder a 175 millones de consultas diarias, y para ello han puesto en marcha dos supercomputadores, con 10 mil núcleos y cientos de terabytes.

Sobre el procesamiento de lenguaje natural. En la presentación han seleccionado ejemplos resultones, así que habrá que ver cuáles son las limitaciones cuando Alpha esté abierto al público. Por ejemplo, en las demostraciones ha sido incapaz de responder a preguntas de los periodistas, tales como "teenage pregnancy USA", "what type of sunglasses was Justin Timberlake wearing at the Oscars" y otras relacionadas con los deportes.

Si nos guiamos por el tipo de consultas realizadas en la presentación, no parece que Wolfram Alpha se dirija a un público general. La herramienta está pensada para analizar datos. A pesar de ello, y gracias a su interfaz simple y al procesamiento de lenguaje natural, conseguirán atraer a personas con un perfil mucho menos avanzado que el de Mathematica.

Alpha y la web semántica

Stephen Wolfram ha afirmado que la plataforma se abrirá a contribuciones de terceros. A mi me parece que esta herramienta, de tan fácil uso, es un gran argumento para que los gobiernos y los organismos internacionales liberen de una vez sus datos. Por no repetir el análisis, que bien lo hace Pablo Moreno, está claro que Wolfram Alpha y la web semántica pueden beneficiarse muntuamente:

«Uno de los problemas de Wolfram Alpha, es que sus bases de datos son limitadas (ahora mismo tan solo 10TB). Puede ser bueno en lo que hace, pero mantener y aumentar una base de datos así, siendo una empresa relativamente pequeña, puede ser muy complicado. Sin embargo, es posible que Wolfram se acabe beneficiando de la Linked Data (más explicaciones aquí). Si Tim Berners-Lee tiene éxito promoviendo la apertura de bases de datos, posiblemente no sería muy complicado para Wolfram acceder directamente a las mismas, y convertirse en un magnífico front-end de la linked data, con todo el poder de procesado abstracto y gráfico que tiene Mathematica».

Puedo pecar de optimista, pero Wolfram Alpha puede ser el regalo más grande que le hayan podido hacer a Tim Berners Lee y su web semántica: hay ya un buen referente para la experiencia de usuario.

Alpha, Beta, Gamma...

Algunas personas que han probado la beta se han desilusionado con la falta de respuestas y acusan al producto de estar por y para personas técnicas. Independientemente de lo que ocurra tras la apertura de Wolfram Alpha, creo que la propuesta que han realizado es tan atractiva que, a pesar de que no se cumplan las promesas, otros continuarán el camino. Más pronto que tarde aparecerán servicios web inspirados en las características de Alpha: contenidos estructurados, buscadores se, etc. .

Y por si los amigos de Google no lo habían dejado claro, el futuro es de los nerds ;)

Referencias

PD - 16 may: Bueno, pues ya está abierto. Después de jugar un poco con Wolfram Alpha, creo que lo descrito en el artículo permanece aplicable. En Barrapunto, faragon realiza algunas búsquedas y  reflexiones.

PD - 19 may: Wolfram Alpha, Post Scriptum. Algunas reflexiones tras el lanzamiento.