Wolfram Alpha: Algo completamente diferente
15 mayo 2009
Resumen
- Wolfram Alpha no es un buscador, ni es una enciclopedia
- Es un web que mezcla conceptos de bases de datos y análisis computacionales
Cada ciertos años uno ve una nueva aplicación que no se parece en nada a lo que habías visto antes, aunque solo sea en aparencia, y sabes que habrá un antes y un después. Ocurrió con Internet, con los navegadores, con Google... Pues bien, como decían los Monty Python, And now for something completely different: Wolfram Alpha. Como todavía no está en línea, es imprescindible ver esta presentación:
¿Lo has visto? ¿Te has quedado tan boquiabierto como yo? En los últimos meses se habían publicado algunas noticias sobre este buscador: en general los medios lo situaban como un competidor de Google. Sin embargo, si has visto la demostración, está claro que Wolfram Alpha no es Google, ni lo pretende ser.
A continuación comento algunas cosas que me parecen destacables.
Alpha es Mathematica
Para entender el origen de esta herramienta quizás es bueno recordar que es un proyecto de Stephen Wolfram, creador de Mathematica y autor del controvertido libro A New Kind of Science. Mathematica es una herramienta de análisis computacional, bastante popular entre ingenieros y científicos. Entre otras muchas cosas, este programa ofrece una serie de datos para utilizar: astronómicos, químicos, geopolíticos, financieros, matemáticos, de idiomas, biomédicos, climatológicos... Son, justamente, los tipos de datos que aparecen en la presentación. Por ejemplo, si echamos un vistazo a la página de Mathematica sobre esos datos geopolíticos vemos que podemos obtener una gráfica del PIB de Francia entre 1970 y 2005. Para ello hay que llamar a varias funciones, con una serie de parámetros:
En la presentación de Wolfram Alpha obtienen datos parecidos:
Como vemos Alpha muestra los mismos datos sobre Francia. La diferencia con Mathematica es que es un sitio web, no un software de escritorio. Y la forma de obtener los datos mezcla las búsquedas por palabras clave y el lenguaje natural -o algo que se le acerca: gdp france, what is the gdp of france. A primera vista impresiona el procesamiento de lenguaje natural, pero gdp france es mucho más corto que what is the gdp of france. ¿La lección? El uso de consultas con cierta estructura evita ambigüedades y ahorra tiempo.
((Alpha vs Google) vs Wikipedia)
¿Todavía hay alguien que piensa que el buscador de Google tiene algo que ver con Wolfram Alpha? Si es así, aquí van algunos argumentos. Hay ciertas similitudes entre Alpha y Google.
- La página principal de Alpha, con su caja de búsqueda, es un gran homenaje a Google.
- En Google y Alpha se introducen una serie de palabras y se obtienen unos resultados ;-P
- Alpha es también un proyecto novedoso y ambicioso, al estilo de Google (uno hubiera esperado que un invento como este saliera de sus laboratorios).
- Google y Alpha miman mucho la presentación de los datos, intentando ser minimalistas, claros y funcionales.
Pero a partir de ahí, las diferencias son grandes.
- Google rastrea e indexa documentos que están en Internet, documentos principalmente en HTML, sin estructura.
- Alpha controla cuáles son las fuentes de datos que utiliza, y son datos con estructura: series temporales de datos, fórmulas matemáticas, símbolos químicos, etc.
- Alpha intenta realizar una interpretación de las consultas. En el buscador de Google, por lo general, se usan las palabras clave para consultar los índices (aunque también usan algo de procesamiento de lenguajes naturales).
- Para cada tipo de búsqueda, Alpha presenta diferentes tipos de datos.
Sí es cierto que Google anda trabajando en cuestiones paralelas a Alpha. Google es capaz de realizar sencillas operaciones matemáticas en sus consultas. En 2007 adquirió Gapminder, un visualizador de estadísticas sobre los países. Más recientemente han estado trabajando en la publicación de datos públicos.
Algunos comparan Alpha con la Wikipedia. Tampoco creo que sea acertada esa comparación. La Wikipedia no realiza cálculos, y no almacena series de datos. Sí es un sitio donde se compila el conocimiento, pero en general no es información computable. Sí que han habido esfuerzos para extraer contenido semántico de la Wikipedia y utilizar el lenguaje natural para realizar las consultas. Es el caso de Powerset, adquirida por Microsoft.
Las claves de Alpha
Según Stephen Wolfram, los pilares de Alpha son cuatro:
- Conservación de los datos. La información está obtenida por lugares públicos y privavdos, y validados por expertos.
- Algoritmos. Entre 5 y 6 millones de líneas de código de Mathematica con modelos, ecuaciones y métodos.
- Lenguaje. Las preguntas en lenguaje natural se interpretan simbólicamente para su procesamiento.
- Representación automática. Los resultados se presentan de forma útil para la gente.
Según Wolfram, en el desarrollo de Alpha han participado 100 personas. El día del lanzamiento, han querido ser capaces de responder a 175 millones de consultas diarias, y para ello han puesto en marcha dos supercomputadores, con 10 mil núcleos y cientos de terabytes.
Sobre el procesamiento de lenguaje natural. En la presentación han seleccionado ejemplos resultones, así que habrá que ver cuáles son las limitaciones cuando Alpha esté abierto al público. Por ejemplo, en las demostraciones ha sido incapaz de responder a preguntas de los periodistas, tales como "teenage pregnancy USA", "what type of sunglasses was Justin Timberlake wearing at the Oscars" y otras relacionadas con los deportes.
Si nos guiamos por el tipo de consultas realizadas en la presentación, no parece que Wolfram Alpha se dirija a un público general. La herramienta está pensada para analizar datos. A pesar de ello, y gracias a su interfaz simple y al procesamiento de lenguaje natural, conseguirán atraer a personas con un perfil mucho menos avanzado que el de Mathematica.
Alpha y la web semántica
Stephen Wolfram ha afirmado que la plataforma se abrirá a contribuciones de terceros. A mi me parece que esta herramienta, de tan fácil uso, es un gran argumento para que los gobiernos y los organismos internacionales liberen de una vez sus datos. Por no repetir el análisis, que bien lo hace Pablo Moreno, está claro que Wolfram Alpha y la web semántica pueden beneficiarse muntuamente:
«Uno de los problemas de Wolfram Alpha, es que sus bases de datos son limitadas (ahora mismo tan solo 10TB). Puede ser bueno en lo que hace, pero mantener y aumentar una base de datos así, siendo una empresa relativamente pequeña, puede ser muy complicado. Sin embargo, es posible que Wolfram se acabe beneficiando de la Linked Data (más explicaciones aquí). Si Tim Berners-Lee tiene éxito promoviendo la apertura de bases de datos, posiblemente no sería muy complicado para Wolfram acceder directamente a las mismas, y convertirse en un magnífico front-end de la linked data, con todo el poder de procesado abstracto y gráfico que tiene Mathematica».
Puedo pecar de optimista, pero Wolfram Alpha puede ser el regalo más grande que le hayan podido hacer a Tim Berners Lee y su web semántica: hay ya un buen referente para la experiencia de usuario.
Alpha, Beta, Gamma...
Algunas personas que han probado la beta se han desilusionado con la falta de respuestas y acusan al producto de estar por y para personas técnicas. Independientemente de lo que ocurra tras la apertura de Wolfram Alpha, creo que la propuesta que han realizado es tan atractiva que, a pesar de que no se cumplan las promesas, otros continuarán el camino. Más pronto que tarde aparecerán servicios web inspirados en las características de Alpha: contenidos estructurados, buscadores se, etc. .
Y por si los amigos de Google no lo habían dejado claro, el futuro es de los nerds ;)
Referencias
- Wolfram Alpha, Regreso al futuro.
- Wolfram Alpha, ReadWriteWeb (en inglés).
- Stephen Wolfram Reveals Radical New Formula for Web Search, Wired (en inglés).
- Wolfram Alpha, Conceptual Graphs (en inglés).
- A Sneak Preview Wolfram Alpha, Universidad de Harvard (vídeo, en inglés).
- Impressive: The Wolfram Alpha “Fact Engine”, Search Engine Land (en inglés).
- Hilo de debate en news.ycombinator.com.
PD - 16 may: Bueno, pues ya está abierto. Después de jugar un poco con Wolfram Alpha, creo que lo descrito en el artículo permanece aplicable. En Barrapunto, faragon realiza algunas búsquedas y reflexiones.
PD - 19 may: Wolfram Alpha, Post Scriptum. Algunas reflexiones tras el lanzamiento.