RSS congestiona el tráfico de algunas webs

Netcraft, sitio conocido por sus estadísticas mensuales sobre el WWW, publicó hace unos días un artículo acerca de los problemas de escala de RSS en algunos sitios populares. RSS Traffic Burdens Publisher's Servers, relata cómo los suscriptores de los titulares de Inforworld parecieran realizar un ataque distribuido al sitio:

«Infoworld.com experiences a "massive surge of RSS newsreader activity at the top of every hour," according to Chad Dickerson, the CTO of Infoworld. "If I didn’t know how RSS worked, I would think we were being slammed by a bunch of zombies sitting on compromised home PCs," Dickerson writes. "Our hourly RSS surge has all the characteristics of a distributed DoS attack, and although the requests are legitimate and small, the sheer number of requests in that short time period creates some aggravating scaling issues"».

Por supuesto, se trata de un uso inocente. Chad Dickerson explica el problema con más detalle en su columna RSS growing pains:

«Several months ago, I spoke to a Web architect at a large media site and asked why his site didn’t support RSS. He raised the concern that thousands (or even millions) of dumb clients could wreak havoc on a popular Web site».

Una mirada al fichero RSS de Inforworld con el navegador Mozilla Firefox nos muestra que no se envía la cabecera HTTP con la fecha de la última modificación, con lo cual se obliga a los agregadores habituales -que suelen estar bien programados- a descargarse no solo la cabecera, sino el fichero completo para comprobar si hay nuevas noticias. El protocolo HTTP permite solicitar la cabecera (HEAD) de una URL, para obtener información sobre cuánto pesa el archivo, el tipo de contenido, etc.

Pero en los gestores de contenidos que utilizan páginas dinámicas, como Blogalia, PHPNukes, etc, cada petición genera el fichero al vuelo, y por tanto, HEAD apenas da información directa, y hay que descargar el archivo completo. Esto se puede suplir programáticamente enviando la cabecera If-Modified-Since. A ver si Infoworld toma nota.

En todo caso, hay que tener cuidado con los agregadores, ya que si se popularizan y están incorrectamente programados, pueden devorar rápidamente el ancho de banda de nuestro sitio. La alternativa es utilizar servicios centralizados como Feedmania.


ListGarden 1.0

Dan Bricklin, uno de los creadores de VisiCalc (la primera hoja de cálculo) publica hoy la versión 1.0 de ListGarden, un agregador multiplataforma hecho en Perl y con licencia libre. Por las capturas disponibles en la documentación tiene buena pinta (aunque sugeriría que algún diseñador le echara una mano).

«The proliferation and growing popularity of RSS readers, highlighted yesterday with Apple's announcement of one coming in the Safari browser, makes RSS a more and more appropriate means for disseminating all sorts of information. Public weblogs and news headlines are not the only application. Website change logs, companions to email newsletters, project status reports, simple lists, use behind the corporate firewall, and more are possible and desirable».

Como esto siga así, hasta los registros del Apache estarán en RSS ;)

PD: Jean Yves me aclara que ListGarden no es un agregador, sino un generador de RSS (por ejemplo, para aquellos cuya herramienta de blogs no los genere automáticamente).


Apple: Servidor de weblogs y soporte de RSS en OSX 10.4

Tal y como comentábamos en Barrapunto, hoy comenzó la Worldwide Developer Conference de Apple, donde se suelen presentar muchas novedades. En software, la más importante ha sido la beta de MacOS X 10.4 (Tiger). En cuanto al mundo de la sindicación, la novedad a destacar es el soporte de RSS y Atom por parte de Safari, el navegador de Apple.

«With Safari RSS you can create your own personal news service about the topics you care about most. Enter a topic keyword into the special RSS search field and Safari RSS will search across all of your RSS feeds for matching headlines and then display the results on a single page in Safari. Bookmark the search and Safari RSS will update your custom news feed as new articles become available, making sure you have the latest headlines from the feeds covering your search topic. Safari RSS is compatible with all the RSS feeds on the Internet because of its standards-based support for RSS 0.9, RSS 1, RSS 2 and Atom».

Imagino que Firefox tardará poco en añadir esta funcionalidad de serie (sería un puntazo que llegara a tiempo de la versión 1.0). Visto en Slashdot.

PD: Por si fuera poco, en la página de novedades de la versión servidor de Tiger, cuentan que incorporará un servidor de weblogs:

«A new Weblog server in Tiger Server makes it easy to publish, distribute and syndicate web-based content. The Weblog server provides users with calendar-based navigation and customizable themes, is fully compatible with Safari RSS and enables posting entries using built-in web-based functionality or with weblog clients that support XML-RPC or the ATOM API. The Weblog Server, based on the popular open source project "Blojsom", works with Open Directory for user accounts and authentication».

Blojsom es la versión Java de blosxom, un sencillo software de blogs programado por Rael Dornfest.


Today's Papers: Otra vuelta de tuerca a la agregación de contenidos

Hace casi un mes de su inauguración, pero lo había pasado por alto. Cameron Barret, uno de los blogueros con más solera, inauguró su servicio de comentario de noticias TodaysPapers.com. Se trata de una página con las últimas noticias, categorizadas, y obtenidas mediante sindicación (por ahora, sólo un centenar de fuentes). La diferencia de leer las noticias en sus lugares originales (como el NY Times) es que los usuarios pueden comentar las noticias en TodaysPapers. Lo cuenta el propio Barret en CamWorld. Announcing TodaysPapers.com:

«Last week, a developer named Joe Stump and I built out my latest idea involving community, personal news management and online discussion. It is called Today's Papers: http://www.todayspapers.com

Simply put, Today's Papers is a news aggregator (like Google News) that provides a discussion thread for every article that comes through a subscribed feed. This means that you can now talk about news articles with other people even if the originating source does not have a discussion area on their site. Additionally, each news article gets it own unique ID which allows us to provide a Trackback service for it».

Me encantan este tipo de iniciativas, pero tengo mis dudas sobre su posible éxito (si está dirigido a un público bloguero). Tal y como está diseñada la interfaz, el sitio no escala bien. Con muchas noticias, será difícil conocer en qué noticias hay comentarios y cuáles no, porque desaparecerán de la portada. Y, en todo caso, para comentar ya tengo mi blog así que ¿para qué usar Today's Papers? (bueno, vale, tienen trackback).

En todo caso, merece la pena jugar un rato en el sitio.

PD: El que no experimenta, no se equivoca, pero tampoco acierta.


Un vistazo a los agregadores para MacOS

El web MacDevCenter, de O'Reilly Network, ha publicado una reseña sobre los agregadores (lectores de fuentes de sindicación -RSS, Atom, etc) disponibles para MacOS X. RSS: The Next Generation:

«Until very recently, NetNewsWire had the lion's share of the limelight, scooping awards and a great deal of praise from Mac-using webloggers. Then competitors started to appear. First Shrook, and now PulpFiction. The newcomers brought new ideas with them. What's going on?»

Soy usuario asiduo de NetNewsWire y aunque anuncié PulpFiction por aquí hace un tiempo, cuando todavía era beta y no habían más que capturas de pantalla... bastante impresionantes, por cierto (me lo voy a bajar ahora mismo para probarlo ;)

Como curiosidad, en este artículo apuntan a las estadísticas de Haiko Hebig (compañero en TypePad Europa) sobre hits de agregadores a su página. Si tengo un poco de tiempo, haré lo mismo con Blogalia.

Para los que sean usuarios de otros sistemas operativos, en el Wiki de la Blogosfera mantenemos una listado de agregadores, y hace unas semanas los ordené por plataforma.


A Andreessen le gusta el RSS

Micro Persuasion extracta la opinión de Marc Andreessen (uno de los creadores del navegador Mosaic y co-fundador de Netscape) al respecto de la sindicación web. Andreessen Comments on RSS:

«Washington, D.C.: Do you think RSS is the future of distributing information via the Internet?

Marc Andreessen: It's *a* future of distributing information :-). It's a very useful approach (this is the idea that you read "feeds" of content that are pushed to you, rather than browsing and searching). It's kind of Pointcast done right, for those of us who remember the late, not-much-lamented Pointcast from the late 90's. Plus the approach will work for a lot of other things too like being notified of auction results, new products, new classified ad listings, or whatever. It will work very well and lots of people will use it and the aggregators and software that are designed to support it but it won't replace browsing or searching, I don't think.

It's a good example of how the Internet keeps changing -- since the Internet is built on software, a new software approach like RSS can change how we think of the Internet without requiring anyone to rewire any networks. That's what I really like about the Internet. First it was email, then web, then IM, then Napster/Kazaa, then Apple iChat, now RSS... one thing after another after another...»

En resumen, Marc cree que la sindicación (o al menos el formato RSS) se popularizará, pero no que sea el futuro de la distribución de contenidos en Internet. Tampoco cree que reemplace la navegación ni la búsqueda en el web.

Y hablando de RSS, parece que Google está pensando si lo soporta, aparte de Atom. Blogger y la beta de los nuevos grupos de Google exportan la información en formato Atom, pero no en RSS, que de momento parece el más popular.


BlogBridge, agregador libre en Java

En Many 2 Many se referencia a BlogBridge, un agregador multiplataforma: Aggregator in development:

«Pito Salas, the technical architect of eRoom, one of the better pieces of corporate social software, is hacking away, writing an aggregator that so far he’s leaning towards open sourcing. He’s blogging the process, with lots of opportunities for the rest of us to comment on features, tech issues, licensing, etc. Pito is wide open to ideas about what would make his aggregator a truly useful tool».

En el blog de Salas se pueden leer las reflexiones del autor sobre su desarrollo (que acabo de añadirlo a la lista de agregadores en el Wiki de la Blogosfera).


Sindicación, correo-e, bitácoras y Bill Gates

Ya conté hace un par de días que a Bill Gates le gustan los blogs y la sindicación.  Bitacoras.com enlazó ayer un par de reflexiones bastante interesantes al respecto. Una, de Antonio Ortiz en Error500: Microsoft sigue rondando los weblogs:

«El acercamiento de Microsoft al mundo de blog habrá que observarlo detenidamente. De nuevo, al igual que en las búsquedas, llegaría a un mercado con varios rivales asentados. Al contrario que contra los buscadores, el número de nuevos usuarios que aún no tienen un weblog es mucho mayor que el de los que no lo tienen, siendo a estos a los que tendría más posiblidades de atraer Microsoft. Aunque Google con Blogger y otros productos como TypePad  o Blogs.Ya estén asentados y con una gran base de clientes, no hay que olvidar que el punto fuerte de Microsoft seguirá siendo la integración con el resto de sus herramientas».

Generalmente, me gusta pensar en la teoría del bar, donde en una calle ganamos todos si hay ambiente con varios bares que si hay uno solo. Sin embargo, las perspectivas de un MSN Blogger se me antojan una pesadilla.

Una de las analogías de Bill Gates para explicar qué es la sindicación y para qué funciona el formato RSS fue utilizar el simíl del correo-e. Y la comparación me parece realmente buena: la sindicación permite leer los webs como si fueran correo electrónico. En la bitácora Alex Barn se ahonda en esta parábola y compara el correo-e con RSS (pros, contras y diferencias de ambos) con la perspectiva de uso en el márketing.

«Since myearlier post on RSS in relation to email marketing, I've come across many related articles...I thought I'd point to some of these...bottom line is that Email as a sales driver has had dramatic success over the years...the debate should move away from RSS v Email and move to how RSS can become part of the marketing mix».

Entre los comentarios encontramos uno de Jakob Nielsen, que aclara algunas ventajas del correo-e que no tiene la sindicación. Principalmente, se queja de que no hay posibilidad de reenvío. Creo que es obvio: las fuentes RSS/Atom/RDF son simples ficheros de texto con formato, que sirven de dispositivos de lectura, mientras que nuestras bitácoras son dispositivos de escritura. Que la mayoría de lectores de sindicación (agregadores) no soporten aún enviar historias a nuestras bitácoras es sólo cuestión de tiempo. Y es precisamente su combinación lo que los hace buenas herramientas de comunicación.

Eppur si muove...


Fuentes RSS de Reuters

En Scripting News leo que la conocida agencia de prensa internacional Reuters inauguró su directorio de fuentes de sindicación. En la página Reuters RSS explican:

«Reuters news and television is now available through the Reuters RSS service. With Reuters RSS you can take Reuters world class news and television headlines, free of charge, and incorporate them into your preferred newsreaders and web logs».

Incluyen las secciones de últimas noticias, negocios, internacional, tecnología o ciencia, entre otras. Reuters se suma así a medios como BBC, New York Times, Washington Post (o en el caso de España, a La Vanguardia y El Mundo).

Anoche estuve reestructurando la página de Sindicación en el Wiki de la Blogosfera y, por ejemplo, ya se pueden localizar los lectores de fuentes por sistema operativo.