Previous month:
septiembre 2010
Next month:
diciembre 2010

España en el #cablegate

Resumen

  • Wikileaks ha publicado 250 mil teletipos de las embajadas estadounidenses.
  • De ellos, 3500 están relacionados con España.
  • A la espera del contenido "completo" de los teletipos, echamos un ojo a las etiquetas de los mensajes relacionados con España.
  • Hay comunicaciones relacionas con las elecciones generales de 2004, el País Vasco y el contraterrorismo.

Actualización 30/11.

Como todo el mundo mundial sabrá a estas alturas, cuatro periódicos han publicado en primicia los primeros análisis del llamado #cablegate. Se trata de una filtración realizada por la organización Wikileaks de 200 mil teletipos enviados desde las embajadas estadounidenses a la Secretaría de Estado de EEUU, el equivalente al Ministerio de Exteriores español, desde 1966 a 2010. El País ha sido uno de esos periódicos con acceso privilegiado, y cuentan su versión en La mayor filtración de la historia deja al descubierto los secretos de la política exterior de EE UU. Según el New York Times, los teletipos y las informaciones se irán publicando en los próximos días.

De momento, en la página "oficial" de Cablegate sólo están disponibles los textos de 220 teletipos. El País también tiene una selección, y una página explicando cómo interpretar los códigos que acompañan a estos documentos.

Como aperitivo, el Data Blog del diario The Guardian ha publicado en formato CSV (valores separados por comas) un fichero con los metadatos de los teletipos, que incluyen la fecha, hora, embajada remitente y etiquetas. El periódico británico también ha publicado una hoja de cálculo guía de las etiquetas, para poder interpretarlas, y una hoja de cálculo con algunos análisis estadísticos del origen y las etiquetas.

"SP", España

El País ha prometido publicar información relacionada con España, pero de momento el poco adelanto que tenemos es un artículo publicado en su versión anglosajona, Diplomatic cables released by Wikileaks reveal US views about Spain. Mientras tanto, he descargado el fichero de metadatos de The Guardian y he filtrado las entradas para la etiqueta correspondiente a España, que es "SP". Los mensajes tienen este formato: 

2010-02-26T16:42:00Z,Embassy Madrid,"OREP, PREL, SP"

Esto es: fecha, embajada (o consulado) remitente, y palabras clave. Según la tabla de The Guardian, OREP significa "U.S. Congressional Travel", PREL es "External Political Relations" y "SP" es la etiqueta para España. He localizado 3672 mensajes y los datan de entre 1986 y 2010.

El siguiente gráfico muestra la cantidad de comunicaciones relacionadas con España por año/mes, desde febrero de 2004 a febrero de 2010. El mes con mayor número de mensajes es junio de 2005, con 131. Desconozco cuán representativa es la muestra de Wikileaks. Los datos los he puesto en una hoja de cálculo en Google Docs.

20101129cablegate-mes-sp

Este otro gráfico muestra los países que EEUU relaciona principalmente con España. Destacan Irán, Cuba, Francia, Siria y Afganistán.

20101129cablegate-paises-spSamuel Negredo ha realizado gráficos de nubes de etiquetas, mostrando las etiquetas más populares en los teletipos relacionados con España. A continuación muestro solo los 25 actividades más citadas en los asuntos concernientes a España (técnicamente, las etiquetas de cuatro caracteres). Para conocer el significado de todas las etiquetas, hay que consultar la tabla de The Guardian.

20101129cablegate-temas-spSegún los mensajes filtrados, los teletipos sobre España están relacionados con PREL (External Political Relations, relaciones políticas externas), OTRA (Travel, viajes), PGOV (Internal Governmental Affairs, asuntos gubernamentales internos), ECON ("Economic Conditions") y PTER (Terrorists and Terrorism, terroristas y terrorismo).

Además de estas etiquetas de dos caracteres (asociadas  países) y de cuatro (asociadas a actividades), hay otras etiquetas más descriptivas. Por ejemplo:

2004-02-23T12:07:00Z,Embassy Madrid,"PGOV, PREL, SP, Popular Party, PSOE - Socialist Party, Spanish Election March 2004"

Elecciones 2004 y 11-M

Durante los primeros meses de 2004, hay muchos teletipos relacionados con las elecciones y el PSOE. Por ejemplo, el 1 de marzo se habla de las elecciones generales y de contraterrorismo (no sé si están relacionados, o son dos comunicaciones sin relación).

2004-03-01T21:14:00Z,Embassy Madrid,"PTER, PGOV, SP, Spanish Election March 2004, Counterterrorism"

El 11 de marzo de 2004, día de los atentados en Madrid, hay varias comunicaciones entre la embajada estadounidense. En negrita señalo las que pueden estar relacionadas con los atentados.

2004-03-11T13:58:00Z,Embassy Madrid,"PTER, PREL, ASEC, SP, OSAC, Counterterrorism, Spanish Election March 2004"

2004-03-11T13:58:00Z,Embassy Madrid,"ENRG, TRGY, KSCA, OTRA, SP, Country Visits"

2004-03-11T13:58:00Z,Embassy Madrid,"ECON, ETRD, SP, Trade Issues"

2004-03-11T13:58:00Z,Embassy Madrid,"SENV, OTRA, KSCA, TPHY, SP, Country Visits"

2004-03-11T13:58:00Z,Embassy Madrid,"TSPA, OTRA, SP, Country Visits"

2004-03-11T18:29:00Z,Embassy Madrid,"PREL, MARR, SP, NATO"

2004-03-11T23:17:00Z,USUN New York,"UNSC, PTER, PREL, SP"

A las 11 de la noche, hay una comunicación remitida desde la oficina estadounidense en la ONU a la embajada española, relacionada con el Consejo de Seguridad (UNSC). Del día 12 también hay teletipos filtrados relacionados con contraterrorismo, el PP, el PSOE y las elecciones, tema que ocupa a la embajada en las siguientes semanas. El 18 de abril de 2004, el día en que Zapatero anuncia la retirada de las tropas españolas de Irak, sólo hay un par de comunicaciones. Tras lo cual, en las siguientes semanas hay muchos teletipos dedicados al PSOE y a las relaciones "American - Spanish".

País Vasco

Hay varias menciones al País Vasco, concretamente durante el año 2005.

2005-01-03T15:34:00Z,Embassy Madrid,"PGOV, PTER, SP, Basque Region"

2005-02-04T17:12:00Z,Embassy Madrid,"ECON, PGOV, PTER, SP, Basque Region"

2005-04-18T15:13:00Z,Embassy Madrid,"PGOV, PTER, SP, Basque Region"

2005-05-16T14:43:00Z,Embassy Madrid,"PTER, PGOV, SP, Basque Region"

2005-06-17T14:35:00Z,Embassy Madrid,"PGOV, PTER, SP, Basque Region"

PTER significa "Terrorists and terrorism". Las fechas son cercanas a algunas acciones de la banda terrorista ETA. 5 días después del teletipo del 3 de enero, pusieron varias bombas en el País Vasco. La comunicación del día 4 de febrero se produce cinco días antes del atentado de ETA en el Parque Juan Carlos I en Madrid. La del 16 de mayo se produce un día antes de que el Congreso apruebe la autorización de diálogo con ETA. La del día 17 de junio sería un día antes del anuncio de ETA de no atentar contra políticos electos. Desconozco si son meras coincidencias.

Curiosidades

Hay algunos nombres de personas filtrados en estos metadatos. Buscando en Google, parecen relacionados con extradiciones, asistencias judiciales, visados y visitas de diplomáticos y personal relevante en la administración estadounidense. También hay un par de mensajes de la embajada "preocupada" por la población musulmana en España:

2004-07-30T14:30:00Z,Embassy Madrid,"KPAO, KDEM, OIIP, PREL, EAID, PHUM, PGOV, EUN, OEXC SP, Spain's Muslim Population"

Por desgracia, a partir de 2006, la información descriptiva es poco habitual en el fichero, así que tendremos que esperar a la publicación de los mensajes. Es posible que se pueda extraer algo más de información del fichero publicado por The Guardian, pero a estas horas de la madrugada, el cerebro no da para más.

Actualización 30/11. Para los teletipos de España, he realizado un gráfico que combina la información temporal del número de comunicaciones con la de temas citados (etiquetas de cuatro caracteres). El streamgraph muestra el número de teletipos enviados según tema. Por limitaciones del software, sólo están incluídos los 20 temas más frecuentes. El gráfico está generado gracias a streamgraph.js. El gráfico a mayor resolución está disponible en Flickr. Está disponible una página con la versión original en JavaScript (es interactiva, el ratón nos da información sobre la etiqueta y frecuencia de la región).

20101130-cablegate-streamgraph-sp

En el gráfico anterior de etiquetas se explicaba su significado. ¿Cómo interpretar la infografía? Es de esperar que, debido a los acontecimientos, exista una evolución en los temas principales que trata el gobierno estadounidense con España. Por ejemplo, hay una gran actividad de mensajes relacionados con viajes (OTRA) en 2005, segunda mitad de 2006 y 2007.


El estudio de piratería de la Coalición de Contenidos, bajo el microscopio

Resumen

  • IDC, a instancias de la Coalición de Contenidos, ha publicado un estudio sobre piratería.
  • Ni la metodología ni los datos están suficientemente explicados.
  • Los resultados no coinciden con la macroencuesta de AIMC Navegantes en la Red.

El pasado miércoles, El País publicó un artículo en primicia donde se desvelaban los datos del segundo estudio sobre 'piratería'. El estudio del Observatorio de piratería y hábitos de consumo de contenidos digitales está realizado por IDC y Nielsen Online (aparentemente en una encuesta a 6000 personas). El informe ha sido encargado por la Coalición de Contenidos, cuyo portavoz es Aldo Olcese. Los informes de IDC no están disponibles al completo, pero en la página de CEDRO sobre Reprografía y piratería se pueden encontrar los resúmenes ejecutivos correspondientes a 2009 y el primer semestre de 2010 (que es el que se presentó esta semana).

Lo primero que hay que preguntarse es cuál es la definición de piratería digital que utiliza IDC. Lo cual, a mi, no me queda nada claro. Según explican:

«El estudio analiza la piratería de pago, es decir, se excluyen del análisis aquellos contenidos que por ser gratuitos para el consumidor no son susceptibles de ser pirateados (Ej Películas en abierto por TV, música en la radio, juegos gratuitos online, streaming musical, etc)».

Detrás del matiz que introducen sobre la gratuidad hay una cuestión importante, y es el asunto de la copia privada. Recordemos que la Ley de Propiedad Intelectual recoge explícitamente la posibilidad de disfrute de obras sin permiso de los autores, si no hay ánimo de lucro y no hay reproducción colectiva. Esta es la razón de la existencia del canon compensatorio (más en Redes P2P y Copia Privada). El estudio debería excluir las descargas amparadas por la copia privada, porque de lo contrario estarían confundiéndola con la piratería de software -recordemos que la LPI no permite la copia privada de software.

Bueno, ahora que (no) tenemos claro qué es la piratería que estudia el informe, pasemos a las conclusiones. Para el primer resumen ejecutivo de junio de 2010, el estudio dice que:

  1. La tasa de piratería ascendió, en media ponderada, a un 76,0%.
  2. El valor total de los contenidos pirateados asciende a 5.121 millones de euros.
  3. El potencial mercado "ilegal" legalizable es de 2.928 millones de euros.

Es la primera vez que se hace el estudio, pero la tasa de piratería «ascendió». Vale. ¿Y cómo llegan a esas conclusiones? El resumen ejecutivo tampoco define qué es tasa de piratería ni explican a partir de qué datos la han calculado. En un estudio sobre piratería de software de 2007, vemos que IDC y BSA definen tasa de piratería como el «número total de unidades de software pirateado desplegados en 2007, dividido por el total de unidades de software instalado». ¿Han preguntado cuántas canciones, películas y libros ha descargado los usuarios a través de Internet y cuántas tienen en casa? Si es así, ¿cuántos son? En el resumen ejecutivo, IDC no lo explica.

En el informe ejecutivo de IDC sólo se muestran dos gráficos con preguntas de la encuesta que han realizado. Se trata del uso de servicios de descarga de contenidos.

20101105idc-descargas
Se corresponden con preguntas de la encuesta realizada por Nielsen Online a 5911 usuarios de Internet. La primera diapo es sobre hábitos de uso de P2P y la segunda, servicios de descarga directa, agrupados por edades. Según IDC/Nielsen, la mayoría de usuarios de Internet entre los 16 y 55 años usan P2P, y mientras que sólo los usuarios más jóvenes usan servicios de descarga directa. Sería interesante conocer si estas preguntas tienen impacto en el cómputo de la tasa de piratería. Tal y como están citadas están sin restricción temporal (1 mes, 6 meses, 1 año). Se puede interpretar com «¿Alguna vez ha descargado contenidos de...?».

IDC vs AIMC: P2P - No cuadran las cuentas

20101106egm-p2p Lo interesante del gráfico sobre uso de P2P es que podemos compararlo con la macroencuesta de Navegantes en la Red (PDF), de la Asociación para la Investigación en Medios de Comunicación (AIMC), responsable del conocido Estudio General de Medios. Se realiza anualmente y en la de 2009 disponen de 36.000 encuestas válidas a Internautas españoles. Para conocer qué hacen los internautas hay varias preguntas, de las que destaco «¿Cuáles de las siguientes actividades ha realizado a través de Internet en el último mes?», «Durante el día de ayer, ¿qué servicios de Internet utilizó?» y «¿Cómo clasificaría su frecuencia de uso de redes de intercambio de archivos P2P?». Entre ellos (páginas 49, 56 y 93-96):

  • El 61% utiliza regularmente redes P2P (29% poco o nunca, 9% NS/NC).
  • El 53% ha descargado música (en el último mes). 90% gratuito, 4% de pago, 6% ambos.
  • El 48% ha descargado películas (en el último mes). 94% gratuito, 2% de pago, 4% ambos.
  • El 58% ha descargado software (en el último mes). 91% gratuito, 3% de pago, 6% ambos.

Primera conclusión: sólo la mitad de los internautas afirma descargar contenidos en el último mes, y sólo el 40% ha usado P2P en ese periodo. Segunda conclusión: un 10% de los internautas afirman pagar por contenidos en línea. Curiosamente, los porcentajes de conversión en los modelos freemium son similares. Ahora comparemos los datos de AIMC con IDC.

  • AIMC: 61% de usuarios de P2P.
  • IDC: 80% de usuarios de P2P.

Vaya, vaya, vaya. ¡Una diferencia de 20 puntos porcentuales!

Podemos comparar más datos para comprobar la coherencia. Vayamos ahora a por el gráfico de uso de P2P por edades. Para ello, he utilizado el Panel de Tabulaciones para la encuesta Navegantes en la Red. El panel permite relacionar tablas y variables. Lo que he hecho ha sido obtener una hoja de cálculo con los datos de P2P relacionado con la variable de edad de los encuestados (en enlace muestra los resultados en bruto en Google Docs). La gráfica que obtenemos de los usuarios de P2P por edades comparada con la de IDC es esta:

20101106egm-p2p-edades
Como puede verse son gráficas muy diferentes. En ambas, con la edad disminuye el uso de P2P, lo cual es lógico. Pero, por ejemplo, según la encuesta de 6000 usuarios de IDC/Nielsen, el 70% de los internautas de entre 45 y 55 años han descargado contenidos desde algún servicio de P2P. Según la encuesta de AIMC a 30.000 usuarios, cuyos datos están públicamente disponibles, sólo el 46% de 45-54 años ha descargado contenidos: otra vez, una diferencia de 20 puntos porcentuales. Recordemos que ambos estudios se refieren al mismo periodo.

Es más, comparemos los datos de 2009 y del primer semestre de 2010.

20101106idc-p2p-edades

Y aquí tenemos lo que podría ser una noticia destacada: según Nielsen/IDC, en un semestre el uso del P2P ha descendido significativamente. También puede ser que los datos de 2009 no fuesen correctos. Sospechosamente, la gráfica de 2010 se parece más a la del EGM de 2009.

AIMC vs IDC: Pago por contenidos

Uno de los datos que utiliza IDC para calcular el mercado ilegal potencialmente "legalizable" es el porcentaje de usuarios dispuestos a pagar el contenido. En música lo estiman en 58,4%, en videojuegos el 59,3%, en películas el 54,8% y en libros, el 69,0%. El estudio de Navegantes en Red tiene una pregunta para eso en la página 142, «En cuanto a los contenidos en Internet protegidos por copyright (música, películas, software,...) ¿con cuál de los siguientes modelos estámás de acuerdo?». Esto son los resultados:

20100611egm-pago
Sólo el 18% está dispuesto a pagar por acceder, siempre y cuando sea a precios razonables, el resto prefiere canon y/o acceso gratuito con publicidad. Como poco hay 40 puntos porcentuales de diferencia.

Conclusiones

Si teníamos problemas con una metodología opaca, y con definiciones nada claras, nos podemos preguntar: ¿Cuán fiables son los datos de 2009 de IDC sobre piratería? Los de AIMC no avalan sus resultados para 2009. Pero es más. Si buscamos en Google referencias sobre IDC y la piratería, nos encontramos conque ni en Suecia ni en Canadá IDC investigó la piratería de software para 2009, pero eso no le impidió realizar una estimación y que se publicaran sus resultados en los principales medios de comunicación. ¿Les suena el cuento de algo?

No quiero alargarme más, porque Ricardo Galli analiza las afirmaciones económicas del "estudio" en IDC, La Coalición y periodistas, o cómo darte por culo con las estadísticas, donde sugiere que las estimaciones del valor de lo pirateado y el potencial legalizable son brindis al sol. También Javier de la Cueva indicaba otro estudio interesante del gobierno de EEUU publicado este mismo año que ponen en cuestión los estudios de impacto económico de la piratería y falsificaciones. Lo que creo que queda claro es que nadie puede fiarse de estudios poco o nada transparentes, cuya metodología y datos no son públicos ni replicables. También se echa mucho en falta medios de comunicación y periodistas con capacidad crítica y voluntad de desentrañar qué hay detrás de las declaraciones intencionadas de los grupos de presión (o como afirma jocosamente un usuario de Barrapunto, grupos de prisión).

Por fortuna, siempre nos quedará Internet... o no.