Reflexiones e Irreflexiones


Inicio > Historias > WWW2004: los artículos

2004-06-01


WWW2004: los artículos

En esta historia vamos a hacer un pequeño resumen y algunos comentarios sobre los artículos de la conferencia WWW 2004 Workshop on the Weblogging Ecosystem: Aggregation, Analysis and Dynamics a la que no envíamos nada en su día por problemas financieros, pero que claramente hubiera sido una apuesta interesante.

Upflux: An open index for weblogs (pdf, sólo las transparencias).
Primero, la presentación de Maciej Ceglowski (conocido por su
NITLE Blog Census y su interesante Idle Words) y Cameron Marlow (conocido por Blogdex, también bitacorea en overstated). Proponen una nueva infraestructura para las arañas bitacoreras, upflux.net. Todos sabemos que hay un montón de cacharritos por ahí, y un montón de arañas visitando nuestras bitácoras. De las transparencias de la presentación (lamentablemente no hay artículo explicando estas cosas) deducimos que la idea es crear una infraestructura común, tal vez con una estructura distribuida de arañas que almacenarían sus resultados en un repositorio común. Me parece una idea muy interesante.

How can we measure the influence of the blogosphere? (pdf).
Kathy E. Gill.
Se trata de una revisión de diferentes formas de medir la influencia de la blogocosa en la opinión pública y los medios de comunicación de masas. Con respecto a los medios se habla de que el punto de inflexión podría establecerse al principio del 2002 cuando los medios empezaron a hablar de bitacoreo, aunque algunos ya llevaban tiempo experimentando con ello. Además, muchos periodistas han adoptado esta forma de publicar dentro de su rutina diaria (bien dentro de sus propios medios, bien de forma individual e independiente). Aporta un dato curioso sobre la adopción de tecnologías bitacoreros, que no se si habíamos referenciado aquí: en marzo de 2004 Variety.com fue el primer periódico en adoptar el 'trackback' para todos sus artículos y revisiones.

Por otra parte, informa acerca del uso por parte de los políticos; desde su incursión en la web, ya hace unos cuantos años, a la creación de una bitácora por parte de Howard Dean (con comentarios y 'trackback') y la comparación ofrecida por Cool/Lame donde se ponen frente a frente los contenidos de las bitácoras de los candidatos a presidente para las próximas elecciones usanianas.

Para la autora, la influencia de la blogocosa es clara, pero compara la dificultad de la medición de esa influencia a la de la medición que se hace en ambientes académicos de la influencia de sus trabajos, mediante el recuento de citas.

En todo caso, notar que la autora no pasa de proporcionar datos anecdóticos y no hace lo que anunciaba en el título, sino que proporciona datos sueltos ligados con un discurso adecuado.

Empieza nombrando el caso de la historia de Trent Lott, que fue prácticamente ignorada por los medios tradicionales, un par de bitacoreros importantes lo nombraron e hicieron que los medios recuperaran la historia y Lott tuvo que dimitir.

También cuenta como Microsoft utilizó la historia de un usuario de Mac que se había pasado ('switch') a Windows. Resultó ser falsa y el descubrimiento se produjo entre los comentaristas de la nota en Slashdot. Web users turn tables on Microsfoft es donde se cuenta la historia.

Dentro de la orbitácora la autora comenta sobre algunos de los cacharritos bitacoreros, basados principalmente en el recuento de enlaces. En particular habla sobre Blogosphere.us, Blogrunner, BlogStreet, y Technorati, comentando sobre las diversas medidas de influencia proporcionadas por cada uno de los sitios.

Todo bastante usa-céntrico, como el congreso que albergaba estos artículos. Hace algunos comentarios sobre los sitios más influyentes, incluyendo la fecha de creación y algunos datos de visitas.

Automatic Collection and Monitoring of Japanese Weblogs (pdf).
Tomoyuki Nanno, Yasuhiro Suzuki, Toshiaki Fujiki, Manabu Okumura.
¿Dije usa-céntrico? También hubo participación japonesa.
Este artículo me pareció bastante interesante por lo que aporta en cuanto a propuestas para identificar sitios web: la idea es tratar de diferenciar bitácoras de cosas que no lo son, supuesto que ya uno tiene una lista de sitios web japoneses.

El método se basa en la extracción de fechas (y la posterior observación de si aparecen secuencias de fechas ordenadas); el segundo paso sería la extracción de entradas fechadas, basándose en las fechas obtenidas en el paso anterior. Finalmente, se establecen unas cuantas reglas para filtrar páginas que no son bitácoras, primero basadas en palabras contenidas en la URL ('bbs', 'chat', 'session') y también en palabras contenidas en el título ('bbs', 'email magazine'); segundo, basadas en reglas aplicadas a las entradas individuales (fechas en el futuro, entradas muy espaciadas en el tiempo, fechas repetidas, fechas desordenadas, entradas demasiado breves, fechas que no están al principio, palabras -'admin', 'reply', 're:' ...-, entradas sin predicados -verbos, adjetivos, ...-). Finalmente, también se controla la evolución de las páginas aceptadas como bitácoras. En este caso, se sigue descargando la página y aplicando las reglas a las entradas posteriores, con algunas adicionales (las nuevas fechas deberían estar entre la última fecha de descarga y la actual, por ejemplo).

Tengo mis dudas en cuanto a la cuestión de las fechas, pero me parece un esfuerzo muy interesante.

Implicit Structure and the Dynamics of Blogspace (pdf).
Eytan Adar, Li Zhang, Lada A. Adamic, Rajan M. Lukose.

Yo creía que de este ya habíamos hablado, pero debo de tenerlo en la pila de pendientes...

Este artículo presenta algo de lo que ya hemos hablado en vidas anteriores: la evolución de las ideas en la blogocosa. Trata de extraer información acerca de la propagación de la información, con una herramienta gráfica, cuyos resultados pueden verse en Memes, Blogs, and iRank.

Muestran diferentes patrones de difusión de la información, desde la que corresponde al interés sostenido, o a un pico de un par de días con decrecimiento lento, o picos de un día con un decrecimiento muy rápido, o también picos de un día con decrecimiento lento. Creo que deberíamos reproducir este estudio en la orbitácora, a ver qué sale. De particular interés (y discutibles, como todo) son los números que se utilizan como umbral para seleccionar determinadas URLs.

Finalmente hacen una comparación de los resultados de su algoritmo (iRank) frente al conocido (y famoso) PageRank de Google.

BlogPulse: Automated Trend Discovery for Weblogs.
Natalie S. Glance, Matthew Hurst, Takashi Tomokiyo.

Este artículos habla sobre BlogPulse que es una herramienta para descubrir de qué cosas se habla en la blogosfera. Publican a diario una lista de personas, frases, párrafos, ... que aparecieron en diferentes bitácoras.

Contiene algunos errores graves en la introducción, al decir que el primer congreso bitacórico fue el BloggerCon cuando BlogTalk fue antes, pero bueno ....

Posteriormente cuenta cómo extraen enlaces, frases, temas, personas y otros datos de las bitácoras que vigilan (alrededor de 10000, pararon de añadir nuevas a su lista al llegar a esta cifra).

Creo que esto también es algo que deberíamos hacer en la blogocosa.


Personal Knowledge Publishing Suite with Weblogs (pdf).
Ikki Ohmukai, Hideaki Takeda, Kosuke Numa.
En este artículo se habla de Semblog, una herramienta de publicación personal de conocimiento, que proporciona un entorno para gestionar la recepción y publicación de información, así como las relaciones con otros.

Por un lado, proponen el procesado de información mediante técnicas de la web semántica (sea lo que sea eso) que todavía no han desarrollado. En segundo lugar, ofrecen las bitácoras como herramientas para la creación/publicación de contenido. En tercer lugar, proponen su herramienta, basada en la lectura de contenido de fuentes RSS y su clasificación y re-distribución según diferentes modelos, desde simples enlaces, a extractos o incluso extractos con comentarios editados manualmente.

Para ello, hay disponibles varias herramientas: el RNA (RSS Aggregation Service) (en japonés, aviso) que permite: suscripción a fuentes RSS, construcción de un árbol global con toda la información integrada, construcción de subárboles según ciertas reglas, re-distribución del contenido de estos subárboles (¿planetas temáticos?), extracto de información de algunos temas, actualización, seguimiento de 'trackbacks', y otras tareas relacionadas con las fuentes RSS.

Otra herramienta es Glucose (también en japonés), un agregador independiente. Permite la gestión de fuentes RSS, gestión de trackbacks, envío de notas a una bitácora, extracción de textos ('clipping'), y recomendaciones a otros mediante un modelo P2P.

Esta gente no sólo ha hecho el ecolucionador universal, sino que le han añadido características.

Finalmente, con toda esta infraestructura pueden hacer sistemas de recomendación basados en la información de gente de nuestra confianza (usando FOAF). En particular, permite la recomendación colaborativa, pero también por similaridad temática, o filtrado relacional basado en la red social de cada usuario.

Por otra parte, también se proponen herramientas egóricas, creando redes relativas al contenido de las historias de un autor, permitiendo búsquedas de gente que habla de lo mismo, palabras clave, y cosas así.

Estoy deseando echarle un ojo y probarlo con detenimiento.

En realidad, estoy deseando programar algo así.

Mapping the Blogosphere in America (pdf).
Jia Lin, Alexander Halavais.

Este artículo se centra en la detección de características geográficas
relativas a las bitácoras y, nuevamente, centrándose en USA. Es un tema que
no me apasiona, aunque reconozco que tiene su interés. Pero como esto ya va quedando suficiéntemente largo, no diré mas.

Blogs as "Protected Space" (pdf).
Michelle Gumbrecht.

De un antecesor de este hablamos en Encuestas bitacoreras y creo que no aporta novedades, así que les remito al otro, si todavía les quedan fuerzas.




votar

Referencias (TrackBacks)

URL de trackback de esta historia http://fernand0.blogalia.com//trackbacks/19112

Comentarios

Nombre
Correo-e
URL
Dirección IP: 54.162.164.247 (19a0fa0531)
Comentario

Acerca de...

Esta es la bitácora de Fernando Tricas García. Está alojada en Blogalia:


Soy profesor y aquí hablo de internet y de casi cualquier cosa que me interese en cualquier momento.
Nací en Huesca y vivo en Zaragoza.

Se puede ver la página de Fernando Tricas García en la Universidad de Zaragoza donde hay información sobre mis clases, temas de investigación y también información sobre otras actividades como charlas, conferencias, cursos fuera de la universidad...

En El Mundo Es Imperfecto se pueden ver otras páginas y publicaciones que voy dejando por la red.

  • RSS
  • Inicio
  • Archivo
  • Contacto
  • Ver estadísticas (Statcounter)
    eXTReMe Tracker

Listas de deseos

Derechos

  • Contrato ColorIuris Verde

Perfil profesional

Seguir en Twitter


Calendario

<Julio 2017
Lu Ma Mi Ju Vi Sa Do
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
By Fernando Tricas García (En Google)