5.1.1.

09 marzo 2005

Los tags de Technorati (y la folcsonomía en general) son sobrevaluados

Categorí­a

Aunque el post gira sobre los servicios de Technorati, ciertos puntos pueden ser extendidos a otros servicios de internet que se basan en la folcsonomía (como del.icio.us en partícular).

Introducción

Extraido de la definición de folcsonomía en la Wikipedia:

… categorización colaborativa por medio de etiquetas simples en un espacio de nombres plano.

O sea que es la gente ordena dentro de categorías creadas por ella misma. Aplicado al ámbito de internet sería clasificar los recursos, como posts en el caso de los blogs o fotos en caso de Flickr, aplicandoles etiquetas para que servicios automatizados puedan reunirlos dentro de una misma categoría. De esta forma, cuando un usuario investiga la categoría Madonna en Technorati encontraría los documentos más recientes relacionados con la cantante.

Finalizada la introducción, pasaré felizmente a la queja.

El atríbuto abusado

Pobre del atríbuto rel. Pensado para explicar las relaciones entre documentos, terminó haciendose conocido por el valor alternate para enlazar los archivos de suscripción, Google lo encontró indefenso a la hora de usarlo para el infame no-follow y ahora lo rematan con el valor tag. Personalmente hubiera usado chapter para las categorías de un blog y que luego de ahí Technorati las extrajera. O quizás otro atríbuto que explique que uno está enlazando otro documento que funciona como repositorio. Es más, empiezo a sospechar que debería ser rev en realidad.

Igualmente rel no es el punto de este post.

Tocayos

La maravilla (inserte aquí algunas estrellitas) de este nuevo metodo de categorización es que es construido desde el suelo hacia arriba por nosotros, no por una máquina o por 3 moderadores poco imparciales (cita: La necesidad de usar tags para las categorías). Reformulado lo anterior sería que los mismos usuarios que generaron el contenido son los que clasifican sus recursos (en lugar de un programa automatizado que debe hacer suposiciones aka cualquier buscador). Aparentemente quién imaginó este método y lo vió como una utopía no recordó un detalle importante: la gente es tonta (en el sentido de su rechazo a la idea de pensar demasiado) y necesita ser controlada.

Voy a poner un simple ejemplo de como una persona promedio es peligrosa. Suponiendo un sujeto X que escribe un artículo sobre el navegador Opera, lo más probable (aparentemente) es que lo termine etiquetando simplemente como Opera. Suponiendo un sujeto Y que escribe sobre Cecilia Bartolli, lo más probable es que (entre otras categorias), termine etiquetando su artículo como Opera. Podés revisar la categoría Opera en Technorati para apreciar como se mezclan los contenidos. Otros casos son los de bug que reune tanto a los insectos como a los errores de programa como cookies que practicamente ignora lo referente a las cookies como archivos.

La necesidad de control

El mejor ejemplo de darle poder al pueblo sin que el poder los termine matando es la Wikipedia. Cuando un contenido no es el apropiado, se lo borra. Cuando dos nombres para distintos temas se superponen, se crean distintas entradas. En la Wikipedia existen entradas diferenciadas para la ópera como expresión artística y el navegador Opera.

Entonces aunque uno tiene el poder de contribuir, no llega a ser un poder absoluto al estar moderado en el fondo por los símpaticos 3 moderadores poco imparciales.

Demasiado especifico

Curiosamente diferentes intentos de encontrar categorías formadas por dos palabras no dieron resultados. De ahí se desprende que el usuario promedio tiene una marcada tendencia a simplificar (y a generalizar como comentaré más adelante).

Para evitar la contraproducente —contraproducente contra el concepto de folcsonomía— opción de la moderación, imaginemos que la gente nota el problema de los tocayos. ¿Es más adecuado una categoría llamada Opera Browser, Opera_Browser, Opera-Browser ó Browser Opera (por no mencionar Opera UA)?

Metelo ahí

Personaje 1
¡Agregaste un artículo en la categoria de CSS! ¿De qué se trata?
Personaje 2
Ni idea. Ví que decia CSS un par de veces así que lo metí ahí.

Esto se vuelve un problema frecuente (y no sólo por ser categorías importantes). La gente mete cualquier cosa en cualquier lado. Hace poco revisando la categoría CSS en Technorati encontré un enlace a un post de alguién que se limitaba a decir que había rediseñado su blog. Es valido decir que existe una relación pero es exagerado reconocerla como un aporte al tema.

Otro caso de recursos que son extremedamente generalizados son los posts personales. ¿Qué puede terminar cayendo en esa categoría? Los posts de los blogs que se dedican a llevar registro de la vida cotidiana del autor probablemente no, porque justamente estos blogs crean varias categorías específicas para lo que otros generalizarían como personal. ¿Que hay del resto? En un caso, la categoría personal podría contener principalmente posts que cuenten pequeñas anecdotas fáciles de entender. En otro blog que quizás tiene una temática muy específica (por ejemplo Uberbin con las empresas y la tecnología) un post personal podría ser una crítica al gobierno por contener una visión muy subjetiva del tema. En un tercer blog podría ser una cita de un poema que sólo tiene sentido para quien lo citó.

Ayudando a meter basura

O dandole poder a todos. Wordpress ¿desde su versión 1.5? agrega a los enlaces de las categorías el valor tag para que los posts sean indexados por Technorati. Ésto seguramente está provocando la aparición de varias categorías que en realidad son la misma o categorías que casi no merecen ser categorías.

Para el primer caso podemos imaginar como ejemplo un blog que reune poesías en una categoría llamada mis hermosas poesías y que terminará con sus posts totalmente desconectados de la categoría poesía (medianamente) más apropiada. Y no, la opción de categorías relacionadas no es la solución.

El segundo caso se podría aplicar a los metaposts (posts que hablan del blog). Tomemos el caso de Lewenhaupt (sin animo de ofender, señor). JEL, su autor, reune sus metaposts en una categoría títulada como su blog. Esto lleva a que Technorati haya creado una categoría especifica para eso. Es como querer enterarse de lo superficial evitando a toda costa el contenido del blog. Alguien podrá decir que la ventaja de esto es que aplicado a otras categorías, el usuario visitante puede filtrar aquellos posts que no son de su interes, pero por un lado, para eso se crearon las categorías y si el interes viene de tener un archivo de suscripción para la categoría específica, éste debería ser una función de los propios manejadores de contenido —CMS para los amigos— y no depender de un tercero que terminaría corriendo mayor riesgo de saturarse.

¿Nos conocemos de antes?

Durante un tiempo estuve suscripto a la categoría CSS de del.icio.us. Practicamente todos los días alguien enlazaba al CSS Zen Garden. ¡Se necesita un control ahí! Si del.icio.us se toma la molestía de almacenar indefinidamente los diferentes enlaces es para que puedan ser investigados. O quizás es todo un plan para hacernos recordar algo mediante la técnica del hartazgo.

Siguiendo con del.icio.us, el otro problema (que algunos vieron como algo interesante) es la posibilidad de titular los enlaces aportados y ver qué considera cada persona como el título más apropiado. Por ejemplo, al agregar un recurso sobre operadores lógicos a la categoría algebra, ¿cuál es la utilidad de que alguien muy inspirado lo titule como esa cosa por la que me bocharon en la facultad?

La regla de los cinco minutos

En ALT1040 se dá está conversación en los comentarios del post La necesidad de usar tags para las categorías.

Alberto (visitante)
Los keywords (agregado por Federico: <meta name="keywords" content="…">) dejaron de tener utilidad, por el abuso que se hizo de ellos por páginas de todo tipo. ¿Que tienen de diferente los tags para que no acaben igual?
Si con las keys se hace spam a lo bestia y por eso no sirven, cuando los tags se empiecen a conocer un poco más y salgan del mundo blog, ¿no serán usados abusivamente?
Eduardo Arcos Barredo (autor del artículo)
El mismo problema se proponía con sistemas fuertemente dependientes en el aspecto social, por ejemplo Wikipedia; la solución es sencilla: somos muchos. Si hay 20, 30, 40, o 50 usuarios con 20 o 30 fotos cada una, lo más probable es que las imágenes basura lleguen a aparecer unos 5 minutos, entre la cantidad de usuarios que estan posteando fotos todo el día más el hecho que puedes reportar fotos en Flickr (y lo hace muy bien), más la misma gente observando el contenido puesto por la gente, esto no aparecería más que 5 minutos.

En la categoría CSS me cruce con dos posts totalmente huecos (posts de pruba más específicamente que había sido públicados hace 11 horas.

Aún siendo benevolente, y suponiendo que esos artículos aparezcan sólo durante un par de horas, el daño es inevitable. Hay una diferencia importante entre del.icio.us y Technorati; el primero almacena los contenidos por tiempo indefinido, mientras que en el segundo un recurso se mantiene promocionado mientras no haya otro más nuevo. Siendo así en el caso de Technorati, un buen (o excelente) recurso puede ser victima de los que meten posts en cualquier lado.

Una posibilidad para salvarse de tan trágico destino es mantenerse revisando la categoría con regularidad (usando una suscripción a los archivos de sindicación) pero eso no quita que uno termina siendo avisado incluso de aquello que es irrelevante.

Descubriendo la bomba atómica

Perdonemos a aquellos que arman lio con los nombres de las categorías. Son simples inexpertos que no buscan lastimar a nadie. Salvo cuando al trillado post de ¡modifique mi template! lo terminan metiendo concientemente en todas las categorías que se les ocurren.

En la captura anterior puede verse como alguien (por no quemar a nadie) categorizó su post en

  • General
  • Desarrollo Web
  • XHTML
  • CSS
  • PHP
  • Muy Personal
  • WTH???
  • Internet
  • Bitacora Interna

¿Muy personal y XHTML al mismo tiempo? ¿Acaso algúna porción de código que sólo tiene sentido para él?

Bitácora interna

Aunque hay que reconocerle que me dió una buena idea. ¿Que les parece algunas categorías en Technorati para este blog que se llamen 511-CSS, 511-HTML, 511-Personal y 511-Internet? De esa forma, quien no quiera revanarse el cerebro entendiendo sobre algún tema específico sólo tendría que suscribirse a la categoría específica. Por supuesto que ésto se aplica a los pobres que usamos Blogger, no a los geeks que pueden instalarse un Wordpress y que deberían tener esa función de fabrica.

Search is dead

Una de las ventajas que escuche sobre este sistema encontrar sitios que no aparecen al inicio de la lista que da una consulta con la misma palabra en Google (cita de Tagging: Una "deliciosa" manera de navegar la web (1)). Pero si necesito información sobre los (múltiples) bugs de IE, ¿donde busco? ¿IE, Internet Explorer, Internet Explorer Bugs o Internet Explorer Bug? Puede ser interesante cuando un grupo se pone de acuerdo en una etiqueta. Volviendo a un ejemplo anterior, las posibilidades de encontrar recursos sobre la cantante Maddonna fuera de la categoría homónima son bajos, pero cuando necesitas información muy específica, el límite de 32 palabras de de Google son de gran utilidad.

Conclusión

Antes que nada, ¿me parece o Technorati no ofrece suscripciones para cada etiqueta?

Es interesante desde un punto de vista sociólogico ver como distintas personas catalogan de manera a veces muy dispares el mismo recurso (suponiendo que el grupo estudiado sea sincero) pero no creo que tenga demasiada utilidad para quien busca mantenerse informado. Si se trata de conseguir información de calidad, siempre existe la posibilidad de que alguien haga un week log o un blog scouting del tema de nuestro interes.

Sobre el poder de la gente y la falta de control, solo puedo responder con una frase: Pegame y categoriza mis posts.

Enlaces relacionados con el tema en Tags & folksonomies: etiquetas semánticas y taxonomías sociales.

Powered by Blogger