Reflexiones e Irreflexiones


Inicio > Historias > Técnicas de spam y la amenaza de los bots

2017-09-18


Técnicas de spam y la amenaza de los bots

Robots
En internet sólo hay dos clases de personas: las que ya han enviado spam, y las que en algún momento lo enviarán. Recordemos que la definición de spam o correo basura es esa de 'mensajes no solicitados, no deseados, o con remitente no conocido, habitualmente de tipo publicitario, generalmente enviados en grandes cantidades que perjudican de alguna o varias maneras al receptor' (de la Wikipedia). La forma más leve de perjudicar a alguien es hacerle gastar su tiempo con nuestros intereses. El que esté libre de pecado que tire la primera piedra. Luego están, entre las primeras, las que lo envían de manera más o menos profesional.

Quiero insistir un poco en que es difícil no cometer el pecado: basta con echar un vistazo a nuestro buzón de correo para detectar mensajes que no deberían estar allí. Incluso de personas cercanas, colaboradores, o gente a la que apreciamos realmente.
Y terminar esta parte del mensaje diciendo: antes de enviar un mensaje, asegurarnos de que el mensaje interesa al receptor y no sólo a nosotros.

Hace unos meses leía How Bots Were Born From Spam que habla de la variante 'profesional' del tema, sobre todo porque explica cómo evitan los filtros (y cada vez notamos que nos llega más spam) utilizando algunas técnicas curiosas.

Primero, añadiendo trozos de los mensajes que recibimos diferentes para
cada mensaje, obtenidos de fuentes legítimas y que hacen la tarea de
decisión más difícil:


... spammers could add legitimate-sounding but nonsensical phrases to the end of their messages, making the job of the filters harder. That technique is called "Bayesian poisoning" and is the origin of spam poetry.


En definitiva, 'envenenan' los filtros con palabras que no forman parte del mensaje en sí.

Otra posibilidad es aplicar variaciones a las frases de los mensajes de manera que significan lo mismo pero son diferentes entre sí:


Spinning uses variations on phrases in an existing message to create large numbers of semantically identical but distinct messages.


Cuanto más contenido hay en internet, más posibilidades hay de generar estas alternativas. Un caso serían los libros generados automáticamente a partir de contenido que se puede encontrar en la red:


In 2010, Amazon opened its eBook store to self-publishing only to be flooded with e-books made automatically by web scrapers.


La amenaza ahora será la de manipular a los bots (como interfaz de comunicación con usuarios) para que entren en el juego de la publicidad engañosa y/o molestosa:


Personally, I suspect that with the new emphasis on conversational interfaces, we'll begin to see hybrid spambots: Existing conversational interface systems like Siri and Echo, because they serve up data from third parties, might begin to be manipulated by some bot-equivalent of SEO to respond to certain queries with advertisements.


votar

Referencias (TrackBacks)

URL de trackback de esta historia http://fernand0.blogalia.com//trackbacks/77069

Comentarios

Nombre
Correo-e
URL
Dirección IP: 54.80.209.254 (d7b8bb15f5)
Comentario

Acerca de...

Esta es la bitácora de Fernando Tricas García. Está alojada en Blogalia:


Soy profesor y aquí hablo de internet y de casi cualquier cosa que me interese en cualquier momento.
Nací en Huesca y vivo en Zaragoza.

Se puede ver la página de Fernando Tricas García en la Universidad de Zaragoza donde hay información sobre mis clases, temas de investigación y también información sobre otras actividades como charlas, conferencias, cursos fuera de la universidad...

En El Mundo Es Imperfecto se pueden ver otras páginas y publicaciones que voy dejando por la red.

  • RSS
  • Inicio
  • Archivo
  • Contacto
  • Ver estadísticas (Statcounter)
    eXTReMe Tracker

Listas de deseos

Derechos

  • Contrato ColorIuris Verde

Perfil profesional

Seguir en Twitter


Calendario

<Octubre 2017
Lu Ma Mi Ju Vi Sa Do
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
29 30 31        
By Fernando Tricas García (En Google)