sábado, 28 de diciembre de 2002

2002, el año del spam

Neal Stephenson, autor de "Criptonomicón", indica en su página web que,
al igual que Donald Knuth y Umberto Eco, se siente feliz en poder decir
que no dispone de una dirección de correo electrónico. El resto de los
mortales, aquellos que sí deseamos utilizar el correo electrónico, nos
vemos inundados a diario por ingentes cantidades de basura en forma de
bytes.

Me imagino que para la mayoría de los lectores de "Una-al-día" no
causará ninguna sorpresa destacar el enorme porcentaje que representa el
spam, el correo basura, en sus buzones de correo.

Las estadísticas sobre el spam producen auténticos escalofríos. En julio
del presente año, MessageLabs afirmaba que el 36% del correo electrónico
en circulación era correo basura. Por su parte, Júpiter Research,
calcula que el número de mensajes de spam que se envían actualmente se
sitúa en 140.000 millones. Lo más preocupante es que, para el 2007, se
prevé alcanzar una cifra de 650.000 millones de mensajes de correo
basura.

Con estas cifras, es evidente que encontramos una solución que aleje el
spam de nuestros buzones o correremos el riesgo de convertir el correo
electrónico en algo totalmente inutilizable.

Spam, un auténtico problema de seguridad

Hasta la fecha, el spam ha sido básicamente un incordio. Pero durante
este año 2002 hemos visto algunas muestras de cómo el correo basura
también se puede convertir en un problema de seguridad. Como ya hemos
relatado en diversos boletines de "una-al-día", no son pocos los casos
en que mensajes de spam donde se utilizan técnicas de ingeniería social,
han conseguido que los usuarios faciliten información sensible.

Pero hay más. Existen mensajes de spam auténticamente diabólicos,
especialmente para los usuarios de Microsoft Outlook (no por el hecho de
que tenga más problemas que otros programas, sino por el hecho de ser el
programa más utilizado). Mensajes con páginas HTML y scripts capaces de
bajarse código y dejarlo en la máquina del usuario.

Todo esto convertirá el spam, en los próximos meses, como el principal
problema de seguridad en Internet. Los virus que circulan en la
actualidad básicamente sólo tienen el efecto de bloquear los servidores
de correo ante el gran volumen de mensajes infectados que son capaces de
generar. El spam tiene este mismo efecto, sólo que el volumen actual del
correo basura es muy superior al de mensajes infectados por virus.

Detección del spam

Existen diversos métodos para la detección de mensajes con correo
basura. El que ha demostrado un mayor porcentaje de acierto, generando
un reducido (o incluso nulo) número de falsos positivos, son los filtros
basadas en lógica bayesiana a partir del trabajo de Paul Graham.

La lógica bayesiana que se aplica consiste en determinar palabras que
aparecen con frecuencia en los mensajes de spam y, a partir de las
mismas, determinar por el contexto otros términos que se incluyen
habitualmente en el correo basura así como aquellos contextos que
aparece en los mensajes legítimos. El análisis se realiza íntegramente
sobre el contenido del mensaje, dejando de banda el remitente o las
máquinas por las que ha pasado.

El resultado, según Paul Graham, es una detección del 99,5% de los
mensajes de correo basura, con un porcentaje de falsos positivos
prácticamente nulo.

Existen diversos programas que ya implementan los filtros de lógica
bayesiana para la detección del correo basura. A nivel de servidor
podemos indicar SpamProbe y Bogofilter; a nivel cliente de correo, la
última versión de Mozilla (1.3). Es de esperar que en los próximos meses
otros programas, incluyendo los sistemas antivirus actuales, vayan
incorporando estas técnicas para reducir el volumen de spam en
circulación.


Xavier Caballé
xavi@hispasec.com


Más información:

2002: The Year of Spam
http://www.silicon.com/public/door?6004REQEVENT=&REQINT1=56535&REQSTR1=silicon.com

Top-10 Spam List: Still gullible
http://news.zdnet.co.uk/story/0,,t269-s2126973,00.html

Report Confirms Massive Increases in Viruses, Spam
http://www.esecurityplanet.com/trends/article/0,,10751_1556361,00.html

Tech Pros Gather Antispam Forces
http://www.wired.com/news/infostructure/0,1377,56809,00.html

Origin of the term "spam" to mean net abuse
http://www.templetons.com/brad/spamterm.html

A Plan for Spam
http://www.paulgraham.com/spam.html

Inteligencia artificial para luchar contra el correo basura
http://ww2.grn.es/merce/2002/IAantispam.html

SpamProbe - Bayesian spam detector
http://sourceforge.net/projects/spamprobe/

Bogofilter
http://bogofilter.sourceforge.net/

Bogofilter mata major
http://bulmalug.net/body.phtml?nIdNoticia=1537

Junk Mail Classification Turned On in Trunk Builds
http://mozillazine.org/talkback.html?article=2667

Mozilla Spam Filtering
http://www.mozilla.org/mailnews/spam.html

Sólo con leyes no se atajará el "spam", advierten los expertos
http://ww2.grn.es/merce/2002/listasnegras.html

La LSSI no se suavizará en torno al spam
http://barrapunto.com/article.pl?sid=02/12/27/1756253

¿Se puede luchar contra el spamming sin LSSI?
http://barrapunto.com/article.pl?sid=02/11/15/0638243

Spam Volume Statistics
http://www.caube.org.au/spamstats.html

Spam hits 36 percent of e-mail traffic
http://zdnet.com.com/2100-1106-955842.html

645.000 millions de spams no desitjats el 2007
http://nosaltres.vilaweb.com/info/vilaweb/cerca_u.noticia?p_idint=100000568785

Razor. Spam should not be propagated beyond necessity
http://razor.sourceforge.net/

Junk Spy ZAPs spam
http://www.junkspy.com/

Una-al-día (15-05-02): "Spam" para robar datos sensibles
http://www.hispasec.com/unaaldia.asp?id=1298

Una-al-día (29-11-01): El parlamento europeo debate el uso de "cookies" y "spam"
http://www.hispasec.com/unaaldia.asp?id=1131

EuroCAUCE, The European Coalition Against Unsolicited Commercial Email
http://www.euro.cauce.org/en/index.html