Neal Stephenson, autor de «Criptonomicón», indica en su página web que,
al igual que Donald Knuth y Umberto Eco, se siente feliz en poder decir
que no dispone de una dirección de correo electrónico. El resto de los
mortales, aquellos que sí deseamos utilizar el correo electrónico, nos
vemos inundados a diario por ingentes cantidades de basura en forma de
bytes.
Me imagino que para la mayoría de los lectores de «Una-al-día» no
causará ninguna sorpresa destacar el enorme porcentaje que representa el
spam, el correo basura, en sus buzones de correo.
Las estadísticas sobre el spam producen auténticos escalofríos. En julio
del presente año, MessageLabs afirmaba que el 36% del correo electrónico
en circulación era correo basura. Por su parte, Júpiter Research,
calcula que el número de mensajes de spam que se envían actualmente se
sitúa en 140.000 millones. Lo más preocupante es que, para el 2007, se
prevé alcanzar una cifra de 650.000 millones de mensajes de correo
basura.
Con estas cifras, es evidente que encontramos una solución que aleje el
spam de nuestros buzones o correremos el riesgo de convertir el correo
electrónico en algo totalmente inutilizable.
Spam, un auténtico problema de seguridad
Hasta la fecha, el spam ha sido básicamente un incordio. Pero durante
este año 2002 hemos visto algunas muestras de cómo el correo basura
también se puede convertir en un problema de seguridad. Como ya hemos
relatado en diversos boletines de «una-al-día», no son pocos los casos
en que mensajes de spam donde se utilizan técnicas de ingeniería social,
han conseguido que los usuarios faciliten información sensible.
Pero hay más. Existen mensajes de spam auténticamente diabólicos,
especialmente para los usuarios de Microsoft Outlook (no por el hecho de
que tenga más problemas que otros programas, sino por el hecho de ser el
programa más utilizado). Mensajes con páginas HTML y scripts capaces de
bajarse código y dejarlo en la máquina del usuario.
Todo esto convertirá el spam, en los próximos meses, como el principal
problema de seguridad en Internet. Los virus que circulan en la
actualidad básicamente sólo tienen el efecto de bloquear los servidores
de correo ante el gran volumen de mensajes infectados que son capaces de
generar. El spam tiene este mismo efecto, sólo que el volumen actual del
correo basura es muy superior al de mensajes infectados por virus.
Detección del spam
Existen diversos métodos para la detección de mensajes con correo
basura. El que ha demostrado un mayor porcentaje de acierto, generando
un reducido (o incluso nulo) número de falsos positivos, son los filtros
basadas en lógica bayesiana a partir del trabajo de Paul Graham.
La lógica bayesiana que se aplica consiste en determinar palabras que
aparecen con frecuencia en los mensajes de spam y, a partir de las
mismas, determinar por el contexto otros términos que se incluyen
habitualmente en el correo basura así como aquellos contextos que
aparece en los mensajes legítimos. El análisis se realiza íntegramente
sobre el contenido del mensaje, dejando de banda el remitente o las
máquinas por las que ha pasado.
El resultado, según Paul Graham, es una detección del 99,5% de los
mensajes de correo basura, con un porcentaje de falsos positivos
prácticamente nulo.
Existen diversos programas que ya implementan los filtros de lógica
bayesiana para la detección del correo basura. A nivel de servidor
podemos indicar SpamProbe y Bogofilter; a nivel cliente de correo, la
última versión de Mozilla (1.3). Es de esperar que en los próximos meses
otros programas, incluyendo los sistemas antivirus actuales, vayan
incorporando estas técnicas para reducir el volumen de spam en
circulación.
xavi@hispasec.com
Más información:
2002: The Year of Spam
http://www.silicon.com/public/door?6004REQEVENT=&REQINT1=56535&REQSTR1=silicon.com
Top-10 Spam List: Still gullible
http://news.zdnet.co.uk/story/0,,t269-s2126973,00.html
Report Confirms Massive Increases in Viruses, Spam
http://www.esecurityplanet.com/trends/article/0,,10751_1556361,00.html
Tech Pros Gather Antispam Forces
http://www.wired.com/news/infostructure/0,1377,56809,00.html
Origin of the term «spam» to mean net abuse
http://www.templetons.com/brad/spamterm.html
A Plan for Spam
http://www.paulgraham.com/spam.html
Inteligencia artificial para luchar contra el correo basura
http://ww2.grn.es/merce/2002/IAantispam.html
SpamProbe – Bayesian spam detector
http://sourceforge.net/projects/spamprobe/
Bogofilter
http://bogofilter.sourceforge.net/
Bogofilter mata major
http://bulmalug.net/body.phtml?nIdNoticia=1537
Junk Mail Classification Turned On in Trunk Builds
http://mozillazine.org/talkback.html?article=2667
Mozilla Spam Filtering
http://www.mozilla.org/mailnews/spam.html
Sólo con leyes no se atajará el «spam», advierten los expertos
http://ww2.grn.es/merce/2002/listasnegras.html
La LSSI no se suavizará en torno al spam
http://barrapunto.com/article.pl?sid=02/12/27/1756253
¿Se puede luchar contra el spamming sin LSSI?
http://barrapunto.com/article.pl?sid=02/11/15/0638243
Spam Volume Statistics
http://www.caube.org.au/spamstats.html
Spam hits 36 percent of e-mail traffic
http://zdnet.com.com/2100-1106-955842.html
645.000 millions de spams no desitjats el 2007
http://nosaltres.vilaweb.com/info/vilaweb/cerca_u.noticia?p_idint=100000568785
Razor. Spam should not be propagated beyond necessity
http://razor.sourceforge.net/
Junk Spy ZAPs spam
http://www.junkspy.com/
Una-al-día (15-05-02): «Spam» para robar datos sensibles
http://www.hispasec.com/unaaldia.asp?id=1298
Una-al-día (29-11-01): El parlamento europeo debate el uso de «cookies» y «spam»
http://www.hispasec.com/unaaldia.asp?id=1131
EuroCAUCE, The European Coalition Against Unsolicited Commercial Email
http://www.euro.cauce.org/en/index.html
Deja una respuesta