| Artículos | 01 JUL 2003

Inteligencia artificial contra el spam

En el juego del ratón y el gato que sigue la industria antispam, a las firmas de este mercado no les resulta nada fácil ir un paso por delante, pues continuamente surgen nuevas maneras de explotar las debilidades de los sistemas convencionales de filtrado del correo electrónico. Ahora, sin embargo, la nueva tecnología de filtrado basada en inteligencia artificial podría darles la oportunidad de contrarrestar más rápidamente las artimañas de los “spammers”.

En términos coloquiales podría decirse que las técnicas de inteligencia artificial siguen el modo de aprendizaje utilizado por la mente humana para, una vez asimilada una habilidad o destreza concreta, “razonar” sobre ella. Del mismo modo actúa para detectar el spam o correo basura que atasca nuestros buzones de email hasta el punto que, según algunas estadísticas, ya supone la mitad del total de mensajes recibidos por los usuarios.
En la lucha contra el spam, los procesadores del lenguaje natural actúan como potentes herramientas de inteligencia artificial. Estos procesadores –en realidad, un conjunto de algoritmos complejos que escanean los mensajes para identificar sus contenidos– se integran en el software de filtrado de correo electrónico, que por lo general reside fuera del cortafuegos corporativo o en la red del proveedor de servicios de la empresa.

En contexto
Este software “inteligente” acepta todo el tráfico de correo entrante, dirigiendo el tráfico válido al servidor SMTP corporativo y clasificando el resto como spam. Los mensajes se envían a un área de “cuarentena” donde el administrador de la red puede ver los contenidos y decidir en consecuencia su eliminación o aceptación.
Los humanos podemos rápidamente juzgar un mensaje como spam o no. Referenciar palabras clave por su localización en una oración nos permite comprender la connotación exacta de una palabra en un texto dado, como sexo o desnudo, por ejemplo, que pueden aparecer tanto en una frase coloquial, científica e incluso comercial como en otra que invite a visitar un sitio web pornográfico. De modo similar, los algoritmos del lenguaje natural dividen los mensajes en frases y analizan su significado.
La tecnología del procesamiento del lenguaje natural reconstruye el significado de los mensajes analizando las palabras, frases y párrafos para descubrir el contexto en que se están utilizando.
Tomemos como ejemplo el siguiente mensaje: “Esta deliciosa pechuga de pollo está diciendo “cómeme”. ¿Quieres probarla? Si estás libre esta noche llámame al trabajo (902 XX XX XX). Ah, puedes ver las fotos de nuestra última cena en www.fotoshion.tyy.com/2623X/perez>.” Un análisis estándar de palabras clave podría detectar los términos “pechuga” y “cómeme”, así como el número telefónico 902 y la dirección Web citados, tratando el mensaje como spam pornográfico. Sin embargo, un análisis basado en inteligencia artificial es capaz de determinar que el mensaje simplemente es una invitación a cenar. En el ejemplo, la tecnología de filtrado basado en palabras clave identifica las partes de la oración sin realmente comprender sus significados, considerando erróneamente el mensaje como pornográfico.
El mismo reto aparece cuando se trata la correspondencia estrictamente profesional. Por ejemplo, un mensaje de un agente financiero a un cliente podría ser el siguiente: “Juan, he estado investigando y he encontrado hipotecas excepcionales a un muy bajo interés. Si te interesa, tienes que llamarme hoy mismo porque la oferta expira a medianoche”. Un análisis de palabras clave estándar podría considerar el mensaje como spam a partir de la identificación de términos como “hipotecas excepcionales” y “bajo interés”. Por el contrario, un análisis basado en inteligencia artificial podría detectar que se trata de un mensaje profesional sobre hipotecas.

Más allá del texto
Las técnicas de inteligencia artificial más sofisticadas podrían cuestionar incluso el análisis del propio mensaje, haciendo depender la decisión final de factores más allá del texto. Por ejemplo, las técnicas de patrones de transmisión ven cuándo se envió el mensaje, quién es el remitente y dónde fue originado. De este modo, continuando con el ejemplo anterior sobre hipotecas, podrían comprobar que el correo procede de la misma dirección y servidor que otros doce mensajes enviados la semana pasada durante el horario laboral habitual, sin que ninguno de ellos fuera considerado spam, circunstancia que jugaría a favor de su validez. Otras técnicas, sin embargo, podrían acabar considerándolo como spam.
En definitiva, aunque nunca habrá un sistema que detenga el cien por cien del spam, las técnicas de inteligencia artificial se acercan mucho más a ese objetivo que los sistemas convencionales.


Cómo funciona
---------------------
Los procesadores del lenguaje natural usan algoritmos complejos para analizar el contenido del correo electrónico y filtrar el spam.

1- Los mensajes de e-mail se envían por Internet a los usuarios corporativos.
2- Antes de que un mensaje llegue al servidor de correo electrónico, el procesador de inteligencia artificial lo intercepta. El software lo analiza para determinar, en función de su contenido, si pasarlo o no al cortafuegos.
3- Los mensajes autorizados pasan el cortafuegos para llegar al servidor de e-mail, que se encarga de hacerlo llegar al usuario que corresponda.
4- El software de filtrado basado en inteligencia artificial detecta los mensajes susceptibles de ser considerados spam y los envía a un área específica donde el administrador del correo electrónico puede revisar su contenido y tomar en consecuencia una decisión final.

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información