Si alguien te dijera que tiene un elixir mágico que curaría todas tus enfermedades y heridas y te haría joven de vuelta, ¿le creerías? Sin importar cuán medieval suene este truco de marketing, todavía hoy, en este siglo XXI basado en datos, hay quienes lo usan.

Ya no se trata de vendedores ambulantes ofreciendo el elixir de la juventud. Fueron reemplazados por una matriz de compañías de ciberseguridad que creen tener la "nueva verdad", ofreciendo misteriosas soluciones de inteligencia artificial (IA) y machine learning (ML). Te dicen que estas tecnologías mantendrán a tu negocio seguro de cualquier malware y de otros tipos de amenazas, ya sea vistas anteriormente o nuevas. Pero claro, estas técnicas son demasiado complicadas como para explicar o entender por completo; son casi mágicas.

Aquí en el planeta Tierra, podemos afirmar que no hay ninguna magia detrás de la inteligencia artificial o el aprendizaje automático. La IA existe desde hace más de 60 años y representa el ideal de una máquina inteligente que puede aprender y tomar decisiones en forma independiente, basándose en aportes de su entorno, sin supervisión humana.

Un poco más atrás de este sueño todavía inalcanzable de la IA está el aprendizaje automático o machine learning, un campo de las ciencias de la computación que da a computadoras la habilidad de encontrar patrones en cantidades enormes de datos, clasificándolos y operando sobre los hallazgos. El concepto podrá ser un poco más nuevo, pero ha estado presente en el ámbito de la ciberseguridad desde los '90.

Si estás un poco perdido y no terminas de comprenderlo, piensa en ese momento en que Facebook encontró tu cara en esa foto multitudinaria: eso fue machine learning. ¿Y cuando Netflix te sugirió una gran película? También.

En ciberseguridad, machine learning generalmente refiere a una de las tecnologías integradas en una solución que ha recibido grandes cantidades de muestras limpias y maliciosas correctamente etiquetadas, y ha aprendido la diferencia. Gracias a este entrenamiento, también conocido como aprendizaje automático supervisado, es capaz de analizar e identificar la mayoría de las amenazas potenciales a usuarios y de actuar proactivamente para mitigarlas.

La automatización de este proceso hace que la solución de seguridad sea más rápida y ayuda a los humanos expertos a manejar el crecimiento exponencial en el número de muestras que aparecen cada día. Los algoritmos que no tienen este entrenamiento, que entran en la categoría de aprendizaje automático no supervisado, son prácticamente inútiles para la seguridad. El motivo es que clasifican los datos en sus propias categorías, que no necesariamente distinguen entre elementos limpios y malware, y son más adecuadas para encontrar similitudes o anomalías en el conjunto de datos que podrían ser invisibles al ojo humano.

En ESET, un fabricante del rubro de la ciberseguridad establecido y con casi tres décadas de experiencia, hemos estado aplicando el aprendizaje automático supervisado durante años. Lo llamamos "detección automatizada".

Para mantener nuestras tasas de detección altas y nuestros falsos positivos bajos, un equipo de supervisores humanos experimentados evalúa los elementos que son muy divergentes de otras muestras y, por lo tanto, difíciles de etiquetar para el machine learning. Este enfoque nos permite evitar las trampas de los falsos positivos o errores que podrían ocurrir en el camino a un algoritmo refinado, que funcione bien con otras tecnologías de protección bajo el paraguas de nuestras soluciones.

Recuerda que en las próximas semanas podrás leer más sobre esta serie:

  1. Editorial: combatiendo la "nueva verdad" con realidad en el ámbito de la ciberseguridad
  2. ¿Qué son machine learning y la inteligencia artificial?
  3. Los conceptos erróneos y malentendidos más comunes sobre ML y AI
  4. Por qué la seguridad basada en ML no asusta a los adversarios inteligentes
  5. Por qué una línea de defensa no es suficiente, aunque sea machine learning
  6. Cazando fantasmas: Los costos reales de las tasas altas de falsos positivos
  7. Cómo las actualizaciones fortalecen tu solución de seguridad
  8. Conocemos ML, lo hemos estado usando durante más de una década

Con la contribución de Jakub Debski y Peter Kosinar.