Bien que l'intelligence artificielle (IA) et l'apprentissage machine (AM), ou machine learning, aient transformé divers domaines de l'activité humaine depuis un certain temps déjà, leur plein potentiel de transformation n'est pas encore réalisé. Les technologies basées sur l’AM contribueront de plus en plus à lutter contre la fraude, à évaluer et à optimiser les processus commerciaux, à améliorer les procédures de test et à développer de nouvelles solutions aux problèmes existants.
Cependant, comme la plupart des innovations marquantes, l'apprentissage machine présente aussi des inconvénients.
Avec l'enchevêtrement de plus en plus grand des affaires, des infrastructures essentielles et de notre vie personnelle avec le monde numérique, de nouveaux risques font leur apparition. Les attaquants peuvent utiliser l’apprentissage machine de multiples façons : pour alimenter leurs logiciels malveillants, pour cibler des victimes spécifiques et extraire des données précieuses, pour traquer les vulnérabilités du jour zéro ou pour protéger les infrastructures piratées comme les botnets.
Les solutions d'apprentissage machine déployées par des organisations légitimes peuvent constituer une autre cible intéressante. En créant des ensembles de données empoisonnées, les attaquants peuvent essayer de manipuler des systèmes autrement bénéfiques pour prendre de mauvaises décisions ou pour fournir une vision déformée de l'environnement surveillé, ce qui peut causer le chaos.
Utilisation abusive de l’AM pour les traductions et le ciblage
Les premiers signes que ces scénarios passent de la théorie à la réalité apparaissent déjà sur le radar. Un bon exemple est celui des spammeurs, qui utilisent à mauvais escient des services de traduction légitimes basés sur l’apprentissage machine pour améliorer leurs messages intempestifs dans un large éventail de langues locales (bien sûr, à moins que les attaquants n'envoient du spam le jour et apprennent ces nouvelles langues la nuit).
Un autre exemple observé dans la nature, qui montre des signes semblables à ceux de l’AM est le très répondu downloader Emotet, soupçonné d'utiliser ce type de technologie pour améliorer son ciblage. Malgré le fait qu'il infecte des milliers de victimes chaque jour, il est devenu étonnamment efficace pour éviter tant les honeypots que les traqueurs de botnet.
Pour parvenir à faire cela, Emotet recueille les données télémétriques de ses victimes potentielles et les envoie au serveur C&C de l'attaquant pour analyse. Sur la base de ces données d'entrée, le logiciel malveillant sélectionne non seulement les modules inclus dans la charge utile, mais distingue également les opérateurs humains des machines virtuelles utilisées par les chercheurs.
N’eut été de l’apprentissage machine, de tels mécanismes d'autodéfense similaires seraient très complexes et coûteux, et les opérateurs d'Emotet devraient investir des ressources extraordinaires pour que leur logiciel malveillant dispose des habiletés qu’il déploie aujourd’hui.
Pas assez de couches, pas assez de sécurité
L’action d’altérer un modèle d’apprentissage machine en lui fournissant des intrants empoisonnés - aussi appelé apprentissage machine accusatoire - est un autre risque qui deviendra plus pressant à l'avenir, en particulier dans le domaine de la cybersécurité.
Si des moteurs d'analyse moins avancés, purement basés sur l’AM, étaient dupés par des attaquants et posaient ainsi des décisions incorrectes, cela pourrait diminuer la sécurité de l'entreprise de la victime et potentiellement causer de sérieux dommages.
However, ESET is aware that machine learning is no silver bullet and that the risks of adversarial machine learning will grow with time. To avoid such potential issues ESET machine learning technology is integrated within an array of highly effective detection technologies such as DNA Detections, Advanced Memory Scanner, Network Attack Protection and UEFI Scanner. We believe that only multilayered solutions can offer reliable protection from ever-developing cyberthreats.
Cependant, ESET est conscient que l'apprentissage machine ne représente pas une panacée et que les risques d'apprentissage machine accusatoire vont augmenter avec le temps. Pour éviter de tels problèmes potentiels, la technologie d'apprentissage machine ESET est intégrée dans un ensemble de technologies de détection hautement efficaces telles que les détections ADN, le scanner de mémoire avancé, la protection contre les attaques réseau et le scanner UEFI. Nous croyons que seules des solutions multicouches peuvent offrir une protection fiable contre les cybermenaces en constante évolution.
Juraj Jánošík, Chef de l’équipe d’IA-AM d’ESET, fera une présentation sur ce sujet lors du Mobile World Congress (MWC), qui se déroulera du 25 au 28 février 2019, à Barcelone.