Microsoft: nuestro nuevo modelo de aprendizaje automático detecta errores críticos de seguridad el 97% del tiempo


Microsoft afirma que los modelos de aprendizaje automático creados para desarrolladores de software package pueden distinguir entre errores de seguridad y no relacionados con la seguridad el 99% del tiempo.

Microsoft planea abrir la metodología detrás de un algoritmo de aprendizaje automático que, según afirma, puede distinguir entre errores de seguridad y errores que no son de seguridad con un 99% de precisión.

La compañia desarrolló un modelo de aprendizaje automático para ayudar a los desarrolladores de software package a detectar más fácilmente los problemas de seguridad e identificar cuáles deben priorizarse.

Al vincular el sistema con expertos en seguridad humana, Microsoft dijo que fue capaz de desarrollar un algoritmo que no solo pudo identificar correctamente los errores de seguridad con casi un 100% de precisión, sino que también identificó correctamente los errores críticos de alta prioridad el 97% del tiempo.

La compañía planea abrir su metodología en GitHub «en los próximos meses».

Según Microsoft, su equipo de 47,000 desarrolladores genera unos 30,000 errores cada mes en sus silos AzureDevOps y GitHub, causando dolores de cabeza a los equipos de seguridad cuyo trabajo es garantizar que las vulnerabilidades críticas de seguridad no se pierdan.

Si bien las herramientas que señalan automáticamente y corrigen errores están disponibles, a veces los falsos positivos se etiquetan o los errores se clasifican como problemas de bajo impacto cuando en realidad son más graves.

Para remediar esto, Microsoft se puso a trabajar en la construcción de un modelo de aprendizaje automático capaz de clasificar errores como problemas de seguridad o no, así como identificar errores críticos y no críticos «con un nivel de precisión lo más cercano posible a eso de un experto en seguridad «.

Esto implicó primero alimentar los datos de entrenamiento modelo que habían sido aprobados por expertos en seguridad, basados ​​en un muestreo estadístico de errores de seguridad y no de seguridad. Una vez que se aprobó el modelo de producción, Microsoft se dedicó a programar un modelo de aprendizaje de dos pasos que permitiría al algoritmo aprender a distinguir entre errores de seguridad y errores que no son de seguridad, y luego asignar etiquetas a los errores que indican si fueron de bajo impacto , importante o crítico

De manera very important, los expertos en seguridad estuvieron involucrados con el modelo de producción en cada etapa del viaje, revisando y aprobando datos para confirmar que las etiquetas fueran correctas seleccionar, entrenar y evaluar técnicas de modelado y revisar manualmente muestras aleatorias de errores para evaluar la precisión del algoritmo.

Scott Christiansen, Gerente Senior del Programa de Seguridad de Microsoft y Mayana Pereira, Científica Aplicada y de Datos de Microsoft, explicaron que el modelo fue reentrenado automáticamente con nuevos datos para mantener el ritmo del ciclo de producción interno de Microsoft.

«Los datos aún son aprobados por un experto en seguridad antes de volver a entrenar el modelo, y monitoreamos continuamente la cantidad de errores generados en la producción», dijeron.

«Al aplicar el aprendizaje automático a nuestros datos, clasificamos con precisión qué elementos de trabajo son errores de seguridad el 99 por ciento del tiempo. El modelo también es 97 por ciento preciso al etiquetar los errores de seguridad críticos y no críticos.

«Este nivel de precisión nos da la confianza de que estamos detectando más vulnerabilidades de seguridad antes de que sean explotadas».



Enlace a la noticia primary