Los investigadores adaptan la IA con el objetivo de identificar anónimos …



En Black Hat Asia, los investigadores de inteligencia artificial y ciberseguridad utilizan redes neuronales para intentar identificar a los autores, pero aún falta precisión.

Dado que la desinformación en las redes sociales es un problema importante, la capacidad de identificar a los autores de artículos maliciosos y los creadores de campañas de desinformación podría ayudar a reducir la amenaza de tales ataques de información.

En la conferencia Black Hat Asia 2020 de esta semana, tres investigadores de Baidu Safety, la división de ciberseguridad del gigante tecnológico chino Baidu, presentaron su enfoque para identificar autores basados ​​en técnicas de aprendizaje automático, como las redes neuronales. Los investigadores utilizaron 130.000 artículos de más de 3.600 autores extraídos de ocho sitios net para entrenar una pink neuronal que pudiera identificar a un autor de un grupo de cinco posibles escritores el 93% de las veces e identificar un autor de un grupo de 2.000 posibles escritores 27% de el tiempo.

Si bien los resultados no son impresionantes, sí muestran que es posible identificar a la persona detrás de un escrito, dijo Li Yiping, investigador de Baidu Security, durante su presentación sobre el trabajo de su equipo.

«La mayoría de las noticias falsas se publican de forma anónima y carecen de información válida para identificar al autor», dijo. «El seguimiento de artículos anónimos es un problema desafiante, pero afortunadamente no es imposible. Diferentes personas tienen diferentes estilos de escritura, por lo que podemos identificar a algunos escritores por sus distintos hábitos».

Las noticias falsas y otras formas de desinformación se han convertido en una plaga en línea durante la última década. Impulsados ​​por el éxito comercial, los ciberdelincuentes han utilizado noticias falsas para atraer visitas a las páginas contra las que se vende publicidad. Más insidiosas, sin embargo, son las campañas de desinformación política de naciones extranjeras y grupos domésticos con agendas que pueden impactar en la opinión pública utilizando información falsa.

A fines de septiembre, el FBI y el Departamento de Seguridad Nacional de EE. UU. Emitieron una advertencia de que tanto los actores extranjeros como los ciberdelincuentes probablemente usarán desinformación en varias campañas esta temporada electoral.

«Los actores extranjeros y los ciberdelincuentes podrían crear nuevos sitios net, cambiar los sitios website existentes y crear o compartir el contenido de redes sociales correspondiente para difundir información falsa en un intento de desacreditar el proceso electoral y socavar la confianza en las instituciones democráticas de Estados Unidos», declararon las agencias.

Se están llevando a cabo una variedad de esfuerzos de investigación con el objetivo de desenmascarar campañas de desinformación. En mayo, por ejemplo, un grupo de investigadores de NortonLifelock lanzó BotSight, un complemento que clasifica las cuentas de redes sociales en una escala de robot compared to humano. La herramienta united states of america las conexiones conocidas entre cuentas de redes sociales para calcular la probabilidad de que una cuenta específica sea administrada por un bot automatizado o un humano actual.

En la conferencia de Black Hat Usa, un gerente de investigación del Stanford Net Observatory argumentó que Rusia tiende a enfocarse más en campañas de desinformación que involucran memes y artículos falsos, mientras que los esfuerzos chinos se enfocan más en crear fuentes de noticias aparentemente legítimas que abrazan un enfoque aprobado por el gobierno. .

El esfuerzo de investigación de Baidu Stability se centró en hacer coincidir un artículo con un autor conocido en una lista de fuentes, denominado problema de atribución del autor, o en determinar la probabilidad de que un artículo fuera escrito por un autor específico, conocido como problema de verificación del autor. El investigador entrenó una pink neuronal utilizando una serie de tripletes de datos de artículos: un artículo ancla escrito por un autor, un artículo que coincide positivamente con el autor y un artículo que no fue escrito por el autor.

Al utilizar un método dinámico para seleccionar tan solo una pequeña parte de posibles tripletes, el equipo de investigación creó un conjunto de datos de entrenamiento para crear una red neuronal que identifica al autor de un artículo. En un experimento que utilizó siete conjuntos de datos de creciente complejidad, los investigadores descubrieron que su método funcionaba bien, con un 93% de precisión, al atribuir cualquiera de los 600 artículos escritos por cinco autores diferentes, pero solo tenía un 27% de éxito al atribuir más de 70.000 documentos escritos por cualquier autor. de 2.000 autores diferentes.

El investigador Li señaló que, incluso con una precisión tan baja con una gran cantidad de documentos, el enfoque del equipo de Baidu tenía una mayor precisión que otros métodos.

«Nuestro método superó a otras líneas de base, especialmente cuando los conjuntos de datos crecen», dijo. «En el futuro, continuaremos probando nuestro modelo y optimizando nuestra purple de aprendizaje profundo y nuestra estrategia de selección de tripletes».

Periodista tecnológico veterano de más de 20 años. Ex ingeniero de investigación. Escrito para más de dos docenas de publicaciones, incluidas CNET Information.com, Dim Examining, MIT&#39s Technological know-how Evaluation, Common Science y Wired News. Cinco premios de periodismo, incluido el de Mejor fecha límite … Ver biografía completa

Lectura recomendada:

Más información





Enlace a la noticia first