La lingüística permite identificar a usuarios anónimos de Internet

Iniciado por wolfbcn, 9 Enero 2013, 21:03 PM

0 Miembros y 1 Visitante están viendo este tema.

wolfbcn

Ciberdelincuentes, piratas y otros usuarios de Internet dedicados a actividades ilegales o prohibidas - incluyendo disidentes en países totalitarios - tienen razones para sentirse preocupados.

Diario TI 09/01/13 12:57:05

La lingüística, que entre otras cosas describe patrones en los idiomas, puede ser utilizada para identificar usuarios determinados de Internet, por encima de los distintos servicios que utilizan.

Las dos lingüistas Aylin Caliskan Islam y Sadia Afroz revelaron en el Congreso de Chaos Communication http://lanyrd.com/2012/29c3/ ealizado entre Navidad y Año Nuevo en Hamburgo, un procedimiento mediante el cual la lingüística  puede revelar al 80% de los usuarios anónimos de Internet.

Para ello, ambas investigadoras utilizan un sistema lingüístico denominado estilometría.

Este método permite identificar la forma en que los usuarios se expresan, reconociendo palabras que se repiten constantemente y los conceptos usados por el usuario. Mediante un software especial es posible analizar y comparar patrones lingüísticos, que permiten determinar, por ejemplo, si es la misma persona formulando los mismos comentarios en distintos lugares de Internet.

"Si tenemos datos correspondientes a 100 usuarios, podemos identificar al menos a 80% de ellos", declaró Sadia Afroz (a la derecha en la fotografía).

Traducciones deficientes

El mayor reto lo constituyen los idiomas distintos al inglés, que deberán ser traducidos para poder ser utilizados por el programa.

En este contexto, las expertas fueron categóricas al señalar que los servicios de traducción automática como por Google Translate y servicios similares reducen considerablemente la exactitud de servicio, y con ello su utilidad. Las investigadores consideran que los servicios dedicados y especializados de traducción podrán solucionar el problema.

Ineficaz con Leet

Otro de los desafíos aún mayor lo representa Leet (también conocido como Leetspeak), que Wikipedia define como "un tipo de escritura compuesta de caracteres alfanuméricos, usada por algunas comunidades y usuarios de diferentes medios de internet. Esta escritura es caracterizada por escribir caracteres alfanuméricos de una forma incomprensible para otros usuarios ajenos, inexpertos o neófitos a los diferentes grupos que utilizan esta escritura. El término "leet", pronunciado lit, proviene de élite".

Ambas investigadoras coinciden en que Leet es un sistema sencillamente impenetrable para la estilometría.

En el siguiente vídeo (1 hora y 39 minutos de duración, los investigadores presentan sus conclusiones.

http://www.youtube.com/watch?feature=player_embedded&v=QRY2mfLpPCs

Fuente: SC Magazine

LEIDO EN : http://diarioti.com/la-linguistica-permite-identificar-a-usuarios-anonimos-de-internet/59892
La mayoria pedimos consejo cuando sabemos la respuesta, pero queremos que nos den otra.

B€T€B€



La picaresca y el ingenio humano son mas poderosos que cualquier software o algoritmo presente o futuro.


Salu2.

Binary_Death