Durante las ultimas horas estuvo en boca de todos la exposición de datos que tuvo Facebook a inicios del 2020 y recientemente se hizo de manera pública y masiva este leak de información, llegando al punto que crearon un Bot en Telegram1 que brindaba información relacionada al leak por un monto de dinero que equivalian a creditos de consulta.
Entre los paises que forman parte de este leak se encuentra Bolivia, por ello nos pusimos conjuntamente con @RizelTane a procesar el fichero en texto plano.
Proceso de análisis
Uno de los primeros a puntos que llama la atención es que existe alguna correlación respecto a los numeros de teléfono, por lo que se tiene en cuenta que este fue el dato usado para realizar el proceso de scraping iterando con el fin de identificar la información de los usuarios.
De los datos referentes a Bolivia se tiene 2969197 registros (cerca a 3 millones) esto verificando por medio del código del Pais, en el procesamiento de los datos se considere el genero registrado masculino (male) y femenino (female), se identificaron otros registros los cuales se encuentran en diferentes idiomas siendo estos relacionados directo al genero registrado.
Genero | Campo |
---|---|
Masculino | Male |
laki-laki | |
เพศชาย | |
ذكر | |
nam | |
အမ်ိဳးသား | |
perempuan | |
Femenino | Female |
perempuan | |
เพศหญิง | |
أنثى | |
nữ | |
မ |
Inferimos que estos datos se tienen así porque usaron proxys para el proceso de obtención de los datos a partir del número de teléfono.
Datos expuestos.
Los datos que se encuentran expuestos en este leak corresponden a:
- Número de Celular.
- Id de Facebook.
- Nombre y apellidos.
- Genero.
- Fuente de trabajo registrada.
- Ubicación / Localización
- Correo electrónico.
A partir del ID de Facebook ya que este es correlativo nos permite identificar la cuenta de Facebook del usuario de manera directa.
https://facebook.com/ID
Nos redirecciona al perfil del usuario, en un par de pruebas realizadas se identificaron que algunos datos de las cuentas no fueron modificados incluyendo el número de teléfono.
Estaremos compartiendo en el blog el análisis de Chile, Argentina, Perú y Colombia así que puedes darte una vuelta.
Análisis de los datos.
A continuación se describe el análisis de los datos realizado teniendo como fuente inicial un total de 2969197 registros.
Genero
En el siguiente grafico se tiene la cantidad de registros identificados por género contando con un 50% perteneciente a varones, un 39% a mujeres y un 11% no realizo ningún registro.
Anális de números de teléfono
En este caso particular se procedio a identificar por tipo de empresa de telefonía, y departamento más que todo por simple curiosidad y querer sacar los datos respectivos.
Por empresa de Telefonía
Verificamos que existe un mayor número de telefonos perteneciente a Entel con un 45%, seguido de Tigo con 38% y por ultimo Viva con un 17% con esto podriamos verificar cual servicio de telefónia es el mas usado.
Contamos con una mayor cantidad de datos referentes a Entel, Seguido de Viva y Tigo esto basandonos en los prefijos2 por operadores considerando que si los datos son de inicios del 2020 en Bolivia ya se contaba con la portabilidad numérica.
Por Departamento
A continuación se detalla el total por departamento de toda la muestra utilizada en el análisis.
Correos Electrónicos
Identificamos un total de 13451 0.45% correos electrónicos de 2969197, contando con un total del 68% que usa el servicio de Hotmail, un 24% Gmail.
Lo que llama la atención es que en muchos casos se hacen uso de correos institucionales para usar las redes sociales. Además se identifico una cuenta Gubernamental es decir .gob.bo que se encuentra expuesta.
Correos electrónicos con un leak de contraseñas
Una duda que tuvimos durante el análisis es verificar el nivel de exposición de las cuentas de correo electrónico identificadas pensando que un atacante podria realizar el cruce de información con otras fuentes, en este objetivo se realizo consultas con Karma.py para verificar si existen credenciales expuestos.
Se tomó como base una muestra de 3000 cuentas de correo, limitados por las solicitudes y el tiempo, de ellas se tuvo 59 que si estaban expuestas un 2%
Otros datos de interes
- Durante la revisión identificamos que un 77.89% no registraron su fuente laboral.
- Existen muchos registros de fuente laboral relacionado a Prensa, Organizaciones Gubernamentales, Entidades Financieras.
- Existen datos de mofa, mencionando fuentes laborales aleatorias o sin sentido.
Como saber si tu número se encuentra registrado?
Debido a que la comunidad de Seguridad informatica es sumamente grande y existen más que buscamos hacer el bien, Cristian Borguello de SeguInfo publicó hace un par de horas un servicio3 que puede ser consultado para verificar si tu número se encuentra en este leak.
Una vez que ingresamos al sitio, se debe de registrar el número de teléfono más el código de país.
Si tu número se encuentra expuesto tendras el siguiente mensaje.
En caso de que no este expuesto en este leak.
Riesgo
El riesgo de estos datos es que pueden ser usados para ataques de ingenieria social, como ser estafas, solicitud de datos bancarios, usurpación de identidad.
Recomendaciones
Si tu número de telefono se encuentra registrado en este leak puedes seguir las siguientes recomendaciones.
- Activar el segundo factor de autenticación en Facebook.
- Evitar responder mensajes via Whatsapp, Telegram o llamadas.
- Cambiar credenciales del correo electrónico asociado y Facebook no vaya a ser que uses la misma contraseña en varios servicios.
Tienes algún comentario sobre el análisis realizado puedes hacerlo por las redes sociales del blog tanto en Facebook, Twitter o Telegram.
Regards,
Snifer