Даже если вы думаете, что просматриваете Twitter «анонимно», алгоритмы машинного обучения могут по-прежнему определять вас в толпе других пользователей 10,000, использующих метаданные, связанные с вашими сообщениями, согласно новому исследованию.
«Метаданные» относятся к данным о других данных. В контексте поста в Твиттере это включает дату и время поста, количество символов в нем, устройство, с которого оно было отправлено, его грамматический стиль, местоположение, с которого оно было отправлено, и множество других маркеров. Средний твит содержит около метаданных 144.
Используя машинное обучение, исследователи из Университетского колледжа Лондона и Института Тьюринга разработали метод идентификации отдельных пользователей с точностью 96.7, используя только метаданные. Даже если ваш дескриптор «LibPwner2016», метаданные все равно могут показать, кто вы. И большая часть этих метаданных доступна через API Twitter.
Эксперимент проводился в Твиттере, но исследователи говорят, что те же методы можно использовать для проверки конфиденциальности на других платформах.
«Методы, описанные в этой работе, могут быть применены к широкому классу платформ и систем, которые генерируют метаданные с похожими характеристиками», - заключают исследователи.
Это плохая новость для Facebook, который провел большую часть этого года, занимаясь национальным контролем после неоднократных скандалов, связанных с потерей конфиденциальных пользовательских данных третьим лицам.