О своем privacy можно будет забыть!

На хакерской конференции 29C3 Chaos Communication Congress в Гамбурге была презентована техника для определения личности анонимных пользователей, оставляющих комментарии на форумах или аналогичных сервисах.

1_0_220_http-__i.haymarket.net.au_News_20130108070456_Untitled-1

Со слов разработчиков Сади Афроз и Эйлин Калискан Ислам эффективность их разработки достигает 80%, упор сделан на законы лингвистики и анализ содержания текста в частности определения места в нем служебных слов. Кроме того применяется стилометрия, как составная часть текстового анализа — каждый человек использует одинаковые коммуникативные конструкции в определенных ситуациях. Пока деанонимизатор работает только с английским языком.

Честно говоря, новость вызывает большие сомнения, показатель 80% считается очень высоким, даже для более простых задач структурного лингвистического анализа, например определения тональности текста или отношения автора к тому или иному предмету.

Здесь же речь идет о фактически создании «цифрового слепка» авторства высказываний. Возможно подобная методика будет работать  эффективно для какой-то узкой выборки типов авторов и видов высказываний, но в общую эффективность на уровне 80% верится слабо. Поживём — увидим.

Источники:

http://events.ccc.de/congress/2012/wiki/Main_Page

http://science.d3.ru/comments/406084/

2 комментария для “Язык мой — враг мой

  1. А где работает современный Феликс Эдмундович? В ГРУ или ФСБ?

    Думаю, его посты данный анализатор тоже сможет распознать 🙂

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *