Язык мой — враг мой

2 комментария

О своем privacy можно будет забыть!

На хакерской конференции 29C3 Chaos Communication Congress в Гамбурге была презентована техника для определения личности анонимных пользователей, оставляющих комментарии на форумах или аналогичных сервисах.

1_0_220_http-__i.haymarket.net.au_News_20130108070456_Untitled-1

Со слов разработчиков Сади Афроз и Эйлин Калискан Ислам эффективность их разработки достигает 80%, упор сделан на законы лингвистики и анализ содержания текста в частности определения места в нем служебных слов. Кроме того применяется стилометрия, как составная часть текстового анализа — каждый человек использует одинаковые коммуникативные конструкции в определенных ситуациях. Пока деанонимизатор работает только с английским языком.

Честно говоря, новость вызывает большие сомнения, показатель 80% считается очень высоким, даже для более простых задач структурного лингвистического анализа, например определения тональности текста или отношения автора к тому или иному предмету.

Здесь же речь идет о фактически создании «цифрового слепка» авторства высказываний. Возможно подобная методика будет работать  эффективно для какой-то узкой выборки типов авторов и видов высказываний, но в общую эффективность на уровне 80% верится слабо. Поживём — увидим.

Источники:

http://events.ccc.de/congress/2012/wiki/Main_Page

http://science.d3.ru/comments/406084/

Possibly Related Posts:


Эксперт сообщества Андрей Фадин

Выпускник МГТУ им. Н.Э.Баумана по специальности "Информационная безопасность". CISSP

Рубрика: информационная безопасность. Метки: . Вы можете следить за отзывами через RSS 2.0. Вы можете оставить отзыв, или трекбек со своего сайта.

2 Отзывов на «Язык мой — враг мой»


  1. Дзержинский

    Думаю анонимные посты Навального можно будет распознать, но смысл ?!

  2. Андрей Фадин

    А где работает современный Феликс Эдмундович? В ГРУ или ФСБ?

    Думаю, его посты данный анализатор тоже сможет распознать 🙂