Яндекс научится определять пол и распознавать личные данные

Пятница, 19 Авг 2011 16:52

Компания «Яндекс» недавно заявила о том, что разработчики рассматривают вариант запуска системы распознавания личных данных пользователя. Это предотвратит возможные утечки, через популярный поисковик приватных данных. Со ссылкой на Аркадия Воложа, ген. директора компании, сообщило агентство ИТАР-ТАСС. «Мы планируем, заранее уведомлять владельцев интернет-ресурсов о том, что нашли нечто похожее на личную информацию. Оповещать веб-мастеров мы будем сами» — говорит Волож.

Конечно, такая система не сможет полностью гарантировать сохранность приватных данных. «Технически невозможно со стопроцентной уверенностью распознавать, персональные данные эти, или другие. Кроме того, это займет очень много времени – делать любые распознаватели», — заявляет глава «Яндекса».

Данное решение связано со скандалами последних недель в Сети, связанных с выдачей «Яндексом» личных данных. Сначала общественность получила доступ к более чем восьми тысячам смс-сообщений «Мегафона», а затем появились частные документы гостиницы Астаны, и информация об абонентах интернет-магазинов. Причиной утечек, по словам ген. Директора, стали неправильно настроенные файлы robots.txt.

Напомним, что еще весной 2011 Яндекс смог научиться определять пол пользователей поискового сервиса – с помощью новой технологии Матрикснет. Матрикснет учитывает более 300 закономерностей в поведении пользователей в процессе поиска, при этом каждый раз оценивая, правильно ли определен пол пользователя.

Основные отличия поискового поведения мужчин и женщин – в самих запросах. Мужские запросы короче женских, 3,2 слова против 3,6 в среднем. Мужчины чуть чаще, в 12% запросов, делают опечатки, женщины – в 11%. Женщины чаще копируют в поисковую систему полные цитаты – ошибиться здесь сложнее. Кроме того, Матрикснет проверяет основные интересы полов, и на основе подробного анализа делает выводы о том, кто сидит за компьютером – мужчина или женщина.

http://blogto4ka.ru

RSS комментариев

Оставьте свой комментарий о материале
(Комментарии со ссылками попадают на модерацию. Остальные не попадают, но я могу удалять те, которые посчитаю бесполезными, не несущими смысловой нагрузки)