Согласно исследованию Яндекса, женщины почти по всем количественным параметрам поискового поведения отстают от мужчин. У них меньше количество запросов в сутки (6 против 6,1 у мужчин), количество запросов за поисковую сессию (2,2 против 2,3), на 1% выше доля сессий из одного запроса (у обоих полов таковые составляют больше половины), на 3% меньше доля уникальных запросов. 

Женщины делают меньше ошибок и опечаток и задают более длинные запросы, но, по мнению аналитиков Яндекса, связано это с тем, что женщины копируют в поисковую строку длинные цитаты.

Женщины ленятся адаптировать свои запросы под понимание роботов и чаще разговаривают с машиной на естественном языке, задавая ей вопросы типа “что приготовить на ужин”. Они почти в два раза реже, чем мужчины, используют в запросах цифры – а когда используют, это чаще всего возраст детей, даты и номера учреждений. 

Мужчины используют цифры при поиске товаров по артикулам. Латиница присутствует почти в трети мужских запросов и всего в 13% женских, да и то 40% женских запросов с латиницей – это адреса сайтов, введенные в поисковую строку вместо адресной строки браузера, и непереключенная раскладка клавиатуры.

Есть в исследовании и неожиданные выводы. Например, любимый цвет у женщин вовсе не розовый, а коричневый – именно такой чаще всего попадается в женских запросах. Анализ поисковых запросов с точки зрения цели поиска показал, что мужчины чаще интересуются покупками, а женщины хотят “скачать” или “смотреть онлайн”.

Не менее интересной, чем выводы исследования, является методика ее проведения. Яндекс определяет пол пользователя вовсе не по соцдем-данным, оставленным при регистрации в его социальных сервисах, как, например, Mail.ru. У Яндекса пол определяет Матрикснет – алгоритм машинного обучения:

Чтобы научить Матрикснет понятиям «мужчина» и «женщина», ему надо «показать» достаточное количество тех и других. Но для этого сначала надо отобрать пользователей с известным полом – а это непростая задача. В качестве основы брались данные из профессиональной социальной сети МойКруг — в профессиональной жизни люди чаще указывают о себе правильную информацию.

Дальше данные обезличивались и автоматически сверялись с информацией из других источников. Отбирались только те пользователи, пол которых совпадал во всех источниках — в итоге около 500 тысяч мужчин и около 500 тысяч женщин. Именно по поисковым сессиям этих пользователей и учился Матрикснет — и выявил около трёхсот важных закономерностей.

Из этих закономерностей Матрикснет построил сложную математическую формулу. По ней и определяется пол пользователя.