В словаре Даля, одном из самых знаменитых и распространенных, примерно 200 тыс. слов. Притом что 150 лет назад он был издан как словарь «живого русского языка», принято считать, что он содержит множество устаревших слов. Компания «Яндекс» решила сравнить поисковые запросы своих пользователей со словарем Даля и выяснить, насколько актуально издание и бывшие в обиходе в России полтора века назад слова сегодня.

 

С начала ноября 2015-го по конец октября 2016 года пользователи ввели примерно 70 млрд запросов в поисковике «Яндекса». После их упорядочивания компания получила свыше 285 млн разных слов, что почти в 1,5 тыс. раз больше, чем у Даля. Далее был использован Национальный корпус русского языка — в основном собрание русскоязычных текстов в электронной форме за XX-XXI века.

«Пересечений оказалось всего около 750 тыс. Можно сказать, что это слова, которые употребляются в современных текстах разных жанров — от художественной литературы до деловых документов», — говорится в сообщении.

Первое издание «Толкового словаря живого великорусского языка» В.И.Даля выходило в 1863-1866 годах. Он не является нормативным: его далеко не всегда можно использовать для ответа на вопросы о том, как пишется то или иное слово и что оно значит. Зато он представляет собой уникальный справочник по живому разговорному языку XIX века. Поисковые запросы содержат в том числе и разговорную лексику, так что, сравнив слова из словаря и слова из запросов, можно увидеть, что изменилось за 150 лет.

Глаголам хуже

Сопоставив все данные, «Яндекс» выяснил, что почти 1/5 (18%) словаря Даля за год ни разу не встречалась в поисковых запросах. Еще примерно 38% слов упоминались в запросах, но отсутствовали в корпусе русского языка, и лишь 44% слов попали в пересечение поиска и корпуса.

Американец Хулио Прието предстал перед судом в Новосибирской области за незаконное пересечение границы РФ.
Американца оштрафовали за незаконный въезд в РФ в поисках лучшей жизни

Таким образом, предварительно как минимум около 36 тыс. слов из знаменитого четырехтомника можно считать вышедшими из обихода.

«Доля глаголов среди этих слов заметно больше, чем в словаре в целом, а доля существительных — меньше. Таким образом, глаголы из словаря Даля устаревают быстрее, чем существительные», — говорится в исследовании.

При этом больше всего глаголов из числа «ставших историей» — с приставками, самая распространенная из которых «по–» (20% из общего количества глаголов, не использовавшихся в поиске за год). Почти треть исчезнувших существительных оканчивается на «-ье» или «-ие» и образована от соответствующих глаголов: «вывороченье», «избоданье», «ловничанье».

© Яндекс
С ноября 2015-го по октябрь 2016-го пользователи ввели примерно 70 млрд запросов в поисковике «Яндекса».

Однако другие производные слова от корней неиспользуемых существительных, отмечают в компании, до сих пор широко используются.

«Вообще вышедшие из употребления слова часто образованы от корней, которые вполне используются и сейчас: "переребячиться", "злодейчивый", "заволшебствовать", "отблинничать", "испивочный", "поплеванье" — сегодня так не говорят, но можно легко догадаться, что имеется в виду», — пишут авторы.

 

Вымирающие слова живого языка

Шарманщик на Рождественской ярмарке в рамках фестиваля "Путешествие в Рождество" в Москве.
Новый год в Москве. Что готовит очередное «Путешествие в Рождество»
Исследование двух других групп слов — «слова из запроса, которые есть и в словаре Даля, и в текстах корпуса (условно "живые")» (44%) и «слова из поиска, которые есть в словаре Даля, но отсутствуют в текстах корпуса (условно "уходящие")» (38%) — оказалось несколько затруднительным.

«Вряд ли можно назвать живым слово, которое есть в письменных текстах, но встречается в запросах всего несколько раз в год, или слово, которое вводят в поиск только для того, чтобы узнать значение», — задаются риторическим вопросом авторы исследования.

Тут важным моментом, отмечают они, являются омонимы — слова, которые звучат и пишутся одинаково, но имеют разные значения.

«У Даля встречаются такие популярные в интернете слова, как "порно", "двач", "прикол", "клубняк", но совсем в другом значении. Иногда написание слов у Даля совпадает с распространенной в поиске ошибкой или опечаткой — "навинка", "кател", "насиление", "загатка"», — сообщает компания.

Популярные запросы по словарю Даля:
порно — крепко, надежно, дюже, прочно, споро;
двач — предмет, состоящий как бы из срослых двойней, близнят;
прикол — действие по глаголу «прикалывать»;
клубняк — вообще все клубоватое, образующее клубки.

Чтобы точнее определить, какая часть словаря Даля до сих пор жива, в компании оценили долю омонимии, а также посчитали, сколько слов люди искали с целью узнать их значение.

© Яндекс
Яндекс сравнил поисковые запросы пользователей со словарём Даля

Выяснилось, что омонимами оказалась почти треть изученных слов. Большинство — почти 60% — в течение года встречались в поисковых запросах более тысячи раз, но отсутствовали в текстах из корпуса («уходящие»). А среди таких слов с более высокой частотностью (больше 100 тыс. запросов за год — «живые») доля омонимов превысила 80%. Около 8,5% слов из словаря Даля интересуют пользователей в первую очередь в контексте поиска значения. Из них самые популярные — "инсинуация", "демагогия", "утрировать", "моногамия" и "импонировать".

Кристина Мищенко из Иркутска победила в конкурсе красоты Mrs. Universal в США
Миссис Вселенная–2016 Кристина Мищенко: Мне помогла футболка с Путиным

В итоге «Яндекс» отнес к вышедшим из употребления словам те, что ни разу не встречались ни в запросах, ни в текстах из корпуса русского языка, а также те, которые оказались там только из-за омонимии или по ошибке.

«Примерно треть слов из словаря Даля (32%) распространена до сих пор. Еще чуть меньше, 30%, используются, но крайне мало, треть из них — только при поиске значений. Почти 40% слов, или полтора тома всего словаря Даля, полностью вышли из употребления», — говорят в заключение авторы.

Если перевести все в абсолютные цифры, то получится, что около 76 тыс. слов из словаря Даля практически не используются в современном русском языке. Еще 60 тыс. слов из четырехтомника употребляются крайне редко, и только около 64 тыс. слов все еще «живы».

 

Глазеть в прогаль

Также на основании поисковых запросов компания проанализировала, какие слова из словаря Даля чаще используют в разных регионах, чем в целом по России. Но и здесь главными «действующими лицами» оказались омонимы.

«Больше половины (57%) этих слов — омонимы, то есть сейчас употребляются в значении, отличном от указанного в словаре. Чаще всего омонимами оказываются фамилии и топонимы — названия населенных пунктов, рек, районов. Например, слово "даровушка" в словаре объяснено как "дарун, дарунок, дарунчик (м.), дареное животное: щенок, жеребенок и пр.", а сейчас его ищут практически только в Кировской области, потому что так называется одна из рек», — говорится в сообщении.

© Яндекс
Яндекс сравнил поисковые запросы пользователей со словарём Даля

Больше всего омонимов (9 из 10) оказалось в Воронежской области и Республике Тыва, а меньше всего (2 из 10) в Москве, Московской и Астраханской областях и Санкт-Петербурге.

Так, наиболее популярным словом из словаря Даля в поисковом запросе в Москве оказалось слово «перевирочный» [«Перевиральный, перевирочный или перевирный, перевранный — к пустым, вздорным вестям, вракам относящ.»], которое использовалось 58 раз за прошедший год (кстати, за этот период это слово в поиске по России искали только в столице). Оно использовалось в следующем виде: «Украинська мова завдання для перевирочных робит Г.В Барае».

89-летняя пенсионерка из Красноярска Елена Ерхова покорила интернет своими путешествиями в одиночку
Вокруг света в 89 лет: баба Лена из Красноярска покоряет интернет

А вот в Подмосковье наиболее популярным оказался более привычный пока глагол «глазеть». Его в Московской области использовали 428 тыс. раз, тогда как по всей России — чуть больше 500 тыс.

В Северной столице РФ наиболее популярным оказалось слово «прогаль» — 32 тыс. запросов из региона и 35 тыс. запросов из России. Именно так называется агентство недвижимости в городе и деревня в области, к которым и относятся поисковые запросы с этим словом. В области же чаще всего искали «подпорожье» (186 тыс. запросов) — город в Ленобласти.

Что касается Кавказа, то, например, в Дагестане чаще всего искали слово «леваши», но так называется село на реке Халагорк в республике.

А в Крыму чаще искали слово «остряковый», но так называется и железнодорожная станция в Севастополе, а также это фамилия генерала, в честь которого назван проспект в городе.