Сервис «Яндекс» выложил в открытый доступ датасет, содержащий информацию о названиях населенных пунктов, их местонахождении, численности населения и прежних названиях, сообщила пресс-служба компании.
Также при участии лингвистов аналитики «Яндекс.Карт» провели исследование российских ойконимов (названий населенных пунктов), в ходе которого определили самые частотные и редкие, самые длинные и короткие и просто необычные названия местностей. Такие данные могут быть использованы затем учеными-языковедами в научных работах.
© Яндекс
«Ойконимы — это большая часть языка и важный материал для лингвистических исследований, — поясняет Борис Иомдин, заведующий сектором Института русского языка им. Виноградова, научный сотрудник "Яндекса", — Информация о том, какие названия встречаются на карте России, позволяет судить об историческом расселении разных этнических групп, о том, от каких слов образуются названия городов и деревень и какие исторические события и имена отражены в этих названиях. Ойконимы также интересны с точки зрения фонетики, грамматики и семантики. Например, какие-то названия звучат понятно, но большинство людей понимает их неправильно: скажем, в Зебревице не живут зебры, а Старая Тумба не связана с мебелью».
© Яндекс
Всего в России на 160 тыс. населенных пунктов оказалось приблизительно 82 тыс. ойконимов, среди которых самыми распространенными стали Александровка (333), Ивановка (280) и Михайловка (272).
Самое длинное название без пробелов у села Кременчуг-Константиновское (25 букв). Без пробелов и дефисов — у села Верхненовокутлумбетьево (23 буквы), опередившего соседнее Нижненовокутлумбетьево на одну букву.
Wylsacom стал голосом «Яндекс.Карт»