На сервисе «Охотник за адресами» внедрена расширенная база адресных объектов РФ. До настоящего момента в качестве основы сервис использовал адресные данные классификатора КЛАДР с небольшими добавлениями, которые мы вносили по мере общения с нашими пользователями.
В течение нескольких месяцев мы вели разработку технологий для расширения возможностей КЛАДР на основе дополнительных источников адресных данных. К настоящему моменту эта работа завершена, в результате чего мы получили новую базу адресных объектов, вместе с которой мы выпустили новую версию нашего сервиса.
Новая адресная база веб-сервиса «Охотник за адресами» содержит примерно на 7% больше информации в сравнении с актуальной версией КЛАДР. Это, в свою очередь, позволяет обрабатывать адресные данные с более высоким качеством.
Более точные данные, отражающие прирост числа наименований адресных объектов в новой адресной базе в сравнении с наименованиями актуальной версии КЛАДР, приведены на рисунке.
Эта диаграмма позволяет оценивать процентный прирост адресных данных в нашей базе по адресным объектам разных уровней административно-территориального деления. Так, для улиц прирост составляет 8%, а для населенных пунктов – 9%. Для прочих адресных объектов, не являющихся улицами или населенными пунктами, количество наименований в нашей базе превышает аналогичное количество в КЛАДР примерно на 5%.
Возможности новой адресной базы автоматически стали доступны в текущей версии сервиса «Охотник за адресами» для всех наших партнеров, работающих по тарифному плану «Экспертный». Более подробно с описанием тарифа можно ознакомиться по следующей ссылке: http://ahunter.ru/site/price. Также соответствующие преимущества получили наши пользователи, использующие возможности веб-сервиса через API, предоставляемые командой VERIFY.
В рамках сервиса «Охотник за адресами» добавлена возможность интеллектуальной навигации по адресному хранилищу. Навигатор доступен по адресу http://ahunter.ru/site/demo/navigate.
Основное назначение навигатора – дать альтернативную возможность простым пользователям узнавать правильную форму написания почтового адреса. Вместе с правильным адресом пользователь узнает и его почтовый индекс.
Возможность узнать индекс и привести почтовый адрес к стандартному виду существовала в нашем сервисе и ранее, для этого нужно было вводить фрагменты интересующего адреса в поисковой форме, например, здесь. Навигатор в данном случае повторяет эту возможность, избавляя от необходимости вообще что-либо вводить вручную. Простейший сценарий его использования состоит в последовательном спуске по иерархии адресных уровней, начиная от региона, которому принадлежит искомый адрес, и заканчивая улицей конкретного населенного пункта или города.
Для ускорения навигации можно осуществлять фильтрацию иерархии адресных объектов, выводимых навигатором. Для этого необходимо ввести часть искомого адреса в поисковой форме. Можно вводить как полный искомый адрес, так и какой-то его небольшой фрагмент, например, название улицы или даже часть ее названия. В этом случае навигатор будет отображать только ту часть иерархии адресных объектов, в которой существуют адреса, соответствующие введенному поисковому запросу. Данная возможность является уникальной в своем роде. Ее можно рассматривать как поиск адресов, соответствующих введенному запросу, при этом результат поиска отображается не в виде традиционного списка найденных адресов, а в виде иерархии, по которой можно осуществлять полноценную навигацию. При этом сам поиск можно начинать не обязательно с корня иерархии, предварительно можно выполнить спуск, например, в интересующий регион.
Для иллюстрации этой возможности предложим, что нам нужно выяснить, в каких населенных пунктах и городах Краснодарского края присутствует улица «60 лет ВЛКСМ».
Для решения данной задачи достаточно осуществить первичную навигацию на выбранный регион (в данном случае, это Краснодарский край).
После чего ввести в поисковую форму название искомой улицы «60 лет ВЛКСМ».
Результат поиска будет выглядеть, как показано на рисунке. Как видно из иллюстрации, искомая улица присутствует в городе Сочи, а также в некоторых населенных пунктах районов Белореченский и Каневской. Чтобы узнать, каким именно населенным пунктам принадлежит данная улица, достаточно продолжить навигацию в одном из двух найденных районов. При этом будут отображаться только те населенные пункты, в которых существуют введенная уровнем выше улица. После завершения спуска по иерархии полный правильный адрес, по которому осуществлен спуск, вместе с почтовым индексом будет отображен в блоке «Маршрут навигации».
Если полученный правильный адрес нужно сообщить кому-то, достаточно скопировать полный URL страницы с результатом навигации и отправить его получателю, например, по электронной почте.
В приведенном примере URL будет иметь вид http://ahunter.ru/site/demo/navigate?code=23c7s1484.
Получив данный URL, адресат всегда сможет просмотреть его в браузере.
Информационная система по распознаванию и исправлению контактных данных («Охотник за адресами») внедрена в ИТ-инфраструктуре компании ОАО «Ростелеком».
Внедренное решение ориентировано на обработку неструктурированных почтовых адресов абонентов ОАО «Ростелеком». В рамках такой обработки выполняется чистка почтовых адресов, включающая распознавание адресных полей, исправление ошибок в них и приведение адресов к стандартной форме. Предусмотрена работа системы как в режиме on-line сервиса, так и в режиме пакетной чистки отложенных массивов с адресными данными. Оба режима реализуются в рамках одного серверного процесса.
В режиме on-line система получает запросы на обработку через специальный программный интерфейс (API), основанный на передаче XML документов посредством протокола HTTP. Отправителями запросов являются внутренние бизнес-процессы ОАО «Ростелеком».
Для пакетной чистки отложенных массивов разработано специализированное веб-приложение. Данное приложение построено на основе стандартного веб-интерфейса сервиса «Охотник за адресами», в рамках которого выполнены доработки, позволяющие адаптировать его под работу в рамках внутренней инфраструктуры. Приложение позволяет пользователям внутренней сети ОАО «Ростелеком» запускать на сервере пакетную обработку посредством обычных веб-браузеров.
Внедренное решение запущено на 64-битной платформе Red Hat.
Версия 1.4 сервиса «Охотник за адресами» запущена в режиме on-line. В рамках данной версии выполнены работы по наращиванию возможностей распознавателя, а также по увеличению его быстродействия.
Из наиболее интересных нововведений отметим следующие.
26.09.2024 Внедрили подсказки по паспортным данным
20.07.2024 Обработали в облаке более 2 млрд. данных
09.04.2024 Добавили на Ахантере подсказки по реквизитам банков
01.02.2024 Внедрили кадастровые номера квартир, домов и участков
09.01.2024 Добавили координаты адресов для новых регионов
11.07.2023 Внедрили гео-кодер для адресов Казахстана
16.09.2020 Запустили распознавание неизвестных ФИО.
27.07.2020 Запустили подсказки по ЕГРИП.
25.06.2020 Добавили в API Ахантера обратный гео-кодер.
02.04.2020 Внедрили на Ахантере подсказки по ЕГРЮЛ.
10.02.2020 Рассказали на конференции Качество данных 2020 про использование ИИ в нашей повседневной работе.