Большинство сотрудников нашей компании являются выпускниками Московского государственного технического университета имени Н.Э. Баумана (МГТУ им. Н.Э. Баумана): www.bmstu.ru.
Это определяет методологию и принципы, используемые нами в ходе научно-исследовательской работы. При решении сложных задач мы используем системный подход, ищем точные и обоснованные решения.
Достижения и результаты нашего R&D направления мы публикуем в журналах и обсуждаем на научно-технических конференциях.
Например, мы часто делаем доклады на конференции "Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции", в трудах которой опубликованы многие результаты нашей работы: www.rcdl.ru
В рамках R&D мы решаем весьма разнообразные задачи, однако акцент мы делаем на проблемах, связанных с обработкой текстовой информации.
Особую роль в этом направлении играет задача извлечения информации. Подробно об этой задаче можно прочитать здесь http://en.wikipedia.org/wiki/Information_extraction или здесь http://ru.wikipedia.org/wiki/Извлечение_информации.
Большое влияние на наше понимание проблемы извлечения информации из неструктурированных текстов и подходов к ее решению оказали работы профессора Массачусетского университета Эндрю Маккалума (Andrew McCallum). Большинство его публикаций на эту тему доступно на его домашней странице: http://www.cs.umass.edu/~mccallum/
Мы глубоко убеждены, что решение многих задач должно выполняться с применением машинного обучения.
Машинное обучение помогает формулировать правила поведения компьютерной системы на основе закономерностей, определяемых инженером не в явной форме, а на основе примеров. Необходимые критерии формулируются автоматическим в ходе анализа системой обучающих примеров. При разработке систем извлечения информации мы активно используем методы машинного обучени.
Кроме общепринятых моделей и методов, применяемых на практике в рамках машинного обучения, на становление нашей методологии в этом направлении большое влияние оказали работы доктора Эдинбургского университета Чарльза Саттона (Charles Sutton) Большинство его публикаций на тему статистического машинного обучения для задачи извлечения информации из текстов доступно на его домашней странице здесь: http://homepages.inf.ed.ac.uk/csutton/
24.09.2025 В гео-кодере Ахантера увеличили число детализированных ответов до дома в два раза
20.03.2025 Доработали подсказки по ЕГРЮЛ, расширили информацию об адресе компаний
09.11.2021 Запустили на Ахантере новый ИИ-алгоритм в стандартизации ФИО.
03.09.2021 Внедрили справочник ГАР на Ахантере вместо прежней ФИАС-версии.
07.06.2021 Запустили обработку адресов для Казахстана.
10.05.2021 Ахантер в облаке обработал 1 млрд. контактных данных.