
Российский специалист из компании «Криптонит» Никита Габдуллин разработал инновационный метод повторной идентификации человека, объединяющий аналитический подход с технологиями глубокого обучения. Новая методика существенно повышает эффективность распознавания ранее неизвестных системе людей, обеспечивая более широкие возможности применения технологии.
Суть реидентификации заключается в способности искусственного интеллекта сопоставлять новое изображение человека с ранее зафиксированными. Система анализирует уникальный набор характеристик, формируя целостный образ. В отличие от классического распознавания лиц, технология учитывает все особенности внешности человека, включая его телосложение, одежду и характерные черты, что делает ее эффективной даже при отсутствии четкого изображения лица.
Современные системы машинного зрения успешно справляются с анализом изображений, полученных в различных условиях съемки — при разном освещении, ракурсах и качестве записи. Алгоритмы способны учитывать изменения во внешности человека, связанные со сменой прически, головного убора или одежды.
Хотя технологии глубокого обучения демонстрируют высокую точность в распознавании, они имеют существенное ограничение — эффективность снижается при работе с новыми, ранее не встречавшимися объектами. Для поддержания качества работы требуется постоянное дообучение моделей, что связано со значительными затратами ресурсов и не всегда возможно из-за отсутствия актуальных данных.
Инновационный подход Габдуллина объединяет DL-парсер с аналитическими методами оценки схожести изображений. Система автоматически разбивает фотографию на семантические области, выделяя ключевые элементы внешности, и анализирует их характеристики без участия человека. Это позволяет создать более точную и гибкую систему распознавания.
Технология использует понятные человеку параметры — цвет и текстуру, что делает возможным поиск людей по словесному описанию. Например, система может найти всех людей в красной одежде с определенным цветом волос — задача, недоступная для классических нейросетей. Более того, разработанный метод поддерживает голосовые и текстовые запросы, что расширяет возможности его практического применения.
Эффективность метода подтверждена масштабными испытаниями на базах данных Market1501 и CUHK03, содержащих тысячи изображений людей в различных условиях. Результаты показали высокую точность распознавания, сопоставимую с существующими DL-моделями.
Особенно впечатляющие результаты достигнуты при работе с разнородными данными — точность 60-90% без необходимости переобучения, что значительно превосходит показатели традиционных моделей глубокого обучения (30-50%).
Технология открывает новые горизонты в обеспечении безопасности общественных пространств. Она незаменима для поиска потерявшихся людей и мониторинга подозрительной активности в местах массового скопления людей — от торговых центров до транспортных узлов.
Универсальность разработанного метода позволяет применять его для анализа любых фото- и видеоматериалов. Система способна работать как в режиме реального времени, так и с архивными записями, повышая эффективность существующих систем безопасности.
Важным преимуществом новой технологии является ее экономичность с точки зрения вычислительных ресурсов. Метод может быть интегрирован непосредственно в камеры видеонаблюдения, реализуя принципы граничных вычислений и повышая автономность систем безопасности.
Результаты исследования опубликованы в электронном архиве Корнеллского университета, подтверждая высокий научный уровень разработки.
Информация и изображения предоставлены НПК «Криптонит».
Источник: scientificrussia.ru





