Анализируй!
Не все фундаменты одинаково прочны.
Эта статья создана без какой-либо сторонней информации из других источников. Все изложенное написано на базе фундаментальных разработок компании СпецЛаб, поэтому вполне допускаются определения, не совпадающие с общепринятыми. НИИ СпецЛаб по праву считает себя одним из разработчиков фундаментальной теории видеоаналитики, поэтому оставляет за собой право вводить собственные обозначения.
До сего дня системы видеоконтроля выполняли роль лишь судмедэкспертов, выдавая заключение о состоявшемся происшествии, но в безопасности, наконец, появилась компьютерная аналитика, способная работать на упреждение. Важнейшей ее частью является видеоаналитика. Большие возможности, которые она несет, кустарные методы реализации – все это породило массу домыслов и недоверие к вычислительной логике. Дабы расставить все по местам, СпецЛаб публикует теоретические основы видеоанализа.
На сегодняшний день можно выделить два основных вида видеоаналитики по типу: видеоанализ на основе детектора объектов OA (Object Analysis) и статистический видеоанализ SA (Statistic Analysis).
Первый – наиболее просто реализуемый - относится к группе, так называемых, жестких алгоритмов и основан на уже собранной математической библиотеке – детекторе объектов, который способен идентифицировать отдельно движущиеся цели. Object Analytics дает широкий простор фантазии для точно поставленных задач. С его помощью можно смоделировать или распознать абсолютно конкретную ситуацию. И если бы не некоторые «но», этот видеоанализ можно было бы применять для выявления нарушений конкретных статей уголовного кодекса. Однако в реальности он может работать лишь в чистых лабораторных условиях, где отсутствует практика жизни. Любое видеонаблюдение, связанное с естественными помехами, с обывательским поведением или с неподготовленным сценарием, будет выдавать больше ложных выходных данных, нежели полезных. Однако OA настолько убедителен при демонстрации, что на нем построено наибольшее количество сказочных возможностей видеоаналитики. Если бы разработчики поумерили свои фантазии, она не слыла бы фантастикой, а успешно использовалась в отдельных редких сферах человеческой деятельности.
Недостатки кроются, конечно, в несовершенстве самого детектора объектов. Последняя конференция по данному вопросу на родине Майкрософт убедительно показала, что сегодняшняя реализация Object detector – лишь стартовая площадка для будущих свершений, удобоваримый вид которых планируется только ближе к 2020 году. Что ж, поживем – увидим. Сегодняшние недостатки, конечно, видны невооруженным глазом, вот почему маркетологи не любят показывать товар вживую, а крутят заранее подготовленные видеоролики, демонстрируя фантастические возможности.
Прежде всего, это неумение разделять перекрывающиеся или рядом движущиеся цели.
Чтобы один объект не заслонял другой, надо камеру поставить вверху и направить вертикально вниз, но и в этом случае только в небольшом радиусе может обеспечиваться достоверность информации.
В своих демонстрационных видеороликах маркетологи выбирают такие моменты, когда нет перекрывающихся объектов в кадре, поэтому работоспособность выглядит убедительно. Однако они умалчивают, что такие периоды составляют лишь доли процентов от общего времени записи.
Отличить автомобиль от группы людей тоже практически невозможно, если изначально в кадр попадают совмещенные цели. Их еще можно как-то варифицировать, если сначала люди двигались раздельно, а потом сошлись вместе, но лишь предположительно, потому что существует масса других условностей. Хотя обывателю может показаться, что нет ничего проще, чем отличать автомобили от людей по соотношению сторон.
Для примера проанализируем эту картинку.
Что видит компьютер в кадре? Увы, он не может распознать людей как вид, для него группа людей лишь пятно, причем расплывчатое, детектор объектов делает поправку на углы поворота. Попытаемся смоделировать графическими эффектами.
Посмотреть видео: http://freehost.goal.ru/files/sl_video.wmv
К тому же это пятно ухудшено шумами видеотракта (помех камеры, кабеля, оцифровщика).
Очень большая вероятность подобное пятно увидеть в качестве автомобиля с учетом его раскраски, рекламы, грязи, бликов… По сути, дальний автомобиль имеет такой же пятнистый узор.
Таким образом, при сегодняшнем уровне детектора объектов распознавание образов и даже по таким, казалось бы, элементарным параметрам как соотношение сторон, больше фантастика, нежели реальность. Но для непосвященного покажут классный фильм, где все работает отлично.
Кроме того, детектор объектов крайне чувствителен к любому типу помех. Пролетевшая ближе к камере птица, севшая на объектив муха, любой муар на оптике – для OA это вопрос непонимания.
Ободки по краям картинок говорят о том, что это не фотомонтаж, такие кадры постоянно записывает система видеозаписи. Это для человека понятно, что летит птичка, а компьютер пытается построить образ, пустые места вокруг тела птицы интерпретируются как цвета, схожие с бэкграундом. По всем параметрам для компьютера это автомобиль.
Тем не менее, ОА в большинстве случаев используется для анализа поведения автотранспорта. На скоростных участках (где длинная дистанция) и при высоком подвесе камеры меньше вероятности перекрытия одной машиной другой, и при хорошей погоде, а также хорошей освещенности (отсутствии солнца и включенных фар) можно продемонстрировать неплохие аналитические результаты. Однако даже элементарные блики фар в темное время суток или солнечные отражения днем полностью парализуют всю логику.
Под действием атмосферных помех, трясущихся на столбах камер, ползающих по объективу насекомых, мы получаем то, что в нашей среде принято называть коротким, но емким словом – БЕСПОЛЕЗНО.
Некоторые компании благородного происхождения практически и не скрывают этого, так в Инструкции к видеоаналитике BOSCH прямо сказано, в каких условиях она не работает. Перечислены практически все ситуации жизни:
IVA 3.5
Требования | ru
Bosch Security Systems
Руководство по эксплуатации стр.12
V 3.5 | 2007.12
2.4
Ограничения
...использование данного типа видеодетекторов движения в определенных условиях не рекомендуется, поскольку движение не всегда может быть обнаружено или в результате отражений может быть обнаружено слишком много движущихся объектов. Неверное обнаружение движущихся объектов может происходить при наличии следующих факторов:
– отражающих металлических поверхностей на заднем плане
– стекол (застекленных фасадов зданий)
– водных поверхностей на заднем плане
– движущихся в темноте световых конусов
Большие области отраженного света также могут привести к ложному определению движущихся объектов. Однако отражения света, вызванные, например, падающими каплями дождя, игнорируются благодаря малому размеру и единообразной природе движения. Объекты, всегда движущиеся единообразно (например, облака), не влияют на обнаружение других движущихся объектов и не вызывают ложных тревог. Для надежного определения движения и обнаружения объекта этого движения необходим неизменный задний план. Чем больше движения происходит на заднем плане, тем сложнее выделить движущийся объект. Например, человек, идущий на фоне живой изгороди, которая колышется на ветру, вероятнее всего, не будет обнаружен. Если изображение в значительной степени состоит из движущихся объектов, т.е. если невозможно отличить объекты друг от друга или от фона, движение отдельного объекта не может быть обнаружено (например, отдельные люди в большой толпе).
При обнаружении слишком большого количества движущихся объектов затрачивается большое количество вычислительных ресурсов, что приводит к ухудшению качества передачи изображения в реальном времени. Следует при необходимости изменить настройки, чтобы обнаруживались только наиболее значимые объекты.
IVA 3.5 и соответствующие меню настроек имеют ряд удобных и простых способов преодоления этих ограничений и устранения проблемных областей. При поиске движущихся объектов с определенными цветовыми характеристиками следует иметь в виду следующее.
– Объект практически никогда не отображается на изображении с неизменными цветовыми характеристиками. Пикселы на внешней границе обнаруживаемого объекта часто содержат цветовую информацию из фона, а не самого объекта. Такие объекты, как автомобили, состоят из множества различных частей (кузов, стекла, колеса). Каждая часть объекта отображается своим собственным цветом; например, крылья красным, а колеса черным.
– Цветовые характеристики объекта зависят от условий освещения. Если условия освещения изменяются, изменяется и цвет отслеживаемого объекта. Объекты на улице отображаются различными оттенками в зависимости от времени суток и погодных условий.
ЗАМЕЧАНИЕ!
Анализ движения в изображениях в реальном времени выдвигает повышенные требования к вычислительной мощности устройства (отправителя или камеры). При анализе движения в записанных изображениях повышенные требования выдвигаются к вычислительной мощности ПК, на котором используется IVA 3.5 вместе с Archive Player.
– Объект, положение или направление движения которого изменяется, также может отображаться с различными цветовыми характеристиками. Например, автомобили часто отображаются в цвете сбоку, но не сзади. При наблюдении людей спереди цвет лица определяет оттенок изображения; если же человек поворачивается спиной, цветовые характеристики определяются цветом волос или головного убора...
Статистическая видеоаналитика (Statistic Analytics) более устойчива к помехам и легко переносит непогодные условия. Сам принцип сравнения последующей статистики с предыдущей предполагает нехитрую арифметическую операцию – вычитание. Разность является критерием изменений, произошедших перед видеокамерой. Огромный плюс такого подхода в том, что при этом также вычитаются и помехи. Они не оказывают влияния на принятие решения по одной простой причине – они вычитаются сами из себя, образуя за собой ноль помех. Естественно, такое определение несколько утрировано, но в полной мере отражает сам принцип помехозащищенности SA.
Недостаток ее в том, что она не может выдать точное умозаключение о характере поведения объектов, номер статьи уголовного кодекса. Она лишь находит отличия существующих действий и состояний от предыдущих. Но в этом контексте можно построить, так называемую, мягкую видеоаналитику, которая не диктует точного определения статьи УК, под которую подпадает то или иное поведение человека, но предупреждает об определенных изменениях самого поведения: сменил темп ходьбы, поменял направление, начал махать руками, присел, встал, побежал, подпрыгнул, положил, взял и т.д. Конечно, каждое из перечисленных действий не может однозначно определяться как криминал, мягкая аналитика лишь предупреждает об изменениях, вернее фильтрует огромный поток видеоинформации, оставляя только ключевые кадры. Такая структура сокращает время, необходимое на просмотр архива, с помощью SA упрощается само видеонаблюдение, т.к. внимание оператора концентрируется лишь на конкретных событиях вместо непрерывного многочасового контроля мониторов.
На аналитическую панель выводятся только новые, необычные, отличные от предыдущих действия, которые могут быть достойными внимания. МОГУТ – это не значит, что они являются однозначно незаконными, это лишь отклонение от нормы как самого объекта с момента его первого появления в кадре (краткосрочная статистика), так и относительно других двигавшихся в данной зоне объектов (долгосрочная статистика). Если отбросить пафос, то к этой технологии больше подходит слово «фильтр» - отфильтровываются повторяющиеся действия.
Видеоаналитика СпецЛаб в большей степени основана на мягком принципе. Хотя она и использует, в том числе, жесткие алгоритмы, но в основном как систему фильтров для мягкой. SLA (SpecLab Analytics) уже проявила себя на большом числе объектов именно за счет своей адаптивности к помеховой активности. Когда все работает без «высоких материй» и специальных настроек, когда не нужно постоянно подстраивать чувствительность для каждого часа работы, система легко приживается по месту и без рекламаций принимается пользователем.
Ему не предлагается панацея от всех проблем, SpecLab Analytics лишь упрощает жизнь, в тысячи раз сокращая время на внимание, которое требуется от оператора при просмотре мониторов видеонаблюдения или видеоархивов записей. Она «останавливает время», задерживая выявленные необычные события на экране, позволяя человеку отвлекаться. Но она не способна на чудеса, номера статей УК не появляются в интерфейсе.
P.S.: На ставшем уже известном форуме forsec.ru есть интересный спор по вопросам видеоаналитики.
Видеопримеры.
Все ключевые моменты заносятся в левую панель с историей. Для экономии пространства показывается только активная часть кадра.
Посмотреть видео: http://freehost.goal.ru/files/vnimanie2_3_lq.wmv
Посмотреть видео:http://freehost.goal.ru/files/vnimanie2_4_lq.wmv
Посмотреть видео:http://freehost.goal.ru/files/vnimanie2_5_lq.wmv
Источник: http://www.goal.ru/left/news_1248638400_1175.html