| |||||
МЕНЮ
| Техническое зрение роботовp> Изложенное выше можно представить в виде процедуры, где на каждом шаге выполняются следующие операции: 1. Разбиение области Ri, для которой Р {Ri) = ЛОЖЬ, на четыре непересекающихся квадранта. 2. Объединение соседних областей Ri и Rk, для которых Р (Ri U Rk) = 3. Выход на останов, когда дальнейшее объединение или разбиение невозможно. Возможны варианты этого алгоритма. Например, можно сначала разбить
образ на квадратные блоки. Дальнейшее разбиение выполняется по изложенному
выше способу, но вначале объединение ограничивается группами из четырех
блоков, являющихся в квадродереве потомками и удовлетворяющих предикату Р. 2.4. Применение движения Движение представляет собой мощное средство, которое используется человеком и животными для выделения интересующих их объектов из фона. В системах технического зрения роботов движение используется при выполнении различных операций на конвейере, при перемещении руки, оснащенной датчиком, более редко при перемещении всей робототехнической системы. 2.4.1.Основной подход. Один из наиболее простых подходов для определения изменений между двумя кадрами изображения (образами) f(x, у, ti) и f(x, у, t,), взятыми соответственно в моменты времени ti и tj, основывается на сравнении соответствующих пикселов этих двух образов. Для этого применяется процедура, заключающаяся в формировании так называемой разности образов. Предположим, что мы имеем эталонный образ, имеющий только стационарные компоненты. Если сравним этот образ с таким же образом, имеющим движущиеся объекты, то разность двух образов получается в результате вычеркивания стационарных компонент (т. е. оставляются только ненулевые записи, которые соответствуют нестационарным компонентам изображения). Разность между двумя кадрами изображения, взятыми в моменты времени ti и tj, можно определить следующим образом: dij(x,y) = [pic] (*) где (—значение порогового уровня. Отметим, что dij(x, у) принимает значение 1 для пространственных координат (х, у) только в том случае, если два образа в точке с этими координатами существенно различаются по интенсивности, что определяется значением порогового уровня (. При анализе движущегося образа все пикселы изображений разности dij(x,
у), имеющие значение 1, рассматриваются как результат движения объекта. 2.4.2.Аккумулятивная разность. Как говорилось выше, разность кадров благодаря шуму часто содержит изолированные записи. Несмотря на то что число таких записей может быть сокращено или полностью ликвидировано в результате анализа связности пороговых уровней, этот процесс может также привести к потере изображений малых или медленно движущихся объектов. Ниже излагается подход для решения этой проблемы путем рассмотрения изменения в расположении пикселов на нескольких кадрах, т. е. в процесс вводится «память». Основная идея заключается в пренебрежении теми изменениями, которые возникают случайно в последовательности кадров и, таким образом, могут быть отнесены к случайному шуму. Рассмотрим последовательность кадров изображения f(x,y,t1), f(x,
у, t2), ..., f(x, у, tn) и допустим, что f(x, у, t1) является эталонным
образом. Изображение аккумулятивной разности формируется в результате
сравнения эталонного образа с каждым образом в данной последовательности. В
процедуре построения изображения аккумулятивной разности имеется счетчик,
предназначенный для учета расположения пикселов. Его значение увеличивается
каждый раз, когда возникает различие в расположении соответствующих
пикселов эталонного образа и образа из рассматриваемой последовательности. Приведенные выше рассуждения иллюстрируются рисунке. На рисунке а—д приведены образы прямоугольного объекта (обозначенного нулями), движущегося вправо с постоянной скоростью 1 пиксел/кадр. Эти образы приведены в моменты времени, соответствующие одному перемещению пиксела. На рис. (а) изображен кадр эталонного образа, на рис. (г) со 2-го по 4-й кадры последовательности, а на рис. (д)— 11-й кадр. Рис. (е— и) соответствуют изображениям аккумулятивной разности, которые можно объяснить следующим образом. На рис. (е) левая колонка из 1 обусловлена различием между объектом на рис. (а), и фоном на рис. (б). Правая колонка из 1 вызвана различием между фоном эталонного образа и передним контуром движущегося объекта. Ко времени появления 4-го кадра (рис. г), первый ненулевой столбец изображения аккумулятивной разности указывает на три отсчета, что соответствует трем основным различиям между этим столбцом в эталонном образе и соответствующим столбцом в последующих кадрах. На рис. и показано общее число из 10 (представленных «A» в шестнадцатеричной системе счисления) изменений этого положения. Остальные записи на этом рисунке объясняются аналогично. Нередко полезно рассматривать три типа изображений аккумулятивной разности: абсолютное, положительное и отрицательное. Последние два получаются из уравнения (*), в котором нет модуля, а вместо f(x, у, ti) подставляется значение эталонного кадра. Предполагая, что числовые значения интенсивности объекта превышают значения фона в случае, когда разность положительна, она сравнивается с положительным значением порогового уровня; если отрицательна, сравнение выполняется с отрицательным значением порогового уровня. Это определение заменяется на противоположное, если интенсивность объекта меньше фона. Рис. Кадр эталонного образа (а), б—д соответственно 2-, 3-, 4- и 11-й
кадры, е—и—изображения аккумулятивной разности для 2-, 3-, 4- и 11-го
кадров . 2.4.3.Определение эталонного образа. Успех применения методов зависит от эталонного образа, относительно которого проводятся дальнейшие сравнения. Как уже говорилось выше, различие между двумя образами в задаче распознавания движущихся объектов определяется путем исключения стационарных компонент при сохранении элементов, соответствующих шуму и движущимся объектам. Проблема выделения образа из шума решается методом фильтрации или с помощью формирования изображения аккумулятивной разности. На практике не всегда можно получить эталонный образ, имеющий только стационарные элементы, и это приводит к необходимости построения эталона из набора образов, содержащих один или более движущихся объектов. Это особенно характерно для ситуаций, описывающих сцены со многими быстроменяющимися объектами или в случаях, когда возникают частые изменения сцен. Рассмотрим следующую процедуру генерации эталонного образа. Предположим, что мы рассматриваем первый образ последовательности в качестве эталонного. Когда нестационарная компонента полностью вышла из своего положения в эталонном кадре, соответствующий фон в данном кадре может быть перенесен в положение, первоначально занимаемое объектом в эталонном кадре. Когда все движущиеся объекты полностью покинули свои первоначальные положения, в результате этой операции воссоздается эталонный образ, содержащий только стационарные компоненты. Перемещение объекта можно определить с помощью операции расширения положительного изображения аккумулятивной разности. 3.ОПИСАНИЕ В системах технического зрения проблемой описания называется выделение свойств (деталей) объекта с целью распознавания. В идеальном случае дескрипторы не должны зависеть от размеров, расположения и ориентации объекта, но должны содержать достаточное количество информации для надежной идентификации объектов. Описание является основным результатом при конструировании систем технического зрения в том смысле, что дескрипторы должны влиять не только на сложность алгоритмов распознавания, но также и на их работу. рассмотрим три основные категории дескрипторов: дескрипторы границы, дескрипторы области и дескрипторы для описания трехмерных структур. 3.1.Дескрипторы границы.
Цепные коды применяются для представления границы в виде
последовательности отрезков прямых линий определенной длины и направления. Изложенные методы нормирования являются точными только в том случае, когда сами границы инвариантны к повороту и изменению масштаба. Этот случай редко встречается на практике. Например, один и тот же объект, разбитый на элементы в двух различных направлениях, как правило, имеет разную форму границы, причем степень различия пропорциональна разрешающей способности изображения. Этот эффект можно уменьшить, если выбирать длины элементов цепи большими, чем расстояния между пикселами дискретного образа, или же выбирать ориентацию решетки вдоль главных осей кодируемого объекта. 3.1.2.Сигнатуры. Сигнатурой называется одномерное функциональное представление границы. 3.1.3.Аппроксимация многоугольниками. Дискретную границу с произвольной точностью можно аппроксимировать многоугольниками. Для замкнутой кривой аппроксимация является точной, когда число сегментов в многоугольнике равно числу точек границы, так что каждая пара соседних точек определяет сегмент многоугольника. На практике целью аппроксимации многоугольниками является качественное определение формы границы с помощью минимального числа многоугольных сегментов. Хотя обычно эта проблема нетривиальна и довольно быстро сводится к итеративному поиску, требующему больших временных затрат, имеется ряд методов аппроксимации многоугольниками, относительная простота которых и требования к обработке данных делают их пригодными для приложений в области технического зрения роботов. В задаче аппроксимации многоугольниками применяются методы
объединения, основанные на ошибке или других критериях. Один из подходов
состоит в соединении точек границы линией по методу наименьших квадратов. Один из методов разбиения сегментов границы состоит в последовательном
делении сегмента на две части до тех пор, пока удовлетворяется заданный
критерий. Например, можно потребовать, чтобы максимальная длина
перпендикуляра, проведенного от сегмента границы к линии, соединяющей две
крайние точки этого сегмента, не превышала ранее установленного значения
порогового уровня. Если это имеет место, наиболее дальняя точка становится
вершиной, разделяя, таким образом, исходный сегмент на два подсегмента. 3.2.Дескрипторы области Область, представляющую интерес, можно описать формой ее границы или же путем задания ее характеристик. Важно отметить, что методы, рассмотренные выше, применяются для описания областей. 3.2.1.Некоторые простые дескрипторы. Существующие системы технического зрения основываются на довольно простых дескрипторах области, что делает их более привлекательными с вычислительной точки зрения. Как следует ожидать, применение этих дескрипторов ограничено ситуациями, в которых представляющие интерес объекты различаются настолько, что для их идентификации достаточно несколько основных дескрипторов. Площадь области определяется как число пикселов, содержащихся в пределах ее границы. Этот дескриптор полезен при сборе информации о взаимном расположении и форме объектов, от которых камера располагается приблизительно на одном и том же расстоянии. Типичным примером может служить распознавание системой технического зрения объектов, движущихся по конвейеру. Большая и малая оси области полезны для определения ориентации объекта. Отношение длин этих осей, называемое эксцентриситетом области, также является важным дескриптором для описания формы области. Периметром области называется длина ее границы. Хотя иногда периметр
применяется как дескриптор, чаще он используется для определения меры
компактности области, равной квадрату периметра, деленному на площадь. Связной называется область, в которой любая пара точек может быть соединена кривой, полностью лежащей в этой области. Для множества связных областей (некоторые из них имеют отверстия) в качестве дескриптора полезно использовать число Эйлера, которое определяется как разность между числом связных областей и числом отверстий. Например, числа Эйлера для букв А и В соответственно равны 0 и —1. Другие дескрипторы области рассматриваются ниже. 3.2.2.Текстура. Во многих случаях идентификацию объектов или областей образа можно
осуществить, используя дескрипторы текстуры. Хотя не существует формального
определения текстуры, интуитивно этот дескриптор можно рассматривать как
описание свойств поверхности (однородность, шероховатость, регулярность). 3.2.3.Скелет области. Важным подходом для описания вида структуры плоской области является ее представление в виде графа. Во многих случаях для этого определяется схема (скелет) области с помощью так называемых прореживающих (или же сокращающих) алгоритмов. Прореживающие процедуры играют основную роль в широком диапазоне задач компьютерного зрения — от автоматической проверки печатных плат до подсчета асбестовых волокон в воздушных фильтрах. Скелет области можно определить через преобразование средних осей (ПСО), предложенное в работе. ПСО области R с границей В определяется следующим образом. Для каждой точки р из R мы определяем ближайшую к ней точку, лежащую на В. Если р имеет больше одной такой точки, тогда о ней говорится, что она располагается на средней оси (скелете) области R. Важно отметить, что понятие «ближайшая точка» зависит от определения расстояния, и поэтому на результаты операции ПСО будет влиять выбор метрики. Хотя ПСО дает довольно удовлетворительный скелет области, его прямое применение затруднительно с вычислительной точки зрения, поскольку требуется определение расстояния между каждой точкой области и границы. Был предложен ряд алгоритмов построения средних осей, обладающих большей вычислительной эффективностью. Обычно это алгоритмы прореживания, которые итеративно устраняют из рассмотрения точки контура области так, чтобы выполнялись следующие ограничения: 1) не устранять крайние точки; 2) не приводить к нарушению связности; 3) не вызывать чрезмерного размывания области. 4.СЕГМЕНТАЦИЯ И ОПИСАНИЕ ТРЕХМЕРНЫХ СТРУКТУР В предыдущих двух разделах основное внимание уделялось методам сегментации и описания двумерных структур. В этом разделе мы рассмотрим эти задачи применительно к трехмерным данным сцены. По существу зрение является трехмерной проблемой, поэтому в основе разработки многофункциональных систем технического зрения, пригодных для работы в различных средах, лежит процесс обработки информации о трехмерных сценах. Хотя исследования в этой области имеют более чем 10-летнюю историю, такие факторы, как стоимость, скорость и сложность, тормозят внедрение обработки трехмерной зрительной информации в промышленных приложениях. Возможны три основные формы представления информации о трехмерной
сцене. Если применяются датчики, измеряющие расстояние, то мы получаем
координаты (х, у, z) точек поверхностей объектов. Применение устройств,
создающих стереоизображение, дает трехмерные координаты, а также информацию
об освещенности в каждой точке. В этом случае каждая точка представляется
функцией f (х, у, z), где значения последней в точке с координатами (х, у,
z) дают значения интенсивности в этой точке (для обозначения точки в
трехмерном пространстве и ее интенсивности часто применяется термин вок
сел). Наконец, можно установить трехмерные связи на основе одного
двумерного образа сцены, т. е. можно выводить связи между объектами, такие,
как «над», «за», «перед». Поскольку точное трехмерное расположение точек
сцены обычно не может быть вычислено на основе одного изображения, связи,
полученные с помощью этого вида анализа, иногда относятся к так называемой 4.1.Описание трехмерной сцены плоскими участками Один из наиболее простых подходов для сегментации и описания трехмерных структур с помощью координат точек (х, у, z) состоит в разбиении сцены на небольшие плоские «участки» с последующим их объединением в более крупные элементы поверхности в соответствии с некоторым критерием. Этот метод особенно удобен для идентификации многогранных объектов, поверхности которых достаточно гладкие относительно разрешающей способности. 4.2. Применение градиента Когда сцена задана вокселами, ее можно описать плоскими участками с помощью трехмерного градиента. В этом случае дескрипторы поверхности также получаются в результате объединения этих плоских участков. Вектор градиента указывает направление максимальной скорости изменения функции, а его величина соответствует величине этого изменения. Эти понятия применимы для трехмерного случая и также могут быть использованы для разбиения на сегменты трехмерных структур тем же способом, который применялся для двумерных данных. 4.3. Разметка линий и соединений Итак, контуры в трехмерной сцене определяются разрывами в данных о координатах и/или интенсивности. После того как был определен набор поверхностей и контуров, располагающихся между ними, окончательное описание сцены может быть получено путем разметки линий, которые соответствуют контурам, и соединений, которые эти контуры образуют. Выпуклая линия (помеченная +) образуется в результате пересечения двух
поверхностей выпуклого тела (например, линия, образованная в результате
пересечения двух сторон куба). Вогнутая линия (помеченная —) образуется в
результате пересечения двух поверхностей, принадлежащих двум различным
телам (например, пересечение стороны куба с полом). Скрытые линии 4.4. Обобщенные конусы Обобщенным конусом (или цилиндром) называется поверхность, получаемая в результате перемещения плоского поперечного сечения вдоль произвольной пространственной кривой (хребта) под постоянным к ней углом, причем поперечное сечение преобразуется по правилу заметания объема. В техническом зрении метод обобщенных конусов независимо от других методов позволяет создавать образы трехмерных структур, что полезно при моделировании и для проверки соответствия построенных моделей исходным данным. 5.Распознавание Распознаванием называется процесс разметки, т.е. алгоритмы распознавания
идентифицируют каждый объект сцены и присваивают ему метки (гаечный ключ,
перемычка). Обычно в большинстве промышленных систем технического зрения
предполагается, что объекты сцены сегментированы как отдельные элементы. 6.Интерпретация Интерпретацию - процесс, который позволяет системе технического зрения приобрести более глубокие знания об окружающей среде по сравнению со знаниями, полученными с помощью методов, изложенных выше. Рассматриваемая с этой точки зрения интерпретация охватывает данные методы как неотъемлемую часть процесса понимания зрительной сцены. Хотя в области технического зрения она и является объектом активных исследований, достижения пока весьма незначительны. Ниже мы кратко рассмотрим проблемы, представляющие современные исследования в этой области технического зрения. Мощность системы технического зрения определяется ее способностью
выделять из сцены значимую информацию при различных условиях наблюдения и
использовании минимальных знаний об объектах сцены. По ряду причин Проблема загораживания одних объектов другими имеет место, когда
рассматривается большое число объектов в реальном рабочем пространстве. Для обработки сцен требуются описания, которые должны содержать
информацию о формах и объемах объектов, а также процедуры для установления
связей между этими описаниями, даже когда они не являются полными. Знание о том, в каких случаях интерпретация сцены или части сцены является невозможной, так же важно, как и правильный анализ сцены. Просмотр сцены из различных точек решил бы эту проблему и был бы естественной реакцией интеллектуального наблюдателя. В этом направлении одним из наиболее перспективных подходов являются
исследования в области технического зрения, основанного на моделях . 7.Выводы Основное внимание уделено понятиям и методам технического зрения, применяемым в промышленных приложениях. Сегментация является одним из наиболее важных процессов на ранней стадии распознавания образов системой технического зрения. Следующей задачей системы технического зрения является образование набора дескрипторов, который полностью идентифицирует объекты определенного класса. Обычно стремятся выбирать дескрипторы, наименее зависящие от размеров объекта, его ориентации и расположения. Хотя зрение и является трехмерной задачей, большинство современных промышленных систем работает с данными, которые часто упрощаются с помощью методов специального освещения или строго определенной геометрии наблюдения. Сложности возникают, когда эти ограничения ослабляются. По существу зрение является трехмерной проблемой, поэтому в основе
разработки многофункциональных систем технического зрения, пригодных для
работы в различных средах, лежит процесс обработки информации о трехмерных
сценах. Хотя исследования в этой области имеют более чем 10-летнюю историю,
такие факторы, как стоимость, скорость и сложность, тормозят внедрение
обработки трехмерной зрительной информации в промышленных приложениях. Проблема загораживания одних объектов другими имеет место, когда
рассматривается большое число объектов в реальном рабочем пространстве. Разработка методов обработки трехмерной зрительной информации в роботизированных и автоматизированных системах в настоящее время задача актуальная, так как такие факторы, как стоимость, скорость, сложность вычислений, трудность реализации алгоритмов делают неприемлемыми многие уже существующие методы. Список литературы 1. Анисимов Б.В., Курганов В.Д. Распознавание и цифровая обработка изображений. 2. Гонсалиес, Фу, Ли. Робототехника. 3. Катыс Г.П. Техническое зрение роботов. Содержание 1.ВВЕДЕНИЕ 1 2.СЕГМЕНТАЦИЯ 2 2.1.Проведение контуров и определение границы 2 2.1.1.Локальный анализ. 3 2.1.2.Глобальный анализ с помощью преобразования Хоуга. 4 2.2.Определение порогового уровня 7 2.2.1.Глобальные и локальные пороги. 8 2.2.3.Определение порогового уровня на основе характеристик границы. 2.2.4.Определение порогового уровня, основанное на нескольких переменных. 2.3.Областно-ориентированная сегментация 13 2.3.1.Основные определения. 13 2.3.2.Разбиение и объединение области. 16 2.4. Применение движения 17 2.4.1.Основной подход. 17 2.4.2.Аккумулятивная разность. 19 2.4.3.Определение эталонного образа. 22 3.ОПИСАНИЕ 23 3.1.Дескрипторы границы. 23 3.1.1.Цепные коды. 23 3.1.2.Сигнатуры. 24 3.1.3.Аппроксимация многоугольниками. 25 3.2.Дескрипторы области 27 3.2.1.Некоторые простые дескрипторы. 27 3.2.2.Текстура. 28 3.2.3.Скелет области. 28 4.СЕГМЕНТАЦИЯ И ОПИСАНИЕ ТРЕХМЕРНЫХ СТРУКТУР 29 4.1.Описание трехмерной сцены плоскими участками 30 4.2. Применение градиента 30 4.3. Разметка линий и соединений 30 4.4. Обобщенные конусы 31 5.Распознавание 31 6.Интерпретация 32 7.Выводы 34 Список литературы
Страницы: 1, 2 |
ИНТЕРЕСНОЕ | |||
|