Машинное зрение c. Машинное зрение: автомобили без водителя

04.03.2020 Видео

Ранняя система машинного зрения Автовижн II компании Автоматикс была продемонстрирована на выставке в 1983. Камера на штативе направлена вниз на стол с подсветкой для получения четкого изображения на экране, которое затем подвергается проверке на блобы

Машинное зрение - это применение компьютерного зрения для промышленности и производства. В то время как компьютерное зрение - это общий набор методов, позволяющих компьютерам видеть, областью интереса машинного зрения, как инженерного направления, являются цифровые устройства ввода-вывода и компьютерные сети, предназначенные для контроля производственного оборудования, таких как роботы-манипуляторы или аппараты для извлечения бракованной продукции. Машинное зрение является подразделом инженерии, связанное с вычислительной техникой, оптикой, машиностроением и промышленной автоматизацией. Одним из наиболее распространенных приложений машинного зрения - инспекции промышленных товаров, таких как полупроводниковые чипы, автомобили, продукты питания и лекарственные препараты. Люди, работавшие на сборочных линиях, осматривали части продукции, делая выводы о качестве исполнения. Системы машинного зрения для этих целей используют цифровые и интеллектуальные камеры, а также программное обеспечение обрабатывающее изображение для выполнения аналогичных проверок.

Энциклопедичный YouTube

    1 / 3

    Компьютерное зрение

    Компьютерное зрение

    Как работает компьютерное зрение

    Субтитры

Введение

Системы машинного зрения запрограммированы для выполнения узкоспециализированных задач, таких как подсчет объектов на конвейере, чтение серийных номеров или поиск поверхностных дефектов. Польза системы визуальной инспекции на основе машинного зрения заключается в высокой скорости работы с увеличением оборота, возможности 24-часовой работы и точности повторяемых измерений. Так же преимущество машин перед людьми заключается в отсутствии утомляемости, болезней или невнимательности. Тем не менее, люди обладают тонким восприятием в течение короткого периода и большей гибкостью в классификации и адаптации к поиску новых дефектов.

Компьютеры не могут «видеть» таким же образом, как это делает человек. Фотокамеры не эквивалентны системе зрения человека, и в то время как люди могут опираться на догадки и предположения, системы машинного зрения должны «видеть» путём изучения отдельных пикселей изображения, обрабатывая их и пытаясь сделать выводы с помощью базы знаний и набора функций таких, как устройство распознавания образов. Хотя некоторые алгоритмы машинного зрения были разработаны, чтобы имитировать зрительное восприятие человека, большое количество уникальных методов были разработаны для обработки изображений и определения соответствующих свойств изображения.

Компоненты системы машинного зрения

Хотя машинное зрение - процесс применения компьютерного зрения для промышленного применения, полезно перечислить часто используемые аппаратные и программные компоненты. Типовое решение системы машинного зрения включает в себя несколько следующих компонентов:

  1. Одна или несколько цифровых или аналоговых камер (черно-белые или цветные) с подходящей оптикой для получения изображений
  2. Программное обеспечение для изготовления изображений для обработки. Для аналоговых камер это оцифровщик изображений
  3. Процессор (современный ПК c многоядерным процессором или встроенный процессор, например - ЦСП)
  4. Программное обеспечение машинного зрения, которое предоставляет инструменты для разработки отдельных приложений программного обеспечения.
  5. Оборудование ввода-вывода или каналы связи для доклада о полученных результатах
  6. Умная камера: одно устройство, которое включает в себя все вышеперечисленные пункты.
  7. Очень специализированные источники света (светодиоды , люминесцентные и галогенные лампы и т. д.)
  8. Специфичные приложения программного обеспечения для обработки изображений и обнаружения соответствующих свойств.
  9. Датчик для синхронизации частей обнаружения (часто оптический или магнитный датчик) для захвата и обработки изображений.
  10. Приводы определенной формы используемые для сортировки или отбрасывания бракованных деталей.

Датчик синхронизации определяет, когда деталь, которая часто движется по конвейеру, находится в положении, подлежащем инспекции. Датчик запускает камеру, чтобы сделать снимок детали, когда она проходит под камерой и часто синхронизируется с импульсом освещения, чтобы сделать четкое изображение. Освещение, используемое для подсветки деталей предназначено для выделения особенностей, представляющих интерес, и скрытия или сведения к минимуму появление особенностей, которые не представляют интереса (например, тени или отражения). Для этой цели часто используются светодиодные панели подходящих размеров и расположения.

Изображение с камеры попадает в захватчик кадров или в память компьютера в системах, где захватчик кадров не используется. Захватчик кадров - это устройство оцифровки (как часть умной камеры или в виде отдельной платы в компьютере), которое преобразует выходные данные с камеры в цифровой формат (как правило, это двумерный массив чисел, соответствующих уровню интенсивности света определенной точки в области зрения, называемых пикселями) и размещает изображения в памяти компьютера, так чтобы оно могло быть обработано с помощью программного обеспечения для машинного зрения.

Программное обеспечение, как правило, совершает несколько шагов для обработки изображений. Часто изображение для начала обрабатывается с целью уменьшения шума или конвертации множества оттенков серого в простое сочетание черного и белого (бинаризации). После первоначальной обработки программа будет считать, производить измерения и/или определять объекты, размеры, дефекты и другие характеристики изображения. В качестве последнего шага, программа пропускает или забраковывает деталь в соответствии с заданными критериям. Если деталь идет с браком, программное обеспечение подает сигнал механическому устройству для отклонения детали; другой вариант развития событий, система может остановить производственную линию и предупредить человека работника для решения этой проблемы и сообщить, что привело к неудаче.

Хотя большинство систем машинного зрения полагаются на «черно-белые» камеры, использование цветных камер становится все более распространенным явлением. Кроме того, все чаще системы машинного зрения используют цифровые камеры прямого подключения, а не камеры с отдельным захватчиком кадров, что сокращает расходы и упрощает систему.

«Умные» камеры со встроенными процессорами, захватывают все большую долю рынка машинного зрения. Использование встроенных (и часто оптимизированных) процессоров устраняет необходимость в карте захватчика кадров и во внешнем компьютере, что позволяет снизить стоимость и сложность системы, обеспечивая вычислительную мощность для каждой камеры. «Умные» камеры, как правило, дешевле, чем системы, состоящих из камеры, питания и/или внешнего компьютера, в то время как повышение мощности встроенного процессора и ЦСП часто позволяет достигнуть сопоставимой или более высокой производительности и больших возможностей, чем обычные ПК-системы.

Методы обработки

Коммерческие пакеты программ для машинного зрения и пакеты программ с открытым исходным кодом обычно включают в себя ряд методов обработки изображений, таких как:

  • Счетчик пикселей: подсчитывает количество светлых или темных пикселей
  • Бинаризация : преобразует изображение в серых тонах в бинарное (белые и черные пиксели)
  • Сегментация : используется для поиска и/или подсчета деталей
    • Поиск и анализ блобов: проверка изображения на отдельные блобы связанных пикселей (например, черной дыры на сером объекте) в виде опорных точек изображения. Эти блобы часто представляют цели для обработки, захвата или производственного брака.
    • Надежное распознавание по шаблонам: поиск по шаблону объекта, который может быть повернут, частично скрыт другим объектом, или отличным по размеру.
  • Чтение штрих-кодов : декодирование 1D и 2D кодов, разработанных для считывания или сканирования машинами
  • Оптическое распознавание символов : автоматизированное чтение текста, например, серийных номеров
  • Измерение: измерение размеров объектов в дюймах или миллиметрах
  • Обнаружение краев: поиск краев объектов
  • Сопоставление шаблонов: поиск, подбор, и/или подсчет конкретных моделей

В большинстве случаев, системы машинного зрения используют последовательное сочетание этих методов обработки для выполнения полного инспектирования. Например, система, которая считывает штрих-код может также проверить поверхность на наличие царапин или повреждения и измерить длину и ширину обрабатываемых компонентов.

Применение машинного зрения

Применение машинного зрения разнообразно, оно охватывает различные области деятельности, включая, но не ограничиваясь следующими:

  • Крупное промышленное производство
  • Ускоренное производство уникальных продуктов
  • Системы безопасности в промышленных условиях
  • Контроль предварительно изготовленных объектов (например, контроль качества, исследование допущенных ошибок)
  • Системы визуального контроля и управления (учет, считывание штрих-кодов)
  • Контроль автоматизированных транспортных средств
  • Контроль качества и инспекция продуктов питания

В автомобильной промышленности системы машинного зрения используются в качестве руководства для промышленных роботов, а также для проверки поверхности окрашенного автомобиля, сварных швов, блоков цилиндров и многих других компонентов на наличие дефектов.

В мире очень много вещей, за которыми человеческий глаз просто не успевает следить. Например, в конвейерной технологии ошибки происходят именно из-за человеческого фактора. Человек просто не в состоянии трезво оценивать предметы после нескольких часов работы. Для этого отлично приспособлены роботы. С помощью машинного зрения они могут сделать детальную проверку продукта, сравнить с образцом и моментально принять решение о дальнейшей обработке изделия.

Как работает машинное зрение?

Машинное зрение - это способность компьютера «видеть». Система машинного зрения использует одну или несколько видеокамер, устройство аналого-цифрового преобразования (АЦП) и цифровой обработки сигналов (ЦОС). Полученные данные поступают в компьютер или робота-контроллера. По степени сложности машинное зрение похоже на распознавание голоса.

Двумя важными характеристиками в любой такой системе являются чувствительность и разрешение. Чувствительность - это способность машины видеть в тусклом свете или различать слабые импульсы в спектре невидимых длин волн.Разрешение - это степень, с которой система различает объекты. Чувствительность и разрешение являются взаимозависимыми параметрами. При увеличении чувствительности, разрешение, как правило, уменьшается, и наоборот, хотя все остальные факторы обычно остаются при этом неизменными.

Человеческие глаза могут различать электромагнитные волны с длиной волны, находящейся в диапазоне от 390 до 770 нанометров. У видеокамер этот диапазон значительно шире, чем это.Например, есть системы машинного зрения, которые могут видеть в инфракрасной, ультрафиолетовой и рентгеновской областях длин волн.

Машинное зрение используется в различных промышленных и медицинских областях:

    Компонентный анализ

    Идентификация подписи

    Оптическое распознавание символов

    Распознавание почерка

    Распознавание объектов

    Распознавание образов

    Контроль материалов

    Контроль валюты

    Медицинский анализ изображения


Машинное зрение - это применение компьютерного зрения для промышленности и производства. В то время как компьютерное зрение - это общий набор методов, позволяющих компьютерам видеть, областью интереса машинного зрения, как инженерного направления, являются цифровые устройства ввода-вывода и компьютерные сети, предназначенные для контроля производственного оборудования, таких как роботы-манипуляторы или аппараты для извлечения бракованной продукции. Машинное зрение является подразделом инженерии, связанное с вычислительной техникой, оптикой, машиностроением и промышленной автоматизацией. Одним из наиболее распространенных приложений машинного зрения - инспекции промышленных товаров, таких как полупроводниковые чипы, автомобили, продукты питания и лекарственные препараты. Люди, работавшие на сборочных линиях, осматривали части продукции, делая выводы о качестве исполнения. Системы машинного зрения для этих целей используют цифровые и интеллектуальные камеры, а также программное обеспечение обрабатывающее изображение для выполнения аналогичных проверок.

Системы машинного зрения запрограммированы для выполнения узкоспециализированных задач, таких как подсчет объектов на конвейере, чтение серийных номеров или поиск поверхностных дефектов. Польза системы визуальной инспекции на основе машинного зрения заключается в высокой скорости работы с увеличением оборота, возможности 24-часовой работы и точности повторяемых измерений. Так же преимущество машин перед людьми заключается в отсутствии утомляемости, болезней или невнимательности. Тем не менее, люди обладают тонким восприятием в течение короткого периода и большей гибкостью в классификации и адаптации к поиску новых дефектов.

Компьютеры не могут «видеть» таким же образом, как это делает человек. Фотокамеры не эквивалентны системе зрения человека, и в то время как люди могут опираться на догадки и предположения, системы машинного зрения должны «видеть» путём изучения отдельных пикселей изображения, обрабатывая их и пытаясь сделать выводы с помощью базы знаний и набора функций таких, как устройство распознавания образов. Хотя некоторые алгоритмы машинного зрения были разработаны, чтобы имитировать зрительное восприятие человека, большое количество уникальных методов были разработаны для обработки изображений и определения соответствующих свойств изображения.

Применение машинного зрения

Применение машинного зрения разнообразно, оно охватывает различные области деятельности, включая, но не ограничиваясь следующими:

    Крупное промышленное производство

    Ускоренное производство уникальных продуктов

    Системы безопасности в промышленных условиях

    Контроль предварительно изготовленных объектов (например, контроль качества, исследование допущенных ошибок)

    Системы визуального контроля и управления (учет, считывание штрих-кодов)

    Контроль автоматизированных транспортных средств

    Контроль качества и инспекция продуктов питания

В автомобильной промышленности системы машинного зрения используются в качестве руководства для промышленных роботов, а также для проверки поверхности окрашенного автомобиля, сварных швов, блоков цилиндров и многих других компонентов на наличие дефектов.

Казалось бы, все компьютеры одинаковые и могут решать любые задачи. Но это не совсем так. Еще в прошлом веке в компьютерной индустрии стало активно развиваться направление промышленных компьютеров, отличающихся от «офисных» собратьев более компактным и прочным механическим конструктивом, широкими возможностями расширения (платы ввода/вывода сигналов) и длительным сроком жизни систем и компонентов, их составляющих. С течением времени произошла более глубокая специализация, выделились линейки промышленных компьютеров для конкретных прикладных областей - так, для эффективного решения проблем машинного зрения появились компьютеры с дополнительными функциями, значительно облегчающими задачи инженерам-разработчикам и повышающими эксплуатационные характеристики системы (рис. 1).

Рис. 1. Классификация компьютеров

Вот лишь неполный список требований для работы в приложениях машинного зрения и видеонаблюдения, которым должно соответствовать оборудование:

  • соответствующие международным стандартам высокопроизводительные интерфейсы для подключения камер GigE/PoE и USB3, слот расширения для установки фреймграббера CameraLink или CoaXpress;
  • широкий выбор процессоров достаточной мощности с графическими сопроцессорами и высоко­производительными наборами микросхем (chipset), способными обрабатывать большие потоки данных;
  • цифровые, легко программируемые линии для подключения датчиков и синхронизации камер и осветителей;
  • установка нескольких, в том числе быстросъемных, накопителей, организация RAID-массивов для высокоскоростной записи видеопотоков и хранения больших объемов данных;
  • промышленные интерфейсы для подключения внешних устройств: RS-232/485, CAN;
  • прочный компактный механический конструктив с минимумом подвижных компонентов, для обеспечения надежной работы и длительного срока службы в сложных условиях эксплуатации.

Очевидно, что в большинстве промышленных, а тем более в офисных компьютерах многие из этих функций избыточны, но в системах машинного зрения они являются определяющими.

Одним из представителей данного направления в компьютерной индустрии стала компания Neousys Technologies (Тайвань), продукция которой с самого начала была предназначена для работы с камерами машинного зрения и видеонаблюдения. Для того чтобы более подробно ознакомиться с особенностями вычислительных платформ для различных приложений, определим основные области применения современных цифровых видеокамер. Итак, можно выделить несколько групп приложений:

  • промышленные системы машинного зрения;
  • системы распознавания;
  • интеллектуальные системы управления движением (ITS);
  • мобильные системы на транспорте.

Теперь рассмотрим требования к вычислительной системе в каждом случае.

Промышленные системы машинного зрения

Промышленные системы машинного зрения, пожалуй, самый разно­образный по количеству и типу задач класс систем. Тем не менее, можно выделить важные особенности:

  • возможность подключения нескольких камер;
  • высокая скорость регистрации, до нескольких сот кадров в секунду;
  • богатый функционал управления настройками камер и подсветки;
  • широкие возможности синхронизации с датчиками;
  • значительные объемы накопителей для архивации данных.

Поскольку в большинстве случаев камера расположена рядом с компьютером, хорошим выбором для ее подключения будет USB3-интерфейс. Он обеспечит и питание камеры, и возможность захвата изображений с высокой скоростью и разрешением (FullHD - более 150 кадр/с).

Рис. 2. Компьютер из линейки РОС-200

С задачами начального уровня вполне справятся компьютеры на базе современного четырехъядерного процессора Atom E3845, оснащенного, помимо всего прочего, достаточно мощным графическим сопроцессором и аппаратным кодеком. В линейке Neousys это ставшая бестселлером серия POC-200 (рис. 2). В распоряжении разработчика два GigE/PoE-интерфейса и три высоко­скоростных USB3. В компактный корпус может быть установлен (а при необходимости легко заменен) SATA HDD/SDD-накопитель стандартного 2,5” формата. Для подключения внешних устройств предусмотрена пара универсальных портов RS-232/485 в дополнение к двум стандартным RS-232. И наконец, несколько быстрых, легко программируемых цифровых линий для подключения кнопок управления, датчиков и выдачи сигналов, например на отбраковку или сигнальную колонну. Все это упаковано в компактном корпусе в четверть листа A4, выдерживающем нагрузки до 5 Grms/500 Гц с рабочим диапазоном температур от –25 °С (по заказу от –45 °С).

Рис. 3. Компьютер Nuvo 5000

Особенность всех компьютеров Neousys - наличие солидного радиатора как составной части корпуса, что стало следствием безвентиляторной (fanless) конструкции машины. Процессор в буквальном смысле приклеен к мощному радиатору. Этот подход хоть и влечет за собой некоторое увеличение массы и габаритов изделия, но является результатом серьезной инженерной проработки для достижения долговечности и механической прочности за счет отсутствия вращающихся компонентов, которые становятся одной из наиболее вероятных причин отказа техники. Нельзя не отметить, что разработчики компьютеров Neousys, помимо чисто инженерных задач, сумели создать изделие с привлекательным промышленным дизайном.

Рис. 4. Компьютеры из серии Nuvo-6000

Neousys Technologies научилась обходиться без вентиляторов не только в системах с младшими процессорами Intel Atom и Celeron, но и с вычислителями верхнего эшелона - i5/i7 шестого поколения Skylake. Сегодня флагман компании, серия компьютеров Nuvo 5000, удостоенный награды специализированного издания Vision Systems Innovators Awards 2016, способен решать самые сложные задачи машинного зрения. Оснащенный мощными процессорами компьютер Nuvo-5000 (рис. 3) сохраняет и развивает выдающиеся способности младших линеек. В увеличившемся, но, тем не менее, оставшимся компактным корпусе можно разместить уже два 2,5” накопителя и организовать их в массив RAID 0/1, оснастив один из накопителей разъемом для горячей замены. Количество портов для подключения камер легко увеличивается до 10. Запатентованная технология MezIO предлагает гибкой механизм расширения возможностей ввода/вывода сигналов управления, индикации и промышленных коммуникационных интерфейсов.

Рис. 5. Отсек расширения для установки двух или шести слотов расширения (серия Nuvo-6000)

В ряде случаев, помимо собственно машинного зрения, компьютеры должны решать задачи классической промышленной автоматики. Ключевым моментом тут становится наличие слотов расширения PCI/PCIe. Для таких приложений лучший вариант - компьютеры серии Nuvo-6000 (рис. 4). Оставаясь по-прежнему надежным компактным безвентиляторным компьютером, машина дополнена отсеком с двумя или шестью слотами расширения (рис. 5). В отсеке установлен вентилятор и система управления для создания комфортных условий работы встраиваемых плат ввода/вывода.

Системы распознавания

Рис. 6. Компьютер Nuvo-5095

Для ответа на вызовы нынешнего дня создаются все более совершенные системы безопасности, в которых ключевым элементом становятся алгоритмы распознавания. Помимо систем безопасности, эти технологии находят применение в коммерческих проектах, например для изучения демографического состава покупателей в торговле, сортировки отходов и других применениях. Современные камеры машинного зрения позволяют получать изображения все большего разрешения и лучшего качества. Разрешение FullHD (2 Мп) распространено в массовом сегменте, 4K (12 Мп) пробует себя в наиболее сложных задачах. Нужно отметить, что объем обрабатываемых данных растет в геометрической прогрессии. Для самых требовательных к вычислительным способностям приложений предлагается адаптированная для установки графических ускорителей nVidia версия компьютера Nuvo-5095 (рис. 6). Но тут уже без вентилятора для nVidia GeForce GTX 950 или GTX 1050, установленного в кассету расширения компьютера, не обойтись. При этом центральный процессор по-прежнему довольствуется пассивным радиатором. В комплексе система с уникальным графическим CUDA-сопроцессором сохранила работоспособность в диапазоне температуры окружающего воздуха от –25 до +60 °С (процессоры i7-6700TE, i5-6500TE, 35ВтTDP).

Интеллектуальные системы управления трафиком ITS

Интеллектуальные системы управления трафиком, в частности устанавливаемые на нагруженном перекрестке, - пожалуй, самые взыскательные к количеству подключаемых камер. Необходимо в одном месте получать и обрабатывать изображения, переданные с нескольких точек обзора. Задачу инсталляторам упрощает промышленный компьютер с б?льшим, чем обычно, количеством портов для подключения камер. Обычно в подобных системах используются камеры с интерфейсом Ethernet/PoE. В линейке Neousys представлена отвечающая таким требованиям модель Nuvo-3616, которая оснащена 16 (!) портами IEEE 802.3at PoE+, четырьмя накопителями с возможностью быстрой замены и организации массивов RAID 0/1/5/10 емкостью до 8 Тбайт.

Мобильные системы на транспорте

Рис. 7. Компьютеры, предназначенные для работы в транспортных средствах: Nuvo-5100VTC и Nuvo-2500 (на ближнем плане)

Современные транспортные средства, особенно коммерческого назначения, будь то грузовик, трактор, комбайн или локомотив, сегодня массово оснащаются компьютеризированными комплексами, призванными повысить безопасность и эффективность их работы. Помимо уже описанных функций, компьютерные платформы, предназначенные для работы на транспорте, должны отвечать еще более жестким требованиям и иметь дополнительные интерфейсы. Специально для таких применений создана версия компьютера Neousys 5100VTC (рис. 7). Она успешно прошла международную сертификацию для применения на железнодорожном транспорте EN 50155. В дополнение к стандартным функциям компьютеров серии Nuvo-5000, она оснащена интерфейсом для контроля цепи зажигания и CAN, что упрощает ее установку в современный автомобиль. Специальная версия Ethernet-разъемов M12 повышает надежность присоединения кабелей от камер в условиях тряски. Дополнительные слоты miniPCI предназначены для установки модулей системы географической локации GPS/GLONASS и сотовой связи 3G/4G с удобным внешним гнездом для SIM-карты.

Для автомобильных систем с более скромными требованиями к вычислительным способностям платформы отлично подойдет компактная версия компьютера с контролем зажигания и CAN-интерфейсом - Nuvo-2500 на базе достаточно мощного четырехъядерного процессора Atom 3845.

В заключение можно отметить, что выбор правильной платформы, содержащей все необходимые компоненты для приложения машинного зрения, в значительной степени определяет ее эксплуатационные характеристики и надежность выполнения алгоритмов обработки изображений. И если для создания математической начинки вполне подойдут офисные компьютеры, то при внедрении систем в эксплуатацию необходимо самым тщательным образом подойти к выбору вычислительной платформы, чтобы инвестиции в разработку программного обеспечения не оказались напрасными.

Магистрант. Мухамедияров Р.М.

Казахский национальный технический университет К.И.Сатпаева, Алматы, Казахстан

Машинное зрение: понятия, задачи и области применения

1. Основные определения и понятия машинного зрения

Машинное зрение - это научное направление в области искусственного интеллекта, в частности робототехники, и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.

Машинное зрение теснейшим образом взаимодействует с такими областями как Компьютерное зрение , Обработка изображений , Анализ изображений , Распознавание образов и т.д. Также нет стандартной формулировки того, как должна решаться проблема данной области и ч асто трудно однозначно отнести возникающие задачи и применяемые методы решения к одной из этих областей. Если сделать обзор технических приемов, алгоритмов, методов обработки изображений, которые используются и разрабатываются в этих областях, можно увидеть, что они являются более или менее идентичными.

Машинное зрение сосредотачивается на применении, в основном промышленном, например, автономные роботы и системы визуальной проверки и измерений. Это значит, что технологии датчиков изображения и теории управления связаны с обработкой видеоданных для управления роботом и обработка полученных данных в реальном времени осуществляется программно или аппаратно.

Обработка изображений и Анализ изображений в основном сосредоточены на работе с 2D изображениями, т.е. как преобразовать одно изображение в другое. Например, попиксельные операции увеличения контрастности, операции по выделению краёв, устранению шумов или геометрические преобразования, такие как вращение изображения. Данные операции предполагают, что обработка/анализ изображения действуют независимо от содержания самих изображений.

Компьютерное зрение сосредотачивается на обработке трехмерных сцен, спроектированных на одно или несколько изображений. Например, восстановлением структуры или другой информации о 3 D сцене по одному или нескольким изображениям. Компьютерное зрение часто зависит от более или менее сложных допущений относительно того, что представлено на изображениях.

Также существует область названная Визуализация , которая первоначально была связана с процессом создания изображений, но иногда имела дело с обработкой и анализом. Например, рентгенография работает с анализом видеоданных медицинского применения.

Наконец, Распознавание образов является областью, которая использует различные методы для получения информации из видеоданных, в основном, основанные на статистическом подходе. Значительная часть этой области посвящена практическому применению этих методов.

Таким образом, можно сделать вывод, что понятие «машинное зрение» на сегодняшний день включает в себя: компьютерное зрение, распознавание зрительных образов, анализ и обработка изображений и т.д.

Основными элементами современных систем машинного зрения можно назвать камеру, с помощью которой получают изображение, плату ввода, оцифровывающую изображение, и плату управления движением. Технология машинного зрения имеет несколько этапов работы системы. Первым этапом является получение изображения контролируемого объекта. Далее полученное изображение необходимо ввести в промышленный контроллер или другой компьютер, где происходит компьютерная обработка, анализ полученных данных и принятие решений в соответствие с заложенной программой управления. Заключительным этапом является вывод управляющих воздействий на исполнительные устройства.

В целом, в задачи систем машинного зрения входит получение цифрового изображения, обработка изображения с целью выделения значимой информации на изображении и математический анализ полученных данных для решения поставленных задач.

Литература :

1. Computer Vision: A Modern Approach by D. A. Forsyth and J. Ponce, Prentice Hall, Upper Saddle River, N.J., 2002

2. Computer Vision. L. Shapiro and G. Stockman, Prentice-Hall, Upper Saddle River, N.J., 2000

3. К . Фу . Структурные методы в распознавании образов . Издательство « Мир ». Москва , 1977.

4. Эдвард А . Патрик . Основы теории распознавания образов. Москва «Советское радио», 1980.

5. Искусственный интеллект. Современный подход. Стюарт Рассел, Питер Норвиг. Москва/Санкт-Петербург/Киев, 2006.

УДК 004.93"1

Машинное зрение

Татьяна Вадимовна Петрова, группа 4241/3

Машинное зрение - это применение компьютерного зрения для промышленности и производства. Областью интереса машинного зрения являются цифровые устройства ввода/вывода и компьютерные сети, предназначенные для контроля производственного оборудования. Машинное зрение имеет некоторые преимущества перед зрением человека. Соответственно, актуально развивать это направление науки. В данном обзоре рассказывается об истории развития машинного зрения, компонентах системы машинного зрения, применении машинного зрения и будущем данной области науки.


Введение

компьютерный машинный зрение производственный

Основную часть информации о внешнем мире человек получает по зрительному каналу и далее весьма эффективно обрабатывает полученную информацию при помощи аппарата анализа и интерпретации визуальной информации. Поэтому встает вопрос о возможности машинной реализации данного процесса.

За счет возрастания сложности решаемых научно-технических задач, автоматическая обработка и анализ визуальной информации становятся все более актуальными вопросами. Данные технологии используются в весьма востребованных областях науки и техники, таких как автоматизация процессов, повышение производительности, повышение качества выпускаемых изделий, контроль производственного оборудования, интеллектуальные робототехнические комплексы, системы управления движущимися аппаратами, биомедицинские исследования и множество других. Кроме того, можно сказать, что успех современного бизнеса основывается главным образом на качестве предлагаемой продукции. А для его обеспечения, если говорить о производстве материальных вещей, требуется визуальный контроль.

Далее мы будем использовать термин «машинное зрение» (Machine vision) как понятие, наиболее полно объемлющее круг инженерных технологий, методов и алгоритмов, связанных с задачей интерпретации визуальной информации, а также как практическое использование результатов этой интерпретации.


1. История развития машинного зрения

Компьютерное зрение оформилось как самостоятельная дисциплина к концу 60х годов. Это направление возникло в рамках искусственного интеллекта в тот его период, когда еще были горячи споры о возможности создания мыслящей машины. Оно выделилось из работ по распознаванию образов. [Зуева, 2008]

Кратко история развития машинного зрения представлена на рисунке 1.

Рис. 1. История машинного зрения

В истории развития машинного зрения можно выделить следующие этапы:

· 1955 г. - профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.

· 1958 г. - психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception - восприятие) - устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704. Аппаратный вариант - Mark I Perceptron - был построен в 1960 г. и предназначался для распознавания зрительных образов [Компьютерное зрение, 2010] .

Однако рассмотрение задач машинного зрения носило скорее умозрительный характер, так как ни техники, ни математического обеспечения для решения таких сложных задач еще не было.

· 1960-е гг.- появление первых программных систем обработки изображений (в основном для удаления помех с фотоснимков, сделанных с самолетов и спутников), стали развиваться прикладные исследования в области распознавания печатных символов. Однако все еще существовали ограничения в развитии данной области науки, такие как отсутствие дешевых оптических систем ввода данных, ограниченность и довольно узкая специализация вычислительных систем. Бурное развитие систем компьютерного зрения на протяжении 60-х годов можно объяснить расширением использования вычислительных машин и очевидной потребностью в более быстрой и эффективной связи человека с ЭВМ. К началу 60-х годов задачи компьютерного зрения в основном охватывали область космических исследований, требовавших обработки большого количества цифровой информации.

· 1970-е гг. - Лавренсе Робертс, аспирант МТИ, выдвинул концепцию машинного построения трехмерных образов объектов на основе анализа их двумерных изображений. На данном этапе стал проводиться более глубокий анализ данных. Начали развиваться различные подходы к распознаванию объектов на изображении, например структурные, признаковые и текстурные.

· 1979 г. - профессор Ганс-Хельмут Нагель из Гамбургского университета заложил основы теории анализа динамических сцен, позволяющей распознавать движущиеся объекты в видеопотоке.

· В конце 1980-х годов были созданы роботы, способные более-менее удовлетворительно оценивать окружающий мир и самостоятельно выполнять действия в естественной среде

· 80-е и 90-е годы ознаменовались появлением нового поколения датчиков двухмерных цифровых информационных полей различной физической природы. Развитие новых измерительных систем и методов регистрации двухмерных цифровых информационных полей в реальном масштабе времени позволило получать для анализа устойчивые во времени изображения, генерируемые этими датчиками. Совершенствование же технологий производства этих датчиков позволило существенным образом снизить их стоимость, а значит, значительно расширить область их применения

· С начала 90-х годов в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой модульной парадигмой. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) – к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.). [Визильтер и др., 2007]

· В середине 90-х годов появились первые коммерческие системы автоматической навигации автомобилей. Эффективные средства компьютерного анализа движений удалось разработать в конце XX века

· 2003 г. - на рынок были выпущены первые достаточно надежные корпоративные системы распознавания лиц.


2. Задачи машинного зрения и области его применения

2.1 Определение понятия «машинное зрение»

Машинное зрение - это применение компьютерного зрения для промышленности и производства. Областью интереса машинного зрения, как инженерного направления, являются цифровые устройства ввода/вывода и компьютерные сети, предназначенные для контроля производственного оборудования, таких как роботы-манипуляторы или аппараты для извлечения бракованной продукции.

Machine vision is the study of methods and techniques whereby artificial vision systems can be constructed and usefully employed in practical applications. As such, it embraces both the science and engineering of vision.

Its study includes not only the software but also the hardware environment and image acquisition techniques needed to apply it. As such, it differs from computer vision, which appears from most books on the subject to be the realm of the possible design of the software, without too much attention on what goes into an integrated vision system (though modern books on computer vision usually say a fair amount about the "nasty realities" of vision, such as noise elimination and occlusion analysis).

2.2 Машинное зрение в настоящее время.

В настоящее время существует четкая граница между так называемым монокулярным и бинокулярным компьютерным зрением. К первой области относятся исследования и разработки в области компьютерного зрения, связанные с информацией, поступающей от одной камеры или от каждой камеры отдельно. Ко второй области относятся исследования и разработки, имеющие дело с информацией, одновременно поступающей от двух и более камер. Несколько камер в таких системах используются для измерения глубины наблюдения. Эти системы называются стереосистемами.

К настоящему моменту теория компьютерного зрения полностью сложилась как самостоятельный раздел кибернетики, опирающийся на научную и практическую базу знаний. Ежегодно по данной тематике издаются сотни книг и монографий, проводятся десятки конференций и симпозиумов, выпускается различное программное и аппаратно-программное обеспечение. Существует ряд научно-общественных организаций, поддерживающих и освещающих исследования в области современных технологий, в том числе технологии компьютерного зрения.

2.3. Основные задачи машинного зрения

В целом, в задачи систем машинного зрения входит получение цифрового изображения, обработка изображения с целью выделения значимой информации на изображении и математический анализ полученных данных для решения поставленных задач.

Однако машинное зрение позволяет решать множество задач, которые условно можно разделить на четыре группы (Рис.2) [Лысенко, 2007] :


Рис.2. Задачи машинного зрения


· Распознавание положения

Цель машинного зрения в данном применении - определение пространственного местоположения (местоположения объекта относительно внешней системы координат) или статического положения объекта (в каком положении находится объект относительно системы координат с началом отсчета в пределах самого объекта) и передача информации о положении и ориентации объекта в систему управления или контроллер.
Примером такого приложения может служить погрузочно-разгрузочный робот, перед которым стоит задача перемещения объектов различной формы из бункера. Интеллектуальная задача машинного зрения заключается, например, в определении оптимальной базовой системы координат и ее центра для локализации центра тяжести детали. Полученная информация позволяет роботу захватить деталь должным образом и переместить ее в надлежащее место.