|
Программное обеспечение системы принятия решений адаптивного робота
Программное обеспечение системы принятия решений адаптивного робота
55 ВведениеРоботы - это физические агенты, которые выполняют поставленные перед ними задачи, проводя манипуляции в физическом мире. Для этой цели роботов оснащают исполнительными механизмами, такими как ноги, колеса, шарниры и захваты. Исполнительные механизмы имеют единственное назначение - прилагать физические усилия к среде. Кроме того, роботов оснащают датчиками, которые позволяют им воспринимать данные об окружающей их среде. В современных роботах применяются различные виды датчиков, включая те, что предназначены для измерения характеристик среды (например, видеокамеры и ультразвуковые дальномеры), и те, которые измеряют характеристики движения самого робота (например, гироскопы и акселерометры). Большинство современных роботов можно отнести к одной из трех основных категорий. Роботы-манипуляторы, или роботы-руки, физически привязаны к своему рабочему месту, например на заводском сборочном конвейере или на борту Международной космической станции. В движении манипулятора обычно участвует вся цепочка управляемых шарниров, что позволяет таким роботам устанавливать свои исполнительные механизмы в любую позицию в пределах своего рабочего пространства. Манипуляторы относятся к типу наиболее распространенных промышленных роботов, поскольку во всем мире установлено свыше миллиона таких устройств. Некоторые мобильные манипуляторы используются в больницах в качестве ассистентов хирургов. Без робототехнических манипуляторов в наши дни не смогут продолжать свою производственную деятельность большинство автомобильных заводов, а некоторые манипуляторы использовались даже для создания оригинальных художественных произведений. Ко второй категории относятся мобильные роботы. Роботы такого типа передвигаются в пределах своей среды с использованием колес, ног или аналогичных механизмов. Они нашли свое применение при доставке обедов в больницах, при перемещении контейнеров в грузовых доках, а также при выполнении аналогичных задач. Одним из примеров мобильного робота является автоматическое наземное транспортное средство (Unmanned Land Vehicle - ULV) NavLab, способное автономно передвигаться по автомагистралям в режиме самовождения. К другим типам мобильных роботов можно отнести автоматическое воздушное транспортное средство (Unmanned Air Vehicle - UAV), обычно используемое для воздушного наблюдения, химической обработки земельных участков и военных операций, автономное подводное транспортное средство (Autonomous Underwater Vehicle - AUV) для глубоководных морских исследованиях, и планетоход, такой как робот Sojourner, приведенный на рис. 1.1, а. а) б) Рисунок. 1.1 - Фотографии широко известных роботов: движущийся робот Sojourner агентства NASA, который исследовал поверхность Марса в июле 1997 года (а); роботы-гуманоиды РЗ и Asimo компании Honda (б) К третьему типу относятся гибридные устройства - мобильные роботы, оборудованные манипуляторами. В их число входят роботы-гуманоиды, которые по своей физической конструкции напоминают человеческое тело. Два таких робота-гуманоида показаны на рис. 1.1, б; оба они изготовлены в японской корпорации Honda. Гибридные роботы способны распространить действие своих исполнительных элементов на более обширную рабочую область по сравнению с прикрепленными к одному месту манипуляторами, но вынуждены выполнять стоящие перед ними задачи с большими усилиями, поскольку не имеют такой жесткой опоры, которую предоставляет узел крепления манипулятора. Реальным роботам обычно приходится действовать в условиях среды, которая является частично наблюдаемой, стохастической, динамической и непрерывной. Некоторые варианты среды обитания роботов (но не все) являются также последовательными и мультиагентными. Частичная наблюдаемость и стохастичность обусловлены тем, что роботу приходится сталкиваться с большим, сложным миром. Робот не может заглянуть за каждый угол, а команды на выполнение движений осуществляются не с полной определенностью из-за проскальзывания приводных механизмов, трения и т.д. Кроме того, реальный мир упорно отказывается действовать быстрее, чем в реальном времени. В моделируемой среде предоставляется возможность использовать простые алгоритмы (такие как алгоритм Q-обучения), чтобы определить с помощью обучения необходимые параметры, осуществляя миллионы попыток в течение всего лишь нескольких часов процессорного времени, а в реальной среде для выполнения всех этих попыток могут потребоваться годы. Кроме того, реальные аварии, в отличие от моделируемых, действительно наносят ущерб. В применяемые на практике робототехнические системы необходимо вносить априорные знания о роботе, о его физической среде и задачах, которые он должен выполнять для того, чтобы быстро пройти обучение и действовать безопасно. 1. Анализ технического задания1.1 Область применения и цель построения подсистемыРазрабатываемая подсистема, называемая «Подсистемой планирования действий интеллектуального робота» предназначена для планирования целенаправленных действий интеллектуального мобильного робота в противодействующей, априорно неопределенной среде функционирования. Цель разработки - информационное моделирование функционирования интеллектуального робота на информационном уровне организации тактико-технического планирования информационно-двигательных действий (ИДД) мобильного робота. На этапе разработки подобная модель подсистемы отсутствовала и планирование не производилось, основываясь лишь на жестком алгоритме отработки заданной траектории перемещения исполнительных подсистем робота. Отсутствие обратной связи с выполняемыми операциями указывает на малую гибкость системы в целом, что значительно сокращает возможности применения ПР в реальных условиях автоматизированного производства. Непосредственная эксплуатация такой системы сталкивается со следующими проблемами:- необходимость создания гибкой распределенной структуры гибких производственных модулей;- решение задач временного согласования работы нескольких роботов при выполнении единой задачи;- необходимость изменения управляющей программы при переходе в новые не структурированные производственные участки, где сказывается сложность ввода траектории отработки технологической операции роботом.Основным недостатком является жёсткое требование к точности задания эталонной траектории, нарушение которой в процессе работы ведёт к нарушению исполнения всего ТП, при этом такую ситуацию сложно автоматически скорректировать, - необходимо интеллектуальное планирование действий.1.2 Задачи, решаемые подсистемойЗадачи, решаемые подсистемой, заключаются в моделировании процесса синтеза информации о допустимых ИДД в зависимости от текущего состояния робота и конфигурации противодействующих объектов в среде функционирования, а также объектов, подлежащих обработке, - планирование выполняемых информационно-двигательных действий мобильного робота. Из всех задач, которые должны решаться подобной подсистемой следует выделить следующие:- представление комплексной информации о рабочем пространстве робота, включая операции картографирования и нанесения условных планов передвижений робота;- автоматическое согласование конфигурации робота и объектов среды;- контроль плана действий в зависимости от динамических изменений в конфигурации объектов среды;- процедурное построение условных информационно-двигательных траекторий передвижения робота;- обеспечение постоянной обратной связи плана действий с потоком сенсорных данных;- синтез карты исследуемой среды.1.3 Функциональные требования к подсистемеПодсистема должна обеспечивать следующие функциональные возможности:- планирование траекторий передвижения интеллектуального робота в априорно неопределенной динамической среде функционирования:1) репрезентация противодействующих объектов среды и функционально-исполнительных узлов мобильного робота с использованием нечеткого конфигурационного пространства;2) формирование траектории передвижения с фиксированным уровнем доверия;3) обновление карты среды при исследовании новых участков среды функционирования.- режим работы планировщика в реальном времени;- модульность и наращиваемость подсистемы.При наполнении базы знаний выбор общих характеристик (наименование, код, и т.п.) известных объектов возлагается на оператора. Параметры обхода объектов вводятся непосредственно из СУ ПР и записываются как дополнительные параметры объектов. Изменение траектории в базе знаний объектов производится только при помощи самой подсистемы, оператор не имеет возможности менять эти параметры вручную.Подсистема обеспечивает обновление методов принятия решений за счёт объектно-ориентированной структуры информационно-моделирующего комплекса, т.е. перекомпоновки без изменения базовых связей между объектами моделирования.2. Информационное моделирование функционирования интеллектуального робота2.1 Обобщенная архитектура интеллектуального роботаС точки зрения построения обобщенной архитектуры интеллектуального робота, актуально воспользоваться понятием интеллектуального агента. В этом случае конструкция компонентов архитектуры агентов (датчиков, исполнительных механизмов и процессоров) уже определена и требуется лишь разрабатывать программы агента. Но успехи в создании реальных роботов не в меньшей степени зависят от того, насколько удачно будут спроектированы датчики и исполнительные механизмы, подходящие для выполнения поставленной задачи.Датчики - это не что иное, как интерфейс между роботами и той средой, в которой они действуют, обеспечивающий передачу результатов восприятия. Пассивные датчики, такие как видеокамеры, в полном смысле этого слова выполняют функции наблюдателя за средой - они перехватывают сигналы, создаваемые другими источниками сигналов в среде. Активные датчики, такие как локаторы, посылают энергию в среду. Их действие основано на том, что часть излучаемой энергии отражается и снова поступает в датчик. Как правило, активные датчики позволяют получить больше информации, чем пассивные, но за счет увеличения потребления энергии от источника питания; еще одним их недостатком является то, что при одновременном использовании многочисленных активных датчиков может возникнуть интерференция. В целом датчики (активные и пассивные) можно разбить на три типа, в зависимости от того, регистрируют ли они расстояния до объектов, формируют изображения среды или контролируют характеристики самого робота.В большинстве мобильных роботов используются дальномеры, которые представляют собой датчики, измеряющие расстояние до ближайших объектов. Одним из широко применяемых типов таких датчиков является звуковой локатор, известный также как ультразвуковой измерительный преобразователь. Звуковые локаторы излучают направленные звуковые волны, которые отражаются от объектов, и часть этого звука снова поступает в датчик. При этом время поступления и интенсивность такого возвратного сигнала несут информацию о расстоянии до ближайших объектов. Для автономных подводных аппаратов преимущественно используется технология подводных гидролокаторов, а на земле звуковые локаторы в основном используются для предотвращения столкновений лишь в ближайших окрестностях, поскольку эти датчики характеризуются ограниченным угловым разрешением. К числу других устройств, альтернативных по отношению к звуковым локаторам, относятся радары (в основном применяемые на воздушных судах) и лазеры. Лазерный дальномер показан на рис. 2.1. а) б)Рис. 2.1 - Типичный пример датчика и его практического применения: лазерный дальномер (датчик расстояния) SICK LMS - широко применяемый датчик для мобильных роботов (а); результаты измерения расстояний, полученные с помощью горизонтально установленного датчика расстояния, спроектированные на двухмерную карту среды (б)Некоторые датчики расстояния предназначены для измерения очень коротких или очень длинных расстояний. В число датчиков измерения коротких расстояний входят тактильные датчики, такие как контактные усики, контактные панели и сенсорные покрытия. На другом конце спектра находится глобальная система позиционирования (Global Positioning System - GPS), которая измеряет расстояние до спутников, излучающих импульсные сигналы. В настоящее время на орбите находятся свыше двух десятков спутников, каждый из которых передает сигналы на двух разных частотах. Приемники GPS определяют расстояние до этих спутников, анализируя значения фазовых сдвигов. Затем, выполняя триангуляцию сигналов от нескольких спутников, приемники GPS определяют свои абсолютные координаты на Земле с точностью до нескольких метров. В дифференциальных системах GPS применяется второй наземный приемник с известными координатами, благодаря чему при идеальных условиях обеспечивается точность измерения координат до миллиметра. К сожалению, системы GPS не работают внутри помещения или под водой.Вторым важным классом датчиков являются датчики изображения - видеокамеры, позволяющие получать изображения окружающей среды, а также моделировать и определять характеристики среды с использованием методов машинного зрения. В робототехнике особо важное значение имеет стереоскопическое зрение, поскольку оно позволяет получать информацию о глубине; тем не менее, будущее этого направления находится под угрозой, поскольку успешно осуществляется разработка новых активных технологий получения пространственных изображений.К третьему важному классу относятся проприоцептивные датчики, которые информируют робота о его собственном состоянии. Для измерения точной конфигурации робототехнического шарнира, приводящие его в действие электродвигатели часто оснащаются дешифраторами угла поворота вала, которые позволяют определять даже небольшие приращения угла поворота вала электродвигателя. В манипуляторах роботов дешифраторы угла поворота вала способны предоставить точную информацию за любой период времени. В мобильных роботах дешифраторы угла поворота вала, которые передают данные о количестве оборотов колеса, могут использоваться для одометрии - измерения пройденного расстояния. К сожалению, колеса часто сдвигаются и проскальзывают, поэтому результаты одометрии являются точными только для очень коротких расстояний. Еще одной причиной ошибок при определении позиции являются внешние силы, такие как течения, воздействующие на автономные подводные аппараты, и ветры, сбивающие с курса автоматические воздушные транспортные средства. Улучшить эту ситуацию можно с использованием инерционных датчиков, таких как гироскопы, но даже они, применяемые без других дополнительных средств, не позволяют исключить неизбежное накопление погрешности определения положения робота.Другие важные аспекты состояния робота контролируются с помощью датчиков усилия и датчиков вращающего момента. Без этих датчиков нельзя обойтись, если роботы предназначены для работы с хрупкими объектами или объектами, точная форма и местонахождение которых неизвестны. Можно представить себе, что робототехнический манипулятор с максимальным усилием сжатия и одну тонну закручивает в патрон электрическую лампочку. При этом очень трудно предотвратить такую ситуацию, что робот приложит слишком большое усилие и раздавит лампочку. Но датчики усилия позволяют роботу ощутить, насколько крепко он держит лампочку, а датчики вращающего момента - определить, с каким усилием он ее поворачивает. Хорошие датчики позволяют измерять усилия в трех направлениях переноса и трех направлениях вращения.Исполнительные механизмы являются теми средствами, с помощью которых роботы передвигаются и изменяют форму своего тела. Для того чтобы представить основные особенности конструкции исполнительных механизмов, необходимо вначале рассмотреть абстрактные понятия движения и формы, используя концепцию степени свободы. Как степень свободы мы будем рассматривать каждое независимое направление, в котором могут передвигаться либо робот, либо один из его исполнительных механизмов. Например, твердотельный свободно движущийся робот, такой как автономный подводный аппарат, имеет шесть степеней свободы; три из них, (х, у, z), определяют положение робота в пространстве, а три других - его угловую ориентацию по трем осям вращения, известную как качание (yaw), поворот (roll) и наклон (pitch). Эти шесть степеней свободы определяют кинематическое состояние или позу робота. Динамическое состояние робота включает по одному дополнительному измерению для скорости изменения каждого кинематического измерения. а) б)Рис. 2.2 - Особенности конструкции манипулятора робота: станфордский манипулятор (Stanford Manipulator) - один из первых манипуляторов робота, в котором используются пять поворотных шарниров (R) и одно призматическое сочленение (Р), что позволяет получить в целом шесть степеней свободы (а); траектория движения неголономного четырехколесного транспортного средства с рулевым управлением от передних колес (б).Роботы, не являющиеся твердотельными, имеют дополнительные степени свободы внутри самих себя. Например, в руке человека локоть имеет одну степень свободы (может сгибаться в одном направлении), а кисть имеет три степени свободы (может двигаться вверх и вниз, из стороны в сторону, а также вращаться). Каждый из шарниров робота также имеет 1, 2 или 3 степени свободы. Для перемещения любого объекта, такого как рука, в конкретную точку с конкретной ориентацией необходимо иметь шесть степеней свободы. Рука, показанная на рис. 2.2, а, имеет точно шесть степеней свободы, создаваемых с помощью пяти поворотных шарниров, которые формируют вращательное движение, и одного призматического сочленения, который формирует скользящее движение. Чтобы убедиться в том, что рука человека в целом имеет больше шести степеней свободы, можно провести простой эксперимент: положите кисть на стол и убедитесь в том, что вы еще имеете возможность поворачивать руку в локте, не меняя положения кисти на столе. Манипуляторами, имеющими больше степеней свободы, чем требуется для перевода конечного исполнительного механизма в целевое положение, проще управлять по сравнению с роботами, имеющими лишь минимальное количество степеней свободы.В мобильных роботах количество степеней свободы не обязательно совпадает с количеством приводимых в действие элементов. Рассмотрим, например, обычный автомобиль: он может передвигаться вперед или назад, а также поворачиваться, что соответствует двум степеням свободы. В отличие от этого кинематическая конфигурация автомобиля является трехмерной - на открытой плоской поверхности можно легко перевести автомобиль в любую точку (х, у), с любой ориентацией (см. рис. 2.2, б). Таким образом, автомобиль имеет три эффективные степени свободы, но две управляемые степени свободы. Робот называется неголономным, если он имеет больше эффективных степеней свободы, чем управляемых степеней свободы, и голономным, если эти два значения совпадают. Голономные роботы проще в управлении (было бы намного легче припарковать автомобиль, способный двигаться не только вперед и назад, но и в стороны), однако голономные роботы являются также механически более сложными. Большинство манипуляторов роботов являются голономными, а большинство мобильных роботов - неголономными.В мобильных роботах применяется целый ряд механизмов для перемещения в пространстве, включая колеса, гусеницы и ноги. Роботы с дифференциальным приводом оборудованы расположенными с двух сторон независимо активизируемыми колесами (или гусеницами, как в армейском танке). Если колеса, находящиеся с обеих сторон, вращаются с одинаковой скоростью, то робот движется по прямой. Если же они вращаются в противоположных направлениях, то робот поворачивается на месте. Альтернативный вариант состоит в использовании синхронного привода, в котором каждое колесо может вращаться и поворачиваться вокруг вертикальной оси. Применение такой системы привода вполне могло бы привести к хаотическому перемещению, если бы не использовалось такое ограничение, что все пары колес поворачиваются в одном направлении и вращаются с одинаковой скоростью. И дифференциальный, и синхронный приводы являются неголономными. В некоторых более дорогостоящих роботах используются голономные приводы, которые обычно состоят из трех или большего количества колес, способных поворачиваться и вращаться независимо друг от друга.Ноги, в отличие от колес, могут использоваться для передвижения не по плоской поверхности, а по местности, характеризующейся очень грубым рельефом. Тем не менее, на плоских поверхностях ноги как средства передвижения значительно уступают колесам, к тому же задача создания для них механической конструкции является очень сложной. Исследователи в области робототехники предприняли попытки разработать конструкции с самым разным количеством ног, начиная от одной ноги и заканчивая буквально десятками. Были разработаны роботы, оборудованные ногами для ходьбы, бега и даже прыжков (как показано на примере шагающего робота на рис. 2.3, а). Этот робот является динамически устойчивым; это означает, что он может оставаться в вертикальном положении, только непрерывно двигаясь. Робот, способный оставаться в вертикальном положении, не двигая ногами, называется статически устойчивым. Робот является статически устойчивым, если центр его тяжести находится над многоугольником, охваченным его ногами.В мобильных роботах других типов для передвижения используются иные, чрезвычайно разнообразные механизмы. В летательных аппаратах обычно применяются пропеллеры или турбины. Роботизированные дирижабли держатся в воздухе за счет тепловых эффектов. В автономных подводных транспортных средствах часто используются подруливающие устройства, подобные тем, которые устанавливаются на подводных лодках.Для того чтобы робот мог функционировать, ему недостаточно быть оборудованным только датчиками и исполнительными механизмами. Полноценный робот должен также иметь источник энергии для привода своих исполнительных механизмов. Для приведения в действие манипулятора и для передвижения чаще всего используются электродвигатели; определенную область применения имеют также пневматические приводы, в которых используется сжатый газ, и гидравлические приводы, в которых используется жидкость под высоким давлением. Кроме того, в большинстве роботов имеются некоторые средства цифровой связи наподобие беспроводной сети. Наконец, робот должен иметь жесткий корпус, на который можно было бы навесить все эти устройства, а также, фигурально выражаясь, держать при себе паяльник, на тот случай, что его оборудование перестанет работать. а) б)Рис. 2.3 - Примеры роботов, передвигающихся с помощью ног: один из шагающих роботов Марка Рэйберта (Marc Raibert) в движении (а); роботы AIBO компании Sony, играющие в футбол (© от 2001 года, федерация RoboCup) (б)Таким образом, существенной задачей в построении интеллектуальных робототехнических систем является информационное моделирование интеллектуального робота как некоторого активного агента среды. И, собственно, одной из задач проектирования рационального агента среды становится задача разработки модели планирования его информационно-двигательных действий.2.2 Общий принцип построения моделиВ соответствие традиционной модели организации моделирования, корда информационными потоками обмениваются исследователь-проектировщик и имитационная модель, обратная связь по результатам моделирования совершает внешняя по отношению к системе имитационного моделирования цепочка - человек с приобщением вспомогательных средств и методов программного обеспечения [11]. При этом исследователь-проектировщик выполняет функцию преобразования информации, которая состоит в интерпретации результатов и принятия решений относительно управления экспериментами и обобщением информации к базе знаний интеллектуального робота. Автоматизация управления экспериментами предполагает при этом создание замкнутого программно реализованного контура управления имитационной моделью в рамках средств внешнего программного обеспечения (рис. 2.4).Целенаправленные серии экспериментов в соответствии с заданной целью функционирования робота и учетом ограничений конфигурационных параметров организуют модули, которые специально относят к составу внешнего программного обеспечения. В общем случае, эти модули должны задавать наборы начальных данных, инициировать прогоны модели в целом, обрабатывать результаты и принимать решения о дальнейшем развитии экспериментов соответствие реализуемому алгоритмом управления моделированием. Такой алгоритм, направляя эксперименты, в области допустимых значений параметров производит поиск такого их объединения, который бы обеспечивал оптимум заданного показателя качества, т.е. по существу решает задачу оптимизации:, (2.1)где f - целевая функция, представленная алгоритмически имитационная модель; - вектор параметров объекта моделирования;X - множество допустимых значений входных параметров.Таким образом, совокупность алгоритмических и программных средств, обеспечивающая процесс автоматизированного моделирования, образует систему автоматизации имитационного моделирования (САИМ) [36]. Поскольку пользователь при этом не вводит каждый набор начальных данных для очередного прогона имитационной модели и только указывает цель или критерий и область варьирования параметров, в то время как поиск допустимых решений задач моделирования выполняется при помощи САИМ автоматически, к последней можно применить определение интеллектуальной системы моделирования. Например, функции САИМ, в контуре управления гибкой производственной системы, в целом, заключаются в анализе альтернативных вариантов поведения роботов после принятия того или иного возможного решения относительно диспетчеризации и оперативного планирования информационно-двигательных действий и т.п.Эффективность реализации этих функций обусловлена заменой жест кой логики управления интеллектуальным роботом, что предполагает использование в отдельных ситуациях заданных и фиксированных эвристик, гибким и динамическим механизмом, который обеспечивает принятие решений не только на основе подобного анализа текущего состояния робота, но и с учетом перспектив его развития. При этом объединяются высокая вероятность результатов и возможность автоматического принятия решений в режиме «жесткого» реального времени.Проблема автоматизации управления экспериментами и синтеза знаний и построения базы знаний может быть представлена логической структурой поэтапного решения отдельных задач интеллектуального робота (рис. 2.5).На первом этапе автоматизации управления экспериментами решаются две задачи: исполняется структурно-алгоритмическое построение собственно модуля управления; формируются содержательные основы и формальные требования к организации информационного обмена с имитационной моделью.Задача структурно-алгоритмического построения модуля управления экспериментами и синтеза системы знаний решается в следующей последовательности: определяются состав и структура модуля (разрабатываются условия взаимодействия его компонент и положение в общей структуре САИМ).При выполнении серии прогонов имитационной модели происходит целенаправленное варьирование значений параметров, которое может влиять на значения целевой функции не только посредством прямого влияния на показатели функционирования объекта моделирования, но и побочно посредством других сопряженных элементов объекта (робота). Как следствие, изменяются стоимостные и другие показатели. Наряду с тем, на значения некоторых параметров можно наложить ограничения, в частности часть их фиксировать, т.е. задать декларативно. Это может отображаться при формировании наборов начальных данных и инициализации начальных состояний процесса моделирования системы знаний.Рассматривая имитационную модель как средство целенаправленного преобразования информации в соответствии с некоторой системой предписаний, имеет смысл говорить про алгоритм имитационного моделирования. Тогда формальную интерпретацию рассмотренных требований можно записать следующим образом: (2.2)где S - входное слово алгоритма имитационного моделирования;Q - множество допустимых наборов значений параметров робота;С - область определения алгоритма имитационного моделирования.Входное слово S задает набор начальных данных для конкретного набора данных, т.е. , где каждая величина соответствует некоторому значению определенного параметра объекта моделирования. Область С определяется программной реализацией алгоритма имитационного моделирования, а образовать ее возможно множеством Dвх наборов входного алфавита. Все величины , имеющие разрешенную реализацию объекта моделирования U.Таким образом, выражения (2.2) соответственно определяют условия согласования S с имитационной моделью и с алгоритмом. Задача состоит в разработке аппарата формального анализа непротиворечивости изменений семантически взаимосвязанных параметров для обеспечения варьирования, что не нарушает условия (2.2) и не приводит к изменениям фиксированных параметров.На втором этапе производится автоматизация управления экспериментами и построения системы знаний решаются следующие этапы:- разработка принципов, взаимодействия системы логического вывода и численных оптимизационных процедур;- выбор (разработка) аппарата реализации логического вывода в комбинированных алгоритмов управления экспериментами;- разработка на основе предложенного аппарата эффективных алгоритмов вывода с учетом специфики взаимодействия с численными процедурами оптимизации.На третьем этапе решается задача разработки оптимизационных процедур, которые используются в планировании экстремальных действий. При этом вопрос разработки алгоритмического обеспечения можно рассматривать для специфических аспектов моделирования объекта, а именно:- автоматизации управления экспериментами в условиях лингвистической неопределенности параметров, например, «степень подобия / отличия…» не имеет естественного численного измерения;- организации экстремальных экспериментов в задачах однопараметрической оптимизации при существенно неравномерном расположении точек в середине интервала, например, унимодальная функция отклика, и фиксирования соответствующих состояний в модели системы знаний;- сокращение времени поиска при значительной продолжительности прогона имитационной модели, что является важным при многоитерационных алгоритмов поиска, полном переборе вариантов и т.п.2.3 Алгоритмы планированияМетод потенциалов в задаче выбора пути для мобильного робота был предложен А.К. Платоновым в 1970 году.При этом рассматривается случай, когда робот снабжен достаточно точной навигационной системой, чтобы ее ошибками можно было пренебречь, и системе управления известны как координаты робота и измерительного устройства, так и ориентация сектора обзора и направление производящихся измерений в некоторой абсолютной системе координат (АСК). Робот во всех случаях представляет собой точку с предписанным вектором ориентации.Суть метода заключается в следующем. Предположим, что цель имеет некоторый положительный заряд, препятствия заряжены отрицательно; местоположения цели и препятствий фиксированы. Пусть также имеется некоторая отрицательно заряженная точка, способная перемещаться. Поместим ее в исходную точку. Под действием сил подвижная точка будет притягиваться к цели и отталкиваться от препятствий, причем законы движения могут задаваться, в принципе, различными способами. Логично предположить, что при некоторых ограничениях на структуру местности и законы движения подвижной точки эта точка достигнет цели.В зависимости от способа задания функций, можно получить трассы с обходом препятствий с той или иной степенью «риска» (величины приближения к препятствиям). Рассматриваемые ниже алгоритмы гарантируют от зацикливания в случае, когда контуры препятствий выпуклы. Метод может также использоваться для случая, когда препятствия разбиваются на группы, выпуклые оболочки которых не пересекаются.За рубежом основные ссылки делаются на работы Брукса и Хатиба, которые вышли в свет в 1985 году [6, 7]. Следует отметить, что в Японии подобные разработки были выполнены сотрудниками фирмы Hitachi, Ltd. в 1984 году [9]. Подобные же алгоритмы использовались и при трассировке печатных плат в 1967 году (см. [8], в которой дана ссылка на более раннюю работу 1948 года). Для того, чтобы проследить эволюцию архетипа основной идеи метода, ниже приводится историческая справка о разработках, имеющих отношение к методу потенциалов в задачи выбора пути. В данной работе исследованы модификации алгоритма, изложенного в [1]. При этом рассмотрены следующие направления модификации исходного алгоритма: 1) Исследованы степенная и показательная функции отталкивания от препятствий и влияние их на результирующий путь мобильного робота (МР). Для оценки эффективности пути использовалась функция отклонения вектора направления движения от вектора направления на цель. 2) Проанализированы возможности использования метода потенциалов для управления распределенной мобильной системой (РМС). Исследовано пять способов организации такого движения: движение по схеме «цепь». В этом случае сила притяжения цели действует на «лидера», и каждый МР «притягивается» к впереди идущему; движение типа «гонка за лидером». В этом случае все элементы РМС «притягиваются» к «лидеру», который, в свою очередь, «притягивается» к целевой точке; движение типа «расхождения». В этом случае на МР, расположенные компактной группой или цепью, начинает действовать сила отталкивания от «лидера». МР «разбегаются», исследуя каждый свой участок; движение типа «схождение». В этом случае «лидер» собирает все элементы РМС в компактную группу; организация движения типа «свободный поиск». В этом случае сила притяжения к цели отсутствует, и каждый элемент РМС движется в свободном от препятствий направлении. Первые два режима используются для организации передвижения РМС, последние три - для информационного исследования среды. Основное отличие нового алгоритма от изложенного в [1] состоит в том, что в [1] непосредственно вычислялось расстояние до каждого из препятствий i непосредственно, а в новом алгоритме используется имитатор дальномерной системы. Полученный массив дальностей в некотором секторе в дальнейшем подвергается логической фильтрации для построения оценок величин i. Наряду с указанным названием - метод потенциалов (Potential Field Approach), он имеет следующие названия: способа «искусственных потенциальных полей» (artificial potential fields), «полей виртуальных сил» (virtual force field - VFF), «гистограммы векторных сил» (vector field histogram-VFH) и др. Суть этого метода, напомним, заключается в том, что путь строится на основе решения специального «уравнения движения», в которое входят «сила притяжения к цели», «силы отталкивания от препятствий» и, возможно, некоторые другие «силы». При ссылке на этот метод в качестве пионерских упоминаются работы 1985-1986 гг. [6,7]. Вместе с тем работа фирмы Хитачи по управлению МР, в которой использованы идеи «силового поля», выпущена в 1984 г. [9]. В [1] опубликовали результаты подобного исследования в ИПМ АН СССР в 1974 г. Вместе с тем использование подобных физических аналогий при трассировке электронных плат уходит корнями вглубь 50_х годов [8]. Правда, вычислительные аспекты при этом имеют свою специфику. Сам архетип идеи движения в поле «информационных» (виртуальных) сил восходит к работам 30-40-х годов одного из виднейших представителей гештальтпсихологии Курта Левина. Он выступил с идеей применения в психологии концепции физического поля для описания поведения и конфликтных ситуаций при взаимодействии индивида с окружающим миром [3]. Современные психологи критикуют К. Левина за физикализм концепции, акцент на динамический аспект в ущерб содержательному и многое другое. Вместе с тем в указанных работах К. Левина можно почерпнуть немало интересного. Экспериментальный материал, подтверждающий разработанную концепцию, был получен в основном при наблюдении за детьми разного возраста и документирован посредством киносъемок. Все они имеют аналоги при использовании метода потенциалов для управления МР. На начальном этапе исследований в ИПМ рассматривались препятствия в виде окружностей. Подобное представление после результатов работ Koditschek с соавторами [4, 5] можно считать основным. Сила притяжения к цели полагалась постоянной по модулю и направленной к точке цели. Сила отталкивания от i_ого препятствия fi зависела от аргумента Ri /ri, где Ri - радиус i_ой окружности, ri -расстояние от центра i_ой окружности до движущейся точки. fi считалась направленной от центра окружности. Траектория («локомоция») получалась в результате интегрирования уравнений движения второго порядка, так как ускорение, действующее на движущуюся точку, определялось суммой указанных сил. В ходе исследований выяснилось, что инерционность, заложенная в указанную модель, приводит к тому, что траектория движения становится малоприемлемой (препятствие «отбрасывает» движущуюся точку очень сильно и траектория получается чересчур «изрезанной». Для того, чтобы избавиться от этого недостатка и сделать метод годным для случая аппроксимации контуров препятствий другими способами, было предпринято следующее. Во-первых, стали использоваться уравнения движения первого порядка (т.е. действующие силы определяют скорость, по сути дела речь идет об аналоге простого градиентного спуска). Во-вторых, сила отталкивания стала определяться аргументом, равным расстоянию до препятствия. При этом форма контура препятствия произвольна, а для приведенного выше примера это разность ri - Ri. Направлена эта сила в сторону от ближайшей точки препятствия. В ходе исследований было признано рациональным в случае наличия нескольких препятствий использовать функции от указанного аргумента x типа x-k или e-cx, которые быстро убывают с расстоянием. При этом коэффициенты k и c могут быть варьируемыми параметрами. Следует особо подчеркнуть, что, варьируя параметры k и c при определении сил отталкивания, можно получать траектории для движения нескольких МР. Если ввести в этом процессе запаздывание, то можно получить режим «следования друг за другом». Иногда среда, в которой расположено много препятствий, «хорошо организована», например, препятствия разбиваются на группы, выпуклые оболочки которых не пресекаются. В этом случае сила отталкивания может вычисляться сразу для всей группы.
Страницы: 1, 2
|
|