Министерство науки и высшего образования Российской Федерации
Санкт-Петербургский политехнический университет Петра Великого
Институт машиностроения, материалов и транспорта
Высшая школа автоматизации и робототехники
Работа допущена к защите
Директор ВШАиР
А.Н. Волков
«___»______________2020г.
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА БАКАЛАВРА
ИССЛЕДОВАНИЕ И РАЗРАБОТКА СИСТЕМЫ УПРАВЛЕНИЯ
МАНИПУЛЯТОРОМ С УПРУГИМИ ШАРНИРАМИ
по направлению подготовки 15.03.06 Мехатроника и робототехника
Направленность (профиль)
15.03.06_04 Автономные роботы
Выполнил
студент гр. 3331506/60401
<подпись>
М.Э. Самородова
Руководитель
Старший преподаватель
<подпись>
А.С. Габриель
Консультант по
нормоконтролю
<подпись>
С.Г. Чупров
Научный консультант
<подпись>
И.В. Шардыко
Санкт-Петербург
2020
САНКТ-ПЕТЕРБУРГСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ПЕТРА ВЕЛИКОГО
Институт машиностроения, материалов и транспорта
Высшая школа автоматизации и робототехники
УТВЕРЖДАЮ
Руководитель ОП
О.Н. Мацко
«
»
20
г.
ЗАДАНИЕ
на выполнение выпускной квалификационной работы
студенту ____Самородовой Марии Эдуардовне,__гр. 3331506/60401___________________
фамилия, имя, отчество (при наличии), номер группы
1. Тема работы: Исследование и разработка системы управления манипулятором с
упругими шарнирами___________________________________________________________
2. Срок сдачи студентом законченной работы: ___15.06.2020
_________________
3. Исходные данные по работе:_Упругий шарнир, параметры двигателя Robodrive
ILM70x18 и волновой передачи Harmonic Drive CobaltLine-32-CPM, геометрия и динамика
робота Franka Emika Panda, рассматриваемый диапазон жёсткости_500-5000 Н‧м/рад,
точность датчиков
_______________ _____________
4. Содержание работы (перечень подлежащих разработке вопросов): Обзор существующих
решений исполнения манипуляторов с упругими шарнирами и возможных реализаций
систем управления, создание модели упругого электромеханического шарнира, разработка
позиционного регулятора шарнира на основе активного демпфирования, создание модели
упругого манипулятора, разработка каскадного регулятора и регулятора с активным
демпфированием для управления манипулятором с упругими шарнирами, разработка
методики подбора коэффициентов регуляторов, исследование разработанных регуляторов
с помощью компьютерного моделирования
.
5. Перечень графического материала (с указанием обязательных чертежей):
_нет__________________________________________________________________________
6. Консультанты по работе: __И.В. Шардыко, ЦНИИ РТК, научный сотрудник; консультант
по нормоконтролю – Г.С. Чупров ________________________________
7. Дата выдачи задания:
11.12.19 _________________________
Руководитель ВКР
А.С. Габриель
(подпись)
Задание принял к исполнению
инициалы, фамилия
11.12.19 __________
(дата)
Студент_______________________
(подпись)
М.Э. Самородова
инициалы, фамилия
РЕФЕРАТ
99 страниц, 59 рисунков, 3 таблицы, 26 источников
КЛЮЧЕВЫЕ
СЛОВА:
ШАРНИРАМИ,
УПРУГИЙ
ПОЗИЦИОННОЕ
ШАРНИР,
МАНИПУЛЯТОР
УПРАВЛЕНИЕ,
МОМЕНТНОЕ
С
УПРУГИМИ
УПРАВЛЕНИЕ,
MATLAB/SIMULINK, COPPELIA SIM (V-REP)
Тема
выпускной
квалификационной
работы:
«Исследование
и
разработка системы управления манипулятором с упругими шарнирами».
Данная
работа
посвящена
разработке
системы
управления
манипулятором с упругими шарнирами и оценке условий применимости
разработанных регуляторов. Задачи, которые решались в ходе исследования:
1. Аналитический обзор способов обеспечения податливости (упругости)
и существующих роботов с упругими шарнирами;
2. Разработка математической модели упругого электромеханического
шарнира и системы управления к нему;
3. Разработка математической модели упругого манипулятора;
4. Разработка системы управления манипулятором.
В работе обосновывается применение элементов со специально
вносимой податливостью (торсионных пружин) для построения манипулятора
на их основе. Проводится обзор существующих роботов с упругостью в
механической цепи, а также анализируются уже существующие публикации
по управлению упругими шарнирами и манипуляторами. Основным этапом
выполнения работы является разработка систем управления манипулятором
по децентрализованной и централизованной схеме. Системы управления и
внутренняя динамика шарниров реализованы в среде разработки MatlabSimulink, динамика твердотельной части рассчитывается в CoppeliaSim (ранее
V-REP). Компьютерное моделирование позволило проанализировать качество
управления обеих систем, а также сравнить их поведение с поведением
классического жёсткого манипулятора при соударении с внешним объектом.
ABSTRACT
99 pages, 59 figures, 3 tables, 26 sources
KEYWORDS: SEA-JOINT, VSA-JOINT, MANIPULATOR WITH ELASTIC
JOINTS,
POSITIONAL
CONTROL,
TORQUE
CONTROL,
MATLAB/
SIMULINK, COPPELIA SIM (V-REP)
The theme of the final qualification work: «Research and development of a
control system for a manipulator with elastic joints».
This work is devoted to the development of a control system for a manipulator
with elastic joints and an assessment of the applicability conditions of the developed
regulators. Tasks that were solved during the study:
1. An analytical review of the ways to ensure compliance (elasticity) and
existing robots with elastic joints;
2. Development of a mathematical model of an elastic electromechanical
hinge and a control system for it;
3. Development of a mathematical model of an elastic manipulator;
4. Development of a control system for the manipulator.
The paper substantiates the use of elements with specially introduced
flexibility (torsion springs) for constructing a manipulator based on them. A review
of existing robots with elasticity in a mechanical chain is carried out, as well as
existing publications on the management of elastic joints and manipulators are
analyzed. The main stage of the work is the development of manipulator control
systems according to a decentralized and centralized scheme. Control systems and
internal dynamics of the joints are implemented in the development environment of
Matlab-Simulink, the dynamics of the solid-state part is calculated in CoppeliaSim
(formerly V-REP). Computer modeling made it possible to analyze the quality of
control of both systems, as well as to compare their behavior with the behavior of a
classic rigid manipulator in a collision with an external object.
ПЕРЕЧЕНЬ СОКРАЩЕНИЙ И ОБОЗНАЧЕНИЙ
SEA – series elastic actuators – привод со специально внесённой постоянной
упругостью;
VSA – variable stiffness actuators – привод с переменной упругостью;
DOF – degrees of freedom – степень свободы;
MIMO – multiple-input multiple-output system – система с несколькими
входами и несколькими выходами;
SISO – single-input single-output system – система с одним входом и одним
выходом;
СУ – система управления;
РАД – регулятор с активным демпфированием.
СОДЕРЖАНИЕ
Введение......................................................................................................... 9
1 Анализ современного состояния исследований в данной области ..... 11
1.1 Виртуальная податливость............................................................... 11
1.2 Конструктивная упругость............................................................... 12
1.1.1 Постоянная упругость ............................................................. 13
1.2.2 Переменная упругость ............................................................. 14
1.3 Манипуляторы с упругими шарнирами и их системы управления16
1.3.1 Робот David ............................................................................... 17
1.3. Гуманоидный робот Valkyrie .................................................... 18
1.3.2 Манипулятор ANYpulator ....................................................... 20
1.3.4 Классификация методов управления ..................................... 21
1.4 Выводы по разделу ........................................................................... 23
2 Математическая модель упругого электромеханического шарнира .. 24
2.1 Математическая модель шарнира ................................................... 25
2.1.1 Математическая модель ДПТ ................................................. 25
2.1.2 Математическая модель редуктора и упругого элемента ... 29
2.2 Синтез СУ для упругого электромеханического шарнира ........... 30
2.3 Переход к новой системе координат с целью добавления
демпфирования ...................................................................................................... 31
2.4 Методика подбора коэффициентов регулятора ............................. 34
2.5 Выводы по разделу ........................................................................... 41
3 Система управления с каскадной структурой ....................................... 43
3.1 Подходы к управлению упругим роботом ..................................... 43
3.2 Модель кинематики .......................................................................... 45
6
3.3 Модель динамики.............................................................................. 46
3.4 Система управления ......................................................................... 50
3.5 Моментный регулятор ...................................................................... 51
3.6 Выводы по разделу ........................................................................... 54
4 Экспериментальное исследование манипулятора с децентрализованной
системой управления ............................................................................................ 55
4.1 Математическая модель манипулятора .......................................... 55
4.2 Отслеживание траектории ............................................................... 57
4.2 Реакция на соударение ..................................................................... 59
4.3 Сравнение с жёстким манипулятором ............................................ 61
4.4 Выводы по разделу ........................................................................... 63
5 Система управления на основе регулятора с активным демпфированием
................................................................................................................................. 64
5.1 Построение регулятора..................................................................... 64
5.2 Статическая ошибка ......................................................................... 67
5.3 Выводы по разделу ........................................................................... 68
6 Экспериментальное исследование манипулятора с централизованной
системой управления ............................................................................................ 69
6.1 Вклад слагаемых с третьей производной в управляющий сигнал70
6.2 Отслеживание траектории ............................................................... 73
6.3 Реакция на соударение ..................................................................... 82
6.4 Сравнение с жёстким манипулятором ............................................ 87
6.5 Выводы по разделу ........................................................................... 90
7
Сравнение
каскадного
регулятора
и
регулятора
с
активным
демпфированием ................................................................................................... 91
7
7.1 Отработка заданной траектории ...................................................... 91
7.2 Реакция на соударение ..................................................................... 92
7.3 Выводы по разделу ........................................................................... 93
ЗАКЛЮЧЕНИЕ ........................................................................................... 94
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ ....................................... 97
8
Введение
С расширением технических знаний и технологического потенциала
увеличивается применение роботов в различных сферах жизнедеятельности
человека. В связи с чем растёт и сложность выполняемых ими работ. Требования,
предъявляемые
к
ним
в
условиях
производства,
а
также
в
слабо
детерминированных («полевых») условиях, не сводятся к простым операциям по
перемещению манипулируемого объекта в пространстве, а подразумевают
высокую степень адаптивности при контакте с внешней средой, в том числе
возможность управления динамикой контактного взаимодействия. Одним из
активно развивающихся способов повышения характеристик выполнения
контактных операций является применение в роботах механически податливых
звеньев [1].
В
случае
классических
манипуляторов
c
жёсткими
шарнирами,
динамические характеристики шарниров в условиях механического контакта
(особенно при ударах и столкновениях) оказываются недостаточными,
вследствие ограниченного быстродействия приводной системы (скорость и
ускорение двигателя) и системы управления (получение и фильтрация сигнала,
расчёты, передача сигнала на двигатель). Рост максимальной скорости и
максимального
ускорения
шарнира
робототехнической
системы
может
производиться только за счет роста моментных/силовых характеристик
двигателя и его мощности, что неизбежно приводит к росту габаритов и массы.
Стоит также учитывать, что возможность увеличения массогабаритных
характеристик всего манипулятора всегда ограничена. Таким образом,
классический манипулятор с жёсткими шарнирами не сможет отреагировать на
случайное внешнее воздействие без некоторой задержки, результатом чего
может
являться
жёсткое
соударение.
При
неблагоприятном
стечении
обстоятельств такой удар может привести к повреждению деталей и узлов робота
либо элементов окружающей среды, также это может представлять опасность
для человека. В условиях производства любая подобная нештатная ситуация
приведёт
к
дополнительным
издержкам,
9
вызванным
остановкой
производственного процесса для устранения последствий. Введение же в
конструкцию податливых (упругих) элементов позволит снизить пиковое
значение силы удара непосредственно механическими средствами, что снижает
риск
нештатной
ситуации
и
повышает
надёжность
и
робастность
робототехнической системы в целом.
Однако, помимо указанного преимущества, введение упругих элементов в
то же время повышает сложность робота как объекта управления, так как каждый
шарнир становится неполноприводной системой. Таким образом, увеличивается
общий порядок динамики системы, следствием чего становится повышенная
колебательность, что требует для управления манипуляционной системой более
сложных методов.
Поэтому целью данной работы является исследование и разработка
системы управления манипулятором с упругими шарнирами, демпфирующий
нежелательные колебания и позволяющей отрабатывать желаемые траектории.
Разработка такой системы управления позволит применять упругие шарниры в
робототехнических системах, что приведёт к повышению надёжности робота.
10
1 Анализ современного состояния исследований в данной области
Повсеместное применение жёстких элементов для робототехнических
систем обусловлено тем, что повышенная жесткость повышает точность,
устойчивость и полосу пропускания для позиционного управления.
Однако применение жестких приводов не обходится без отрицательных
аспектов.
Они
мало
применимы
для
использования
в
динамически
изменяющихся и неопределенных средах, особенно при взаимодействии робота
с человеком. Шестерни цилиндрических редукторов создают трение, люфт,
пульсации крутящего момента и шум. Использование зубчатой передачи
вызывает увеличение эффективной инерции, так что ударные нагрузки
вызывают гораздо более высокие усилия на зубьях шестерни. Увеличенная
эффективная инерция совместно с высоким трением заднего хода зубчатых
передач может послужить причиной существенного нанесённого вреда объектам
окружающей среды при случайном соударении. При этом для приводов лёгких
роботов чаще всего номинальная нагрузка редуктора ограничивает пиковый
крутящий момент, поэтому отказы редуктора из-за удара не редки. Поэтому
возникла идея создания нежестких приводов, позволяющих осуществлять
манипулирование при наличии ограничений и не приводящих к приложению
чрезмерной силы [1].
Податливость привода может быть реализована двумя способами:
программным (виртуальная податливость) и конструктивным. Программное
внесение подразумевает под собой то, что сам привод остаётся жёстким, а
податливость обеспечивается программами управления. Конструктивная же
податливость означает внесение упругого элемента непосредственно в
механическую цепь робота.
1.1 Виртуальная податливость
К
виртуальной
податливости
относится
активное
импедансное
управление. При этом, как уже было сказано ранее, это является программным
11
средством и не связано с каким-либо конкретным механическим исполнением
привода.
Активное импедансное управление основывается на взаимодействии
привода, датчика и контроллера, при этом в случае механически жёсткого
привода отсутствует возможность запасания энергии и поглощения ударных
нагрузок.
В настоящее время в целом ряде традиционных высокотехнологичных
промышленных роботов используют программное обеспечение для реализации
виртуальной податливости. Например, манипуляторы, разработанные ABB
Robotics используют продукт SoftMove
[2], программное
обеспечение
управления активной податливостью, которое измеряет внешние силы, а затем
по мере необходимости уменьшает выходные усилия шарниров в указанном
декартовом направлении, сохраняя исходное поведение в других направлениях
и позволяя роботу смещаться в соответствии с приложенными внешними
силами.
Также активное импедансное управление достигло высокой степени
зрелости в системе, разработанной DLR и KUKA [2]. Робот LWR4 оснащён
датчиками момента в каждом шарнире, что позволяет достичь программируемой
податливости. Это позволяет роботу действовать как система «пружинадемпфер», в которой параметры могут быть установлены в широких пределах.
1.2 Конструктивная упругость
Приводы, выполненные по данной технологии, содержат пассивный, или
механически упругий, элемент. Приводы данного вида далее подразделяются на
приводы с постоянной и переменной упругостью.
Необходимо сразу отметить, что конструктивная упругость обладает
принципиальным недостатком – повышенной колебательностью системы.
Поэтому для восстановления желательного качества управления, то есть для
подавления колебаний, необходимо вводить демпфирование, которое может
быть реализовано механическим элементом либо программно, для чего
12
требуются высокодинамичные двигатели. При этом компенсирующие действия
приводят к существенным энергозатратам, что снижает энергоэффективность
системы в целом. Однако, если целевое движение само по себе циклическое, то
указанный эффект перестаёт быть недостатком.
1.1.1 Постоянная упругость
Историю
роботов
со
специально
вносимой
упругостью
принято
отсчитывать с работы [1], являющейся в настоящее время базовой для
развившегося направления создания приводов с механической упругостью,
известному под аббревиатурой SEA (series elastic actuators). Авторы [1]
выдвигают и обосновывают утверждение, что для определённых задач упругий
привод подходит лучше жёсткого, в частности для управления усилием,
например, в гуманоидных или космических роботах, и в том числе, в
планетоходах. Структурная схема реализации упругого привода представляет
собой торсионную пружину, расположенную последовательно с жёстким
приводом, как показано на рисунке 1. Итоговая жёсткость определяется выбором
пружины и не может быть физически изменена во время эксплуатации. В статье
также проводится анализ показателей качества и предлагается методика синтеза
системы управления в виде ПИД-регулятора.
Рисунок 1 – Структурная схема шарнира с постоянной упругостью
Одним из главных достоинств последовательно вносимой податливости
является то, что пружина служит низкочастотным фильтром ударных нагрузок,
тем самым значительно уменьшая пиковые усилия на зубчатую передачу.
Следует отметить, что при этом также фильтруются низкочастотные колебания
13
со стороны привода, но это в определённых пределах часто является
допустимым.
Кроме того, достигаются следующие положительные аспекты:
− превращение задачи управления усилием в управление положением, что
повышает точность исполнения заданий по усилию;
− снижение сложности обеспечения устойчивости силового управления,
которое достигается, если инерция нагрузки выше некоторого значения, что
обеспечивается массой самого робота при соответствующей настройке
регуляторов;
− обеспечения
возможности
запасания
энергии,
что,
например,
существенно повышает экономичность при перемещении шаганием.
Также использование упругих элементов на уровне контроллера шарнира
позволяет снять вычислительную нагрузку с контроллеров верхних уровней, для
которых шарнир становится источником момента.
Однако специально вносимая податливость создаёт упругую деформацию
всякий раз, когда сила изменяется. Это дополнительное движение добавляется к
движению груза. И в зависимости от относительной амплитуды, фазы силы
нагрузки и формы волны движения, упругость может увеличивать или
уменьшать полосу пропускания при позиционном управлении.
1.2.2 Переменная упругость
Для
решения
различных
задач
оптимальный
выбор
жёсткости
манипулятора может различаться. Так, приводы с переменной упругостью,
известные также как VSA (variable stiffness actuators) [4], могут быть
использованы для подстройки шарниров робота, чтобы применять высокую
жесткость при движении по направлениям без ограничений по усилиям и низкую
– при движении по направлениям с ограничениями.
При этом приводы с переменной жесткостью (VSA) обеспечивают
полезные
свойства
для
повышения
производительности.
Основными
преимуществами VSA являются более высокая устойчивость к воздействиям,
14
лучшая энергоэффективность, расширенные динамические возможности и их
улучшенная адаптивность к задачам благодаря их регулируемой жёсткости.
Фактически, это те основные причины, по которым люди все еще имеют
недостижимую производительность для роботов при решении множества задач.
Рассматриваемый в [4] класс VSA реализует это соответствие с помощью
переменного,
двигателем
нелинейного,
и
звеном.
упругого
Активное
элемента,
изменение
установленного
жёсткости
между
достигается
дополнительным двигателем, как показано на рисунке 2.
Рисунок 2 – Упрощенная схема шарнира с переменной жёсткостью [4]
Особенность VSA заключается в том, что механизм изменения жесткости
добавляет дополнительную степень свободы (DOF) шарниру. Чтобы система
была энергоэффективной и способной к преднамеренному рассеиванию
кинетической энергии, а также чтобы сохранялась возможность использовать
упругие элементы для измерения крутящих моментов шарниров робота,
шарниры
разрабатывают
с
очень
низким
внутренним
(механическим)
демпфированием.
Однако
сложность
электромеханической
системы
роботов
VSA,
характеризующихся нелинейностью, вносимой упругими элементами, и
колебательным поведением с низким затуханием, требует более сложных
методов управления.
Таким образом, для реализации переменной упругости требуется минимум
два двигателя, один из которых управляет положением или моментом на
выходном валу, второй – величиной упругости (жёсткости).
15
Переменная (изменяемая) упругость в свою очередь может достигаться
различными способами:
− изменение преднатяга пружины;
− изменение передачи между пружиной и выходным валом (изменение
передаточного отношения);
− изменение физических свойств пружины: активной длины, площади
поперечного сечения, модуля упругости (в теории).
1.3 Манипуляторы с упругими шарнирами и их системы управления
Наиболее известными примерами практического применения приводов с
управляемой переменной механической упругостью являются робот David [4],
динамические
характеристики
которого
превосходят
характеристики
существующих аналогов, и манипулятор мобильного робота из комплекса
Sherpa [5]. Среди других примеров (в том числе с постоянной механической
упругостью) высокий уровень демонстрируют гуманоидный робот Valkirye [6],
манипулятор ANYpulator [7], биоморфный робот ANYmal [8].
Предполагаемое назначение робота Valkirye – работа в зоне катастроф
(подобных Фукусиме), а также для помощи космонавтам за пределами Земли,
например, на Марсе.
ANYmal был специально создан для длительной автономной работы в
тяжелых условиях. Акцент был сделан на большую мобильность, быстрые и
динамические
навыки
передвижения,
высокую
надежность,
простое
обслуживание и безопасное взаимодействием с оператором.
Следует отметить, что в настоящее время развитие манипуляторов с
изменяемой механической упругостью не дошло до стадии индустриального
применения, а сосредоточено в основном в ведущих мировых лабораториях по
робототехнике. При этом манипуляторы с постоянной упругостью внедряются
на рынке коллаборативных роботов [9].
16
1.3.1 Робот David
Манипулятор DLR [4], представленный на рисунке 3, в соответствии с
идеями авторов, должен обладать всеми свойствами руки человека, используя
переменную жесткость во всех шарнирах. В роботе применяются шарниры FSJ
(Floating Spring Joints), собственной разработки компании DLR.
Рисунок 3 – Манипулятор DLR [4]
Роботизированные манипуляторы с несколькими шарнирами VSA, как
David, требуют усовершенствованных алгоритмов управления, которые могут
справляться с упругими шарнирами и свойствами системы с несколькими
входами и несколькими выходами (MIMO).
Отличительной особенностью приводов с переменной жесткостью
заключается
в
том,
что
механизм
изменения
жесткости
добавляет
дополнительную степень свободы (DOF) шарниру и, следовательно, увеличивает
сложность системы. Это также приводит к увеличению сложности управления.
Что касается совместного управления, в литературе в основном рассматривается
независимое управление положением и жесткостью путем регулировки
положения или крутящего момента двух совместных двигателей [10].
Для данного манипулятора разработчиками предлагается демпфирующий
MIMO-контроллер на основе подхода разъединения (decoupling) собственных
колебаний [11]. MIMO-контроллер представляет из себя контроллер на основе
обратной связи по переменным состояния для линеаризованной системы по
номинальной траектории. Здесь обратная связь по крутящему моменту
17
используется для формирования динамики системы. Это превращает систему
MIMO в набор обособленных систем с одним входом и одним выходом (SISO),
позволяя назначить коэффициенты регуляторов для каждого шарнира по
отдельности.
Следствием
этого
является
значительное
снижение
вычислительной ёмкости и аналитической сложности.
Алгоритм
управления,
состоящий
из
четырёх
основных
частей,
представлен на рисунке 4.
Рисунок 4 – Алгоритм управления демпфированием [4]
На первом шаге обратная связь по крутящему моменту применяется для
формирования момента инерции двигателя в виде диагональной матрицы, что
исключает взаимосвязи и позволяет по отдельности контролировать каждый
шарнир. Затем система трансформируется в новый базис, в котором динамика
системы записывается в виде независимых дифференциальных уравнений
четвёртого порядка. Далее для достижения желаемого демпфирующего
поведения и определения коэффициентов регулятора развязанная система
записывается в виде двух критических демпфирующих систем второго порядка.
На заключительном этапе контроллер преобразуется обратно в исходную
систему координат.
1.3. Гуманоидный робот Valkyrie
Гуманоидный робот Valkyrie [6], представленный на рисунке 5, выполнен
по технологии SEA. Механическая реализация упругости отличается на разных
18
шарнирах. Жёсткость пружины для каждого шарнира выбрана по желаемой
величине деформации при максимальном моменте.
Рисунок 5 – Гуманоидный робот Valkirye [6]
В системе управления применяется децентрализованный подход, как
показано на рисунке 6.
Рисунок 6 – Децентрализованный подход управления Valkirye [6]
В подходе децентрализованного управления, используемом в Valkirye,
динамика уровня шарнира отделяется от центрального контроллера. Верхний
контроллер воспринимает робота как совокупность твёрдых тел, приводимых в
действие крутящими моментами шарниров. Выходные данные данного
19
контроллера представляют собой требуемые моменты вращения, которые затем
передаются на контроллер нижнего уровня каждого шарнира (см. рисунок 7).
Контроллеры нижнего уровня моделируют динамику привода и обеспечивают
требуемый
крутящий
момент.
Этот
подход
отличается
от
подходов
централизованного управления, которые не абстрагируют динамику привода от
общей модели робота.
Рисунок 7 – Схема контроля крутящего момента [6]
1.3.2 Манипулятор ANYpulator
Манипулятор ANYpulator [7], представленный на рисунке 8, построен из
легких углеродных волокон и модульных упругих шарнирах ANYdrive,
разработанных в ETH Zurich. Это обеспечивает возможность динамического
перемещения, низкоимпедансного контроля крутящего момента в шарнире и
безопасность взаимодействия.
Рисунок 8 – Манипулятор ANYpulator с шарнирами ANYdrive, разработанный в
ETH Zurich [7]
20
Здесь реализуется метод прямого управления силой на основе модели,
основанный исключительно на регулировании крутящего момента в шарнире.
Используя унифицированное управление силой и движением, положение
конечного звена можно точно и динамически отслеживать в пространстве задач,
при этом безопасно реагируя на неожиданные контакты с окружающей средой.
Структура управления крутящим моментом была адаптирована из упругих
шарниров, используемых в роботе Valkyrie [6]. Двигатель считается источником
крутящего момента, управляемым контроллером нижнего уровня. Контур
управления крутящим моментом шарнира реализован в виде ПИД-регулятора с
компенсацией прямой связи в зависимости от электрической постоянной
двигателя и передаточного числа редуктора. Для малых амплитуд крутящего
момента в шарнире предложенная исполнительная система достигает полосы
пропускания до 70 Гц, которая уменьшается при высоких амплитудах из-за
эффектов насыщения двигателя.
1.3.4 Классификация методов управления
Обобщая всё, что было сказано, введение элементов с высокой упругостью
в конструкцию сопровождается увеличением порядка и колебательности
собственной динамики системы. Эти динамические эффекты являются
нежелательными и должны быть скомпенсированы, для того чтобы достигать
результатов позиционирования и быстродействия по входному сигналу,
приближенных к жёстким манипуляторам.
За последние годы было предложено несколько схем управления
шарнирами (и манипуляторами на их основе) со специально внесённой
податливостью: ПД-регулятор [12], линеаризация посредством обратной связи
[13], активное демпфирование [14], различные варианты оптимального
управления [15-17].
Классификация, связанная с вычислительными процедурами и входными
данными, также дает два крупных класса [18]: 1) управление по модели и 2)
управление по обратным связям. Первые активно используют модель объекта
21
для вычисления сигналов управления, для них характерны использование
моделей динамики и наблюдателей состояния. К ним, в частности, относится
большинство подходов, связанных с оптимальным управлением. Вторые
стремятся минимизировать знания системы управления об объекте управления и
ориентируются на расширенный спектр сигналов обратных связей. К
недостаткам первых следует отнести отсутствие на практике точных параметров
модели. К недостаткам вторых – высокий порядок динамики самой системы
(добавляется динамика датчиков). Однако в последнее время предпочтение
отдается вторым, т.к. они дают в среднем лучшие показатели качества, в
частности по устойчивости. Выбор схемы управления, как правило, диктуется
задачей.
Таким образом, на данный момент управление реализуется большим
количеством способов, среди которых можно выделить несколько основных
направлений:
1.
Частичная или полная линеаризация по обратной модели динамики
[11,13, 19-20].
Преимущества:
– имеются теоретические обоснования работоспособности регуляторов;
– часто являются прямым применением или расширением регуляторов для
роботов с жесткими сочленениями;
– позволяют выполнять оценку качества регулирования.
Недостатки:
– (как правило) не реализуются на практике в силу отсутствия точных
оценок параметров или вычислительной сложности.
2. Подходы с централизованным управлением, основанные на свойстве
пассивности [21].
Преимущества:
− имеются доказательства устойчивости;
− гарантированно устойчивы;
22
− имеют практическое применение;
− (как правило) не меняет структуру (уравнения) замкнутой системы;
− предоставляют возможность управления импедансом в декартовом
пространства.
Недостатки:
− сложно установить оценку качества работы замкнутой системы;
− сложно
повысить
быстродействие
замкнутой
системы
в
силу
ограничений подхода на основе пассивности;
− не удается добиться понижения порядка системы в замкнутом контуре.
3. Подходы с децентрализованным управлением, основанные на свойстве
пассивности [22].
Преимущества:
− имеются доказательства устойчивости;
− гарантированно устойчивы;
− имеют практическое применение;
− (как правило) не меняет структуру (уравнения) замкнутой системы.
Недостатки:
− сложно установить оценку качества работы замкнутой системы;
− не удается добиться понижения порядка системы в замкнутом контуре;
− менее качественно осуществляют демпфирование в связи с отсутствием
учета движения других звеньев.
1.4 Выводы по разделу
В ходе обзора современного состояния исследований в данной области был
проведён анализ способов введения податливости в конструкции шарниров и
робототехнических систем на их основе. Были рассмотрены различные способы
построения систем управления, обеспечивающих подавление колебаний,
вносимых нелинейными характеристиками податливых элементов.
23
2 Математическая модель упругого электромеханического шарнира
В качестве прототипа рассмотрен шарнир [23], который показан на
рисунке 9 и содержит следующие основные компоненты:
− бесколлекторный двигатель Robodrive ILM70x18;
− волновую передачу Harmonic Drive CobaltLine-32-CPM в качестве
редуктора;
− упругий элемент разработки ЦНИИ РТК.
В шарнире заложены элементы модульности, в частности, не требуется
вносить существенных изменений в конструкцию при замене двигателя на какойлибо из двигателей с аналогичными габаритами, то же верно и для волновых
передач. Упругий элемент также имеет возможность замены на другой для
достижения желаемой жёсткости из определённого диапазона. Жёсткость упругого
элемента определяется исходя из назначения манипулятора и функций шарнира в
манипуляторе, предполагается минимальная жёсткость элемента в 500 Н∙м/рад и
максимальная в 5000 Н∙м/рад.
Рисунок 9 – Конструкция рассматриваемого упругого шарнира (в разрезе)
24
2.1 Математическая модель шарнира
Математическая модель шарнира, состоящая из трёх блоков, включающих
в себя ДПТ, редуктор и упругий элемент, представлена на рисунке 10.
Рисунок 10 – Блоковая математическая модель упругого шарнира
2.1.1 Математическая модель ДПТ
В качестве модели двигателя принята традиционная модель двигателя
постоянного тока, входными переменными которой являются напряжение на
обмотке двигателя и внешний момент, а выходом – скорость и положение ротора.
Выбранный
двигатель
обладает
следующими
характеристиками,
представленными в таблице 1.
Таблица 1 – Основные характеристики двигателя
Параметр
Индуктивность обмотки якоря 𝐿, мкГн
Сопротивление обмотки якоря R, Ом
Момент инерции 𝐵, ‧10-4 кг‧м2
Постоянная ЭДС двигателя 𝑘𝜔 ,
В∙с
0,255
рад
Постоянная момента двигателя 𝑘𝑀 ,
Значение
1350
0,655
0,34
Н∙м
А
0,255
Для двигателя постоянного тока (ДПТ) основными уравнениями являются:
уравнение электрического равновесия, уравнение механического равновесия,
уравнения связи, которые можно представить в виде системы:
25
𝑈 + 𝐸 = 𝑅𝐼 + 𝐿𝐼 ̇
𝑀эм − Мвн = 𝐵𝜔̇ дв
𝑀эм = 𝑘𝑀 𝐼
{ 𝐸 = −𝑘𝜔 𝜔дв
(2.1)
где U – напряжения двигателя,
E – противо-ЭДС двигателя,
R – сопротивление обмотки якоря,
I – ток якоря,
𝑀эм – электромагнитный момент двигателя,
Мвн – внешний момент,
𝐵 – момент инерции ротора,
𝑘𝑀 – постоянный коэффициент момента двигателя,
𝑘𝜔 – постоянный коэффициент ЭДС двигателя,
𝜔дв – скорость вращения вала двигателя.
Модель ДПТ представлена на рисунке 11.
U – напряжение двигателя, R – сопротивление обмотки якоря; L – индуктивность
обмотки якоря; Km – постоянная момента двигателя; B – момент инерции ротора
двигателя; Bm – вязкое трение двигателя; Ke – постоянная ЭДС двигателя;
teta``, teta`, teta – ускорение, скорость, положение двигателя соответственно
Рисунок 11 – Математическая модель ДПТ
26
Передаточная функция контура тока в соответствии с рисунком 12
выглядит следующим образом:
1
1
𝑅 ,
𝑊𝑝 (𝑠) =
=
𝐿
𝐿𝑠 + 𝑅
𝑠+1
𝑅
где 𝜏𝑀 =
𝐿
𝑅
= 2 ∙ 10−3
Гн
Ом
(2.2)
– электромагнитная постоянная двигателя.
Рисунок 12 – Контур тока
Электромагнитная постоянная 𝜏𝑀 определяет задержку системы, поэтому
чем
она
больше,
тем
дольше
выходная
величина
будет
достигать
установившегося значения. Для повышения быстродействия двигателя и
минимизации статической ошибки разработан классический ПИ-регулятор тока
(момента).
Передаточная функция контура ПИ-регулятора (см. рисунок 13).
𝐾𝑃
𝐾
(
𝑠 + 1)
𝐼
𝐾𝐼 𝐾𝑃 𝑠 + 𝐾𝐼
𝐾𝐼
𝑊𝑃𝐼 (𝑠) = 𝐾𝑃 + =
=
,
𝑠
𝑠
𝑠
𝐾𝑃
𝐿
= 𝜏𝑀 = ≈ 2 ∙ 10−3 .
𝐾𝐼
𝑅
где 𝐾𝑃 – пропорциональный коэффициент усиления,
𝐾𝐼 – интегральный коэффициент усиления.
27
(2.3)
(2.4)
Рисунок 13 – Контур ПИ-регулятора
Тогда для полной системы, включающей в себя и контур тока, и контур
ПИ-регулятора, получаем следующее. Передаточная функция разомкнутой
системы:
𝑊 ′ 𝑝 (𝑠 ) =
𝐾𝐼𝑖 (
𝐾𝑃𝑖
1
𝑠 + 1)
𝐾𝐼𝑖
𝐾𝐼𝑖
𝑅
∙
=
.
𝐿
𝑠
𝑅
∙
𝑠
𝑠+1
𝑅
(2.5)
Полная передаточная функция замкнутой системы:
𝐾𝐼𝑖
′ ( )
𝑊
𝑠
1
𝑝
𝑅 ∙ 𝑠 = 𝐾𝐼𝑖
𝑊 ′ з (𝑠 ) =
=
=
,
𝑅
1 + 𝑊 ′ 𝑝 (𝑠) 1 + 𝐾𝐼𝑖
𝑅𝑠 + 𝐾𝐼𝑖
𝑠+1
𝐾𝐼𝑖
𝑅∙𝑠
𝑅
= 𝜏 ′ 𝑀𝑖 ,
𝐾𝐼𝑖
(2.6)
(2.7)
Таким образом, значение электромагнитной постоянной зависит от
вводимых пропорционального и интегрального коэффициентов ПИ-регулятора:
𝐾𝐼𝑖 =
𝐾𝑃𝑖 =
𝑅
𝜏 ′ 𝑀𝑖
,
𝐿
𝐿 𝑅
𝐿
𝐾𝐼𝑖 = ∙ ′ = ′ .
𝑅
𝑅 𝜏 𝑀𝑖 𝜏 𝑀𝑖
28
(2.8)
(2.9)
Коэффициенты подбираются так, чтобы обеспечить уменьшение значения
τ′ 𝑀𝑖 до удовлетворяющих показателей качества системы. Были подобраны
следующие значения коэффициентов:
𝐾𝑃𝑖 = 13,5; 𝐾𝐼𝑖 = 6550,
что соответствует 𝜏 ′ 𝑀𝑖 = 10−4 .
Уменьшение электромагнитной постоянной в 20 раз позволило повысить
быстродействие и убрать статическую ошибку, что демонстрирует график 14.
Рисунок 14 – Переходные процессы для тока двигателя
2.1.2 Математическая модель редуктора и упругого элемента
Редуктор, как и упругий элемент, реализованы посредством модели
пружины с демпфером с соответствующими параметрами (см. рисунок 15 а,б).
Характеристики редуктора представлены в таблице 2.
Таблица 2 – Основные параметры редуктора
Параметр
Значение
Передаточное число
160
−4
2
1,69
Момент инерции Jr, ∙ 10 кг ∙ м
Н
100000
Коэффициент жёсткости,
м
29
iHD – передаточное отношение; K_red – коэффициент жёсткости редуктора;
Jred – момент инерции редуктора; B_red – вязкое трение редуктора;
K – коэффициент жёсткости упругого элемента; M – момент инерции упругого
элемента; Mn -внешний момент; B_link – вязкое трение упругого элемента
Рисунок 15 – Математическая модель редуктора (а) и упругого элемента (б)
Для дальнейшего упрощения анализа системы можно пренебречь полной
моделью редуктора и рассматривать его в виде передаточного числа.
2.2 Синтез СУ для упругого электромеханического шарнира
Основная идея, заложенная в реализацию системы управления, взята из
работы [24] и состоит в том, чтобы добавить демпфирующую составляющую в
систему уравнений динамики упругих шарниров. Это достигается путем
введения новых координат двигателя. При этом результирующая динамика
системы должна структурно равняться динамике в исходных координатах.
Эквивалентная модель упругого электромеханического шарнира реализуется в
соответствии с рисунком 17.
30
q – выходное положение упругого звена; ϴ – выходное положение двигателя;
τm – электромагнитный момент двигателя; K – жёсткость пружины; B – инерция
двигателя; 𝜂 – новая координата двигателя; D – демпфирующий коэффициент;
𝑞̇ – скорость двигателя
Рисунок 17 – Структурная схема упругого шарнира с исходной и новой
системой координат
2.3 Переход к новой системе координат с целью добавления
демпфирования
Двигатель с инерцией B воздействует на звено с инерцией M через
пружину с жесткостью K в соответствии с законом:
𝑀𝑞̈ = 𝐾 (𝜃 − 𝑞),
(2.10)
где θ и q угол поворота привода и упругого элемента.
Со стороны двигателя баланс моментов выглядит как:
𝐵𝜃̈ + 𝐾 (𝜃 − 𝑞) = 𝜏𝑚 ,
где τm – электромагнитный момент двигателя.
31
(2.11)
Для стабилизации переходного процесса системы вводится фиктивный
демпфирующий элемент D со стороны выходного вала в соответствии со схемой
на рисунке 18, так что динамику привода можно записать через новую
координату двигателя 𝜂:
𝐾 (𝜃 − 𝑞) = 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇ ,
𝐵𝜃̈ + 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇ = 𝜏𝑚 .
(2.12)
(2.13)
Из (2.12) также можно выразить новую координату:
𝜂=𝜃+
𝐷
𝑞.
𝐾
̇
(2.14)
𝐷
Подстановка 𝜃̈ = 𝜂̈ − 𝑞 (3) – ускорения привода, в уравнение баланса
𝐾
моментов на двигатель (2.13) приводит к появлению нового входа системы 𝑢̅ в
соответствии с
𝐵𝜂̈ −
𝐵𝐷 (3)
𝑞 + 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇ = 𝜏𝑚 ,
𝐾
𝜏𝑚 = 𝑢̅ − 𝐵𝐾 −1 𝐷𝑞(3) − 𝐷𝑞̇ ,
𝑢̅ = 𝐵𝜂̈ + 𝐾 (𝜂 − q).
(2.14)
(2.15)
(2.16)
В результате динамика системы будет описываться системой уравнений
{
𝑀𝑞̈ = 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇
𝐵𝜂̈ + 𝐾 (𝜂 − 𝑞) = 𝑢̅
32
(2.17)
Таким образом, после перехода к эквивалентной модели, задача сводится
к регулированию 𝜂 по желаемому значению 𝜂𝐷 . Это может быть достигнуто с
помощью ПД-регулятора
𝐷
𝐷
𝐾
𝐾
𝑢̅ = −𝐾𝐷 𝜂̇ − 𝐾𝑝 (𝜂 − 𝜂𝐷 ) = −𝐾𝐷 (𝜃̇ + 𝑞̈ ) − 𝐾𝑝 (𝜃 − 𝑞̇ − 𝜂𝐷 ).
(2.18)
Замкнутая система с таким регулятором будет иметь вид
𝑀𝑞̈ = 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇
{
𝐵𝜂̈ + 𝐾𝐷 𝜂̇ + 𝐾𝑝 (𝜂 − 𝜂𝐷 ) + 𝐾(𝜂 − 𝑞) = 0
(2.19)
Модель шарнира с регулятором представлена на рисунке 18.
Kp, Kd – пропорциональный и дифференциальный коэффициенты регулятора;
u_ – входной сигнал системы; eta – новая координата двигателя; eta’ – ускорение
двигателя, соответствующее новой координате; D – демпфирующий член;
iHD – передаточное отношение; B – момент инерции ротора; K – жёсткость
упругого элемента; q’’, q’, q – ускорение, скорость и положение выходного звена
соответственно
Рисунок 18 – Эквивалентная модель для упругого шарнира
33
Чтобы приблизить модель к реальному объекту, вносим шум и реализуем
фильтр. Особый интерес представляет вид третьей производной угла поворота,
которая
задействована
в
регуляторе.
Фильтр
ограничивает
диапазон
собственных частот механики, с которым работает данный регулятор. Вклад
составляющей, основанной на третьей производной при типовых скоростях
представляет собой фактически шум.
2.4 Методика подбора коэффициентов регулятора
Настройка регулятора начинается с анализа системы (2.19). Первое
уравнение описывает систему со стороны звена и представляет из себя
дифференциальное уравнение пружины второго порядка
𝑀𝑞̈ + 𝐷𝑞̇ + 𝐾𝑞 = 𝐾𝜂,
(2.20)
где входом является виртуальная координата ротора 𝜂.
Соответствующий характеристический полином для уравнения (2.20)
имеет следующие корни:
𝜆1,2
−𝐷 ± √𝐷2 − 4𝑀𝐾
=
.
2𝑀
(2.21)
Тогда критическое демпфирование достигается при следующем условии:
𝐷2 − 4𝑀𝐾 = 0 ⇔ 𝐷 = 2√𝑀𝐾.
(2.22)
Если η=0, иначе говоря, входной вал фиксирован, система (2.20) имеет
апериодический переходный процесс.
Второе уравнение (2.19), описывающее подсистему со стороны двигателя,
можно переписать в виде
34
𝐵𝜂̈ + 𝐾𝐷 𝜂̇ + (𝐾𝑝 + 𝐾)𝜂 = 𝐾𝑝 𝜂𝐷 + 𝐾𝑞.
(2.23)
Если 𝐾𝑝 𝜂𝐷 + 𝐾𝑞 = 0, то есть входной и выходной вал фиксирован, то
корни характеристического полинома следующие:
−𝐾𝐷 ± √𝐾𝐷2 − 4𝐵(𝐾𝑝 + 𝐾)
𝜆3,4 =
2𝐵
.
(2.24)
Критическое демпфирование достигается при следующем условии:
𝐾𝐷2 − 4𝐵(𝐾𝑝 + 𝐾) = 0 ⇔ 𝐾𝐷 = 2√𝐵(𝐾𝑝 + 𝐾).
(2.25)
Таким образом, задавая коэффициент 𝐾𝑝 , можно определить 𝐾𝐷 , и все
коэффициенты регулятора являются определёнными.
Более удобная настройка поведения системы может быть достигнута с
введением дополнительного параметра 𝛾, масштабирующего усиления:
𝐷 = 2𝛾√𝑀𝐾,
(2.26)
𝐾𝐷 = 2𝛾√𝐵(𝐾𝑝 + 𝐾),
(2.27)
где 𝛾 – коэффициент сверхдемпфирования.
Подстановка (2.26) в (2.21) приводит к условию устойчивости:
−2𝛾√𝑀𝐾 + √4𝛾 2 𝑀𝐾 − 4𝑀𝐾 < 0,
4𝛾 2 𝑀𝐾 > 4𝛾 2 𝑀𝐾 − 4𝑀𝐾,
35
(2.28)
(2.29)
следовательно, устойчивость системы всегда обеспечивается, поскольку
инерция звена M и жесткость K отличны от нуля и инвариантны к 𝛾.
Далее важно оценить верхние постоянные времени, соответствующие
полиномиальные корни при подстановке в них (2.26) и (2.27):
2
−2𝛾√𝑀𝐾 + √4𝛾 2 𝑀𝐾 − 4𝑀𝐾 −√𝑀𝐾(𝛾 − √𝛾 − 1)
𝜆1 =
=
< 0, (2.30)
2𝑀
𝑀
−2𝛾√𝐵(𝐾𝑝 + 𝐾) + √4𝛾 2 𝐵 (𝐾𝑝 + 𝐾 ) − 4𝐵 (𝐾𝑝 + 𝐾 )
𝜆3 =
=
2𝐵
−√𝐵(𝐾𝑝 + 𝐾)(𝛾 − √𝛾 2 − 1)
=
𝐵
< 0.
(2.31)
Из этих выражений видно, что увеличение 𝛾 при 𝛾 ≥ 1 вызывает
уменьшение 𝜆1 и 𝜆3 . Временные константы, которые определяются как
𝑇1 =
1
,
𝜆1
(2.32)
𝑇3 =
1
,
𝜆3
(2.33)
при 𝛾 ≥ 1 увеличиваются, при этом поскольку 𝑇1 зависит только от 𝛾, то
она определяет общее поведение системы и принимает минимальное значение
равное при 𝛾 = 1
𝑀
𝑇1 = √ .
𝐾
36
(2.34)
Таким
образом,
никакой
настройкой
коэффициентов
нельзя
принципиально поднять быстродействие системы, не приводя при этом к
колебательности или перерегулированию.
Дальнейшая настройка основана на анализе корней характеристических
полиномов системы (2.19).
Далее выразим 𝜂 из (2.20)
𝜂=
1
(𝑀𝑞̈ + 𝐷𝑞̇ + 𝐾𝑞),
𝐾
(2.35)
𝜂̇ =
1
(𝑀𝑞⃛ + 𝐷𝑞̈ + 𝐾𝑞̇ ),
𝐾
(2.36)
𝜂̈ =
1
(𝑀𝑞 (4) + 𝐷𝑞⃛ + 𝐾𝑞̈ ),
𝐾
(2.37)
и подставим в (2.23).
𝐵
𝐾𝐷
𝐾𝑃
(𝑀𝑞⃛ + 𝐷𝑞̈ + 𝐾𝑞̇ ) +
(𝑀𝑞̈ + 𝐷𝑞̇ + 𝐾𝑞) +
(𝑀𝑞 (4) + 𝐷𝑞⃛ + 𝐾𝑞̈ ) +
𝐾
𝐾
𝐾
+𝑀𝑞̈ + 𝐷𝑞̇ = 𝐾𝑝 𝜂𝐷 ,
𝐵
𝐾𝐷
𝐵
𝐾𝐷
𝐾𝑃
𝑀𝑞 (4) + [ 𝑀 + 𝐷] 𝑞⃛ + [ 𝐷 + 𝐵 +
𝑀 + 𝑀] 𝑞̈ +
𝐾
𝐾
𝐾
𝐾
𝐾
𝐾𝑃
+ [𝐾𝐷 +
𝐷 + 𝐷] 𝑞̇ + 𝐾𝑝 𝑞 = 𝐾𝑝 𝜂𝐷 .
𝐾
(2.38)
(2.39)
Вводя обозначения
𝑎4 𝑞(4) + 𝑎3 𝑞⃛ + 𝑎2 𝑞̈ + 𝑎1 𝑞̇ + 𝑎0 𝑞 = 𝐾𝑝 𝜂𝐷 ,
37
(2.40)
𝑎4 =
𝑎3 = [
𝑎2 =
𝐵
𝑀,
𝐾
(2.41)
𝐾𝐷
𝐵
𝑀 + 𝐷],
𝐾
𝐾
(2.42)
𝐾𝐷
𝐾𝑃
𝐷+𝐵+
𝑀 + 𝑀,
𝐾
𝐾
𝑎1 = 𝐾𝐷 +
(2.43)
𝐾𝑃
𝐷 + 𝐷,
𝐾
(2.44)
(2.45)
𝑎0 = 𝐾𝑝 .
Поделив все выражение на 𝑎4
𝑞(4) + 𝑏3 𝑞⃛ + 𝑏2 𝑞̈ + 𝑏1 𝑞̇ + 𝑏0 𝑞 =
где bi =
ai
a4
Переходя
𝐾𝑝
𝜂 ,
𝑎4 𝐷
(2.46)
.
к
преобразованию
Лапласа
и
рассматривая
только
характеристический полином
𝑠 4 + 𝑏3 𝑠 3 + 𝑏2 𝑠 2 + 𝑏1 𝑠 + 𝑏0 = (𝑠 − 𝜆1 )(𝑠 − 𝜆2 )(𝑠 − 𝜆3 )(𝑠 − 𝜆4 ) =
= (𝑠 2 − 𝜆2 𝑠 − 𝜆1 𝑠 + 𝜆1 𝜆2 )(𝑠 2 − 𝜆4 𝑠 − 𝜆3 𝑠 + 𝜆3 𝜆4 ) =
= 𝑠 4 − (𝜆1 + 𝜆2 + 𝜆3 + 𝜆4 )𝑠 3 +
+(𝜆3 (𝜆1 + 𝜆2 ) + 𝜆1 𝜆2 + 𝜆4 (𝜆1 + 𝜆2 + 𝜆3 ))𝑠 2 +
+(−𝜆4 (𝜆3 (𝜆1 + 𝜆2 ) + 𝜆1 𝜆2 ) − 𝜆1 𝜆2 𝜆3 )𝑠 + 𝜆1 𝜆2 𝜆3 𝜆4 = 0.
(2.47)
Подставляя (2.26) и (2.27) для ai
𝑎4 =
38
𝐵
𝑀,
𝐾
(2.48)
2𝐵𝛾√𝑀𝐾 + 2𝛾√𝐵(𝐾𝑝 + 𝐾)𝑀
𝑎3 =
2(𝐵√𝑀𝐾 + 𝑀√𝐵(𝐾𝑝 + 𝐾)
=
𝐾
𝐾
4𝛾 2 √𝐵(𝐾𝑝 + 𝐾)√𝑀𝐾
𝑎2 = 𝐵 +
+
𝐾
𝑎1 = 2𝛾√𝐵(𝐾𝑝 + 𝐾) +
= 2 (√𝐵(𝐾𝑝 + 𝐾) +
𝛾,
𝐾𝑝 𝑀
+ 𝑀,
𝐾
(2.49)
(2.50)
2𝐾𝑝 𝛾√𝑀𝐾
+ 2𝛾√𝑀𝐾 =
𝐾
𝐾𝑝 √𝑀𝐾
+ √𝑀𝐾) 𝛾,
𝐾
𝑎0 = 𝐾𝑝.
(2.51)
(2.52)
Тогда bi можно переписать в виде
𝑏4 = 1,
𝑏3 =
𝑏2 =
𝑎3 𝑏31
=
𝛾 = −(𝜆1 + 𝜆2 + 𝜆3 + 𝜆4 ),
𝑎4
𝑎4
(2.53)
(2.54)
𝑎2 𝑏21 2
=
𝛾 + 𝑏22 = 𝜆3 (𝜆1 + 𝜆2 ) + 𝜆1 𝜆2 + 𝜆4 (𝜆1 + 𝜆2 + 𝜆3 ), (2.55)
𝑎4
𝑎4
𝑏1 =
𝑎1 𝑏11
=
𝛾 = −𝜆4 (𝜆3 (𝜆1 + 𝜆2 ) + 𝜆1 𝜆2 ) − 𝜆1 𝜆2 𝜆3 ,
𝑎4
𝑎4
(2.56)
𝑎0 𝐾𝑝
=
= 𝜆1 𝜆2 𝜆3 𝜆4 .
𝑎4 𝑎4
(2.57)
𝑏0 =
Решая (2.51) относительно 𝜆4 , имеем
39
𝐾𝑝
𝑏31
𝑏21 2
𝑏11
𝜆44 + (
𝛾) 𝜆34 + (
𝛾 + 𝑏22 ) 𝜆24 + (
𝛾) 𝜆4 +
= 0.
𝑎4
𝑎4
𝑎4
𝑎4
(2.58)
Задавшись 𝛾, можно определить 𝜆4 , а затем решив (2.54 − 2.57) получить
корни 𝜆1 , 𝜆2 , 𝜆3 , ориентируясь на дополнительное условие для выбора корней
𝜆1 , 𝜆2 , 𝜆3 , 𝜆4 < 0, 𝜆1 , 𝜆2 , 𝜆3 , 𝜆4 𝜖𝑅.
Годограф
корней
характеристического
полинома
представлен
на
рисунке 19.
Рисунок 19 – Корневой годограф корней характеристического полинома полной
системы
Как видно из графика один из корней монотонно уменьшается,
следовательно, монотонно возрастает его постоянная времени. Более того, это
наименьший корень, так что общая постоянная времени в значительной степени
определяется этим корнем.
Графики на рисунке 20 показывают реакцию системы на единичное
воздействие по углу поворота при различных значениях коэффициента
сверхдемпфирования 𝛾.
40
Рисунок 20 – Реакция системы на единичное внешнее воздействие при
различных коэффициентах сверхдемпфирования
В
случае
критического
демпфирования
(𝛾 = 1)
колебательность
переходного процесса обусловлена влиянием фильтра положения выходного
звена с постоянной времени и тем, что динамика двигателя лишь частично
компенсирована. Таким образом, при 𝛾 > 1 обеспечивается апериодический
переходный процесс. Варьирование 𝛾 позволяет задать желаемое поведение
системы в диапазоне от минимального временного отклика до максимальной
плавности.
2.5 Выводы по разделу
В этой главе рассматривается закон управления для электромеханического
шарнира с упругостью в виде пружины, который обеспечивает отслеживание
траектории выходного звена. Специально введенная новая координата двигателя
изменяет
исходную
динамику
шарнира,
добавляя
виртуальный
член
демпфирования. При этом механика системы не изменяется. Для достижения
желаемого поведения эквивалентной системы используется ПД-регулятор и
рассматривается алгоритм для настройки его параметров, а также значения
41
виртуального демпфирования. Для настройки регулятора необходимо задать
только пропорциональный коэффициент и коэффициент сверхдемпфирования,
имеющие простой физический смысл.
42
3 Система управления с каскадной структурой
3.1 Подходы к управлению упругим роботом
Упругость манипулятора – это динамическое поведение, при котором
происходит непрерывный переход кинетической энергии в потенциальную
энергию упругих сил и обратно. Кинетическая энергия запасается в инерции
движения, а потенциальная – в упругих элементах. В момент случайного
контакта с внешним объектом на робота будет оказана большая и прерывистая
импульсная сила, которая может повредить объект или самого робота. В данном
случае необходимо, чтобы кинетическая энергия внешнего объекта максимально
быстро рассеивалась через переход в кинетическую энергию робота, что в
предельном случае соответствует абсолютно податливому поведению. На
практике же, как правило, более актуальным является упругое поведение.
Негативным явлением в любом из случаев является переход кинетической
энергии внешнего объекта в пластическую деформацию робота, что может
привести к повреждению и потере работоспособности. Таким образом, всегда
будет существовать компромисс между сохранением упругости и риском
пластической деформации. Упругий элемент, в нашем случае пружина, между
двигателем и шарниром, в момент контакта начнет упруго деформироваться, и
кинетическая энергия передастся потенциальной энергии пружины, поэтому
система управления роботом успеет среагировать и остановить или повернуть
двигатели. В дополнение к амортизации, деформация пружины обеспечивает
средство определения силы, которую оказывает робот. Упругость вызывает
механические колебания и статические деформации, что значительно усложняет
управление движением манипулятора. Если время для урегулирования
колебаний является значительным по отношению к времени цикла общей задачи,
упругость робота будет основным фактором, который необходимо учитывать
при разработке системы управления.
Как уже упоминалось, существует два подхода управления роботом:
централизованное и децентрализованное управление.
43
Простейший метод управления многозвенным роботом состоит в
применении
для
каждого
шарнира
независимого
контроллера.
Децентрализованное управление целесообразно, когда динамика робота
обособлена по управлению, по крайней мере, приблизительно (см. рисунок 21).
При этом динамика считается обособленной, когда ускорение каждого
отдельного шарнира зависит только от крутящего момента, положения и
скорости этого же шарнира.
Использование иерархической схемы (каскадной структуры) снижает
сложность модели всего робота от модели с упругостью до твердотельной
модели. Также это позволяет использовать существующие методы управления
всем роботом, которые предполагают модель жёсткого шарнира, приводимую в
действие идеальными источниками крутящего момента. К тому же, благодаря
данному подходу появляется возможность настройки каждого шарнира
индивидуально, до интеграции в состав робота, что уменьшает время разработки
и упрощает процесс тестирования функционала высокого уровня после сборки
робота. Кроме того, повышение обособленности между центральной и
периферийными системами уменьшает общие задержки в линиях связи
вследствие более низкого количества сигналов, требуемых для передачи.
Рисунок 21 – Схематичное изображение децентрализованного управления
44
В
централизованном
подходе
напротив
для
расчёта
управления
необходима полная информация о состоянии каждого из n-шарниров для
каждого шарнира. То есть при таком подходе общий контроллер моделирует и
динамику твердого тела, и динамику привода (см. рисунок 22), при этом уже
необходимо учитывать упругость всего робота.
Рисунок 22 – Схематичное изображение централизованного управления
Данный метод имеет преимущество в случае, когда не удаётся обеспечить
достаточное быстродействие на нижнем уровне, а также в случае необходимости
реализации совместного демпфирования. Так как упругость шарниров в задачах
слежения затягивает переходные процессы и требует демпфирования, то
централизованный подход потенциально более пригоден для управления
упругими шарнирами. Тем не менее, он более сложен в реализации, в связи с чем
в первую очередь рассматривается реализация децентрализованного подхода.
3.2 Модель кинематики
В данной работе проводится динамическое моделирование в среде
разработки Matlab/Simulink совместно с пакетом моделирования Coppelia
Robotics (V-REP). Для моделирования будет рассматриваться робот Franka Emika
Panda [9], так как он имеется во встроенных библиотеках V-REP. Робот имеет
семь вращательных шарниров с общим весом приблизительно 18 кг и
грузоподъёмностью до 3 кг. Робот и его кинематическая схема показаны на
рисунке 23. Для описания кинематических зависимостей между звеньями
применяется матричный метод Денавита-Хартенберга последовательного
45
построения систем координат. Соответствующие параметры представлены в
таблице 3.
Рисунок 23 – Внешний вид робота Panda и его кинематическая схема
Таблица 3 – Параметры систем координат звеньев манипулятора
1
2
3
4
5
6
Линейное
смещение
a i, м
0
0
0
0,0825
-0,0825
0
7
0,088
Шарнир
i
Присоединённый
d i,
угол
м
αi, рад
0
0,333
0
-π/2
0,316
π/2
0
π/2
0,384
-π/2
0
π/2
π/2
0
Обобщённая
координата
qi
q1
q2
q3
q4
q5
q6
q7
3.3 Модель динамики
При проектировании системы управления необходимо основываться на
динамической модели робота. Полная динамическая модель робота с упругими
шарнирами выглядит следующим образом:
46
𝑀 (𝑞 )
( 𝑇
𝑆 (𝑞 )
𝑆(𝑞) 𝑞̈
𝑐(𝑞, 𝑞̇ ) + 𝑐1 (𝑞, 𝑞̇ , 𝜃̇ )
)( ) + (
)+
𝐵
𝑐2 (𝑞, 𝑞̇ )
𝜃̈
𝑔 (𝑞 ) + 𝐾 (𝑞 − 𝜃 )
0
+(
) = ( ),
𝜏𝑚
𝐾 (𝑞 − 𝜃 )
(3.1)
где 𝑀(𝑞) − матрица инерции звена,
𝑆(𝑞) − матрица, выражающая массо-инерционное взаимодействие
между двигателем и предыдущими звеньями робота,
𝐶𝑡𝑜𝑡 (Θ, Θ̇) − центробежные и Кориолисовы силы,
𝑔(𝑞) − сила гравитации,
𝐾 – жёсткость пружины ,
𝜏𝑚 – электромагнитный момент двигателя.
При этом далее в работе будет рассматриваться упрощённая модель, для её
вывода необходимо применить следующие допущения [19]:
1. кинетическая энергия ротора учитывается только для его собственного
вращения, без учёта движения в составе шарнира (впоследствии эта
энергия учитывается в составе общей массы шарнира) – данное допущение
обосновывается большим передаточным числом;
2. тензоры инерции ротора и редуктора симметричны относительно оси
вращения ротора (шарнира), таким образом гравитационный потенциал
системы и скорость центра масс ротора не зависят от положения ротора
(угла поворота).
Из-за дополнительных степеней свободы, создаваемых упругой связью
вала двигателя с звеньями, будем моделировать ротор каждого привода как
«фиктивное звено», то есть как дополнительное твердое тело в цепи с
собственной инерцией. Таким образом, манипулятор состоит из n «реальных»
звеньев и n «фиктивных» или роторных звеньев (см. рисунок 24).
47
Ji – момент инерции ротора двигателя; qi – обобщённая координата звена;
𝜃𝑖 − обобщённая координата ротора, приведённая к выходу редуктора
Рисунок 24 – Схематичное изображение упругого шарнира
В таком случае ротор, как промежуточное звено, теперь имеет свою
собственную систему координат и связанный с ней тензор инерции. Для
простоты будем рассматривать звено «ротора» в виде круглого цилиндра.
Учитывая симметричность цилиндра, установим систему координат в центре
масс. Предположим, что оси координат также являются главными осями
цилиндра, а угол ротора измерен вокруг оси Oz. Тензор инерции ротора тогда
выглядит следующим образом:
𝐼𝑥𝑥𝑖
𝐼𝑖 = [ 0
0
0
𝐼𝑦𝑦𝑖
0
0
0 ]
(3.2)
𝐼𝑧𝑧𝑖
где 𝐼𝑥𝑥𝑖 , 𝐼𝑦𝑦𝑖 , 𝐼𝑧𝑧𝑖 – моменты инерции ротора относительно главных осей.
То есть кинетическую энергию ротора можно записать:
1
1
2
2
𝐾𝑖 = 𝑀𝑖 𝑣 𝑇 𝑖 𝑣𝑖 + 𝜔𝑇 𝑖 𝐼𝑖 𝜔𝑖 ,
где 𝑀𝑖 – масса ротора,
48
(3.3)
𝑣𝑖 – представляет скорость центра масс ротора,
𝜔𝑖 – вектор угловых скоростей относительно главных осей.
Опираясь на внесённые допущения, первое слагаемое отнесём к
кинетической энергии звена, а кинетическая энергия ротора запишется
следующим образом:
2
1
𝐾𝑖 = 𝐼𝑧𝑧𝑖 𝜃𝑖̇ ,
(3.4)
2
где 𝜃𝑖̇ – обобщённая скорость ротора.
Таким образом, полную кинетическую энергию системы можно записать
как:
1
1
𝐾𝑖 = 𝑞̇ 𝑇 𝑖 𝑀(𝑞𝑖 )𝑞̇ 𝑖 + 𝜃̇ 𝑇 𝑖 𝐵′ 𝜃̇𝑖 ,
2
(3.5)
2
где 𝑀(𝑞𝑖 ) – инерция звена,
𝐵′ = 𝐵𝑟 2 – момент инерции относительно выхода редуктора,
В – момент инерции ротора, r – передаточное число редуктора.
Полная потенциальная энергия системы определяется следующим
образом:
𝑃 = 𝑃1 (𝑞) + 𝑃2 (𝑞 − 𝜃),
(3.6)
где 𝑃1 (𝑞) – потенциальная энергия звена в поле силы тяжести,
𝑃2 (𝑞 − 𝜃) = 𝐾(𝑞 − 𝜃)
–
потенциальная
энергия,
определяемая
упругими свойствами пружины.
Выразив
Лагранжиан,
составим
уравнения
описывающие динамику робота в общем случае:
49
Эйлера-Лагранжа,
{
𝑀(𝑞)𝑞̈ + 𝑐 (𝑞, 𝑞̇ ) − 𝐾 (𝑞 − 𝜃) = 0
𝐵′ 𝜃̈ + 𝐾 (𝑞 − 𝜃) = 𝜏𝑚
(3.7)
где 𝑞̈ – обобщённое ускорение звена,
𝑞̇ – обобщённая скорость звена,
𝜃̈ – обобщённое ускорение ротора,
𝑐 (𝑞, 𝑞̇ ) – матрица, содержащая кориолисовые, центростремительные и
гравитационные силы и моменты,
K – жёсткость пружины,
𝜏 = 𝐾 (𝑞 − 𝜃) – крутящий момент, передаваемый звену от ротора через
торсионную пружину,
𝜏𝑚 – крутящий момент двигателя.
При этом здесь следует отметить, что, с учётом принятых упрощений,
гироскопические эффекты между каждым из роторов и другими звеньями не
учитываются.
3.4 Система управления
Схематичное
изображение
разработанной
системы
управления
представлено на рисунке 25. Предлагаемая система управления имеет каскадную
структуру. Шарнир воспринимается как идеальный источник момента, при этом
он обладает ненулевой постоянной времени. И чем меньше постоянная времени,
тем более оправдана каскадная двухуровневая система, так как динамика
шарнира и динамика звена будет иметь разный порядок. Однако если динамика
шарнира будет становиться медленнее (в частности, со снижением жёсткости) и
приближаться по быстродействию к динамике твердотельной части, то
допущение потеряет свою актуальность.
50
Рисунок 25 – Схематичное изображение системы управления
Внешний контроллер получает информацию о реальном положении и
скорости
перемещения
выходного
вала
шарниров.
По
ПД-регулятору
рассчитывается необходимое значение ускорения. Метод computed-torque [25] на
основе обратной задачи динамики (модель была выведена ранее, см. раздел 3.3),
во внешнем контуре управления генерирует требуемый крутящий момент для
обеспечения заданной траектории. Моментный регулятор каждого шарнира
получает рассчитанный крутящий момент (τd) и использует обратную связь по
реальному крутящему моменту и его первой производной для обеспечения
выполнения этой команды.
3.5 Моментный регулятор
В данном случае применяется динамическая модель без учёта матрицы
𝑐 (𝑞, 𝑞̇ ), то есть инерционные связи между ротором и предыдущими звеньями не
учитываются.
Тогда
модель
динамики
системы
(шарнира)
принимает
следующий вид:
𝑀𝑞̈ = 𝜏
{𝐵′ 𝜃̈ + 𝜏 = 𝜏𝑚
𝜏 = 𝐾 (𝑞 − 𝜃 )
51
(3.8)
Из второго уравнения системы (3.8) крутящего момента, создаваемого
пружиной, можно выразить обобщённую координату звена q через обобщённую
координату ротора 𝜃:
𝑞=𝜃−
𝜏
𝐾
(3.9)
Взяв вторую производную, получим:
𝑞̈ = 𝜃̈ −
𝜏̈
𝐾
(3.10)
Далее подставив обобщённое ускорение звена (3.10) в первое уравнение
системы (3.8) модели динамики и выразив ускорение ротора 𝜃̈ из второго
уравнения системы (3.8), получим преобразованную систему:
𝑀𝜏̈
𝑀𝜃̈ −
=𝜏
𝐾
{
𝜏 −𝜏
𝜃̈ = 𝑚 ′
(3.11)
𝐵
Таким образом, подставляя обобщённое ускорение двигателя в первое
уравнение системы (3.11) имеем дифференциальное уравнение:
𝑀
𝑀
𝑀
𝜏
−
𝜏
−
𝜏̈ = 𝜏
𝑚
𝐵′
𝐵′
𝐾
(3.12)
𝑀
𝑀
𝑀
𝜏̈ + 𝜏 ( ′ + 1) = ′ 𝜏𝑚
𝐾
𝐵
𝐵
(3.13)
Закон управления примем следующего вида [26]:
𝜏𝑚 =
𝐵′
𝑀
𝑢,
52
(3.14)
где 𝑢 = 𝐾𝑝 (𝜏𝑑 − 𝜏) + (
𝑀
𝐵′
+ 1) 𝜏 − 𝐾𝑑 𝜏̇
(3.15)
Подставляя вместо момента 𝜏𝑚 уравнение (3.14) в дифференциальное
уравнение (3.13), имеем:
𝑀
𝑀
𝑀 𝐵′
𝑀
𝜏̈ + 𝜏 ( ′ + 1) = ′ ∙ (𝐾𝑝 (𝜏𝑑 − 𝜏) + ( ′ + 1) 𝜏 − 𝐾𝑑 𝜏̇ )
𝐾
𝐵
𝐵 𝑀
𝐵
𝑀
𝜏̈ + 𝐾𝑑 𝜏̇ + 𝐾𝑝 𝜏 = 𝐾𝑝 𝜏𝑑
𝐾
𝜏̈ +
Рассматривая
(3.17)
𝐾𝑝 𝐾
𝐾𝑑 𝐾
𝐾
𝜏̇ +
𝜏 = 𝐾𝑝 𝜏𝑑
𝑀
𝑀
𝑀
данную
систему
как
систему
(3.16)
(3.18)
второго
порядка
с
характеристическим полиномом 𝑇 2 𝜆2 + 2𝜉𝑇𝜆 + 1, можно записать:
𝐾𝑑 𝐾
{ 1𝑀
𝑇2
=
2𝜉
𝑇
𝐾𝑝 𝐾
=
(3.19)
𝑀
Откуда можно вычислить пропорциональный и дифференциальный
коэффициенты:
{
𝐾𝑝 =
𝐾𝑑 =
2𝜉𝑀
𝐾𝑇
𝑀
𝐾𝑇 2
= 2𝜉𝑇𝐾𝑝
где T – постоянная времени,
𝜉 – коэффициент демпфирования.
53
(3.20)
При 0 < 𝜉 < 1 система является колебательным звеном, при 𝜉 > 1 система
раскладывается на два апериодических звена. T и 𝜉 подбираются эмпирически в
зависимости от качества переходного процесса.
3.6 Выводы по разделу
В данном разделе были рассмотрены кинематическая и динамическая
модель манипулятора. Выбран подход к построению системы управления. А
также предложен и обоснован моментный регулятор в качестве контроллера
нижнего уровня децентрализованной системы управления.
54
4
Экспериментальное
исследование
манипулятора
с
децентрализованной системой управления
4.1 Математическая модель манипулятора
В компьютерном моделировании используется связь Matlab/Simulink –
Coppelia Robotics (комплекс моделирования, ранее известен как V-REP).
Ведущей программой является Matlab/Simulink, в которой разработана
непосредственно система управления, включающая в себя модель регулятора,
шарниров и датчиков положения ротора и выходного звена. Для визуализации и
реализации твердотельной динамики процесса используется V-REP, в которой
импортирована CAD-модель манипулятора. Также из среды V-REP берутся
значения динамических параметров робота, такие как масса, моменты инерции и
центр масс шарниров, для инициализации робота в Matlab/Simulink.
Математическая модель манипулятора, разработанная в среде MatlabSimulink, представлена на рисунке 26. При этом в блок Arm Controller входят
контроллеры верхнего и нижнего уровня (см. рисунок 27), а блок Arm в свою
очередь включает модели упругих шарниров манипулятора (см. рисунок 28).
Поскольку в реальной жизни сигнал, снимаемый с датчиков, имеет погрешность,
то на выходной сигнал модели накладывается шум, реализованный средствами
Matlab, максимальная амплитуда шума устанавливается пользователем. Для
фильтрации выходного сигнала используется линейный фильтр третьего
порядка, представленный в управляемой канонической форме, для которого
задаются частоты среза каждого отдельного фильтра первого порядка. Данный
фильтр даёт также первую производную сигнала.
55
Рисунок 26 – Математическая модель манипулятора
Рисунок 27 – Блок Arm Controller
На рисунке 27 вход C_Input содержит желаемые значения обобщённых
координат, скоростей и ускорений, рассчитанные посредством интерполяции по
точкам траекторий, состоящих из полиномов пятой степени. Второй вход
56
Feedback включает в себя отфильтрованные сигналы положения выходного
звена и ротора двигателя, а также их производные, то есть скорости. На выход
C_Output приходит требуемое значение момента на выходном валу каждого
шарнира, т.е. на упругом элементе, для отработки заданной траектории.
Рисунок 28 – Блок Arm
На рисунке 28 вход ArmInput содержит значения требуемого крутящего
момента, блок обратной связи MotionPhysicalFeedback содержит физическую
информацию,
а
не
неотфильтрованными
сигнал
и
с
датчиков,
мгновенными.
то
Выход
есть
значения
ArmState
являются
соответствует
первичному сигналу датчиков положения ротора и шарнира.
Математическая модель шарниров включает в двигатель, редуктор и
упругий элемент, которые рассматривались ранее в главе 2.
4.2 Отслеживание траектории
Рассмотрим случай условно «упругого» манипулятора при жёсткости,
заданной вектором значений K=[5000 5000 5000 5000 5000 2000] Н∙м/рад, для
шести шарниров манипулятора соответственно. При этом управляющий сигнал
не строится для последнего седьмого шарнира. Предполагается, что он является
обычным жёстким, так как на нём не ожидаются большие значения момента при
соударениях с внешними объектами в силу кинематических зависимостей.
57
Условимся, что начальное положение манипулятора равно q0 = [15° 45° 15° -60°
30° 15°], и зададимся перемещением всех шарниров на 15°. Конечное положение
будет qf = [0° 60° 0° -75° 15° 30°], при этом время на исполнение перемещения
зададим равным 0,5 с, что соответствует средней скорости 30°/с. При этом
желаемая траектория задаётся с помощью интерполяции данных. Зададимся
целью обеспечить податливый характер поведения манипулятора, для чего
подобраны следующие коэффициенты для ПД-регулятора ускорения: Kp = [1000
1000 1000 1500 2500 4000], а Kd рассчитывается как Kd= 2𝜉 √𝐾𝑝, где 𝜉 = 1.
Стоит отметить, что коэффициент Kp в данном случае имеет физический смысл
виртуальной жёсткости, то есть при активной работе СУ именно он будет
определять статическое отклонение от заданного положения при воздействии
внешней постоянной силы. Данные значения подбираются эмпирически, однако
необходимо учитывать ограничения, налагаемые сверху и снизу, обусловленные
физическими свойствами системы. Так, при слишком больших значениях
коэффициентов система выйдет за пределы устойчивости. При уменьшении
коэффициентов (как и жёсткости самих шарниров), при определённых значениях
под воздействием силы тяжести робот начнёт падать, в то время как регулятор
не сможет обеспечить достаточное быстродействие для противодействия этому.
Исполнение рассчитанных траекторий представлено на рисунках 29. На
графиках видно, что желаемое положение достигается к моменту времени
0,9 с – 1 с, то есть примерно за 0,6 – 0,7 с, что незначительно дольше заданного
времени. При отслеживании траектории отсутствуют колебания, что также
видно на графиках движения. В установившемся же режиме наблюдается
отсутствие статической ошибки. При этом скорость всех шарниров плавно
изменяется и на участке движения не превышает значения в 1 рад/с
(см. рисунок 30). Отклонение от траектории, которое хорошо заметно на
графиках скорости и крутящего момента (см. рисунок 30) в начале
моделирования, обусловлено действием силы тяжести на манипулятор и
процессом натяга пружины двигателем в начальном положении.
58
Рисунок 29 – Отработка заданной траектории 1-ым и 4-ым шарниром
манипулятора
Рисунок 30 – Скорость и крутящий момент на пружине 1-ого и 4-ого шарнира
Можно сделать вывод о том, что разработанная система управления
обеспечивает отработку заданной траектории и стабилизацию заданного
положения.
4.2 Реакция на соударение
Как уже неоднократно упоминалось ранее, одним из преимуществ упругих
шарниров является повышенная ударопрочность. Поэтому далее промоделируем
59
ситуацию, при которой происходит соударение упругого манипулятора с
внешним объектом. Будет рассматриваться случай, при котором на манипулятор
падает шар диаметром 0,1 м и массой 4,2 кг. Заданием в данном случае является
поддержание исходного положения.
Для случая с жёсткостью K = [5000 5000 5000 5000 5000 2000] Н∙м/рад
рассмотрим два варианта: первый будет с теми же коэффициентами, что
рассматривались ранее, для ПД-регулятора, то есть Kp = [1000 1000 1000 1500
2500 4000 10000], а второй – с повышенными значениями Kp = [10000 6000 10000
15000 25000 20000 100000]. Графики положения звеньев для обоих случаев при
ударе приблизительно в t=0,3 с представлены на рисунке 31. Моменты на
упругом элементе представлены на рисунке 32.
По графикам видно, что в момент времени, равный t=0,3 с, появляется
кратковременное воздействие, которое приводит к дестабилизации положения и
движению звеньев. При этом на пружине образуется момент, который
постепенно возвращает шарниры в исходное положение. При повышенных
значениях коэффициентов ПД-регулятора выходные величины приобретают
более колебательный характер с большей амплитудой, но быстрее возвращаются
в исходное положение. То есть, подбирая коэффициенты необходимо искать
компромисс между отклонением от траектории и упругостью, т.е. снижением
ударных сил.
60
Рисунок 30 – Реакция 1-ого и 4-ого шарнира манипулятора на соударение в
момент времени t=0,3
Рисунок 31 – Момент на упругом элементе 1-ого и 4-ого шарнира при
соударении в момент времени t=0,3с
4.3 Сравнение с жёстким манипулятором
Можно предположить, что реакция манипулятора с повышенным
значением жёсткости на случайное внешнее воздействие приведёт к большим
значениям момента на выходном валу, так как динамические характеристики
механики шарниров оказываются недостаточными. Для подтверждения
61
промоделируем ситуацию с ударом при жёсткости K= [50000 50000 50000 50000
5000 2000] Н∙м/рад.
Сравнительный график реакций жёсткого и упругого манипуляторов
представлен на рисунке 32. Моменты на упругом элементе в обоих случаях
представлены на рисунке 33.
Рисунок 32 – Сравнений реакций 1-ого и 4-ого шарнира упругого и жёсткого
манипулятора на соударение с внешним объектом в момент времени t=0,3с
Рисунок 33 – Сравнение моментов 1-ого и 4-ого шарнира упругого и жёсткого
манипулятора при соударении с внешним объектом в момент времени t=0,3 с
62
По графикам видно, что хотя упругие шарниры отклоняются в большей
степени от заданного положения при ударе, однако, моменты на выходном валу
достигаются в два и более раза меньше. Для рассмотренного шарнира предельно
допустимый момент на волновой передаче составляет 459 Н·м. Таким образом,
оба манипулятора в данном случае не выходят за границу работоспособности
передачи, однако, упругий манипулятор имеет более чем трёхкратный запас
надёжности в отличие от жёсткого манипулятора, запас которого около двух.
Если обратиться к рассмотренной ситуации, то упругий манипулятор сможет без
потери работоспособности выдержать падение в два раза более тяжёлого шара,
чем жёсткий.
4.4 Выводы по разделу
В
данном
разделе
была
продемонстрирована
работоспособность
разработанной системы управления, основанной на децентрализованном
подходе.
Манипулятор
отрабатывает
заданную
траекторию
с
удовлетворительной точностью. Применение данного регулятора является
обоснованным, когда удаётся обеспечить достаточное быстродействие на
нижнем уровне. Далее построим централизованную систему управления
манипулятором с упругими шарнирами и сравним два подхода.
63
5
Система
управления
на
основе
регулятора
с
активным
демпфированием
5.1 Построение регулятора
Динамика системы с учётом инерциальных сил и гравитации, и без учёта
трения, записывается следующим образом:
𝑀𝑞̈ + 𝐶𝑞̇ = −𝑔 + 𝐾(𝜃 − 𝑞)
{
𝐵𝜃̈ + 𝐾 (𝜃 − 𝑞) = 𝜏𝑚
(5.1)
В главе 2 рассматривалось построение системы управления отдельным
шарниром путём введения новых координат двигателя для преобразования
объекта управления с целью добавления фиктивного демпфирующего члена со
стороны выходного вала звена. Перенесём данную идею на случай управления
целым манипулятором и перепишем динамику системы через новую
координату – эквивалентный угол поворота двигателя 𝜂:
{
𝑀𝑞̈ + 𝐶𝑞̇ = −𝐷𝑞̇ + 𝐾(𝜂 − 𝑞)
,
𝐵𝜂̈ + 𝐾 (𝜂 − 𝑞) = 𝑢
(5.2)
где u – управляющий сигнал для преобразованного объекта, расчёт
которого может быть выполнен при помощи простого ПД-регулятора:
𝑢 = −𝐾𝑝 (𝜂 − 𝜂𝐷 ) − 𝐾𝐷 𝜂̇ .
(5.3)
Вследствие добавления фиктивного демпфирующего элемента D со
стороны выходного вала звена, из (5.1) и (5.2) можно найти равенство вида
𝐾 (𝜃 − 𝑞) − 𝑔 = 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇ + 𝑛0 .
64
(5.4)
При этом если рассматривается задача стабилизации, то n0 = 0, в случае же
задачи слежения (траекторной задачи):
𝑛0 = 𝑀𝑞̈ 𝑑 (𝑡) + 𝐶𝑞̇ 𝑑 (𝑡).
(5.5)
Далее из (5.4) можно взаимно выразить координаты двигателя 𝜂 и 𝜃:
𝜃 − 𝑞 − 𝐾 −1 𝑔 = 𝜂 − 𝑞 − 𝐾 −1 𝐷𝑞̇ + 𝐾 −1 𝑛0 ,
(5.6)
𝜂 = 𝜃 − 𝐾 −1 (𝑔 − 𝐷𝑞̇ + 𝑛0 ),
(5.7)
𝜃 = 𝜂 + 𝐾 −1 (𝑔 − 𝐷𝑞̇ + 𝑛0 ),
(5.8)
𝜃̇ = 𝜂̇ + 𝐾 −1 (𝑔̇ − 𝐷𝑞̈ + 𝑛1 ),
(5.9)
𝜃̈ = 𝜂̈ + 𝐾 −1 (𝑔̈ − 𝐷𝑞⃛ + 𝑛2 ).
(5.10)
Подстановка (5.8) и (5.10) во второе уравнение системы (5.1) приводит к
уравнению вида
𝐵𝜂̈ + 𝐵𝐾 −1 (𝑔̈ − 𝐷𝑞⃛ + 𝑛2 ) + 𝑔 + 𝐾 (𝜂 − 𝑞) − 𝐷𝑞̇ + 𝑛0 = 𝜏𝑚
(5.11)
Сравнение (5.11) со вторым уравнением системы (5.2) даёт следующее
равенство:
𝑢 = 𝜏𝑚 − 𝐵𝐾 −1 (𝑔̈ − 𝐷𝑞⃛ + 𝑛2 ) − 𝑔 + 𝐷𝑞̇ + 𝑛0 ,
(5.12)
Из которого следует, что полный задающий момент на двигателе
рассчитывается как
65
𝜏𝑚 = 𝑢 + 𝐵𝐾 −1 (𝑔̈ − 𝐷𝑞⃛ + 𝑛2 ) + 𝑔 − 𝐷𝑞̇ − 𝑛0
(5.13)
Подстановка (5.7) в (5.3) позволяет переписать управление u через
исходную координату двигателя, то есть в расчёте на использование только
имеющихся датчиков – датчиков положения (угла поворота) двигателя и
выходного вала:
𝑢 = −𝐾𝑃 (𝜂 − 𝜂𝐷 ) − 𝐾𝐷 𝜂̇ = −𝐾𝑃 (𝜃 − 𝐾 −1 (𝑔 − 𝐷𝑞̇ + 𝑛0 ) − 𝜂𝐷 ) −
−𝐾𝐷 (𝜃̇ − 𝐾 −1 (𝑔̇ − 𝐷𝑞̈ + 𝑛1 )) = 𝑢1 + 𝑢2 ,
Для
упрощения
построения
управляющего
сигнала
(5.15)
пренебрежём
слагаемыми 𝑛0 , 𝑛1 и 𝑛2 , допустимость чего будет проверена экспериментально.
При этом также пренебрежём слагаемым с первой производной по гравитации,
данное допущение является оправданным в случае предположения, что сила
тяжести изменяется достаточно медленно. Тогда можно записать
𝑢1 = 𝐾𝑃 (𝜂𝐷 − 𝜃) + 𝐾𝑝 𝐾 −1 𝑔 − 𝐾𝑃 𝐾 −1 𝐷𝑞̇ ,
𝑢2 = −𝐾𝐷 𝜃̇ + 𝐾𝐷 𝐾 −1 𝑔̇ − 𝐾𝐷 𝐾 −1 𝐷𝑞̈ =−𝐾𝐷 𝜃̇ − 𝐾𝐷 𝐾 −1 𝐷𝑞̈ .
(5.16)
(5.17)
Тогда для выполнения желаемой команды необходимо обеспечить
следующий крутящий момент двигателя:
𝜏𝑚 = 𝑢1 + 𝑢2 − 𝐵𝐾 −1 𝐷𝑞⃛ + 𝐵𝐾 −1 𝑔̈ + 𝑔 − 𝐷𝑞̇
(5.18)
Приравняем к нулю также и вторую производную по силе тяжести. В
результате управляющий сигнал, т.е. задающий момент двигателя будет
рассчитываться как
66
𝜏𝑚 = 𝑢1 + 𝑢2 − 𝐵𝐾 −1 𝐷𝑞⃛ + 𝑔 − 𝐷𝑞̇ .
(5.19)
5.2 Статическая ошибка
Перепишем систему (5.2) с учётом управляющего сигнала (5.15)
𝑀𝑞̈ + 𝐶𝑞̇ = −𝐷𝑞̇ + 𝐾(𝜂 − 𝑞)
{
(5.20)
𝐵𝜂̈ + 𝐾 (𝜂 − 𝑞) = 𝐾𝑃 (𝜂𝐷 − 𝜃) + 𝐾𝑝 𝐾 −1 𝑔 − 𝐾𝑃 𝐾 −1 𝐷𝑞̇ − 𝐾𝐷 𝜃̇ − 𝐾𝐷 𝐾 −1 𝐷𝑞̈
Для определения статической ошибки в установившемся режиме
необходимо обнулить все производные и решить оставшуюся систему, найдя
зависимость q от 𝜂𝐷 . Тогда систему (5.20) можно переписать следующим
образом:
0 = 𝐾(𝜂 − 𝑞)
{
𝐾 (𝜂 − 𝑞) = 𝐾𝑃 (𝜂𝐷 − 𝜃) + 𝐾𝑃 𝐾 −1 𝑔
(5.21)
С учётом равенства нулю производных моторная координата (5.8) будет
равна
𝜃 = 𝜂 + 𝐾 −1 𝑔
(5.22)
𝜃 = 𝑞 + 𝐾 −1 𝑔
(5.23)
Поскольку 𝜂 = 𝑞, то
Из (5.21) и (5.23) следует, что
𝐾𝑃 (𝜂𝐷 − 𝑞 − 𝐾 −1 𝑔) + 𝐾𝑃 𝐾 −1 𝑔 = 0
(5.25)
𝜂𝐷 − 𝑞 − 𝐾 −1 𝑔 + 𝐾 −1 𝑔 = 0
67
(5.26)
𝑞 = 𝜂 = 𝜂𝐷
(5.27)
Таким образом, было показано, что в установившемся режиме
наблюдается нулевая статическая ошибка, так как реальное значение угла
поворота выходного звена равно заданному.
5.3 Выводы по разделу
В данном разделе был рассмотрен принцип построения позиционной
системы управления по централизованной схеме на основе регулятора с
активным демпфированием (РАД). Во втором разделе данный подход был
применён к отдельному шарниру, здесь же идея была распространена на
управление всем манипулятором. Для упрощения построения регулятора был
введён ряд допущений, оправданность которых будет определена из результатов
экспериментов, приведённых в последующих разделах. Основным критерием
достаточности является успешное демпфирование колебаний и отсутствие
статической
ошибки, а также соответствие процессов демпфирования
задаваемым параметрам.
68
6
Экспериментальное
исследование
манипулятора
с
централизованной системой управления
Для анализа качества разработанной системы управления, необходимо
проверить, справляется ли регулятор с отработкой заданной траектории, а также
каково при этом быстродействие системы. Кроме того, необходимо оценить,
какой вклад вносит слагаемое с третьей производной по углу поворота
выходного звена и как влияет шум на выходной сигнал датчиков. Для проверки
надёжности системы проводится эксперимент с соударением с внешним
объектом, а также сравнение реакции на соударение с классическим жёстким
исполнением манипулятора.
Условимся,
что
начальное
положение
манипулятора
равно
q0 = [15° -45° 15° -45° 30° 15° 15°]. Зададимся перемещением всех шарниров на
15°, тогда конечное положение – qf = [0° -60° 0° -30° 15° 30° 30°]. Время на
исполнение перемещения зададим такое же, как и для децентрализованного
управления, то есть равным 0,5 с, что соответствует средней скорости 30°/с.
Желаемая траектория задаётся с помощью интерполяции данных. Конечная и
начальная конфигурация манипулятора представлена на рисунке 34 а,б.
а) – начальная конфигурация манипулятора, б) – конечная конфигурация
манипулятора
Рисунок 34 – Исходная и конечная конфигурация манипулятора при
отработке заданной траектории
69
Модель манипулятора с РАД-регулятором, построенная в пакете Simulink,
аналогична модели манипулятора с разработанной децентрализованной
системой управления. Их различие заключается только в применяемом
регуляторе, а также в блоке вычисления второй и третьей производной по углу
поворота выходного звена для случая централизованной схемы (в составе блока
соответствующего фильтра).
6.1 Вклад слагаемых с третьей производной в управляющий сигнал
В управляющем сигнале разработанной централизованной системы
управления присутствует слагаемое с третьей производной по положению
выходного звена:
𝑢3 = −𝐵𝐷𝑞⃛.
(6.1)
Так как взятие третьей производной может вызвать существенные
трудности на реальных шарнирах, следует проверить величину данной
составляющей управления относительно полного сигнала управления с точки
зрения полезного вклада. Последнее означает, что вклад по шуму не
представляет интереса. В случае, если данный сигнал окажется относительно
малым, им можно будет пренебречь в последующих экспериментах. Поэтому
далее рассмотрим три варианта условно «мягкого» манипулятора при жёсткости,
заданной векторами значений K=[500 500 500 500 500 500] Н∙м/рад, K=[2000
2000 2000 2000 2000 1000] Н∙м/рад и K=[5000 5000 5000 5000 5000 2000] Н∙м/рад
соответственно для каждого из шарниров манипулятора. При этом управляющий
сигнал не строится для последнего седьмого шарнира. Предполагается, что он
является обычным жёстким, так как на нём не ожидаются большие значения
момента при соударениях с внешними объектами в силу кинематических
зависимостей. Для дальнейшего упрощения описания поведения системы при
различных значениях жёсткости введём следующие условные наименования:
70
малая, средняя и повышенная жёсткость соответственно для трёх векторов
значений жёсткости.
Промоделируем для каждого набора значений жёсткости K следующий
набор ситуаций:
– отслеживание отработки заданной траектории при полном управляющем
сигнале;
– отслеживание отработки заданной траектории без учёта слагаемого u3
при построении управляющего сигнала u.
При этом моделирование проводится без наложения шума, поскольку, если
вкладом u3 в идеализированной ситуации можно пренебречь, то им также можно
пренебречь в условиях наложения шума от датчиков на выходное положение
звена.
Отработка заданной траектории шарнирами по полному управляющему
сигналу, а также без учёта u3 при малой жёсткости представлена на рисунке 35.
Графики отклонения показывают разность между фактической траекторией
шарнира в случае, когда учитывается слагаемое с третьей производной u3, и
траекторией шарнира в случае, когда этим слагаемым пренебрегают. По
графикам разницы положения видно, что слагаемое с третьей производной u3
вносит незначительный вклад, так как отклонение положения от траектории,
построенной в случае полного управляющего сигнала, не превышает 4∙10-3 рад, а
на участке слежения (от 0,1 с) – не превышает 10-3 рад.
71
Рисунок 35 – Влияние u3 при отработке траектории при малой жёсткости
На рисунках 36 и 37 представлена отработка заданной траектории и
разница положения при средней и повышенной жёсткости соответственно.
Рисунок 36 – Влияние u3 при отработке траектории при средней жёсткости
72
Рисунок 37 – Влияние u3 при отработке траектории при повышенной жёсткости
Как видно по графикам, в случае средней и повышенной жёсткости
отклонение траектории без учёта u3 от траектории, построенной по полному
управляющему сигналу, не превышает 1,2∙10-3 рад.
Таким образом, можно сделать вывод, что вклад слагаемого (6.1) с третьей
производной угла поворота выходного звена невелик, поэтому им можно
пренебречь для упрощения построения полного управляющего сигнала u. В
последующих экспериментах эта составляющая не учитывается.
6.2 Отслеживание траектории
Промоделируем следование заданной траектории при наложении шума на
выходной сигнал, что в большей степени приблизит ситуацию к реальной. Шум
датчика положения ротора двигателя в пересчёте на биты равен 216=65535. Шум
датчика положения выходного звена в пересчёте на биты – 219=524288. Для
определения общих закономерностей влияния на качество системы её
параметров, таких как механическая и виртуальная жёсткость, здесь и далее
рассмотрим три варианта задания механической жёсткости и два – виртуальной.
Кроме того, как было показано в разделе 6.1, пренебрежём слагаемым с третьей
производной.
73
Прежде всего рассмотрим влияние шума на управляющий сигнал при
различных значениях жёсткости. Для этого сравним построенную траекторию
при идеальном выходном сигнале с траекторией, рассчитанной при наложении
шума. Как видно по графикам на рисунках 38, 39 и 40 отклонение при малой
жёсткости не превышает 10-4 рад, при средней – 4∙10-6 и при повышенной – 10-5.
Это свидетельствует о незначительном влиянии шума на сигнал и соответствует
требованиям регулятора.
Рисунок 38 – Расхождение результатов моделирования по углу поворота
выходного звена шарниров 2 и 4 при наложении шума при малой жёсткости
74
Рисунок 39 – Расхождение результатов моделирования по углу поворота
выходного звена шарниров 2 и 4 при наложении шума при средней жёсткости
Рисунок 40 – Расхождение результатов моделирования по углу поворота
выходного звена шарниров 2 и 4 при наложении шума при повышенной
жёсткости
Исполнение рассчитанных траекторий при малой механической жёсткости
и различных значениях виртуальной жёсткости представлено на рисунке 41. По
графикам положения выходного звена видно, что с повышением коэффициента
Kp реальная траектория приближается к желаемой, при этом повышается
75
быстродействие. Однако дальнейшее увеличение Kp может привести к
повышению колебательности системы.
Рисунок 41 – Отработка заданной траектории шарнирами 2 и 4
при малой жёсткости
При отслеживании траектории отсутствуют значительные колебания, что
также видно по графикам скорости и момента (см. рисунок 42-43). Скорость
шарниров при этом плавно изменяется и на участке движения не превышает
значения в 1 рад/с. При этом при увеличении Kp растут и значения скорости и
момента.
76
Рисунок 42 – Скорость и крутящий момент на пружине шарнира 2 при малой
жёсткости
Рисунок 43 – Скорость и крутящий момент на пружине шарнира 4 при малой
жёсткости
Исполнение рассчитанных траекторий при средней механической
жёсткости и различных значениях виртуальной жёсткости представлено на
рисунке 44. Как видно по графикам повышение жёсткоcти привело к общему
повышению быстродействия системы и уменьшению влияния силы тяжести, так
77
как отклонение от траектории стало меньше. При этом также сохраняются те же
тенденции при повышении Kp. Скорость и момент представлены на
рисунках 45, 46.
Рисунок 44 – Отработка заданной траектории шарнирами 2 и 4 при средней
жёсткости
Рисунок 45 – Скорость и крутящий момент на пружине шарнира 2 при средней
жёсткости
78
Рисунок 46 – Скорость и крутящий момент на пружине шарнира 2 при средней
жёсткости
Исполнение рассчитанных траекторий при повышенной жёсткости
представлено на рисунке 47. Как и в двух предыдущих случаях наблюдается
повышение быстродействия с ростом виртуальной жёсткости. Скорость и
момент представлены на рисунках 48, 49.
Рисунок 47 – Отработка заданной траектории шарнирами 2 и 4 при
повышенной жёсткости
79
Рисунок 48 – Скорость и крутящий момент на пружине 2-ого шарнира при
повышенной жёсткости
Рисунок 49 – Скорость и крутящий момент на пружине шарнира 4 при
повышенной жёсткости
Сравнение траекторий при различных значениях механической жёсткости
и значении Kp=5000 представлено на рисунке 50. Траектории шарниров
80
практически совпадают, это говорит о возможности уменьшения жёсткости с
целью повышения надёжности системы без потери в качестве управления.
Рисунок 50 – Сравнение траектории при различном значении жёсткости
Рисунок 51 представляет отклонение траектории, рассчитаной при малой
и средней жёсткости, от траектории самого жёсткого исполнения. По графикам
видно, что разница угла поворота при малой жёсткости не превышает 0,04 рад,
что примерно равно 2°. Это может свидетельствовать о незначительном
ухудшении отработки заданной траектории при понижении жёсткости при
одновременном повышении надёжности системы.
81
Рисунок 51 – Отклонение траектории при малой и средней жёсткости 2-ого и 4ого шарнира от тракетории, рассчитанной при самом жёстком исполнении
Таким образом, можно сделать вывод о том, что разработанная
централизованная система управления с РАД-регулятором обеспечивает
отработку
заданной
траектории
и
стабилизацию
положения
с
удовлетворительной точностью для различных значений жёсткости. Увеличение
Kp приводит к повышению быстродействия системы. Наличие шума с
амплитудой предполагаемого уровня не приводит к нарушению работы системы
управления.
6.3 Реакция на соударение
Как и в случае децентрализованной системы управления с каскадным
регулятором рассмотрим соударение манипулятора с внешним объектом,
который представляет из себя шар диаметром 0,1 м и имеет массу 4,2 кг. Данный
эксперимент должен показать, какую амортизацию удара способен обеспечить
манипулятор с упругими шарнирами и системой управления, построенной по
централизованной схеме. Заданием манипулятора в данном случае является
поддержание исходного положения. Здесь также рассмотрим различные
значения жёсткости шарниров и коэффициента регулятора Kp.
82
Графики положения звеньев в случае высокой упругости при ударе
приблизительно в t=0,3 с представлены на рисунке 52. Моменты на упругом
элементе представлены на рисунке 53.
По графикам видно, что в момент времени, равный t=0,3 с, появляется
кратковременное воздействие, которое приводит к дестабилизации положения и
движению звеньев, однако, возникающий на пружине момент возвращает
шарниры в исходное положение. При этом для 2-ого шарнира на это требуется
большее время, чем для 4-ого. На рисунке 53 видно, что с повышением
коэффициента Kp увеличивается и момент на пружине, однако возрастает он
незначительно.
Рисунок 52 – Реакция 2-ого и 4-ого шарнира манипулятора на соударение в
момент времени t=0,3 при малой жёсткости
83
Рисунок 53 – Момент на упругом элементе 2-ого и 4-ого шарнира при
соударении в момент времени t=0,3с при малой жёсткости
Графики положения звеньев в случае средней упругости при ударе
приблизительно в t=0,3 с представлены на рисунке 54. Моменты на упругом
элементе представлены на рисунке 55. Здесь максимальное быстродействие
достигается при Kp=5000, при этом данный случай имеет и минимальное
отклонение от исходного положения для второго шарнира. Максимальное
значение момента, которое наблюдается в данном случае также имеет второй
шарнир. Кроме того, по графикам видно, что с повышением жёсткости различие
моментов при повышении Kp стало существенно меньше. Это может
свидетельствовать о возможности поднять быстродействие системы, не понижая
её надёжность.
84
Рисунок 54 – Реакция 2-ого и 4-ого шарнира манипулятора на соударение в
момент времени t=0,3 при средней жёсткости
Рисунок 55 – Момент на упругом элементе 2-ого и 4-ого шарнира при
соударении в момент времени t=0,3с при средней жёсткости
Графики положения звеньев в случае повышенной жёсткости при ударе в
t=0,3 с представлены на рисунке 56. Моменты на упругом элементе
85
представлены на рисунке 57. Здесь наблюдаются те же тенденции, что и в ранее
рассмотренных случаях. Повышение Kp в меньшей степени влияет на
увеличение момента.
Рисунок 56 – Реакция 2-ого и 4-ого шарнира манипулятора на соударение в
момент времени t=0,3 при повышенной жёсткости
Рисунок 57 – Момент на упругом элементе 2-ого и 4-ого шарнира при
соударении в момент времени t=0,3с при повышенной жёсткости
86
Сравнивая графики положения (см. рисунки 52, 54 и 56) и момента (см.
рисунки 53, 555и 57), можно заметить, что с повышением жёсткости повышается
быстродействие и уменьшается амплитуда отклонения, однако повышается
частота колебаний и момент на выходном звене при соударении. Моменты же в
случае различных значений виртуальной жёсткости Kp различаются в малой
степени, кроме того, повышение механической жёсткости приводит к
понижению влияния коэффициента Kp на изменения момента на выходном
звене. При средней и повышенной жёсткости моменты практически совпадают.
Это свидетельствует о возможности в достаточно большом диапазоне изменять
виртуальную жёсткость, подстраивая её значение под конкретную задачу, при
этом не теряя в надёжности системы.
6.4 Сравнение с жёстким манипулятором
В случае централизованной системы управления также необходимо
сравнить реакцию условно мягкого и условно жёсткого манипулятора на
соударение с внешним объектом. В качестве жёсткого манипулятора рассмотрим
манипулятор со следующим вектором значений жёсткости K=[10000 50000
10000 50000 2000 2000] Н∙м/рад.
При
соударении
с внешним объектом
желательным поведением
манипулятора является минимальное отклонение от исходного положения до
соударения. Однако приоритетным качеством остаётся минимизация значений
момента, поскольку в случае превышения пиковых значений произойдёт
повреждение хрупких элементов привода. Исходя из этого для определения
общих тенденций в поведении манипулятора при соударении возьмём для
сравнения с жёстким два варианта условно мягкого манипулятора, жёсткость
которых задана следующими векторами значений K=[500 500 500 500 500 500 ]
Н∙м/рад и K=[5000 5000 5000 5000 5000 2000] Н∙м/рад. В качестве виртуальной
жёсткости возьмём значение Kp=5000, поскольку ранее было показано, что в
данном случае манипулятор в меньшей степени отклоняется от заданного
положения.
87
График сравнения угла поворота выходного звена при соударении условно
мягкого манипулятора с малой и с повышенной жёсткостью и жёсткого
манипулятора представлен на рисунке 58. Моменты на упругом элементе
представлены на рисунке 59. По графикам положения видно, что упругие
шарниры, как и ожидалось, отклоняются в большей степени от заданного
положения. Однако в случае жёсткого манипулятора на втором шарнире
достигается момент равный примерно 480 Н∙м, что превышает более чем в 2,5
раза момент, достигнутый упругим шарниром при повышенной жёсткости, и
более чем в 4 раза превышает момент на шарнире при малой жёсткости.
Допустимый же момент на рассматриваемой волновой передаче составляет
459 Н·м. Это свидетельствует о том, что в случае жёсткого манипулятора может
произойти повреждение передачи, в то время как упругий шарнир с повышенной
жёсткостью в данном случае имеет более чем двукратный запас надёжности, а
упругий шарнир с малой жёсткостью – четырёхкратный. Очевидно, что
абсолютные значения будут зависеть от конкретных параметров удара, тем не
менее, сам факт большего запаса надёжности упругих шарниров останется
верным для общего случая удара.
88
Рисунок 58 – Сравнение реакций 2-ого и 4-ого шарнира упругого и жёсткого
манипулятора на соударение с внешним объектом в момент времени t=0,3с
Рисунок 59 – Сравнение моментов 2-ого и 4-ого шарнира упругого и жёсткого
манипулятора при соударении с внешним объектом в момент времени t=0,3 с
89
6.5 Выводы по разделу
Разработанная
централизованная
система
управления
позволяет
демпфировать возникающие колебания и отрабатывать заданные траектории, в
частности для шарниров с особо малой жёсткостью. Это позволяет успешно
использовать упругие шарниры в манипуляторах, наделяя их основным
преимуществом упругости – возможностью амортизировать удары.
90
7 Сравнение каскадного регулятора и регулятора с активным
демпфированием
7.1 Отработка заданной траектории
Результаты
экспериментов,
представленные
в
подразделе
4.1,
подтверждают, что каскадный регулятор способен обеспечить устойчивую
работу системы в диапазоне жёсткости основных шарниров (шарниры с первого
по четвёртый) от 5000 до 50000 Н·м/рад. При более низких значениях,
моментные
регуляторы
шарниров
начинают
показывать
недостаточное
быстродействие для того, чтобы было верно допущение, на основе которого
разработан
каскадный
регулятор.
Строгую
границу
определить
не
представляется возможным по различным причинам:
⎯
шарниры могут иметь различную жёсткость;
⎯
устойчивое движение также зависит от работы датчиков и настройки
фильтров;
⎯
исследование проведено только для одного робота с конкретными
массо-инерционными характеристиками;
⎯
в исследовании предполагается, что на манипуляторе не установлен
инструмент и нет полезного груза;
⎯
не учитывается трение в шарнире.
Тем не менее, можно утверждать, что нижняя граница по жёсткости
существует, и в данном случае она близка к 5000 Н·м/рад, что является
существенной величиной.
При значениях жёсткости более 50000 Н·м/рад теоретические ограничения
отсутствуют, так как быстродействие моментного контура будет расти с
увеличением жёсткости. Однако, также будут расти и собственные частоты
манипуляторов, что начнёт входить в противоречие с работой фильтров. В
данном случае особую роль начинает играть трение, поэтому обоснованные
результаты может дать только исследование на физическом макете. Однако,
стоит отметить, что при значениях жёсткости выше 100000 Н·м/рад манипулятор
91
принято считать жёстким, и для управления в данном случае применяются
соответствующие методы.
В
то
же
время,
результаты
экспериментов,
представленные
в
подразделе 6.2, показывают, что регулятор с активным демпфированием (РАД)
обеспечивает отслеживание траектории при жёсткости основных шарниров от
500 до 5000 Н·м/рад. Благодаря совместному демпфированию минимальный
уровень жёсткости меньше, чем в случае каскадного регулятора. Исследования
на предел по жёсткости снизу не проводилось, однако, стоит отметить два факта.
Во-первых, жёсткость менее 500 Н·м/рад достаточно сложно реализовать
конструктивно, в то время как вызывает вопросы и целесообразность настолько
высоких упругих свойств. Во-вторых, фактическим пределом снизу выступает
необходимость упругого элемента обеспечивать достаточное сопротивление
влиянию силы тяжести, так как при недостаточной жёсткости манипулятор
начнёт падать, меняя конфигурацию быстрее, чем двигатели будут способны
создавать упругий момент.
С повышением жёсткости растут собственные частоты системы, что
затрудняет реализацию фильтров. Вследствие этого, в реальных системах с
шумом реализация данного регулятора будет возможна только до определённых
значений жёсткости. Так как по сравнению с каскадным регулятором требуется
взятие как минимум на одну производную больше (угловое ускорение
выходного вала), то и проблема фильтрации является более острой, в частности,
при упругости основных шарниров 50000 Н·м/рад запаздывание, вносимое
фильтрами, уже приводит к выходу из устойчивости.
В целом, можно отметить, что каскадный регулятор и РАД существенно
отличаются по области применимости, тем не менее, эти области пересекаются.
7.2 Реакция на соударение
Реакция
на
соударение
представляет
интерес
с
двух
позиций:
демпфирование возникающих колебаний и величина моментов, развиваемых на
выходном валу шарнира, т.е. на упругом элементе. С первой позиции регуляторы
обеспечивают решение задачи стабилизации, что является частным случаем
92
задачи слежения. Как было показано ранее, регуляторы успешно решают задачу
слежения каждый в своём диапазоне жёсткости.
Со второй позиции можно отметить несколько закономерностей. Вопервых, момент реакции на удар определяется в первую очередь механическими
характеристиками,
что
подтверждается
результатами
экспериментов
в
подразделах 4.3 и 6.4, и в случае манипуляторов с упругими шарнирами момент
реакции оказывается существенно ниже. Во-вторых, при применении РАД,
вследствие реализации совместного управления, моменты реакции в достаточно
малой степени зависят от выбранных коэффициентов виртуальной жёсткости, в
то время как в случае каскадного регулятора момент реакции значительно растёт
с ростом коэффициента (рисунки 53, 55, 57 и 31 соответственно). Данный факт
позволяет в случае РАД адаптировать виртуальную упругость под нужды
текущей задачи практически без изменений в показателях качества. В-третьих,
РАД позволяет управлять более упругими манипуляторами, чем каскадный
регулятор, которые в свою очередь обеспечивают ещё меньшие моменты
реакции, что также можно отнести к преимуществам РАД.
Таким образом, РАД более пригоден для управления манипуляторами в
случае, когда требуется обеспечить минимизацию моментов шарниров при
реакции на удары для повышения надёжности применения манипулятора.
7.3 Выводы по разделу
Оба разработанных регулятора обладают своими ограничениями, которые
определяют области их применения. Сравнение регуляторов позволило
определить преимущества и недостатки одного перед другим. В целом,
манипуляторы с упругими шарнирами могут быть управляемы при помощи
предложенных регуляторов в широком диапазоне жёсткости шарниров.
93
ЗАКЛЮЧЕНИЕ
При выполнении работы было достигнуто несколько целей. Во-первых,
разработан
позиционный
регулятор
шарнира
на
основе
активного
демпфирования, обеспечивающий устойчивость и отсутствие статической
ошибки в задаче слежения, а также методика настройки (выбора коэффициентов)
регулятора. Настройка сводится к назначению двух параметров, имеющих
понятный физический смысл: виртуальной жёсткости и коэффициента
сверхдемпфирования. Первый позволяет адаптировать регулятор под нужды
конкретной задачи, второй позволяет настроить баланс между минимизацией
времени переходного процесса и гладкостью движения, то есть степенью
демпфирования колебаний.
Ко второй цели работы относилось исследование и разработка системы
управления (регулятора) для манипулятора, состоящего из упругих шарниров.
При этом в зависимости от значений жёсткости шарниров лучшие свойства
могут показывать различные типы регуляторов. В настоящей работе предложены
два типа регуляторов, на основе централизованного и децентрализованного
подхода соответственно.
Децентрализованный регулятор представляет из себя иерархическую
структуру, в которой каждый шарнир воспринимается как идеальный источник
крутящего момента. Применение данного регулятора оправдано, когда удаётся
обеспечить необходимое быстродействие на нижнем уровне. Его реализация
является более простой, в сравнение с централизованной схемой, так как каждый
шарнир настраивается по отдельности, а модель робота на верхнем уровне
упрощается от модели с упругостью до твердотельной, что позволяет
использовать регулятор на основе обратной динамики. Разработанный
децентрализованный регулятор показал устойчивую работу в случае жёсткости
основных шарниров (шарниры 1-4) от 5000 Н·м/рад и выше, при этом с
уменьшением жёсткости качество работы регулятора падает. Для определения
коэффициентов регулятора шарнира необходимо задание двух констант:
постоянной времени шарнира и показателя сверхдемпфирования. Для
94
регулятора верхнего уровня также необходимо задать два параметра:
коэффициент виртуальной жёсткости и показатель сверхдемпфирования. С
повышением значения виртуальной жёсткости при соударении растёт как
отклонение от траектории, так и момент на упругом элементе, при этом шарнир
быстрее возвращается в исходное положение.
Централизованный регулятор более сложен в реализации, так как в нём на
едином, верхнем, уровне учитываются возникающие взаимосвязи между
шарнирами, таким образом, общий регулятор строится с учётом как динамики
твёрдотельной
системы,
так
и
динамики
приводов.
В
качестве
централизованного регулятора построен регулятор на основе активного
демпфирования, являющийся расширением позиционного регулятора упругого
шарнира на случай манипулятора. По сравнению с децентрализованным
регулятором, в данном случае обеспечивается совместное демпфирование, что
позволяет понизить значения виртуальной жёсткости. Было разработано две
модификации регулятора: полная и упрощённая, при этом в последней часть
составляющих приравнены к нулю, что позволило сократить вычисления при
минимальных отклонениях в работе регулятора, не являющихся критичными.
Подтверждена возможность данного регулятора обеспечивать устойчивую
работу в диапазоне жёсткости основных шарниров от 500 до 5000 Н·м/рад.
Дальнейшее уменьшение механической жёсткости не рассмотрено, так как
сложно осуществимо по конструктивным соображениям. С повышением
жёсткости растут собственные частоты системы, что затрудняет реализацию
фильтров. Вследствие этого, в реальных системах с шумом реализация данного
регулятора будет возможна только до определённых значений жёсткости. Для
настройки регулятора необходимо задать два параметра: виртуальную жёсткость
Kp и коэффициент сверхдемпфирования. При этом с повышением Kp растёт
быстродействие системы при различных значениях жёсткости.
Сравнение
манипуляторов
с
упругими
шарнирами
с
жёсткими
манипуляторами в сценарии столкновения с движущимся телом малой массы
показало преимущество первых. Отношение моментов на шарнирах при
95
столкновении составило от 2 до 4 в пользу упругих шарниров, что соответствует
большему запасу прочности и, следовательно, более высокой надёжности
манипуляторов с упругими шарнирами. Было определено, что изменение
коэффициента виртуальной упругости в случае децентрализованного регулятора
существенно влияет на моменты при столкновении, в то время как для
централизованного регулятора влияние коэффициента виртуальной упругости
незначительное. Также стоит отметить, что отклонение от траектории в случае
манипулятора с упругими шарнирами составило около до 2 % и до 5 % для
децентрализованного и централизованного регуляторов соответственно при
нулевой статической ошибке, что допустимо для большинства практических
задач.
Таким образом, была решена проблема управления манипулятором с
упругими шарнирами. Оба предложенных регулятора показали пригодность к
применению в типовых манипуляционных системах с определёнными
допущениями и рекомендациями, поэтому полученные результаты (алгоритмы
управления) могут быть применены при разработке роботов с упругими
шарнирами, предназначенных, в частности, для экстремальных условий.
96
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
1.
Pratt, G. Series elastic actuators [Text] / G. Pratt, M. Williamson //
IEEE/RSJ International Workshop on Intelligent Robots and Systems. – Augest 1995.
– pp. 399–406 vol.1.
2.
ABB Robotics. Application manual SoftMove [Text]/ 2011. – pp. 80.
3.
Bischoff, R. LWR The KUKA-DLR Lightweight Robot arm [Text] /
R. Bischoff et al. // ISR/ROBOTIK, Proceedings for the joint conference of ISR 2010
(41st Internationel Symposium on Robotics), 6th German Conference on Robotics. –
Munich, Germany, 7-9 June 2010.
4.
Grebenstein, M. The DLR hand arm system [Text] // M. Grebenstein et
al. / IEEE International Conference on Robotics and Automation. – 2011.
5.
Barret, E. et al. Mechatronic Design of a Variable Stiffness Robotic Arm
[Text] // E. Barret et al. / IEEE/RSJ International Conference on Intelligent Robots
and Systems (IROS). – 2017.
6.
Paine, N. Actuator Control for the NASA-JSC Valkyrie Humanoid Robot:
A Decoupled Dynamics Approach for Torque Control of Series Elastic Robots [Text]
// N. Paine et al. / Journal of Field Robotics. – 32(3), May 2015.
7.
Bodie, K. ANYpulator: Design and Control of a Safe Robotic Arm [Text]
// K. Bodie, C.D. Bellicose, M. Hutter. / IEEE/RSJ International Conference on
Intelligent Robots and Systems (IROS). – 2016.
8.
Hutter, M. ANYmal - a highly mobile and dynamic quadrupedal robot
[Text] // M. Hutter et al. / IEEE/RSJ International Conference on Intelligent Robots
and Systems (IROS), – 2016.
9.
Gaz, C. Dynamic Identification of the Franka Emika Panda Robot with
Retrieval of Feasible Parameters Using Penalty-based Optimization [Text] // C. Gaz,
M. Cognetti, A. Oliva, P.R. Giordano, A. De Luca. / IEEE Robotics and Automation
Letters. – July 2019, 4 (4), pp.4147- 4154.
10.
Migliore, S.A. Biologically inspired joint stiffness control [Text] //
S. A. Migliore, S.A. E. A. Brown, and S. P. DeWeerth / Proc. of the IEEE/RSJ
International Conference on Intelligent Robots and Systems. – 2005, pp. 4519–4524.
97
11.
Petit, F. State Feedback Damping Control For A Multi DOF Variable
Stiffness Robot Arm [Text] // Florian Petit and Alin Albu-Schaffer / Proceedings –
IEEE International Conference on Robotics and Automation. – 2011.
12.
Tonietti, G. Design and control of a variable stiffness actuator for safe
and fast physicalhuman/robot interaction [Text] // G. Tonietti, R. Schiavi and Bicchi /
Proceedings IEEE international conference on robotics and automation. – 18-22 April
2005. – pp. 528–533.
13.
Palli, G. On the feedback linearization of robots with variable joint
stiffness [Text] // G. Palli, C. Melchiorri and De Luca. / IEEE international conference
on robotics and automation. – 2008. – pp. 1753–1759.
14.
Petit, F. State feedback damping control for a multi dof variable stiffness
robot arm [Text] // F. Petit and Albu-Schaffer / IEEE international conference on
robotics and automation (ICRA). – 2011. – pp. 5561–5567.
15.
Haddadin, S. Kick it like a safe robot: Requirements for2050. [Text] //
S. Haddadin, T. Laue, U. Frese, S. Wolf, A. Albu-Schaeffer and G. Hirzinger / Robotics
and Autonomous Systems. – January 2008. – pp. 761–775.
16.
Garabini, M. Optimality principles in variable stiffness control: The
vsahammer [Text] // M. Garabini, A. Passaglia, F. Belo, P. Salaris and A. Bicchi /
IEEE/RSJ international conference on intelligent robots and systems (IROS). – 2011.
– pp. 3770–3775.
17.
Visser, L. Energy efficient control of robots with variable stiffness
actuators [Text] // L. Visser, R. Carloni and S. Stramigioli / Proceedings of the IFAC
international symposium on nonlinear controlsystems. – 2010.
18.
Grioli, G. Variable stiffness actuators: The user’s point of view [Text] //
G. Grioli, S. Wolf, M. Garabini, M. Catalano, E. Burdet, D. Caldwell, A. Bicchi / The
International Journal of Robotics Research. – 2015. – pp. 727–743.
19.
Spong, M.W. Modeling and Control of Elastic Joint Robots [Text] //
M. W. Spong / Journal of dynamic systems, measurement and control. – 1987.
98
20.
De Luca, A. A general algorithm for dynamic feedback linearization of
robots with elastic joints [Text] // A. De Luca and P. Lucibello / Proceedings IEEE
international conference on robotics and automation. – 1998. – vol. 1, pp. 504–510.
21.
Sardellitti, I. Gain scheduling control for a class of variable stiffness
actuators based on lever mechanisms [Text] // I. Sardellitti, N. Tsagarakis, A. Jafari,
and D. Caldwell / Proceedings IEEE international conference on robotics and
automation. – June 2013. –vol. 29, no. 3, pp. 791–798.
22.
Albu-Schaffer, A. Constructive energy shaping control for a class of
euler-lagrange systems [Text] // A. Albu-Schaffer, C. Ott, and F. Petit / Proceedings
10th Int. IFAC Symp.Robot Control. – 2012. – vol. 45, no. 22, pp. 567–575.
23.
Kopylov, V.M. Development of mechatronic unit with modular design
and increased torque measurement reliability // V.M. Kopylov, I.V. Shardyko, A.A.
Truts, K.A. Volnyakov, D.S. Bobkov / 30th International Scientific and Technical
Conference EXTREME ROBOTICS. –13-15 June 2019.
24.
Keppler, M. A Passivity-Based Approach for Trajectory Tracking and
Link-Side Damping of Compliantly Actuated Robots // M. Keppler, D. Lakatos, C.
Ott, A. Albu-Schäffer / International Conference on Robotics and Automation. – 1621 May 2016.
25.
Corke, P. Robotics, Vision and Control: Fundamental Algorithms In
Matlab, Second Edition (2nd.ed.) / P. Corke // Springer Publishing Company,
Incorporated. – 2017. – p. 697.
26.
Ott, C. Comparison of Adaptive and Nonadaptive Tracking Control Laws
for a Flexible Joint Manipulator // C.Ott, A. Albu-Schaffer and G. Hirzinger /
IEEE/RSJ, Conference on Intelligent Robots and Systems EPFL. – October 2002.
99
Отзывы:
Авторизуйтесь, чтобы оставить отзыв