Обоснование метода решения задачи оптимизации перевозочной работы локомотивов

Justification of the method for solving optimization problem transportation work of locomotives
Цитировать:
Аблялимов О.С. Обоснование метода решения задачи оптимизации перевозочной работы локомотивов // Universum: технические науки : электрон. научн. журн. 2020. № 9(78). URL: https://7universum.com/ru/tech/archive/item/10699 (дата обращения: 26.09.2021).
Прочитать статью:

 

АННОТАЦИЯ

Обоснованы основные положения метода динамического пошагового программирования, целью которого является выбор (расчёт) оптимального режима ведения поезда локомотивами в реальных условиях эксплуатации.

ABSTRACT

The main provisions of the method of dynamic step-by-step programming are substantiated, the purpose of which is to select (calculate) the optimal mode of driving a train by locomotives in real operating conditions.

 

Ключевые слова: исследование, оптимизация, метод, динамическое программирование, решение, выбор, режим, теория, принцип максимума.

Keywords: investigation, optimization, method, dynamic programming, optimality principle, decision, choice, mode, theory, maximum principle.

 

В работе [1] приводится общая постановка и даётся формулировка задачи оптимизации перевозочной работы локомотивов, в которой с учётом исследований [2] была показана несостоятельность решения этой задачи существующими, классическими математическими методами оптимального управления – динамическое программирование и принцип максимума.

Настоящие исследования направлены на обоснование основных положений принятого автором метода решения поставленной задачи, связанной с оптимизацией перевозочной работы локомотивов.

Решение задачи оптимизации перевозочной работы локомотивов возможно, если выполняется следующая гипотеза 1. Для любой отличной от О1 точки фазового пространства существует оптимальный процесс перехода из точки Оo в точку О1, который может быть суммой аддитивных оптимальных решений на соответствующих N - шагах оптимизации.

В силу этой гипотезы полагаем возможным вести процесс расчёта сразу не на всём участке, а лишь в пределах соответствующего шага оптимизации (ШО).

В силу сказанного имеем следующее:

В* = Вo                                                                      (1)

Выражение (1) проще для реализации, чем условие оптимальности Р. Беллмана [4-6]

В* = Вo + опт                                                                 (2)

По смыслу условия оптимальности Р. Беллмана требуется от любого достигнутого состояния с полученным Во, вести далее процесс на всём оставшемся отрезке с оптимальной суммой выигрыша. Оба условия (1) и (2) в принципе обеспечивают решение поставленной задачи, но условие (1) является более простым для выполнения.

Будем также предполагать, что для рассматриваемого объекта выполняется

гипотеза 2. Если в пределах шага оптимизации (ШО) с наличием соответствующих ограничений координат объекта применить одинаковый режим управления, то при различных начальных фазовых состояний объекта в пределах ШО могут достигаться одинаковые конечные состояния.

Гипотеза 2 основана на наличии разной интенсивности изменения фазовых траекторий состояния объекта, для принятого одинакового режима, при неодинаковых начальных состояниях объекта и наличии соответствующих ограничений состояния, конечные состояния объекта в таких случаях всегда будут одинаковыми, что позволяет находить их и при отсутствии данных о начальных координатах объекта. Это служит основанием для выбора величины шага оптимизации ШО.

Использование приведённых выше гипотез облегчает возможность нахождения на шаге оптимизации оптимального управления, так как для такого случая на i - м (текущем шаге) может быть записано такое выражение

                                                   (3)

где  - условно – оптимальное состояние объекта вначале i + 1-го шага оптимизации;

 и  - оптимальные траектории вектора объекта и вектора режима на i – м шаге оптимизации.

Выражение (3) вытекает из положения о том, что оптимизация процесса может полностью завершиться на шаге оптимизации, для которого известны оптимальное управления и конечное условно - оптимальное фазовое состояние, что позволяет оптимизировать процесс на всём участке. Отметим, что использование того или иного принципа оптимальности может приводить к выводам об общей направленности решения.

Так, аналитические исследования изыскания возможностей по оптимизации процесса движения поезда на основе принципа максимума [7] привело к выводу о необходимости быстрейшего выхода процесса от начального состояния к ведению процесса с наибольшим выигрышем, а затем уже продолжение его в этих условиях и быстрейший перевод из этого состояния в конечное состояние. Однако такие полезные рекомендации для их реализации требуют применение и соответствующего метода отыскания конкретных решений.

В данной работе задача оптимизации перевозочной работы локомотивов решается нами на основе метода, который условно назван "динамическим пошаговым программированием" (ДПП).

Основные особенности метода ДПП следующие:

1. Шаг оптимизации (ШО) выбирается с учётом возможности осуществления законченной пошаговой оптимизации согласно условию (1).

2. Решение задачи начинается с первых двух по ходу процесса ШО, на которых просчёты выполняют вначале от конца к началу, а затем от начала к концу. Просчёты на i +1-м ШО проводят только от конца к началу ШО и имеют целью выявить условно - оптимальное состояние объекта вначале i + 1-го ШО, к которому на первом i-м ШО стремятся в прямом счёте, и которое будет "желательным" конечным состоянием на i-м шаге оптимизации.

3. В процессе расчётов на шаге оптимизации строят условно - оптимальную траекторию (УОТ) с использованием управления, обеспечивающего получение условно - оптимального выигрыша, от уже известного конечного на i-м ШО "желательного" по условиям ведения процесса на последующем шаге оптимизации состояния  .

4. Затем, строят реально - оптимальную траекторию на текущем i-м ШО с возможно быстрейшим переходом на условно - оптимальную траекторию. В результате на каждом ШО используют все возможности ведение процесса как можно ближе к УОТ с выходом на эту траекторию, где удаётся, так как УОТ является условно – экстремальной для некоторых условий ведения процесса.

Учитывая (7) [2] общее решение (3) [3] можно записать

 = опт (УФ) - УФ € Ру                                                   (4)

или через функцию управления

= опт  (По, Пу, П, Пк,…) - ni € Пд                                       (5)

где:

По - управляющий параметр выбора координат вектора объекта;

Пу - управляющий параметр выбора траектории координат вектора объекта;

Пк - управляющие параметры выбора траектории режима управления;

Пд - допустимая область параметров управления.

Выявление смыслового содержания указанных управляющих параметров и соответствующего содержания ƒу, является главным вопросом метода динамического пошагового программирования (ДПП) и может быть выполнено при рассмотрении конкретной задачи.

Рассмотрим решение задачи оптимизации перевозочной работы локомотивов, в которой необходимо минимизировать функционал

Bi =                                                                (6)

где:

t производная параметра выигрыша B по времени;

t производная пути по времени (скорость).

Величина производной параметра выигрыша B по времени t = в [V,ny(S)] – является характеристической функцией объекта (локомотива).

Например, для тепловозов такой характеристикой может быть удельный расход топлива Gт, кг/мин.

Величину производной пути по времени tV находят решением интеграла

V =                                                            (7)

где:

s =  - производная скорости по пути;

u - равнодействующая сила, зависящая от скорости и позиции управления;

 - некоторый коэффициент пропорциональности.

Решение выражения (7) необходимо производить для любой выбранной траектории управления ny(S), поэтому получим V[ny(S)].

Область протекания процесса может иметь ограничения фазовых координат                                             

                                                 (8)

 

При этом индексы «н» и «к» относятся к начальному и конечному значениям; индексы «м» относится к нижнему, а «ог» к верхнему пределам индекс «г» для заданного графиком движения значений; допустимая погрешность времени Δtт.

Траектории режима управления также ограничены и находятся в некоторой заданной области Ру, то есть

                                                (9)

Задача оптимизации сводится к получению наибольшего эффекта при условии протекания процесса в области ограниченной условиями (8) и (9), а также обеспечения заданных начальной (Он) и конечной (Ок) координатах вектора объекта.

В качестве оценки траектории управления выбран функционал (6).

Решение можно свести к следующему выражению

 

                                (10)

 

Для упрощения решения выражения (10) весь процесс на текущем i-м шаге оптимизации расчленим на периоды:

а) рабочего хода, для которого имеем:

ТРХ - траектория рабочего хода с соответствующей траекторией управления nк(S);

bрbк (V,nк) + bсл (nк) – характеристическая функция при рабочем ходе;

Здесь bк - характеристика  мощности потока параметра В, идущего на внешнюю работу процесса; bсл - мощность потока параметра В, идущего на служебные нужды;

SнiSкр - пределы интегрирования, где Sкр - координата конца рабочего хода;

Bрi = Bкi + Bслi = ds – величина слагаемой параметра Bi для периода рабочего хода.

Здесь: Bкi - слагаемая, связанная с внешней работой процесса, зависящая от комплекса условий процесса на участке, времени процесса и позиций управления; Bслi - слагаемая Bi , зависящая от расходов на служебные нужды;

б) холостого хода, для которого будет:

ТХХ - траектория холостого хода с траекторией управления nх(S);

bхbсл (nх)  - характеристическая функция для холостого хода;

SнрSкх - пределы интегрирования от конца рабочего хода Sнр до конца холостого хода Sкх;

Bхi =  - слагаемая величины Вi, выявленная за период холостого

хода.

в) торможения:

ТТХ- траектория тормозного хода с траекторией управления nт(S);

bтbсл (nт) - характеристическая функция при торможении;

SкхSкi – пределы интегрирования от конца холостого хода Sкх до конца шага оптимизации (Sкi );

Bтi =  – слагаемая величины Вi, выявленная на участке торможения.

Для рассматриваемого шага оптимизации получим:

реально - оптимальную траекторию;

РОТ = ТРХ + ТХХ + ТТХ                                                                       (11)

пределы интегрирования;

SнiSкi = (SнiSкр) + (SкрSкх) + (SкхSкi)                                                   (12)

возможные значения характеристической функции;

                                                                       (13)

Параметры выигрыша на шаге оптимизации ШО

Вi = Вкi + Вслi + Вхi + Втi = Вкi + Вbi                                                        (14)

Здесь ВbiВслi + Вхi + Втi = b0- слагаемая Вi, зависящая только от времени процесса t при условии принятия bс = bсл = bх = bт = пост., что обычно имеет место в практических условиях.

Выявление  и на шаге оптимизации ШО производится на основании следующих соображений.

Анализируя ход процессов можно заметить, что Вхi > 0, Втi ≥ 0, Вкi ≥ 0.

В случаях, когда Вкi = 0 и Втi = 0 будет наименьшая величина параметра Вmin B = В0i = Вхi.

Величина Вхi реализуется для условно – оптимальной траектории (УОТ), построенной при nх(S) = пост., которая является единственной траекторией при этом. Построение УОТ производится в направлении обратном ходу процесса. Для i+1-го ШО строят УОТi+1 от некоторой конечной координаты Sкn  до известной начальной Sнi+1 и определяют фазовую координату объекта , которой обычно является скорость . Построения  УОТi+1 позволяют выявить единственную условно - оптимальную начальную для i+1-го ШО координату , при которой обеспечивается получение наибольшего выигрыша и на последующем i+1-м ШО, а следовательно и на двух смежных шагах оптимизации ШО, что является достаточным основанием для выполнения расчётов по выражению (1).

Построение УОТi+1 позволит определить и протяжённость соответствующего ШО, точнее предел интегрирования Sкi+1 = Sкn  по условию

 dS = пост.      (n = 1,…,i+1)                              (15)

 

Если дополнительно соблюдается также условие выбора некоторой начальной скорости (координаты)

Vум(Sкn) V0кn(Sкn) Vог(Sкn)                                                   (16)

Последовательно принимая Sкn = S1, S2… и производя расчёты по (15) для двух значений  и , можно найти такое значение , при котором будет соблюдаться условия (16). Соблюдение условия (16) вполне достижимо при наличии ограничений (8), а также ведении процесса при неизменном режиме nх(S) = пост. Выполнение описанного порядка расчётов позволяет выявить и число шагов оптимизации ШО на участке счёта, то есть автоматически разделить весь участок счёта на N шагов.

Найденная координата  принимается как желательная конечная на i-м ШО, то есть  = . От значения  затем, производят все расчёты по определению В*i и Р*тi. УОТi строят на i-м шаге оптимизации ШО при различных значениях управляющей скорости и различных сочетаниях позиций траекторий управления для рабочего хода nк(S), выбор которых производился следующим порядком.

Величина Вкi пропорциональна реализуемой мощности Nк, которая зависит от позиции управления nк, выбираемой в переделах от наименьшей nminк до наибольшей возможной позиции контролера машиниста nmaxк, при этом выбор nк следует производить исходя из условия достижения наибольшего коэффициента полезного действия (к.п.д.) преобразования слагаемой Вкi во внешнюю работу процесса, что выразим условием

max ηB = max  ,  €                             (17)

где Fкn - касательная сила тяги, развиваемая локомотивом при данной текущей скорости Vn и позиции контролера машиниста nк. Величина Fкn определяется выражением в виде полинома Fкn = для каждой позиции контроллера машиниста;

- соответствующая характеристическая функция при рабочем ходе, определяемая обычно выражением вида bкn =.

Зная текущее значение , можно найти при всех возможных величинах Fкn и bкn ту позицию nк, для которой будем иметь наибольшее значение ηB.

Обычно число позиций ограничено и составляют 10 - 15 позиций (тепловозы) и 20 - 30 позиций (электровозы), что позволяет указанный выбор производить на ЭВМ в практически приемлемое время.

Выбранная траектория nк(S) оказывает влияние на предел интегрирования Sкр, а также и на время t процесса, поэтому указанный процесс выбора nк(S) по max ηB следует также регулировать изменением нижнего или верхнего передела значений позиций контроллера машиниста, а именно:

 =  и  =                         (18)

где  - величина изменения позиций (обычно  = 1-2 позиции).

Условие (17) распространяется только на участках ТРХ, а условие (18) на участки ТРХ и ТХХ. Общее регулирование процесса на ШО производится путём изменения управляющей скорости , являющейся нижним пределом значений скорости при построении УОТ. Значение  принимаются в пределах  ÷ , через выбранный интервал изменения , который также можно регулировать для повышения точности расчётов.

От выбранного значения  зависят характер УОТ на ШО, пределы интегрирования Sкр и Sкх, время процесса t, соотношение слагаемых Вкi и Вbi, а также соотношение траекторий управления nк(S), nх(S) и nт(S).

Учитывая вышеизложенное, выражение (10) можно записать в виде ступенчатой оптимизации процессов на шаге оптимизации методом динамического пошагового программирования, а именно:

Уравнение (19) является частным случаем общего выражения ступенчатой оптимизации процессов на ШО методом динамического пошагового программирования, которое уже учитывает возможности оптимизации не только отдельных  слагаемых (14), но и их общей суммы, но и оптимизацию также сумм смежных членов величины В, то есть оптимизацию сумм Врi + Вхi  и Вкi + Втi

             (19)

Здесь - опт' - nкs(S), опт'' -  € Ру, опт''' – VуVумVог.

  (20)

Здесь - опт° - Пт € ПΔх, опт°° - Пх € ПΔх, опт°°° - ПΔх € Ру, опт' - Пх € ПΔр, опт'' - Пк € ПΔр, опт''' - ПΔр € Ру, опт'''' - Пу € Ом - Оог

где:

Пу - управляющий параметр выбора траектории объекта;

ПΔр и ПΔх - управляющие параметры выбора пределов изменения позиций рабочего ПΔр и холостого ПΔх режимов для возможных сочетаний сумм Врi + Вхi  и Вкi + Втi и выражения (14);

Пк, Пх, Пт - соответствующие управляющие параметры выбора режимов рабочего, холостого и тормозного периодов.

В практических условиях нередко слагаемые Вкi и Втi определяются по одной характеристике объекта bc, = пост., что имеется и при решении задач оптимизации перевозочной работы локомотивов, в связи с чем, в дальнейшем будет использовано выражение (19).

В результате проведённых исследований обоснованы основные положения предлагаемого метода решения задач оптимизации – метод динамического пошагового программирования, посредством которого можно будет получить оптимальные режимы ведения поезда в реальных условиях эксплуатации.

 

Список литературы:

  1. Аблялимов О. С. О решении задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10676 (дата обращения: 30.08.2020).
  2. Аблялимов О. С. К методу решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10675 (дата обращения: 30.08.2020).
  3. Аблялимов О.С. К формулировке математических методов оптимальных решений [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10667 (дата обращения: 28.08.2020).
  4. Беллман Р. Динамическое программирование [Текст] / Р. Беллман. - М.: Иностранная литература, 1960, 400 с.
  5. Беллман Р. Прикладные задачи динамического программирования (перевод с английского Лурье К. А.) [Текст] / Р. Беллман, С. Дрейфус. - М.: Наука, 1965, 460 с.
  6. Вентцель Е. С. Элементы динамического программирования [Текст] / Е. С. Вентцель. - М.: Наука, 1964, 176 с.
  7. Hozh Peter «Ȕber die Auwendung des Maximum Prinzips von Pontrjagin zur Ermittlung von Algorithmen fȕr line energie optimule Zugstouerung». Wissz Hochsch. Verkehrsn Dusden, 1971, 18 № 4, 919 - 934 (немец.). Экспресс информация «Техническая эксплуатация подвижного состава и тяга поездов», № 29, 9.VIII.1972.
Информация об авторах

канд. техн. наук, старший научный сотрудник, и.о. профессора кафедры «Локомотивы и локомотивное хозяйство» Ташкентский институт инженеров железнодорожного транспорта, Узбекистан, Ташкент

doctor of philosophy, chief scientific worker, acting professor of the chair «Loсomotives and locomotive economy» Tashkent institute of railway transpоrt engineering, Uzbekistan, Tashkent

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top