Обоснование метода решения задачи оптимизации перевозочной работы локомотивов

Justification of the method for solving optimization problem transportation work of locomotives

Аблялимов О.С.

25.09.2020 267

№ 9(78)

10. Информатика, вычислительная техника и управление

Цитировать:

Аблялимов О.С. Обоснование метода решения задачи оптимизации перевозочной работы локомотивов // Universum: технические науки : электрон. научн. журн. 2020. № 9(78). URL: https://7universum.com/ru/tech/archive/item/10699 (дата обращения: 01.11.2024).

Прочитать статью:

АННОТАЦИЯ

Обоснованы основные положения метода динамического пошагового программирования, целью которого является выбор (расчёт) оптимального режима ведения поезда локомотивами в реальных условиях эксплуатации.

ABSTRACT

The main provisions of the method of dynamic step-by-step programming are substantiated, the purpose of which is to select (calculate) the optimal mode of driving a train by locomotives in real operating conditions.

Ключевые слова: исследование, оптимизация, метод, динамическое программирование, решение, выбор, режим, теория, принцип максимума.

Keywords: investigation, optimization, method, dynamic programming, optimality principle, decision, choice, mode, theory, maximum principle.

В работе [1] приводится общая постановка и даётся формулировка задачи оптимизации перевозочной работы локомотивов, в которой с учётом исследований [2] была показана несостоятельность решения этой задачи существующими, классическими математическими методами оптимального управления – динамическое программирование и принцип максимума.

Настоящие исследования направлены на обоснование основных положений принятого автором метода решения поставленной задачи, связанной с оптимизацией перевозочной работы локомотивов.

Решение задачи оптимизации перевозочной работы локомотивов возможно, если выполняется следующая гипотеза 1. Для любой отличной от О₁точки фазового пространства существует оптимальный процесс перехода из точки О_o в точку О₁, который может быть суммой аддитивных оптимальных решений на соответствующих N - шагах оптимизации.

В силу этой гипотезы полагаем возможным вести процесс расчёта сразу не на всём участке, а лишь в пределах соответствующего шага оптимизации (ШО).

В силу сказанного имеем следующее:

В* = В_o + (1)

Выражение (1) проще для реализации, чем условие оптимальности Р. Беллмана [4-6]

В* = В_o + опт (2)

По смыслу условия оптимальности Р. Беллмана требуется от любого достигнутого состояния с полученным В_о, вести далее процесс на всём оставшемся отрезке с оптимальной суммой выигрыша. Оба условия (1) и (2) в принципе обеспечивают решение поставленной задачи, но условие (1) является более простым для выполнения.

Будем также предполагать, что для рассматриваемого объекта выполняется

гипотеза 2. Если в пределах шага оптимизации (ШО) с наличием соответствующих ограничений координат объекта применить одинаковый режим управления, то при различных начальных фазовых состояний объекта в пределах ШО могут достигаться одинаковые конечные состояния.

Гипотеза 2 основана на наличии разной интенсивности изменения фазовых траекторий состояния объекта, для принятого одинакового режима, при неодинаковых начальных состояниях объекта и наличии соответствующих ограничений состояния, конечные состояния объекта в таких случаях всегда будут одинаковыми, что позволяет находить их и при отсутствии данных о начальных координатах объекта. Это служит основанием для выбора величины шага оптимизации ШО.

Использование приведённых выше гипотез облегчает возможность нахождения на шаге оптимизации оптимального управления, так как для такого случая на i - м (текущем шаге) может быть записано такое выражение

(3)

где - условно – оптимальное состояние объекта вначале i + 1-го шага оптимизации;

и - оптимальные траектории вектора объекта и вектора режима на i – м шаге оптимизации.

Выражение (3) вытекает из положения о том, что оптимизация процесса может полностью завершиться на шаге оптимизации, для которого известны оптимальное управления и конечное условно - оптимальное фазовое состояние, что позволяет оптимизировать процесс на всём участке. Отметим, что использование того или иного принципа оптимальности может приводить к выводам об общей направленности решения.

Так, аналитические исследования изыскания возможностей по оптимизации процесса движения поезда на основе принципа максимума [7] привело к выводу о необходимости быстрейшего выхода процесса от начального состояния к ведению процесса с наибольшим выигрышем, а затем уже продолжение его в этих условиях и быстрейший перевод из этого состояния в конечное состояние. Однако такие полезные рекомендации для их реализации требуют применение и соответствующего метода отыскания конкретных решений.

В данной работе задача оптимизации перевозочной работы локомотивов решается нами на основе метода, который условно назван "динамическим пошаговым программированием" (ДПП).

Основные особенности метода ДПП следующие:

1. Шаг оптимизации (ШО) выбирается с учётом возможности осуществления законченной пошаговой оптимизации согласно условию (1).

2. Решение задачи начинается с первых двух по ходу процесса ШО, на которых просчёты выполняют вначале от конца к началу, а затем от начала к концу. Просчёты на i +1-м ШО проводят только от конца к началу ШО и имеют целью выявить условно - оптимальное состояние объекта вначале i + 1-го ШО, к которому на первом i-м ШО стремятся в прямом счёте, и которое будет "желательным" конечным состоянием на i-м шаге оптимизации.

3. В процессе расчётов на шаге оптимизации строят условно - оптимальную траекторию (УОТ) с использованием управления, обеспечивающего получение условно - оптимального выигрыша, от уже известного конечного на i-м ШО "желательного" по условиям ведения процесса на последующем шаге оптимизации состояния .

4. Затем, строят реально - оптимальную траекторию на текущем i-м ШО с возможно быстрейшим переходом на условно - оптимальную траекторию. В результате на каждом ШО используют все возможности ведение процесса как можно ближе к УОТ с выходом на эту траекторию, где удаётся, так как УОТ является условно – экстремальной для некоторых условий ведения процесса.

Учитывая (7) [2] общее решение (3) [3] можно записать

= опт (УФ) - УФ € Р_у (4)

или через функцию управления

= опт (П_о, П_у, П_∆, П_к,…) - n_i € П_д (5)

где:

П_о - управляющий параметр выбора координат вектора объекта;

П_у - управляющий параметр выбора траектории координат вектора объекта;

П_∆,П_к - управляющие параметры выбора траектории режима управления;

П_д - допустимая область параметров управления.

Выявление смыслового содержания указанных управляющих параметров и соответствующего содержания ƒ_у, является главным вопросом метода динамического пошагового программирования (ДПП) и может быть выполнено при рассмотрении конкретной задачи.

Рассмотрим решение задачи оптимизации перевозочной работы локомотивов, в которой необходимо минимизировать функционал

B_i = (6)

где:

Ḃ_t – производная параметра выигрыша B по времени;

Ṡ_t – производная пути по времени (скорость).

Величина производной параметра выигрыша B по времени Ḃ_t = в [V,n_y(S)] – является характеристической функцией объекта (локомотива).

Например, для тепловозов такой характеристикой может быть удельный расход топлива G_т, кг/мин.

Величину производной пути по времени Ṡ_t = V находят решением интеграла

V = (7)

где:

Ṽ_s = - производная скорости по пути;

u - равнодействующая сила, зависящая от скорости и позиции управления;

- некоторый коэффициент пропорциональности.

Решение выражения (7) необходимо производить для любой выбранной траектории управления n_y(S), поэтому получим V[n_y(S)].

Область протекания процесса может иметь ограничения фазовых координат

(8)

При этом индексы «н» и «к» относятся к начальному и конечному значениям; индексы «м» относится к нижнему, а «ог» к верхнему пределам индекс «г» для заданного графиком движения значений; допустимая погрешность времени Δt_т.

Траектории режима управления также ограничены и находятся в некоторой заданной области Р_у, то есть

(9)

Задача оптимизации сводится к получению наибольшего эффекта при условии протекания процесса в области ограниченной условиями (8) и (9), а также обеспечения заданных начальной (О_н) и конечной (О_к) координатах вектора объекта.

В качестве оценки траектории управления выбран функционал (6).

Решение можно свести к следующему выражению

(10)

Для упрощения решения выражения (10) весь процесс на текущем i-м шаге оптимизации расчленим на периоды:

а) рабочего хода, для которого имеем:

ТРХ - траектория рабочего хода с соответствующей траекторией управления n_к(S);

b_р = b_к (V,n_к) + b_сл (n_к) – характеристическая функция при рабочем ходе;

Здесь b_к - характеристика мощности потока параметра В, идущего на внешнюю работу процесса; b_сл - мощность потока параметра В, идущего на служебные нужды;

S_н_i – S_кр - пределы интегрирования, где S_кр - координата конца рабочего хода;

B_р_i = B_к_i + B_сл_i = ds – величина слагаемой параметра B_i для периода рабочего хода.

Здесь: B_к_i - слагаемая, связанная с внешней работой процесса, зависящая от комплекса условий процесса на участке, времени процесса и позиций управления; B_сл_i - слагаемая B_i , зависящая от расходов на служебные нужды;

б) холостого хода, для которого будет:

ТХХ - траектория холостого хода с траекторией управления n_х(S);

b_х = b_сл (n_х) - характеристическая функция для холостого хода;

S_нр – S_кх - пределы интегрирования от конца рабочего хода S_нр до конца холостого хода S_кх;

B_х_i = - слагаемая величины В_i, выявленная за период холостого

хода.

в) торможения:

ТТХ- траектория тормозного хода с траекторией управления n_т(S);

b_т = b_сл (n_т) - характеристическая функция при торможении;

S_кх – S_к_i – пределы интегрирования от конца холостого хода S_кх до конца шага оптимизации (S_к_i );

B_т_i = – слагаемая величины В_i, выявленная на участке торможения.

Для рассматриваемого шага оптимизации получим:

реально - оптимальную траекторию;

РОТ = ТРХ + ТХХ + ТТХ (11)

пределы интегрирования;

S_н_i – S_к_i = (S_н_i – S_кр) + (S_кр – S_кх) + (S_кх – S_к_i) (12)

возможные значения характеристической функции;

(13)

Параметры выигрыша на шаге оптимизации ШО

В_i = В_к_i + В_сл_i + В_х_i + В_т_i = В_к_i + В_bi (14)

Здесь В_bi = В_сл_i + В_х_i + В_т_i = b₀- слагаемая В_i, зависящая только от времени процесса t при условии принятия b_с = b_сл = b_х = b_т = пост., что обычно имеет место в практических условиях.

Выявление и на шаге оптимизации ШО производится на основании следующих соображений.

Анализируя ход процессов можно заметить, что В_х_i > 0, В_т_i ≥ 0, В_к_i ≥ 0.

В случаях, когда В_к_i = 0 и В_т_i = 0 будет наименьшая величина параметра В – min B = В⁰_i = В_х_i.

Величина В_х_i реализуется для условно – оптимальной траектории (УОТ), построенной при n_х(S) = пост., которая является единственной траекторией при этом. Построение УОТ производится в направлении обратном ходу процесса. Для i+1-го ШО строят УОТ_i₊₁ от некоторой конечной координаты S_к_n до известной начальной S_н_i₊₁ и определяют фазовую координату объекта , которой обычно является скорость . Построения УОТ_i₊₁ позволяют выявить единственную условно - оптимальную начальную для i+1-го ШО координату , при которой обеспечивается получение наибольшего выигрыша и на последующем i+1-м ШО, а следовательно и на двух смежных шагах оптимизации ШО, что является достаточным основанием для выполнения расчётов по выражению (1).

Построение УОТ_i₊₁ позволит определить и протяжённость соответствующего ШО, точнее предел интегрирования S_к_i₊₁ = S_к_n по условию

dS = пост. (n = 1,…,i+1) (15)

Если дополнительно соблюдается также условие выбора некоторой начальной скорости (координаты)

V_ум(S_к_n) ≤ V⁰_к_n(S_к_n) ≤ V^ог(S_к_n) (16)

Последовательно принимая S_к_n = S₁, S₂… и производя расчёты по (15) для двух значений и , можно найти такое значение , при котором будет соблюдаться условия (16). Соблюдение условия (16) вполне достижимо при наличии ограничений (8), а также ведении процесса при неизменном режиме n_х(S) = пост. Выполнение описанного порядка расчётов позволяет выявить и число шагов оптимизации ШО на участке счёта, то есть автоматически разделить весь участок счёта на N шагов.

Найденная координата принимается как желательная конечная на i-м ШО, то есть = . От значения затем, производят все расчёты по определению В^*_i и Р^*_т_i. УОТ_i строят на i-м шаге оптимизации ШО при различных значениях управляющей скорости и различных сочетаниях позиций траекторий управления для рабочего хода n_к(S), выбор которых производился следующим порядком.

Величина В_к_i пропорциональна реализуемой мощности N_к, которая зависит от позиции управления n_к, выбираемой в переделах от наименьшей n^min_к до наибольшей возможной позиции контролера машиниста n^max_к, при этом выбор n_к следует производить исходя из условия достижения наибольшего коэффициента полезного действия (к.п.д.) преобразования слагаемой В_к_i во внешнюю работу процесса, что выразим условием

max η_B = max , € (17)

где F_к_n - касательная сила тяги, развиваемая локомотивом при данной текущей скорости V_n и позиции контролера машиниста n_к. Величина F_к_n определяется выражением в виде полинома F_к_n = для каждой позиции контроллера машиниста;

- соответствующая характеристическая функция при рабочем ходе, определяемая обычно выражением вида b_к_n =.

Зная текущее значение , можно найти при всех возможных величинах F_к_n и b_к_n ту позицию n_к, для которой будем иметь наибольшее значение η_B.

Обычно число позиций ограничено и составляют 10 - 15 позиций (тепловозы) и 20 - 30 позиций (электровозы), что позволяет указанный выбор производить на ЭВМ в практически приемлемое время.

Выбранная траектория n_к(S) оказывает влияние на предел интегрирования S_кр, а также и на время t процесса, поэтому указанный процесс выбора n_к(S) по max η_B следует также регулировать изменением нижнего или верхнего передела значений позиций контроллера машиниста, а именно:

= и = (18)

где - величина изменения позиций (обычно = 1-2 позиции).

Условие (17) распространяется только на участках ТРХ, а условие (18) на участки ТРХ и ТХХ. Общее регулирование процесса на ШО производится путём изменения управляющей скорости , являющейся нижним пределом значений скорости при построении УОТ. Значение принимаются в пределах ÷ , через выбранный интервал изменения , который также можно регулировать для повышения точности расчётов.

От выбранного значения зависят характер УОТ на ШО, пределы интегрирования S_кр и S_кх, время процесса t, соотношение слагаемых В_к_i и В_bi, а также соотношение траекторий управления n_к(S), n_х(S) и n_т(S).

Учитывая вышеизложенное, выражение (10) можно записать в виде ступенчатой оптимизации процессов на шаге оптимизации методом динамического пошагового программирования, а именно:

Уравнение (19) является частным случаем общего выражения ступенчатой оптимизации процессов на ШО методом динамического пошагового программирования, которое уже учитывает возможности оптимизации не только отдельных слагаемых (14), но и их общей суммы, но и оптимизацию также сумм смежных членов величины В, то есть оптимизацию сумм В_р_i + В_х_i и В_к_i + В_т_i

(19)

Здесь - опт' - n_к_s(S) € , опт'' - € Р_у, опт''' – V_у € V_ум – V^ог.

(20)

Здесь - опт° - П_т € П_Δх, опт°° - П_х € П_Δх, опт°°° - П_Δх € Р_у, опт' - П_х € П_Δр, опт'' - П_к € П_Δр, опт''' - П_Δр € Р_у, опт'''' - П_у € О_м - О^ог

где:

П_у - управляющий параметр выбора траектории объекта;

П_Δр и П_Δх - управляющие параметры выбора пределов изменения позиций рабочего П_Δр и холостого П_Δх режимов для возможных сочетаний сумм В_р_i + В_х_i и В_к_i + В_т_i и выражения (14);

П_к, П_х, П_т - соответствующие управляющие параметры выбора режимов рабочего, холостого и тормозного периодов.

В практических условиях нередко слагаемые В_к_i и В_т_i определяются по одной характеристике объекта b_c, = пост., что имеется и при решении задач оптимизации перевозочной работы локомотивов, в связи с чем, в дальнейшем будет использовано выражение (19).

В результате проведённых исследований обоснованы основные положения предлагаемого метода решения задач оптимизации – метод динамического пошагового программирования, посредством которого можно будет получить оптимальные режимы ведения поезда в реальных условиях эксплуатации.

Список литературы:

Аблялимов О. С. О решении задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10676 (дата обращения: 30.08.2020).
Аблялимов О. С. К методу решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10675 (дата обращения: 30.08.2020).
Аблялимов О.С. К формулировке математических методов оптимальных решений [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10667 (дата обращения: 28.08.2020).
Беллман Р. Динамическое программирование [Текст] / Р. Беллман. - М.: Иностранная литература, 1960, 400 с.
Беллман Р. Прикладные задачи динамического программирования (перевод с английского Лурье К. А.) [Текст] / Р. Беллман, С. Дрейфус. - М.: Наука, 1965, 460 с.
Вентцель Е. С. Элементы динамического программирования [Текст] / Е. С. Вентцель. - М.: Наука, 1964, 176 с.
Hozh Peter «Ȕber die Auwendung des Maximum Prinzips von Pontrjagin zur Ermittlung von Algorithmen fȕr line energie optimule Zugstouerung». Wissz Hochsch. Verkehrsn Dusden, 1971, 18 № 4, 919 - 934 (немец.). Экспресс информация «Техническая эксплуатация подвижного состава и тяга поездов», № 29, 9.VIII.1972.

Информация об авторах

Аблялимов Олег Сергеевич

канд. техн. наук, профессор, профессор кафедры Локомотивы и локомотивное хозяйство, Ташкентский государственный транспортный университет, Узбекистан, г. Ташкент

Oleg Ablyalimov

Doctor of philosophy, professor, professor of the chair Loсomotives and locomotive economy, Tashkent state transpоrt university, Uzbekistan, Tashkent