Алгоритмизация задачи оптимизации перевозочной работы локомотивов на основе метода динамического пошагового программирования

Algorithmization of the optimization problem of the locomotives transportation work on the based dynamic step-by-step programming method

Аблялимов О.С.

25.10.2020 522

10(79)

10. Информатика, вычислительная техника и управление

Цитировать:

Аблялимов О.С. Алгоритмизация задачи оптимизации перевозочной работы локомотивов на основе метода динамического пошагового программирования // Universum: технические науки : электрон. научн. журн. 2020. 10(79). URL: https://7universum.com/ru/tech/archive/item/10771 (дата обращения: 12.03.2026).

Прочитать статью:

АННОТАЦИЯ

Предложены алгоритм решения задачи оптимизации, опираясь на метод динамического пошагового программирования и основные положения его реализации. Обосновано преимущество метода динамического пошагового программирования по сравнению с другими, существующими, аналогичными математическими методами и принципами оптимального управления.

ABSTRACT

An algorithm for solution the optimization problem is proposed, based on the method of dynamic step-by-step programming and the main provisions of its implementation. The advantage of the method of dynamic step-by-step programming in comparison with other existing similar mathematical methods and principles of optimal control is substantiated.

Ключевые слова: алгоритм, решение, задача, локомотив, перевозочная работа, вариант работы, шаг оптимизации, процесс, траектория, условно-оптимальный, реально-оптимальный, идеально-оптимальный, метод.

Keywords: algorithm, solution, problem, locomotive, transportation work, work option, optimization step, process, trajectory, conditionally optimal, real-optimal, ideal-optimal, method.

Для нахождения значений параметра выигрыша надо соответствующим образом подбирать величины шага оптимизации (ШО), в пределах которого необходимо будет получить законченный процесс оптимизации, что осуществляется при использовании метода динамического пошагового программирования (ДПП), о чем уже говорилось в исследованиях [1-3].

На шаге оптимизации ШО, используя условно - оптимальную позицию работы (n_х), можно построить, начиная от конечного состояния С_к в обратном направлении, идеально - оптимальную траекторию (ИОТ), обеспечивающую выявление "идеального" состояния объекта в начале шага и получение идеального выигрыша (рис. 1).

Рисунок 1. Схема решения задачи оптимизации методом динамического пошагового программирования

В реальных условиях ведения процесса, при наличии соответствующих ограничений значений координат O, строят условно - оптимальную траекторию, обеспечивающую достижение возможного условно - оптимального выигрыша B^о и желательного в данных реальных условиях условно - оптимального начального состояния . Такие построения УОТ делают, как на текущем i-м шаге оптимизации ШО, так и на последующем i+1-м шаге оптимизации ШО. Последнее имеет целью выявить только "желательное" состояние , при этом построение можно начинать от любого возможного состояния в конце i + 1-ого шага оптимизации ШО в виду того, что при наличии ограничений значений координат объекта, принятие произвольного возможного значения не оказывает влияния на результаты полученного значения , если процесс вести при неизменном режиме n_х. Заметим, что шаг оптимизации ШО; при этом должен быть достаточной протяженности, то есть выбран с учётом вышеуказанных обстоятельств. В подавляющих случаях за шаг оптимизации ШО можно брать расстояние между раздельными пунктами (перегон), что удобно также из - за необходимости учёта времени хода поезда по перегонам участка железной дороги.

Построение реально - оптимальной траектории (РОТ) и выявление оптимального управления на i-м шаге оптимизации ШО производится с учётом скорейшего перехода на УОТ от заданного начального состояния С_н_i (сам переход должен быть при возможно наивыгоднейшей позиции, обеспечивающий оптимальный режим выхода на УОТ или возможно лучшее приближение реальной траектории к УОТ, если переход на УОТ не представляется возможным). Введение процесса при переходе или приближении к УОТ с использованием наиболее выгодных позиций определяется особенностями конструкции локомотива и условий работы, а также выбором некоторой функции управления f_y, которая и регулирует процесс решения.

Важное значение имеет выбор шага оптимизации, то есть участка счёта, на котором можно получить оптимальное аддитивное значение выигрыша и соответствующую оптимальную траекторию управления . На шаге оптимизации ШО изменяется траектория управления Р_т, соответственно, фазовые координаты объекта, включая координату В.

В задачах, где оптимизируются координаты материальной базы процесса Мб и организации работ Ор, выявляется соответствующий участок влияния, оптимизируемой координаты , который называем участком оптимизации (УО), объединяющим ряд шагов оптимизации ШО. Таким образом, участок оптимизации УО может быть и всем участком счёта и железнодорожным направлением, тогда как влияние оптимальной траектории управления обычно распространяется лишь на соответствующий шаг оптимизации ШО.

Таким образом, на участок оптимизации УО выявление производится за счёт выбора оптимизируемой координаты и оптимальной траектории управления .

При оптимизации перегона и оптимизации поездок варианта работы обычно можно принимать за шаг оптимизации ШО – перегон.

Для случаев оптимизации депо, регионального железнодорожного узла и направления, охватывающих пределы работы локомотива от станции прицепки до станции оборота (тяговое плечо) или от станции формирования до станции расформирования поездов, или соответствующие участки выбора профиля пути и т.д., приходится вести процесс оптимизации также и на шаге оптимизации (перегоне). Выбор шага расчёта при оптимизации по границам элементов профиля пути [5], а также выявление возможного состояния на границах шага оптимизации без специальных соображений, как это приходится делать при использовании метода динамического программирования, значительно усложняет все расчёты, о чем уже было сказано выше [4].

В пределах шага оптимизации ШО можно в отдельных случаях выделить ещё шаги сравнения (ШС), что позволяет иногда сократить объём расчётов при выявлении оптимальных траекторий режимов управлений (рис. 1), Крайними траекториями на шагах сравнения ШС будут траектории управления P_т при наименьшей, практически применяемой, позиции с одной стороны и для наибольшей позиции , с другой.

Выявление оптимального управления на текущем i -м и последующем i+1-м шагах оптимизации требует знания и конечного состояния , которое должно соответствовать "желательному" начальному состоянию объекта на последующем i + I - м шаге оптимизации ШО. Это будет обеспечивать наибольший выигрыш на двух смежных шагах оптимизации ШО.

Для выявления производят построение условно – оптимальной траектории УОТ_i₊₁ на i +1-м шаге оптимизации ШО от некоторого возможного конечного состояния на i +1-м шаге оптимизации ШО (рис. 1). Условно – оптимальная траектория УОТ_i₊₁, строится на шаге оптимизации ШО в обратном направлении с использованием режима, обеспечивающего построение условно - оптимальной траектории и нахождения соответствующего желательного состояния. Построение условно – оптимальной траектории УОТ ведут с использованием позиции n_х, которая обеспечивает получение условно - оптимального выигрыша и соответствующего "желательного" начального состояния объекта. Условно – оптимальная траектория УОТ - есть построенная с конца шага оптимизации ШО в обратном направлении условно - оптимальная траектория обратного хода процесса, с учётом соответствующих ограничений состояния и объекта и использования позиции n_х.

Позиция n_х должна обеспечивать наименьшие затраты энергии и времени, а следовательно и наименьшие расходы, связанные с этими координатами. Обычно n_х соответствует позиции холостого хода.

Особенностью принятого в работе метода динамического пошагового программирования является организация расчёта на двух смежных шагах оптимизации, расположенных в начале участка счёта. В указанном методе расчёты на шаге оптимизации производят вначале "обратно", а затем "вперед" (рис. 1). Расчёты на шаге оптимизации "обратно" дают возможность при известном С_к_i или намеченном получить условно - оптимальную траекторию, которая обеспечивает протекание процесса с наибольшим выигрышем в каждом случае и выявление наивыгоднейшего (желательного) состояния объекта в начале шага оптимизации. При заданном (известном) начальном состоянии С_норганизуется процесс в направлении скорейшего достижения и перевода процесса на уже построенную условно - оптимальную траекторию.

В методе динамического программирования расчёты начинают на шаге оптимизации, расположенном в конце участка, а сами расчёты организуются, как при первом проходе шагов оптимизации с конца участка, так и при втором проходе шагов оптимизации с начала участка, только "вперед", то есть по ходу процесса. При такой организации расчётов неизбежно получение любых конечных состояний C_к1, С_к2 при известном начальном C_н, которое в методе динамического программирования может быть принято любым из возможных исходных состояний объекта на шаге оптимизации расчёта. Конечное состояние объекта известно только в конце участка счёта. Таким образом, в методе динамического программирования выбор лучшего варианта траектории будет связан с просчётами всех возможных состояний объекта для промежуточных шагов оптимизации и необходимостью запоминания огромной промежуточной информации на всем участке счёта, как состояний, так и режимов ведения поезда.

Предложенный метод динамического пошагового программирования исключает это существенное неудобство, так как процесс расчётов проводится на двух смежных шагах оптимизации и порядком отличающимся от применяемого в методе динамического программирования [4].

Полагая, что для решения задачи оптимизации перевозочной работы локомотивов достаточно просмотреть 10 - 12 вариантов по скорости управления V_у (от V_ум = 10 до V^ог = 80 км/ч через интервал скорости в ΔV_у = 10 км/ч с уменьшением интервала скорости ΔV_у до 2 - 3 км/ч в зоне нахождения экстремума), 8 - 10 вариантов пределов изменения - при дизельной тяге (тепловозах) и 15 - 20 вариантов изменений - при электрической тяге (электровозах). Общее максимальное число вариантов просчёта на каждом шаге оптимизации будет достигать приблизительно 200 – 240 раз, что потребует примерно машинного времени 5 - 7 минут на один шаг оптимизации.

При построении условно - оптимальной траектории УОТ и реально - оптимальной траектории РОТ большое значение имеет выбор "нижнего уровня состояния, обычно принимаемого равного выбранной скорости управления V_y. "Верхний" уровень состояния объекта определён обычно ограничением скорости V^ог (S), поэтому, выбрав скорость управления V_у, можно получить определенный "коридор" изменения состояния объекта на шаге оптимизации, в значительной степени определяющий траекторию режима управления и координат объекта, в том числе и времени хода по перегонам t_п. Меняя значения скорости управления V_у от некоторой наименьшей величины V_ум до наибольшей V^ог через определенный интервал изменения скорости ΔV_у, можно получать соответственно траекторию управления Р_т, положение условно - оптимальной траектории УОТ при определённом изменении рабочих позиций прямого хода n_к (S) – регулировать выбор реально - оптимальной траектории РОТ по условиям достижения наибольшего выигрыша в при принятых условиях его реализации.

Выбор траектории управления на участках выхода к условно – оптимальной траектории УОТ производится по заранее намеченному порядку, охватывающему все возможные позиции контроллера машиниста от до и пределы их колебаний согласно (1.64) [3] с учётом возможности реализации наибольших к.п.д. локомотива (см. формулу 1.63) [3]. В итоге построений получают наиболее полное приближение реального процесса к условно - оптимальному, а следовательно и практически возможному оптимальному решению. Можно получить процесс, в какой - то степени, приближающийся к условно - оптимальной траектории УОТ и чем лучше это приближение, тем эффективнее решение. Говорить о возможности полного достижения условно - оптимальной траектории УОТ или идеально - оптимальной траектории ИОТ практически невозможно. Например, для идеально - оптимальной траектории ИОТ, если за параметр выигрыша В принять расход энергии Е, то можно полагать minЕ = E_в.

Для условно - оптимальной траектории УОТ уже будем иметь , а для реально - оптимальной траектории РОТ практически можно достигнуть величины .

Величина – есть некоторый расход энергии на касательную механическую работу при достижении условно - оптимальной траектории УОТ.

Основные положения разработанного алгоритма сводятся к следующему.

1. Процесс расчёта делится на циклы, каждый из которых выполняется на двух смежных шагах оптимизации - текущем i–м шаге оптимизации ШО и последующем i +1-м шаге оптимизации ШО, начиная от начала участка. Условия (8) [3] и (15) [3] при решении задач оптимизации перевозочной работы локомотивов, как правило, позволяют принимать протяжённость шага оптимизации ШО равной длине перегонов.

2. Находят условно - оптимальное состояние в начале i+1–го шага оптимизации ШО (перегона) согласно (15) [3], а затем строят условно – оптимальную траекторию УОТ_i на i – м шаге оптимизации ШО (перегоне) начиная от состояния .

3. При решении (19) [3] на i – м ШО принимают первое значение V_u₁, а затем выбирают согласно (1.64) [3] соответствующий предел колебаний - и в выбранном пределе - на основании (17) [3] выбирают конкретное значение условно-оптимальной траектории режимов рабочего хода (S). В результате для принятого варианта получают некоторое значение выигрыша В₁₁. Затем для нового предела (диапазона) - аналогичным порядком находят второе значение выигрыша В₁₂ и т.д.

Из всех найденных значений В₁₁, В₁₂,…выбирают относительно - оптимальный вариант со значением выигрыша , которое запоминают.

Проводя последовательно на i - м шаге оптимизации ШО аналогичные расчёты при разных значениях V_у2, V_у3,…находят соответствующие относительно – оптимальные значения …,, из которых уже находят абсолютно - оптимальное значение и соответствующую оптимальную траекторию режима управления на i-м шаге оптимизации ШО.

4. Переходы от рабочего хода к холостому ходу и от холостого хода к торможению (определение координат пределов интегрирования для каждого периода процесса) находят по условиям:

для нахождения координаты S_кр

(1)

нахождения координаты S_кх

(2)

где и - значения скорости для прямого рабочего и холостого хода в рассматриваемом сечении;

и - значения скорости для условно - оптимальной траектории скорости движения при торможении, которая строится в обратном ходу процесса направлении на некотором отрезке пути D_т. [6]. Для уточнения отыскания указанных точек перехода соответствующие расчёты проводятся на фиксированном шаге интегрирования уравнения (10) [1], который обычно принимается в пределах h_ф, = 50 - 100 м. Такие расчёты организуются в пределах длины элемента профиля пути, на котором определилась точка перехода.

5. Касательная работа с наибольшим коэффициентом полезного действия силовой цепи локомотива (η_в) реализуется согласно (17) [3].

Значение коэффициента полезного действия η_в силовой цепи локомотива на текущем h_к шаге интегрирования уравнения движения поезда зависит от применяемой позиции п_к, текущей скорости V_п [п_к (S)] (км/ч), силы тяги реализуемой в данный момент F_ки {V_n [п_к (S)], п_к(S)}, (Н, кгс), а также величины потока энергии в силовой цепи локомотива b_кп{V_n [п_к (S)], п_к(S)} (кг/мин) для тепловозов и a - для электровозов.

В каждый момент работы на h_п можно найти согласно (1.63) [3] наибольшее значение η_в и соответствующую позицию контроллера машиниста, используя выражение

(3)

где а_Е - энергетический эквивалент механической работы.

Для тепловозов а_Е = 0,392 · 10^-5, для электровозов постоянного тока а_Е= 0,907 · 10^-3 и для электровозов перемершего тока а_Е= 0,109 · 10^-3.

На основании (3) можно на каждом h_n выявлять наибольшее значение η_в и соответствующую позицию п_кв зависимости от пути. Необходимые значения F_к_n(V_n,п_к) и b_к_n(V_n,п_к) находят, используя их выражения через аппроксимирующие полиномы.

Вначале делают выбор позиции п_к контроллера машиниста с maxη_в для всех значений от до Затем, если по ходу расчётов это потребуется, либо нижние значения увеличивают, то есть берут от + 1 до , а затем от + 2 до и т.д. Либо уменьшают верхнее значение, то есть берут от до – 1, затем от до – 2 и т.д.

Правильный ход процесса выбора пределов определится тенденцией изменения значений параметра выигрыша В.

6. По окончании расчётов первого цикла переходят к расчётам второго, при этом i + 1-й шаг оптимизации ШО первого цикла принимается за i - й шаг оптимизации ШО второго цикла, а последующий будет уже i + 1 – й шаг оптимизации ШО и т.д.

Таким образом, расчёты ведутся на двух смежных шагах оптимизации ШО, что позволяет производить все вычисления на участке счёта без запоминания большой промежуточной информации, а это, в первую очередь, является неоспоримым преимуществом предложенного метода динамического пошагового программирования по сравнению с другими, существующими, математическими методами и принципами оптимального управления.

Список литературы:

Аблялимов О. С. К методу решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10697 (дата обращения: 09.09.2020
Аблялимов О. С. О решении задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10698 (дата обращения: 09.09.2020
Аблялимов О. С. Обоснование метода решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10699 (дата обращения: 09.09.2020
Аблялимов О. С. О решении задачи оптимизации методом динамического программирования [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10670 (дата обращения: 09.09.2020
Сидельников В. М. Выбор оптимальных режимов управления локомотивом с использованием ЭЦВМ [Текст] / В. М. Сидельников // Научный журнал «Вестник ВНИИЖТ» / Всесоюзный науч-иссл. ин-т. ж-д транспорта. – М.: Трансжелдориздат, 1965, № 2. – С. 52 – 58.
Толкачев А. В. Некоторые вопросы алгоритмизации тяговых расчётов [Текст] / А. В. Толкачёв, С. Г. Упадышева // Тр. ТашИИТ, вып. 55 / Ташкентский ин-т. инж. ж-д транспорта. – Ташкент, 1968. – С. 73 – 81.

Информация об авторах

Аблялимов Олег Сергеевич

канд. техн. наук, профессор, профессор кафедры Локомотивы и локомотивное хозяйство, Ташкентский государственный транспортный университет, Узбекистан, г. Ташкент

Oleg Ablyalimov

Doctor of philosophy, professor, professor of the chair Loсomotives and locomotive economy, Tashkent state transpоrt university, Uzbekistan, Tashkent