Алгоритмизация задачи оптимизации перевозочной работы локомотивов на основе метода динамического пошагового программирования

Algorithmization of the optimization problem of the locomotives transportation work on the based dynamic step-by-step programming method
Аблялимов О.С.
Цитировать:
Аблялимов О.С. Алгоритмизация задачи оптимизации перевозочной работы локомотивов на основе метода динамического пошагового программирования // Universum: технические науки : электрон. научн. журн. 2020. 10(79). URL: https://7universum.com/ru/tech/archive/item/10771 (дата обращения: 22.12.2024).
Прочитать статью:

 

АННОТАЦИЯ

Предложены алгоритм решения задачи оптимизации, опираясь на метод динамического пошагового программирования и основные положения его реализации. Обосновано преимущество метода динамического пошагового программирования по сравнению с другими, существующими, аналогичными математическими методами и принципами оптимального управления.

ABSTRACT

An algorithm for solution the optimization problem is proposed, based on the method of dynamic step-by-step programming and the main provisions of its implementation. The advantage of the method of dynamic step-by-step programming in comparison with other existing similar mathematical methods and principles of optimal control is substantiated.

 

Ключевые слова: алгоритм, решение, задача, локомотив, перевозочная работа, вариант работы, шаг оптимизации, процесс, траектория, условно-оптимальный, реально-оптимальный, идеально-оптимальный, метод.

Keywords: algorithm, solution, problem, locomotive, transportation work, work option, optimization step, process, trajectory, conditionally optimal, real-optimal, ideal-optimal, method.

 

Для нахождения значений параметра выигрыша  надо соответствующим образом подбирать величины шага оптимизации (ШО), в пределах которого необходимо будет получить законченный процесс оптимизации, что осуществляется при использовании метода динамического пошагового программирования (ДПП), о чем уже говорилось в исследованиях [1-3].

На шаге оптимизации ШО, используя условно - оптимальную позицию работы (nх), можно построить, начиная от конечного состояния Ск в обратном направлении, идеально - оптимальную траекторию (ИОТ), обеспечивающую выявление "идеального" состояния объекта в начале шага  и получение идеального выигрыша (рис. 1).

 

Рисунок 1. Схема решения задачи оптимизации методом динамического пошагового программирования

 

В реальных условиях ведения процесса, при наличии соответствующих ограничений значений координат O, строят условно - оптимальную траекторию, обеспечивающую достижение возможного условно - оптимального выигрыша Bо и желательного в данных реальных условиях условно - оптимального начального состояния . Такие построения УОТ делают, как на текущем i-м шаге оптимизации ШО, так и на последующем i+1-м шаге оптимизации ШО. Последнее имеет целью выявить только "желательное" состояние , при этом построение можно начинать от любого возможного состояния в конце i + 1-ого шага оптимизации ШО в виду того, что при наличии ограничений значений координат объекта, принятие произвольного возможного значения  не оказывает влияния на результаты полученного значения , если процесс вести при неизменном режиме nх. Заметим, что шаг оптимизации ШО; при этом должен быть достаточной протяженности, то есть выбран с учётом вышеуказанных обстоятельств. В подавляющих случаях за шаг оптимизации ШО можно брать расстояние между раздельными пунктами (перегон), что удобно также из - за необходимости учёта времени хода поезда по перегонам участка железной дороги.

Построение реально - оптимальной траектории (РОТ) и выявление оптимального управления  на i-м шаге оптимизации ШО производится с учётом скорейшего перехода на УОТ от заданного начального состояния Снi (сам переход должен быть при возможно наивыгоднейшей позиции, обеспечивающий оптимальный режим выхода на УОТ или возможно лучшее приближение реальной траектории к УОТ, если переход на УОТ не представляется возможным). Введение процесса при переходе или приближении к УОТ с использованием наиболее выгодных позиций определяется особенностями конструкции локомотива и условий работы, а также выбором некоторой функции управления fy, которая и регулирует процесс решения.

Важное значение имеет выбор шага оптимизации, то есть участка счёта, на котором можно получить оптимальное аддитивное значение выигрыша  и соответствующую оптимальную траекторию управления . На шаге оптимизации ШО изменяется траектория управления Рт, соответственно, фазовые координаты объекта, включая координату В.

В задачах, где оптимизируются координаты материальной базы процесса Мб и организации работ Ор, выявляется соответствующий участок влияния, оптимизируемой координаты , который называем участком оптимизации (УО), объединяющим ряд шагов оптимизации ШО. Таким образом, участок оптимизации УО может быть и всем участком счёта и железнодорожным направлением, тогда как влияние оптимальной траектории управления  обычно распространяется лишь на соответствующий шаг оптимизации ШО.

Таким образом, на участок оптимизации УО выявление  производится за счёт выбора оптимизируемой координаты  и оптимальной траектории управления .

При оптимизации перегона и оптимизации поездок варианта работы обычно можно принимать за шаг оптимизации ШО – перегон.

Для случаев оптимизации депо, регионального железнодорожного узла и направления, охватывающих пределы работы локомотива от станции прицепки до станции оборота (тяговое плечо) или от станции формирования до станции расформирования поездов, или соответствующие участки выбора профиля пути и т.д., приходится вести процесс оптимизации также и на шаге оптимизации (перегоне). Выбор шага расчёта при оптимизации по границам элементов профиля пути [5], а также выявление возможного состояния на границах шага оптимизации без специальных соображений, как это приходится делать при использовании метода динамического программирования, значительно усложняет все расчёты, о чем уже было сказано выше [4].

В пределах шага оптимизации ШО можно в отдельных случаях выделить ещё шаги сравнения (ШС), что позволяет иногда сократить объём расчётов при выявлении оптимальных траекторий режимов управлений (рис. 1), Крайними траекториями на шагах сравнения ШС будут траектории управления Pт при наименьшей, практически применяемой, позиции  с одной стороны и для наибольшей позиции , с другой.

Выявление оптимального управления  на текущем i -м и последующем i+1-м шагах оптимизации требует знания и конечного состояния , которое должно соответствовать "желательному" начальному состоянию объекта  на последующем i + I - м шаге оптимизации ШО. Это будет обеспечивать  наибольший выигрыш на двух смежных шагах оптимизации ШО.

Для выявления  производят построение условно – оптимальной траектории УОТi+1 на i +1-м шаге оптимизации ШО от некоторого возможного конечного состояния   на i +1-м шаге оптимизации ШО (рис. 1). Условно – оптимальная траектория УОТi+1, строится на шаге оптимизации ШО в обратном направлении с использованием режима, обеспечивающего построение условно - оптимальной траектории и нахождения соответствующего желательного состояния. Построение условно – оптимальной траектории УОТ ведут с использованием позиции nх, которая обеспечивает получение условно - оптимального выигрыша и соответствующего "желательного" начального состояния объекта. Условно – оптимальная траектория УОТ - есть построенная с конца шага оптимизации ШО в обратном направлении условно - оптимальная траектория обратного хода процесса, с учётом соответствующих ограничений состояния и объекта и использования позиции nх.

Позиция nх должна обеспечивать наименьшие затраты энергии и времени, а следовательно и наименьшие расходы, связанные с этими координатами. Обычно nх соответствует позиции холостого хода.

Особенностью принятого в работе метода динамического пошагового программирования является организация расчёта на двух смежных шагах оптимизации, расположенных в начале участка счёта. В указанном методе расчёты на шаге оптимизации производят вначале "обратно", а затем "вперед" (рис. 1). Расчёты на шаге оптимизации "обратно" дают возможность при известном Скi или намеченном   получить условно - оптимальную траекторию, которая обеспечивает протекание процесса с наибольшим выигрышем в каждом случае и выявление наивыгоднейшего (желательного) состояния объекта в начале шага оптимизации. При заданном (известном) начальном состоянии Сн организуется процесс в направлении скорейшего достижения и перевода процесса на уже построенную условно - оптимальную траекторию.

В методе динамического программирования расчёты начинают на шаге оптимизации, расположенном в конце участка, а сами расчёты организуются, как при первом проходе шагов оптимизации с конца участка, так и при втором проходе шагов оптимизации с начала участка, только "вперед", то есть по ходу процесса. При такой организации расчётов неизбежно получение любых конечных состояний Cк1, Ск2 при известном начальном Cн, которое в методе динамического программирования может быть принято любым из возможных исходных состояний объекта на шаге оптимизации расчёта. Конечное состояние объекта известно только в конце участка счёта. Таким образом, в методе динамического программирования выбор лучшего варианта траектории будет связан с просчётами всех возможных состояний объекта для промежуточных шагов оптимизации и необходимостью запоминания огромной промежуточной информации на всем участке счёта, как состояний, так и режимов ведения поезда.

Предложенный метод динамического пошагового программирования исключает это существенное неудобство, так как процесс расчётов проводится на двух смежных шагах оптимизации и порядком отличающимся от применяемого в методе динамического программирования [4].

Полагая, что для решения задачи оптимизации перевозочной работы локомотивов достаточно просмотреть 10 - 12 вариантов по скорости управления Vу (от Vум = 10 до Vог = 80 км/ч через интервал скорости в ΔVу = 10 км/ч с уменьшением интервала скорости ΔVу до 2 - 3 км/ч в зоне нахождения экстремума), 8 - 10 вариантов пределов изменения  -  при дизельной тяге (тепловозах) и 15 - 20 вариантов изменений  -  при электрической тяге (электровозах). Общее максимальное число вариантов просчёта на каждом шаге оптимизации будет достигать приблизительно 200 – 240 раз, что потребует примерно машинного времени 5 - 7 минут на один шаг оптимизации.

При построении условно - оптимальной траектории УОТ и реально - оптимальной траектории РОТ большое значение имеет выбор "нижнего уровня состояния, обычно принимаемого равного выбранной скорости управления Vy. "Верхний" уровень состояния объекта определён обычно ограничением скорости Vог (S), поэтому, выбрав скорость управления Vу, можно получить определенный "коридор" изменения состояния объекта на шаге оптимизации, в значительной степени определяющий траекторию режима управления и координат объекта, в том числе и времени хода по перегонам tп. Меняя значения скорости управления Vу от некоторой наименьшей величины Vум до наибольшей Vог через определенный интервал изменения скорости ΔVу, можно получать соответственно траекторию управления Рт, положение условно - оптимальной траектории УОТ при определённом изменении рабочих позиций прямого хода nк (S) – регулировать выбор реально - оптимальной траектории РОТ по условиям достижения наибольшего выигрыша в при принятых условиях его реализации.

Выбор траектории управления на участках выхода к условно – оптимальной траектории УОТ производится по заранее намеченному порядку, охватывающему все возможные позиции контроллера машиниста от  до  и пределы их колебаний согласно (1.64) [3] с учётом возможности реализации наибольших к.п.д. локомотива (см. формулу 1.63) [3]. В итоге построений получают наиболее полное приближение реального процесса к условно - оптимальному, а следовательно и практически возможному оптимальному решению. Можно получить процесс, в какой - то степени, приближающийся к условно - оптимальной траектории УОТ и чем лучше это приближение, тем эффективнее решение. Говорить о возможности полного достижения условно - оптимальной траектории УОТ или идеально - оптимальной траектории ИОТ практически невозможно. Например, для идеально - оптимальной траектории ИОТ, если за параметр выигрыша В принять расход энергии Е, то можно полагать minЕ = Eв.

Для условно - оптимальной траектории УОТ уже будем иметь , а для реально - оптимальной траектории РОТ практически можно достигнуть величины .

Величина  – есть некоторый расход энергии на касательную механическую работу при достижении условно - оптимальной траектории УОТ.

Основные положения разработанного алгоритма сводятся к следующему.

1. Процесс расчёта делится на циклы, каждый из которых выполняется на двух смежных шагах оптимизации - текущем i–м шаге оптимизации ШО и последующем i +1-м шаге оптимизации ШО, начиная от начала участка. Условия (8) [3] и (15) [3] при решении задач оптимизации перевозочной работы локомотивов, как правило, позволяют принимать протяжённость шага оптимизации ШО равной длине перегонов.

2. Находят условно - оптимальное состояние в начале i+1–го шага оптимизации ШО (перегона) согласно (15) [3], а затем строят условно – оптимальную траекторию УОТi на i – м шаге оптимизации ШО (перегоне) начиная от состояния .

3. При решении (19) [3] на i – м ШО принимают первое значение Vu1, а затем выбирают согласно (1.64) [3] соответствующий предел колебаний  -   и в выбранном пределе  -   на основании (17) [3] выбирают конкретное значение условно-оптимальной траектории режимов рабочего хода (S). В результате для принятого варианта получают некоторое значение выигрыша В11. Затем для нового предела (диапазона)  -   аналогичным порядком находят второе значение выигрыша В12 и т.д.

Из всех найденных значений В11, В12,…выбирают относительно - оптимальный вариант со значением выигрыша , которое запоминают.

Проводя последовательно на i - м шаге оптимизации ШО аналогичные расчёты при разных значениях Vу2, Vу3,…находят соответствующие относительно – оптимальные значения  …,, из которых уже находят абсолютно - оптимальное значение  и соответствующую оптимальную траекторию режима управления  на i-м шаге оптимизации ШО.

4. Переходы от рабочего хода к холостому ходу и от холостого хода к торможению (определение координат пределов интегрирования для каждого периода процесса) находят по условиям:

для нахождения координаты Sкр

                                                                                 (1)

нахождения координаты Sкх

                                                                                 (2)

где  и  - значения скорости для прямого рабочего и холостого хода в рассматриваемом сечении;

 и  - значения скорости для условно - оптимальной траектории скорости движения при торможении, которая строится в обратном ходу процесса направлении на некотором отрезке пути Dт. [6]. Для уточнения отыскания указанных точек перехода соответствующие расчёты проводятся на фиксированном шаге интегрирования уравнения (10) [1], который обычно принимается в пределах hф, = 50 - 100 м. Такие расчёты организуются в пределах длины элемента профиля пути, на котором определилась точка перехода.

5. Касательная работа с наибольшим коэффициентом полезного действия силовой цепи локомотива (ηв) реализуется согласно (17) [3].

Значение коэффициента полезного действия ηв силовой цепи локомотива на текущем hк шаге интегрирования уравнения движения поезда зависит от применяемой позиции пк, текущей скорости Vп [пк (S)] (км/ч), силы тяги реализуемой в данный момент Fки {Vn [пк (S)], пк(S)}, (Н, кгс), а также величины потока энергии в силовой цепи локомотива bкп{Vn [пк (S)], пк(S)} (кг/мин) для тепловозов и a - для электровозов.

В каждый момент работы на hп можно найти согласно (1.63) [3] наибольшее значение ηв и соответствующую позицию контроллера машиниста, используя выражение

                                                    (3)

где аЕ - энергетический эквивалент механической работы.

Для тепловозов аЕ = 0,392 · 10-5, для электровозов постоянного тока аЕ = 0,907 · 10-3 и для электровозов перемершего тока аЕ = 0,109 · 10-3.

На основании (3) можно на каждом hn выявлять наибольшее значение ηв и соответствующую позицию пк в зависимости от пути. Необходимые значения Fкn(Vn,пк) и bкn(Vn,пк) находят, используя их выражения через аппроксимирующие полиномы.

Вначале делают выбор позиции пк контроллера машиниста с maxηв для всех значений от  до   Затем, если по ходу расчётов это потребуется, либо нижние значения  увеличивают, то есть берут от + 1 до , а затем от + 2 до  и т.д. Либо уменьшают верхнее значение, то есть берут от  до – 1, затем от  до – 2 и т.д.

Правильный ход процесса выбора пределов определится тенденцией изменения значений параметра выигрыша В.

6. По окончании расчётов первого цикла переходят к расчётам второго, при этом i + 1-й шаг оптимизации ШО первого цикла принимается за i - й шаг оптимизации ШО второго цикла, а последующий будет уже i + 1 – й шаг оптимизации ШО и т.д.

Таким образом, расчёты ведутся на двух смежных шагах оптимизации ШО, что позволяет производить все вычисления на участке счёта без запоминания большой промежуточной информации, а это, в первую очередь, является неоспоримым преимуществом предложенного метода динамического пошагового программирования по сравнению с другими, существующими, математическими методами и принципами оптимального управления.

 

Список литературы:

  1. Аблялимов О. С. К методу решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10697 (дата обращения: 09.09.2020
  2. Аблялимов О. С. О решении задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10698 (дата обращения: 09.09.2020
  3. Аблялимов О. С. Обоснование метода решения задачи оптимизации перевозочной работы локомотивов [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10699 (дата обращения: 09.09.2020
  4. Аблялимов О. С. О решении задачи оптимизации методом динамического программирования [Текст] / О. С. Аблялимов // Universum: технические науки: электрон. научн. журн. 2020. № 9 (78). URL: https://7universum.com/ru/tech/archive/item/10670 (дата обращения: 09.09.2020
  5. Сидельников В. М. Выбор оптимальных режимов управления локомотивом с использованием ЭЦВМ [Текст] / В. М. Сидельников // Научный журнал «Вестник ВНИИЖТ» / Всесоюзный науч-иссл. ин-т. ж-д транспорта. – М.: Трансжелдориздат, 1965, № 2. – С. 52 – 58.
  6. Толкачев А. В. Некоторые вопросы алгоритмизации тяговых расчётов [Текст] / А. В. Толкачёв, С. Г. Упадышева // Тр. ТашИИТ, вып. 55 / Ташкентский ин-т. инж. ж-д транспорта. – Ташкент, 1968. – С. 73 – 81.
Информация об авторах

канд. техн. наук, профессор, профессор кафедры Локомотивы и локомотивное хозяйство, Ташкентский государственный транспортный университет, Узбекистан, г. Ташкент

Doctor of philosophy, professor, professor of the chair Loсomotives and  locomotive economy, Tashkent state transpоrt university, Uzbekistan, Tashkent

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top