где
![]()
В классе всех стратегий наибольший интерес представляют т. н. однородные марковские стратегии, характеризуемые одной функцией а (х) такой, что an (x,..., xn) = a (xn) при всех n = 0, 1,...
Следовательно, критерий оптимальности (или достаточное условие оптимальности) может быть использован для проверки того, что данная однородная марковская стратегия является оптимальной: пусть существуют функции a* = а*(х) и V* = V*(x) такие, что для любого d Î D
0 = f (x, a*(x)) + La*V*£ f (x, d) + LdV*(x)
(Ld = Td – I, I – единичный оператор), тогда V* является ценой (V* = V) и стратегия a* = a*(х) является оптимальной.
Лит.: Ховард Р.-А., Динамическое программирование и марковские процессы, пер. с англ., М. 1964.
А. Н. Ширяев.
Управляемый термоядерный синтез
Управля'емый термоя'дерный си'нтез, процесс слияния лёгких атомных ядер, происходящий с выделением энергии при высоких температурах в регулируемых, управляемых условиях. Скорости протекания термоядерных реакций малы из-за кулоновского отталкивания (см. Кулона закон) положительно заряженных ядер. Поэтому процесс синтеза идёт с заметной интенсивностью только между лёгкими ядрами, обладающими малым положительным зарядом и только при высоких температурах, когда кинетическая энергия сталкивающихся ядер оказывается достаточной для преодоления кулоновского потенциального барьера. В природных условиях термоядерные реакции между ядрами водорода (протонами) протекают в недрах звёзд, в частности во внутренних областях Солнца, и служат тем постоянным источником энергии, который определяет их излучение. Сгорание водорода в звёздах идёт с малой скоростью, но гигантские размеры и плотности звёзд обеспечивают непрерывное испускание огромных потоков энергии в течение миллиардов лет (подробнее см. Термоядерные реакции). С несравненно большей скоростью идут реакции между тяжёлыми изотопами водорода (дейтерием 2H и тритием 3H) с образованием сильно связанных ядер гелия:
Именно названные реакции представляют наибольший интерес для проблемы У. т. с. В особенности привлекательна вторая реакция, сопровождающаяся большим энерговыделением и протекающая со значительной скоростью. Тритий радиоактивен (период полураспада 12,5 лет) и не встречается в природе. Следовательно, для обеспечения работы предполагаемого термоядерного реактора, использующего в качестве ядерного горючего тритий, должна быть предусмотрена возможность воспроизводства трития. С этой целью рабочая зона рассматриваемой системы может быть окружена слоем лёгкого изотопа лития, в котором будет идти процесс воспроизводства
6Li + n ® 3H + 4He.
Вероятность (эффективное поперечное сечение) термоядерных реакций быстро возрастает с температурой, но даже в оптимальных условиях остаётся несравненно меньше эффективного сечения столкновений атомных. По этой причине реакции синтеза должны происходить в полностью ионизованной плазме, нагретой до высокой температуры, где процессы ионизации и возбуждения атомов отсутствуют и дейтон-дейтонные или дейтон-тритонные столкновения рано или поздно завершаются ядерным синтезом.
Удельная мощность термоядерного реактора находится путём умножения числа ядерных реакций, происходящих ежесекундно в единице объёма рабочей зоны реактора, на энергию, выделяющуюся при каждом акте реакции.
Критерий Лоусона. Применение законов сохранения энергии и числа частиц позволяет выяснить некоторые предъявляемые к реактору синтеза общие требования, не зависящие от каких-либо особенностей технологического или конструктивного характера рассматриваемой системы. На рис. 1 изображена принципиальная схема работы реактора. Установка произвольной конструкции содержит чистую водородную плазму с плотностью п при температуре Т. В реактор вводится топливо, например равнокомпонентная смесь дейтерия и трития, уже нагретая до необходимой температуры. Внутри реактора инжектируемые частицы время от времени сталкиваются между собой и происходит их ядерное взаимодействие. Это полезный процесс; одновременно, однако, из реактора уходит энергия за счёт электромагнитного излучения плазмы и из рабочей зоны ускользает некоторая доля «горячих» (обладающих высокой энергией) частиц, которые не успели испытать ядерные взаимодействия. Пусть t – среднее время удержания частиц в реакторе; смысл величины t таков: за время в 1 сек из 1 см3 плазмы в среднем уходит n/t частиц каждого знака. В стационарном режиме в реактор надо ежесекундно инжектировать такое же число частиц (в расчёте на единицу объёма). Для покрытия энергетических потерь подводимое топливо должно подаваться в зону реакции с энергией, превышающей энергию потока ускользающих частиц. Эта дополнительная энергия должна компенсироваться за счёт энергии синтеза, выделяющейся в зоне реакции, а также за счёт частичной рекуперации в стенках и оболочке реактора электромагнитного излучения и корпускулярных потоков. Примем для простоты, что коэффициент преобразования в электрическую энергию продуктов ядерных реакций, электромагнитного излучения и частиц с тепловой энергией одинаков и равен h. Величину (часто называют коэффициент полезного действия (кпд). В условиях стационарной работы системы и при нулевой полезной мощности уравнение баланса энергии в реакторе имеет вид:
h(Po + Pr + Pt) = Pr + Pt, (1)
где Po – мощность ядерного энерговыделения, Pr – мощность потока излучения и Pt – энергетическая мощность потока ускользающих частиц. Когда левая часть написанного равенства делается больше правой, реактор перестаёт расходовать энергию и начинает работать как термоядерная электростанция. При написании равенства (1) предполагается, что вся рекуперированная энергия без потерь возвращается в реактор через инжектор вместе с потоком подводимого нагретого топлива. Величины Ро, Pr и Pt известным образом зависят от температуры плазмы, и из уравнения баланса легко вычисляется произведение
nt = f (T), (2)
где f (T) для заданного значения кпд h и выбранного сорта топлива есть вполне определённая функция температуры. На рис. 2 приведены графики f (T) для двух значений h и для обеих ядерных реакций. Если величины h, достигнутые в данной установке, расположатся выше кривой f (T), это будет означать, что система работает как генератор энергии. При h = 1/3 энергетически выгодная работа реактора в оптимальном режиме (минимум на кривых рис. 2) отвечает условию («критерии Лоусона»):