Butun axtardiqlarinizi tapmaq ucun buraya: DAXIL OLUN
  Mp4 Mp3 Axtar Yukle
  Video Axtar Yukle
  Shekil Axtar Yukle
  Informasiya Melumat Axtar
  Hazir Inshalar Toplusu
  AZERI CHAT + Tanishliq
  1-11 Sinif Derslikler Yukle
  Saglamliq Tibbi Melumat
  Whatsapp Plus Yukle(Yeni)

  • Ana səhifə
  • Təsadüfi
  • Yaxınlıqdakılar
  • Daxil ol
  • Nizamlamalar
İndi ianə et Əgər Vikipediya sizin üçün faydalıdırsa, bu gün ianə edin.

Bellman tənliyi

  • Məqalə
  • Müzakirə

Riçard E. Bellmanın adını daşıyan Bellman tənliyi dinamik proqramlaşdırma kimi tanınan riyazi optimallaşdırma metodu ilə əlaqəli optimallıq üçün zəruri şərtdir.[1] Bellman tənliyi, müəyyən bir zaman nöqtəsində qərar probleminin "dəyərini" bəzi ilkin seçimlərdən əldə edilən gəlir və həmin ilkin seçimlərdən yaranan qalan qərar probleminin "dəyəri" baxımından yazır.[2]

Bellman axını diaqramı (optimallaşdırmanın asandlaşdırılması)

Əsas koməyi uzun-dövrdə baş verən qərarı iki vaxt perioduna, bugünə və sabaha bölür. Beləliklə gələcəkdə baş verəcək qərarları həll etməkdə asand bir yanaşma inkişaf elətdirir. Bellman tənliyi konsepsional olaraq çətin görünən gələcək qərarı sadələşdirərək həllinə kömək edir.

Bellmanın “optimallıq prinsipi”nin (principle of optimality) təyin etdiyi kimi, dinamik optimallaşdırma problemini daha sadə alt problemlər ardıcıllığına bölür.[3] Bellman tənliyi əvvəlcə mühəndislik idarəetmə nəzəriyyəsinə və tətbiqi riyaziyyatın digər mövzularına tətbiq olunub. Sonralar iqtisadi nəzəriyyədə mühüm alətə çevrilib. "Bellman tənliyi" termini adətən diskret vaxtlı optimallaşdırma problemləri ilə əlaqəli dinamik proqramlaşdırma tənliyinə (DPE) istinad edir.[4] Davamlı zamanın optimallaşdırılması məsələlərində analoji tənlik qismən diferensial tənlikdir və Hamilton-Jacobi-Bellman tənliyi adlanır.[5][6]

Mündəricat

  • 1 Riyazi izah
    • 1.1 Dinamik qərar problemi
    • 1.2 Bellman tənliyi
  • 2 İqtisadiyyatda tətbiqlər
  • 3 İstinadlar

Riyazi izah

Dinamik qərar problemi

Bellman tənliyi əsasən, sonsuz üfüqlü qərar problemini iki vaxt perioduna bölərək həll edir, bugün və sabah. Sabah bütün gələcəyi nəzərə alır. Aşağıdakı formanı alır:

V ( x 0 ) := max { a t } t = 0 ∞ ∑ t = 0 ∞ β t F ( x t , a t ) , {\displaystyle V(x_{0})\;:=\;\max _{\left\{a_{t}\right\}_{t=0}^{\infty }}\sum _{t=0}^{\infty }\beta ^{t}F(x_{t},a_{t}),}   (1)

məhdudiyyətlərə tabedir

a t ∈ Γ ( x t ) , x t + 1 = T ( x t , a t ) , ∀ t = 0 , 1 , 2 , … {\displaystyle a_{t}\in \Gamma (x_{t}),\;x_{t+1}=T(x_{t},a_{t}),\;\forall t=0,1,2,\dots }  

Tənlik (1)-də verilmiş problemi olduğu kimi analitik həll etmək çox çətindir. Hər bir yeni vaxt periodunda yenidən həll olunmalıdır, çünki maksimizasiya a t ∀ t = 0 , 1 , 2 , … {\displaystyle a_{t}\forall t=0,1,2,\dots }   formasındadır. Bellman tənliyi bu problemi zaman perspektivindən iki hissəyə bölür. a 0 {\displaystyle a_{0}}   (bugün) və a t ∀ t = 1 , 2 , … {\displaystyle a_{t}\forall t=1,2,\dots }   (sabah və bütün gələcək). İndi isə bu prosesi addım-addım göstərək. Beləliklə, təkcə a 0 {\displaystyle a_{0}}   seçimini edərək tənlik (1)-i həll edə biləcəyik.[7][8]

Eyni problemi biraz fərqli şəkildə izah edək. Fərz edək ki, x 1 = T ( x 0 , a 0 ) {\displaystyle x_{1}=T(x_{0},a_{0})}   və x 0 {\displaystyle x_{0}}  , a 0 {\displaystyle a_{0}}   bizim ilk dövrdə olan seçimlərimizdir. Həmin yeni dövlət 1-ci vaxtdan etibarən qərar probleminə təsir edəcək. Bütün gələcək qərar problemi sağdakı kvadrat mötərizədə görünür.

V ( x 0 ) = max a 0 { F ( x 0 , a 0 ) + β [ max { a t } t = 1 ∞ ∑ t = 1 ∞ β t − 1 F ( x t , a t ) : a t ∈ Γ ( x t ) , x t + 1 = T ( x t , a t ) , ∀ t ≥ 1 ] } {\displaystyle V(x_{0})=\max _{a_{0}}\left\{F(x_{0},a_{0})+\beta \left[\max _{\left\{a_{t}\right\}_{t=1}^{\infty }}\sum _{t=1}^{\infty }\beta ^{t-1}F(x_{t},a_{t}):a_{t}\in \Gamma (x_{t}),\;x_{t+1}=T(x_{t},a_{t}),\;\forall t\geq 1\right]\right\}}   (2)

məhdudiyyətlərə tabedir

a 0 ∈ Γ ( x 0 ) , x 1 = T ( x 0 , a 0 ) . {\displaystyle a_{0}\in \Gamma (x_{0}),\;x_{1}=T(x_{0},a_{0}).}  

Fikir verin ki, problemi hər bir yeni vaxtda eyni formada həll etmək çox və qeyri-optimaldır. Tənlik (2) heç də asand həll olunmur. Bellman tənliyi formasında isə dəfələrlə sadələşdirilir. Beləliklə, Bellman tənliyini bir riyazi alqoritm alqoritm olaraq da fikirləşmək olar.

Bellman tənliyi

İndiyə qədər biz bugünkü qərarı gələcək qərarlardan ayırmaqla problemi daha da çətinləşdirmişdik. Bellman tənliyi, əvvəlki tənliyi sadələşdirərək həll etməkdir. İndi, x 1 = T ( x 0 , a 0 ) {\displaystyle x_{1}=T(x_{0},a_{0})}   və x 1 {\displaystyle x_{1}}   bütün gələcək qərarları bir araya toplayır. Bugün verdiyimiz qərar ilə sabahkı qərarı müqayisə edirik. Beləliklə, sabah ilə nəzərdə tutduğumuz bütün gələcək qərarları bir araya toplayır.

Əvvəlki qeyd etdiyimiz problem dəyər funksiyasının rekursiv tərifi kimi yenidən yazıla bilər:

V ( x 0 ) = max a 0 { F ( x 0 , a 0 ) + β V ( x 1 ) } {\displaystyle V(x_{0})=\max _{a_{0}}\{F(x_{0},a_{0})+\beta V(x_{1})\}}  , (3)
məhdudiyyətlərə tabedir: a 0 ∈ Γ ( x 0 ) , x 1 = T ( x 0 , a 0 ) . {\displaystyle a_{0}\in \Gamma (x_{0}),\;x_{1}=T(x_{0},a_{0}).}  

Tənlik (3)-də göstərilən zaman alt yazıları atıldıqda və növbəti vəziyyətin dəyəri qoşulduqda, daha da sadələşdirilə bilər:

V ( x ) = max a ∈ Γ ( x ) { F ( x , a ) + β V ( T ( x , a ) ) } . {\displaystyle V(x)=\max _{a\in \Gamma (x)}\{F(x,a)+\beta V(T(x,a))\}.}   (4)

V ( x ) {\displaystyle V(x)}   Bellman tənliyidir. V ( x ) {\displaystyle V(x)}   formasında maximizasiya problemini bir qərar ilə həll etmiş oluruq. Məsələn, burdakı dəyər funksiyasını tapmaq üçün əlin-sağ-tərəfində olan hissədə maximizasiya problemini həll edirik. Problem artıq sadələşdiyi üçün, bu maksimizasiya artıq asandca tapıla bilər.

Bellman tənliyi konsepsional olaraq çətin görünən gələcək qərarı sadələşdirərək həllinə kömək edir.

İqtisadiyyatda tətbiqlər

Bellman tənliyinin iqtisadiyyatda hərtərəfli istifadə olunur. Bugün əsasən makroiqtisadi problemlərin həllində istifadə olunur.

Nensi Stokey, Robert E. Lukas və Edvard Preskott stoxastik və qeyri-stoxastik dinamik proqramlaşdırmanı mükəmməlləşdirərək yeni-nəsil iqtisadçılara kitablarında təqdim edirlər. Bellman tənliyi optimal iqtisadi artım, resurs hasilatı, prinsipal agent problemləri, dövlət maliyyəsi, biznes investisiyası, aktivlərin qiyməti, faktor təchizatı və sənaye təşkili daxil olmaqla, iqtisadiyyatda nəzəri problemlərin geniş spektrini həll etmək üçün istifadə olunur.[9]

İstinadlar

  1. ↑ Dixit, Avinash K. Optimization in Economic Theory (2nd). Oxford University Press. 1990. səh. 164. ISBN 0-19-877211-4.
  2. ↑ "Bellman's principle of optimality". www.ques10.com. İstifadə tarixi: 2023-08-17.
  3. ↑ Kirk, Donald E. Optimal Control Theory: An Introduction. Prentice-Hall. 1970. səh. 55. ISBN 0-13-638098-0.
  4. ↑ Kirk, 1970
  5. ↑ Kamien, Morton I.; Schwartz, Nancy L. Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management (Second). Amsterdam: Elsevier. 1991. səh. 261. ISBN 0-444-01609-0.
  6. ↑ Kirk, 1970
  7. ↑ Kamien, Morton I.; Schwartz, Nancy L. Dynamic Optimization: The Calculus of Variations and Optimal Control in Economics and Management (Second). Amsterdam: Elsevier. 1991. səh. 261. ISBN 0-444-01609-0.
  8. ↑ Kirk, 1970
  9. ↑ Miranda, Mario J.; Fackler, Paul L. Applied Computational Economics and Finance. MIT Press. 2004. ISBN 978-0-262-29175-0.
Mənbə — "https://az.wikipedia.org/w/index.php?title=Bellman_tənliyi&oldid=8041787"
Informasiya Melumat Axtar