इष्टतम नियंत्रण

testwiki से
नेविगेशन पर जाएँ खोज पर जाएँ

इष्टतम नियंत्रण (Optimal control), नियंत्रण की नीति (कन्ट्रोल स्ट्रेटिजी) निर्धारित करने की एक गणितीय इष्टतमीकरण विधि है। यह विचरण-कलन (calculus of variations) का विस्तार है जिसका विकास १९५० के दशक में लेव पोंट्रयागिन ( Lev Pontryagin) तथा रिचर्ड बेलमान (Richard Bellman) ने किया था। इष्टतम नियंत्रण के अनुप्रयोग विविध क्षेत्रों में हो रहे हैं, जैसे- इंजीनियरी, अर्थनीति, जीवविज्ञान, पर्यावरण, वित्त, प्रबन्धन, चिकित्सा आदि।

उदाहरण : सीमित काल

किसी खान मालिक को निर्नय लेना है कि खान से खनिज किस गति से निकाले जांय। उसके पास खनन का स्वामित्व दिनांक 0 से दिनांक T तक है। दिनाक 0 को खान में अयस्क की मात्रा x0 है। अयस्क की वर्तमान मात्रा x(t) उसी गति से घटती जाती है जिस गति u(t) से खनिज निकाला जाता है। खान से अयस्क निकालने का खर्च u(t)2/x(t) है और अयस्क का मूल्य नियतांक p है। समय T पर खान में जो अयस्क बच जाता है उसका कोई मूल्य नहीं रहेगा। खान स्वामी, अपने स्वामित्व काल में अपना लाभ अधिकतम करने के लिये खनन की दर u(t) कैसी रखे?

1. Discrete-time version

The manager maximizes profit Π:

Π=t=0T1[putut2xt]

subject to the law of evolution for the state variable xt

xt+1xt=ut

Form the Hamiltonian and differentiate:

H=putut2xtλt+1ut
Hut=pλt+12utxt=0
λt+1λt=Hxt=(utxt)2

As the mine owner does not value the ore remaining at time T,

λT=0

Using the above equations, it is easy to solve for the xt and λt series

λt=λt+1+(pλt+1)24
xt+1=xt2p+λt+12

and using the initial and turn-T conditions, the xt series can be solved explicitly, giving ut.

2. Continuous-time version

The manager maximizes profit Π:

Π=0T[pu(t)u(t)2x(t)]dt

subject to the law of evolution for the state variable x(t)

x˙(t)=u(t)

Form the Hamiltonian and differentiate:

H=pu(t)u(t)2x(t)λ(t)u(t)
Hu=pλ(t)2u(t)x(t)=0
λ˙(t)=Hx=(u(t)x(t))2

As the mine owner does not value the ore remaining at time T,

λ(T)=0

Using the above equations, it is easy to solve for the differential equations governing u(t) and λ(t)

λ˙(t)=(pλ(t))24
u(t)=x(t)pλ(t)2

and using the initial and turn-T conditions, the functions can be solved to yield

x(t)=(4pt+pT)2(4+pT)2x0

इन्हें भी देखें

साँचा:आधार