পিডি-সীমাবদ্ধ অপ্টিমাইজেশনের জন্য অ্যাডমিন্ট পদ্ধতির ব্যয় বোঝা


11

আমি বুঝতে চেষ্টা করছি যে কীভাবে সামঞ্জস্য-ভিত্তিক অপ্টিমাইজেশন পদ্ধতিটি PDE সীমাবদ্ধ অপ্টিমাইজেশনের জন্য কাজ করে। বিশেষত, আমি বুঝতে চেষ্টা করছি কেন ডিজাইনের ভেরিয়েবলগুলির সংখ্যা বড় যেখানে সমস্যাগুলির জন্য অ্যাডমিন্ট পদ্ধতিটি আরও দক্ষ, তবে "সমীকরণের সংখ্যাটি ছোট"।

আমি যা বুঝতে পারি:

নিম্নলিখিত PDE সীমাবদ্ধ অপ্টিমাইজেশন সমস্যা বিবেচনা করুন:

minβ I(β,u(β))s.t.R(u(β))=0

যেখানে I ভেক্টর ডিজাইন ভেরিয়েবল β এবং ফিল্ড ভেরিয়েবল অজানা u (\ বিটা) এর ভেক্টর u(β)যা ডিজাইনের ভেরিয়েবলগুলির উপর নির্ভরশীল, এবং R(u) পিডিইর অবশিষ্টাংশ where

স্পষ্টতই, আমি এবং আর এর প্রথম প্রকারের পরিবর্তনগুলি করতে পারি

δI=Iβδβ+Iuδu

δR=Rβδβ+Ruδu=0

ল্যাংরেঞ্জ মাল্টিপ্লায়ার্স \ লাম্বদা এর ভেক্টরটির সাথে পরিচয় করিয়ে λদিয়ে, উদ্দেশ্যমূলক কার্যের বিভিন্নতা হিসাবে লেখা যেতে পারে

δI=Iβδβ+Iuδu+λT[Rβδβ+Ruδu]

পুনরায় সাজানো পদগুলি, আমরা লিখতে পারি:

δI=[Iβ+λTRβ]δβ+[Iu+λTRu]δu

সুতরাং, আমরা যদি যেমন সমাধান করতে সক্ষমআমিλ

Iu+λTRu=0 (adjoint equation)

তারপরে গ্রেডিয়েন্ট মূল্যায়ন করা হয় কেবল ডিজাইনের ভেরিয়েবলগুলির ক্ষেত্রে ।βδI=[Iβ+λTRβ]δββ

সুতরাং, একটি স্থগিত ভিত্তিক অপ্টিমাইজেশন অ্যালগরিদম নিম্নলিখিত পদক্ষেপগুলি লুপ করবে:

  1. বর্তমান ডিজাইন ভেরিয়েবলগুলি দেওয়া হয়েছেβ
  2. ফিল্ড ভেরিয়েবল জন্য সমাধান করুন (পিডিই থেকে)u
  3. ল্যাংরেঞ্জ মাল্টিপ্লায়ার্স ল্যাম্বদা ( অ্যাডেজ সমীকরণ থেকে) এর জন্য সমাধান করুনλ
  4. গ্রেডিয়েন্টগুলি গণনা করুনIβ
  5. ডিজাইন ভেরিয়েবলগুলি আপডেট করুনβ

আমার প্রশ্ন

ডিজাইনের ভেরিয়েবলের সংখ্যা বৃহত্তর ক্ষেত্রে এই পুনরাবৃত্তির জন্য অপটিমাইজেশনের ব্যয়কে কীভাবে উন্নত করতে পারে? আমি শুনেছি স্থগিতকরণ পদ্ধতির জন্য গ্রেডিয়েন্ট মূল্যায়নের ব্যয় ডিজাইনের ভেরিয়েবলের সংখ্যার থেকে 'স্বতন্ত্র'। তবে এটি ঠিক কীভাবে সত্য?

আমি নিশ্চিত যে খুব স্পষ্ট কিছু আছে যা আমি একরকম উপেক্ষা করছি।


3
যাইহোক, ল্যাঞ্জরঞ্জ গুণকটি সাধারণত উদ্দেশ্যগত কার্যক্রমে যুক্ত হয়, প্রকরণটি নয়; এভাবে । থেকে সম্মান সঙ্গে ব্যুৎপন্ন সেট শূন্য উৎপাদনের adjoint সমীকরণ, এবং এই ঢোকাতে (এবং সমাধান রাষ্ট্র সমীকরণের ) থেকে সম্মান সঙ্গে ব্যুৎপন্ন মধ্যে গ্রেডিয়েন্ট উৎপাদ। আপনি যদি PDE এর দুর্বল সূচনা দিয়ে শুরু করেন, জিনিসগুলি আরও সহজ হয়ে যায়: পরীক্ষার ফাংশনের জায়গায় কেবল ল্যাঞ্জরেঞ্জ গুণকটি সন্নিবেশ করান। শক্তিশালী ফর্ম বা কোথাও আংশিক একীকরণের প্রয়োজন নেই। তোমার দর্শন লগ করা তোমার দর্শন লগ করা আর ( তোমার দর্শন লগ করা , β ) = 0 βminu,βmaxλI(u,β)+λTR(u,β)uuR(u,β)=0β
ক্রিশ্চান ক্লাসন

1
যে কোনও সিমুলেশনের সবচেয়ে ব্যয়বহুল অংশ হ'ল সমাধান পর্ব phase অ্যাজেপমেন্টটি ব্যবহার করে আপনি দুটি সলভের মধ্যে গ্রেডিয়েন্ট পাবেন, সীমাবদ্ধ পার্থক্যের তুলনায় অনেক কম সস্তা যেখানে আপনার কমপক্ষে এন +1 সলভ প্রয়োজন, আপনার মডেলের নিখরচায় প্যারামিটারের সংখ্যা।
stally

উত্তর:


10

ডিজাইনের ভেরিয়েবলের সংখ্যা বৃহত্তর ক্ষেত্রে এই পুনরাবৃত্তির জন্য অপটিমাইজেশনের ব্যয়কে কীভাবে উন্নত করতে পারে?

আমি লিনিয়ার বীজগণিতের দৃষ্টিকোণ থেকে ব্যয়টি নিয়ে ভাবি। ( স্টিফেন জি জনসনের এই নোটগুলি দেখুন , যা আমি ল্যাঞ্জরেঞ্জ গুণক পদ্ধতির চেয়ে আরও স্বজ্ঞাত বলে মনে করি)। সামনের দিকে এগিয়ে যাওয়া পদ্ধতির সংবেদনশীলতার জন্য সরাসরি সমাধানের পরিমাণ:

uβ=(Ru)1Rβ

যার মধ্যে ভেক্টর- প্রতিটি প্যারামিটারের জন্য একটি রৈখিক সিস্টেম সমাধান করা , তারপরে মূল্যায়ন করা জড়িতβ

dIdβ=Iβ+Iuuβ,

যেখানে a মোট ডেরিভেটিভকে বোঝায়, এবং আংশিক ডেরিভেটিভকে বোঝায়।d

স্থগিত পন্থা নোট করে যে

dIdβ=IβIu(Ru)1Rβ,

সুতরাং অ্যাডমিন্ট ভেরিয়েবল (ল্যাঞ্জারেঞ্জ গুণক) দ্বারা সংজ্ঞা দেওয়া যায়λ

Iu(Ru)1=λT,

যা সমীকরণের সমীকরণের সাথে সম্পর্কিত

Iu+λTRu=0.

পদগুলির এই পুনরায় গ্রুপিংয়ের জন্য প্রতিটি প্যারামিটারের জন্য রৈখিক সমাধানের পরিবর্তে কেবলমাত্র একটি লিনিয়ার সলিউশন প্রয়োজন, যা বহু প্যারামিটার ক্ষেত্রে মূল্যায়ন স্থগিত করে।

আমি শুনেছি স্থগিতকরণ পদ্ধতির জন্য গ্রেডিয়েন্ট মূল্যায়নের ব্যয় ডিজাইনের ভেরিয়েবলের সংখ্যার থেকে 'স্বতন্ত্র'। তবে এটি ঠিক কীভাবে সত্য?

এটি সম্পূর্ণ স্বাধীন নয়; সম্ভবত মূল্যায়নের ব্যয় এবং প্যারামিটারের সংখ্যার সাথে বৃদ্ধি পাবে। রৈখিক সমাধান অবশ্য এখনও একই আকারের, যতদিন আয়তন হবে পরিবর্তন করে না। অনুমানটি হ'ল সলভগুলি ফাংশন মূল্যায়নের চেয়ে অনেক বেশি ব্যয়বহুল।(I/β)(R/β)u


8

সংক্ষেপে, সুবিধায় কমে উদ্দেশ্য এর কম্পিউট ডেরাইভেটিভস যে সত্য থেকে আসে , আপনি কি সত্যিই ডেরিভেটিভ জানা প্রয়োজন না সম্মান সঙ্গে একটি পৃথক অবজেক্ট হিসাবে, তবে এর কেবলমাত্র সেই অংশই পরিবর্তিত হতে পারে ।I(β,u(β))u(β)βI(β,u(β))

আমাকে একটি স্বরলিপিতে স্যুইচ করতে দাও আমি এতে আরও কিছুটা স্বাচ্ছন্দ্য বোধ করি: ( হচ্ছেন ভেরিয়েবল ডিজাইন করুন, রাষ্ট্রীয় পরিবর্তনশীল, এবং উদ্দেশ্য)। আসুন বলে অন্তর্নিহিত ফাংশন উপপাদ্য প্রয়োগ করতে চমৎকার যথেষ্ট, তাই সমীকরণ হয়েছে একটি অনন্য সমাধান যা থেকে সম্মান সঙ্গে ক্রমাগত differentiable হয় , এবং উপজাত সমাধান দেওয়া হয় ( এবং হচ্ছে আংশিক ডেরাইভেটিভস) ।

miny,uJ(y,u)subject toe(y,u)=0
uyJe(y,u)e(y,u)=0y(u)uy(u)
(1)ey(y(u),u)y(u)+eu(y(u),u)=0
eyeu

এর অর্থ আপনি হ্রাস উদ্দেশ্য সংজ্ঞায়িত করতে পারেন , যা পার্থক্যমূলকও (যদি হয়)। গ্রেডিয়েন্ট বৈশিষ্ট্যযুক্ত করার একটি উপায় নির্দেশমূলক ডেরাইভেটিভগুলির মাধ্যমে (যেমন, নকশার জায়গার ভিত্তিতে সমস্ত আংশিক ডেরাইভেটিভগুলি গণনা করুন)। এখানে, দিক নির্দেশনা নির্দেশমূলক ব্যুৎপন্ন যেমন চেইন নিয়ম দেওয়া হয় তাহলে চমৎকার হয় গনা শুধুমাত্র কঠিন জিনিস দেওয়া । এটি দিয়ে গুণ করে করা যায়j(u):=J(y(u),u)J(y,u)j(u)h

(2)j(u;h)=Jy(y(u),u),y(u)h+Ju(y(u),u),h.
Jy(u)hh(1)h জন্য ডান এবং সমাধান করা (যা অন্তর্নিহিত ফাংশন উপপাদ্যটি অনুমতি দেয়), অর্থাৎ, এবং এই এক্সপ্রেশনটিকে প্লাগ ইন করুন । PDE-সীমাবদ্ধ অপ্টিমাইজেশান, একটি একরৈখিক PDE সমাধানে এই পরিমাণে যে ভিত্তি ভেক্টর জন্য নকশা স্থান।y(u)h
(3)[y(u)h]=ey(y(u),u)1[eu(y(u),u)h]
(2) h

তবে, আমরা যদি কোনও অপারেটর যেমন যে তবে এটি অবশ্যই পছন্দসই গ্রেডিয়েন্ট হতে হবে। তাকিয়ে আমরা লিখতে পারি (সঙ্গে adjoint অপারেটর হচ্ছে), তাই সব আমরা গনা প্রয়োজন । এটি Using ব্যবহার করে এটি ব্যবহার করে করা যেতে পারে , অর্থাৎ এবং সেটিং সীমাবদ্ধ অপ্টিমাইজেশনে,j

j(u;h)=j,hfor all h,
(1)
Jy(y(u),u),y(u)h=y(u)Jy(y(u),u),h
y(u)y(u)jy(y(u),u)(AB)=BA(3)
λ:=ey(y(u),u)Jy(y(u),u)
J y ( y ( u ) , u ) λ u
j(u)=eu(y(u),u)λ+Ju(y(u),u).
Jy(y(u),u)সাধারণত কিছুটা অবশিষ্টাংশ, এবং কম্পিউটিং- ডিজাইনের জায়গার মাত্রা ব্যতীত একটি একক (লিনিয়ার) স্থগিত PDE সমাধান করা জড়িত । (বস্তুত, এই এমনকি বিতরণ পরামিতি, অর্থাত্ জন্য, কাজ করে কিছু অসীম-মাত্রিক Banach স্থান, যেখানে প্রথম পদ্ধতির infeasible হয় একটি ফাংশন।)λu
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.