ম্যাট্রিক্স ফাংশনের ডেরাইভেটিভের এই গণনাটি কী ন্যায়সঙ্গত করে?


10

অ্যান্ড্রু এনগের মেশিন লার্নিং কোর্সে তিনি এই সূত্রটি ব্যবহার করেছেন:

Atr(ABATC)=CAB+CTABT

এবং তিনি একটি দ্রুত প্রমাণ যা নীচে প্রদর্শিত হয়েছে:

Atr(ABATC)=Atr(f(A)ATC)=tr(f()ATC)+tr(f(A)TC)=(ATC)Tf()+(Ttr(f(A)TC)T=CTABT+(Ttr(T)Cf(A))T=CTABT+((Cf(A))T)T=CTABT+CAB

প্রমাণটি কোনও মন্তব্য ছাড়াই খুব ঘন বলে মনে হচ্ছে এবং এটি বুঝতে আমার সমস্যা হচ্ছে। দ্বিতীয় থেকে তৃতীয় সমতা ঠিক কী ঘটেছিল?


তিনি অবশ্যই A , B এবং সি এর মাত্রাগুলি সম্পর্কে বিশেষ অনুমান করছেন C, অন্যথায় এই সূত্রটি সাধারণভাবে কোনও ধারণা রাখে না। বাম দিকে A একটি হওয়া আবশ্যক i×j , ম্যাট্রিক্স B একটি j×j ম্যাট্রিক্স, এবং C একটি i×m নির্বিচারে অ নেতিবাচক পূর্ণসংখ্যার জন্য ম্যাট্রিক্স i,j,m । তবে ডানদিকে থাকা পণ্যগুলি i = m না থাকলে সংজ্ঞায়িত করা হবে না i=m
হোয়বার

@ যাহা আমি দেখি অনুমানের দেওয়া, আমি এখনও বুঝতে পারছি না কিভাবে রূপান্তরটি যেখানে তিনি প্রবর্তন তৃতীয় লাইনে দ্বিতীয় থেকে ঘটেছে ।
মানিবল

দ্বিতীয় এবং তৃতীয় লাইনের মধ্যে তিনি । দ্বিতীয় এবং তৃতীয় লাইনের মধ্যে তিনি পণ্যের বিধি ব্যবহার করেছেন। পরে তিনি থেকে মুক্তি পেতে চেইন রুল ব্যবহার করেন । f ( )f(A)=ABf()
ব্রায়ান বোর্চারস

উত্তর:


14

স্বরলিপিটির একটি সূক্ষ্ম তবে ভারী অপব্যবহার যা অনেকগুলি পদক্ষেপকে বিভ্রান্ত করে। আসুন ম্যাট্রিক্সের গুণ, স্থানান্তর, ট্রেস এবং ডেরিভেটিভসের সংজ্ঞাগুলিতে ফিরে গিয়ে এই সমস্যাটির সমাধান করুন। ব্যাখ্যাগুলি বাদ দিতে ইচ্ছুক ব্যক্তিদের জন্য, কঠোর বিক্ষোভ কতটা সংক্ষিপ্ত এবং সহজ হতে পারে তা দেখতে কেবল "শেষাংশে এটি একসাথে রেখে" শেষ বিভাগে যান।


স্বরলিপি এবং ধারণা

মাত্রা

এক্সপ্রেশনটির জন্য যখন একটি ম্যাট্রিক্স হয় তখন একটি (বর্গ) ম্যাট্রিক্স এবং অবশ্যই একটি ম্যাট্রিক্স হতে হবে, যেখানে পণ্যটি ম্যাট্রিক্স। ট্রেসটি নিতে (যা তির্যক উপাদানগুলির যোগফল, ), তারপরে , বর্গ ম্যাট্রিক্স তৈরি করে।A m × n B n × n C m × p m × p Tr ( X ) = i X i i p = m CABACAm×nBn×nCm×pm×pTr(X)=iXiip=mC

ডেরিভেটিভস

" " স্বরলিপিটি সাথে সম্মানের সাথে একটি অভিব্যক্তির ডেরিভেটিভকে বোঝায় । সাধারণত, পার্থক্য হল একটি ফাংশন তে সঞ্চালিত একটি অপারেশন । বিন্দুতে ডেরিভেটিভ হ'ল একটি লিনিয়ার ট্রান্সফর্মেশন । এই ভেক্টর স্পেসগুলির জন্য ঘাঁটিগুলি বেছে নেওয়ার পরে, এই জাতীয় রূপান্তরকে ম্যাট্রিক্স হিসাবে উপস্থাপন করা যেতে পারে । এই ঘটনা এখানে না!: আর এনআর এম এক্স আর এন ডি ( এক্সAAf:RNRMxRN এম × এনDf(x):RNRMM×N

ভেক্টর হিসাবে ম্যাট্রিক

এর পরিবর্তে, একটি উপাদান হিসেবে বিবেচিত হচ্ছে : তার কোফিসিয়েন্টস unrolled হচ্ছে (সাধারণত হয় কলাম দ্বারা সারি বা কলাম দ্বারা সারি) দৈর্ঘ্যের একটি ভেক্টর মধ্যে । ফাংশন বাস্তব মূল্যবোধ, কোথা হয়েছে । ফলে, একটি হওয়া আবশ্যক এটি একটি রৈখিক ফর্ম প্রতিনিধিত্বমূলক একটি সারিতে ভেক্টর আছে: ম্যাট্রিক্স । যাইহোক, প্রশ্নের গণনাগুলি রৈখিক ফর্মগুলি উপস্থাপনের জন্য আলাদাভাবে ব্যবহার করে: তাদের সহগগুলি ম্যাট্রিক্সে ফিরে আসে upআর এম এম এন এন = এম এন ( ) = ট্র ( বি সি ) এম = 1 ডি এফ ( এক্স ) 1 × মিARmnN=mnf(A)=Tr(ABAC)M=1Df(x)R m n m × n1×mnRmnm×n

একটি লিনিয়ার ফর্ম হিসাবে ট্রেস

যাক একটি ধ্রুবক হতে ম্যাট্রিক্স। তারপরে, ট্রেস এবং ম্যাট্রিক্স গুণনের সংজ্ঞা দ্বারা,এম × এনωm×n

Tr(Aω)=i=1m(Aω)ii=i=1m(j=1nAij(ω)ji)=i,jωijAij

এই কোফিসিয়েন্টস অধিকাংশ সাধারণ সম্ভব রৈখিক সমন্বয় প্রকাশ : হিসাবে একই আকৃতি একটি ম্যাট্রিক্স হয় এবং সারিটির তার সহগ এবং কলাম সহগ হয় রৈখিক একযোগে। কারণ , এবং এর ভূমিকা পাল্টে যেতে পারে, সমান অভিব্যক্তি প্রদান করেω একজন আমি একজন আমি ω আমি একজন আমি =AωAijAij ω AωijAij=AijωijωA

(1)i,jωijAij=Tr(Aω)=Tr(ωA).

বা ফাংশনগুলির সাথে একটি ধ্রুবক ম্যাট্রিক্স সনাক্ত করে , আমরা লিনিয়ার উপস্থাপন করতে পারি ম্যাট্রিক্স হিসাবে ম্যাট্রিক্স হিসাবে ফর্ম (এগুলি থেকে ! এর ফাংশনের ডেরিভেটিভগুলির সাথে বিভ্রান্ত করবেন না ))ট্র ( ω ) ট্র ( ω ) মি × n এম ×ωATr(Aω)ATr(ωA)m×nm×nআর এমRnRm


একটি ডেরিভেটিভ গণনা করা হচ্ছে

সংজ্ঞাটি

পরিসংখ্যানগুলিতে सामना করা অনেকগুলি ম্যাট্রিক্স ফাংশনগুলির ডেরাইভেটিভস সংজ্ঞা থেকে খুব সহজে এবং নির্ভরযোগ্যভাবে গণনা করা হয়: আপনাকে সত্যই ম্যাট্রিক্সের পার্থক্যের জটিল নিয়মগুলি অবলম্বন করার দরকার নেই। এই সংজ্ঞা বলছেন যে এ differentiable হয় যদি এবং কেবল যদি আছে একটি রৈখিক রূপান্তর যেমন যেx এলfxL

f(x+h)f(x)=Lh+o(|h|)

নির্বিচারে ছোট স্থানচ্যুত । সামান্য-ওহ স্বরলিপি মানে যে ত্রুটি পার্থক্য approximating তৈরি দ্বারা আকারের চেয়ে ইচ্ছামত ছোট যথেষ্ট জন্য । বিশেষত, আমরা সবসময় এর সমানুপাতিক ত্রুটিগুলি উপেক্ষা করতে পারি f ( x + h ) - f ( x ) L hhRNf(x+h)f(x)Lhh | এইচ | 2hh|h|2

হিসাব

আসুন প্রশ্নে ফাংশনটিতে সংজ্ঞাটি প্রয়োগ করি। , গুন বিস্তৃত, এবং শব্দ উপেক্ষা দুই একটি পণ্যের সাথে 'এটা গুলি,h

(2)f(A+h)f(A)=Tr((A+h)B(A+h)C)Tr(ABAC)=Tr(hBAC)+Tr(ABhC)+o(|h|).

ডেরিভেটিভ , আমাদের অবশ্যই এটি ফর্ম । ডানদিকে প্রথম শব্দটি ইতিমধ্যে form সহ এই ফর্মটিতে রয়েছে । ডানদিকে থাকা অন্য জন্য ফর্ম রয়েছে । আসুন এটি লিখুন:( 1 ) ω = B A C TrL=Df(A)(1)ω=BACX = A BTr(XhC)X=AB

(3)Tr(XhC)=i=1mj=1nk=1mXijhkjCki=i,j,khkj(CkiXij)=Tr((CX)h).

পুনরায় রচনা করা , আবার লেখা যেতে পারে( )X=AB(2)

f(A+h)f(A)=Tr(hBAC)+Tr(CABh)+o(|h|).

এটা তোলে হয় এই অর্থে যে আমরা ব্যুৎপন্ন বিবেচনা করতে পারে এ হতে কারণ এই ম্যাট্রিক্স খেলা ট্রেস সূত্রগুলিতে ভূমিকা ।A D f ( A ) = ( B A C ) + C A B = C A B + C A B , ω ( 1 )fA

Df(A)=(BAC)+CAB=CAB+CAB,
ω(1)

সবগুলোকে একত্রে রাখ

এখানে, তারপর, একটি সম্পূর্ণ সমাধান।

যাক একটি হতে ম্যাট্রিক্স, একটি ম্যাট্রিক্স, এবং একটি ম্যাট্রিক্স। আসুন । যাক একটি হতে ইচ্ছামত ছোট কোফিসিয়েন্টস সঙ্গে ম্যাট্রিক্স। কারণ (পরিচয় অনুসারে ) হয় পার্থক্যযোগ্য এবং এর ডেরাইভেটিভ হ'ল ম্যাট্রিক্স দ্বারা নির্ধারিত রৈখিক ফর্মm × n B n × n C m × m f ( A ) = Tr ( A B A C ) h m × n ( 3 ) f ( A + h ) - f ( A ) = Tr ( h B A ′)) + ট্র ( বি এইচ সি )Am×nBn×nCm×mf(A)=Tr(ABAC)hm×n(3)সি

f(A+h)f(A)=Tr(hBAC)+Tr(ABhC)+o(|h|)=Tr(h(CAB)+(CAB)h)+o(|h|),
f
CAB+CAB.

যেহেতু এটি প্রায় অর্ধেক কাজ নেয় এবং কেবলমাত্র ম্যাট্রিক এবং ট্রেস (গুণ এবং স্থানান্তর) এর সর্বাধিক বুনিয়াদি হস্তক্ষেপ জড়িত তাই এটিকে একটি সহজ - এবং তর্কসাপেক্ষে আরও স্বচ্ছ - ফলাফল হিসাবে প্রদর্শন হিসাবে বিবেচনা করতে হবে। আপনি যদি সত্যিকারের মূল প্রদর্শনের স্বতন্ত্র পদক্ষেপগুলি বুঝতে চান তবে আপনি এখানে দেখানো গণনার সাথে তুলনা করা ফলদায়ক বলে মনে করতে পারেন।


1
এটি জেনে রাখা সহায়ক যে সাধারণভাবে, যখনই ম্যাট্রিকগুলি সামঞ্জস্যপূর্ণ মাপের হয় । এই করা (3) একটি তুচ্ছ পদক্ষেপ জেনে। tr(ABC)=tr(CAB)
ব্রায়ান বোর্চার্স

1
@ আমোবা আমি বলতে পারি না আপনি হাস্যকর হওয়ার চেষ্টা করছেন কিনা। আংশিক ডেরাইভেটিভগুলির সাথে প্রশ্ন বা উত্তরগুলির প্রত্যক্ষভাবে কোনও সম্পর্ক নেই। ফর্মটি স্পষ্টভাবে একটি লিনিয়ার ফর্ম যা ভেক্টর স্পেস এর রিয়েল ম্যাট্রিক্সে সংজ্ঞায়িত হয় । যখন কেউ দাবি করেন যে ফাংশনটির ডেরিভেটিভ একটি বিন্দু কিছু ম্যাট্রিক্স সমান হয় , তার অর্থ রৈখিক দ্বারা প্রদত্ত ফর্ম । মাদুর ( মি , এন ) মি × n : মাদুর ( মি , এন ) আরω ডি (1)Mat(m,n)m×nf:Mat(m,n)RAωDf(A)X:→Tr(Xω)
হোবার

2
@ আমোবা ঠিক এটি সঠিক - এটি উত্তরের প্রথম লাইনে থাকা দৃ jus়তার সাথে প্রমাণ দেয়। এই কারণেই আমি " এই অর্থে" লিখেছিলাম এবং পরে সংক্ষেপে "সমান" না হয়ে "দ্বারা নির্ধারিত" বাক্যাংশটি ব্যবহার করেছি। আমি অস্বীকার করব না যে ব্যাখ্যাটি চ্যালেঞ্জিং ছিল; আমি কীভাবে এটি স্পষ্ট করতে হবে সে সম্পর্কে ভাবব এবং আমি আপনার সমস্ত মন্তব্য এবং পরামর্শগুলির প্রশংসা করব।
whuber

1
@ ব্যবহারকারী 10324 আমি এই সাইটে যা পোস্ট করি তার বেশিরভাগই আমার নিজস্ব সূত্র - আমি খুব কমই উত্সগুলির সাথে পরামর্শ করি (এবং আমি যখন তা করি তখনই এটি নথি করি)। এই পোস্টগুলি অনেক বই এবং কাগজপত্র পড়া থেকে পাতন নিরোধক হয়। কয়েকটি সেরা বই সেগুলি সম্পূর্ণরূপে গাণিতিকভাবে কঠোর নয়, তবে যা অন্তর্নিহিত ধারণাগুলিকে সুন্দরভাবে ব্যাখ্যা ও চিত্রিত করেছে। পরিসংখ্যানের ক্রম অনুসারে প্রথম যেগুলি মনে আসে - তারা হলেন ফ্রিডম্যান, পিসানী, এবং পার্ভস, পরিসংখ্যান (যে কোনও সংস্করণ); জ্যাক কিফার, পরিসংখ্যানগত অনুক্রমের ভূমিকা ; এবং স্টিভেন শ্রেভ, স্টোকাস্টিক ক্যালকুলাস ২ য় অর্থের জন্য
whuber

1
@ যাহা হউক অবশেষে ট্রেসটির রৈখিক রূপটি আমার কিছুটা উপলব্ধি আছে। আমি আপনার ব্যাখ্যাটি আরও মনোযোগ সহকারে পড়তে পারলে পৃথক পোস্টে আবার একই প্রশ্ন জিজ্ঞাসা করার জন্য আমি ক্ষমাপ্রার্থী। আমি আরও একটি প্রশ্ন আছে। যদি আপনার সমীকরণ প্রয়োগ করা যায় যে কোনও ম্যাট্রিক্স ফাংশনের ডেরিভেটিভগুলি খুঁজে পেতে, কি মতো মাত্রা আছে ? সুতরাং যদি , তবে ? h x x R m × n h R m × nf(x+h)f(x)=Lh+o(|h|)hxxRm×nhRm×n
মানিবল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.