ওএলএসের অনুমানকারীটি স্কেল সমতুল্য?


11

আমার স্কেল ইক্যুয়ারিয়েন্সের কোনও আনুষ্ঠানিক সংজ্ঞা নেই, তবে এখানে পরিসংখ্যান শিক্ষার পরিচিতি পিএ সম্পর্কে কী বলে। 217:

স্ট্যান্ডার্ড সর্বনিম্ন স্কোয়ার ... স্কেল : একটি ধ্রুবক দ্বারা কেবল এর একটি ফ্যাক্টর দ্বারা সর্বনিম্ন স্কোয়ার সহগ অনুমানের স্কেলিং বাড়ে ।Xjc1/c

সরলতার জন্য, সাধারণ রৈখিক মডেল অনুমান করা যাক y=Xβ+ϵ , যেখানে yRN , X হ'ল একটি N×(p+1) ম্যাট্রিক্স (যেখানে p+1<N ) R , βRp+1 , এবং ϵ একটি হল N সঙ্গে রিয়েল-মূল্যবান র্যান্ডম ভেরিয়েবল -dimensional ভেক্টর E[ϵ]=0N×1

ওএলএস অনুমান থেকে আমরা জানি যে যদি X এর পূর্ণ (কলাম) র‌্যাঙ্ক থাকে,

β^X=(XTX)1XTy.
ধরুন আমরা একটি কলাম গুন X বলতে xk কিছু k{1,2,,p+1} ধ্রুবক c \ neq 0 দ্বারা \ {1, 2, \ বিন্দুগুলি, পি + 1 \} এc0 । এটি ম্যাট্রিক্সের সমতুল্য হবে
X[111c11]S=[x1x2cxkxp+1]X~
যেখানে ম্যাট্রিক্স অন্যান্য সমস্ত এন্ট্রি S উপরে হয় 0 , আর c হয় k তির্যক তম এন্ট্রি S । তারপর,X~X~নতুন ডিজাইনের ম্যাট্রিক্স হ'ল
β^X~=(X~TX~)1X~Ty.
কিছু কাজ করার পর, এক দেখাতে পারি যে,
X~TX~=[x1Tx1x1Tx2cx1Txkx1Txp+1x2Tx1x2Tx2cx2Txkx2Txp+1cxkTx1cxkTx2c2xkTxkcxkTxp+1xp+1Tx1xp+1Tx2cxp+1Txp+1xp+1Txp+1]
d সিডটস এবং \ ম্যাথবিএফ {x} _ {পি + 1} ^ {টি} \ ম্যাথবিএফ {এক্স} _ {পি + 1} \\ \ এন্ড {বম্যাট্রিক্স} এবং
X~Ty=[x1Tyx2TycxkTyxp+1Ty]
above উপরের উদ্ধৃত দাবিটি দেখতে আমি কীভাবে এখান থেকে যাব (অর্থাত, β^X~=1cβ^X )? এটা আমার কাছে পরিষ্কার নয় কিভাবে গনা (X~TX~)1

আমি মনে করি আপনার right সঠিক নয়, এটি পুরো সারিতে একটি গুণকটি হারিয়েছে । X~TX~c
ফায়ারব্যাগ

1
এছাড়াও, মনে রাখবেন দাবিটি হ'ল , প্রতিটি নয় । ββ^k,new=1cβ^k,oldβ
ফায়ারব্যাগ

@ ফায়ারবাগ হ্যাঁ, আমি ঠিক এটি বুঝতে পেরেছি। আমি একটি উত্তর পোস্ট করছি।
ক্লারিনেটিস্ট

2
আপনি এই সমস্ত বীজগণিতকে অনেক সহজ ইউনিট বিশ্লেষণ দ্বারা প্রতিস্থাপন করতে পারেন , কারণ দ্বারা করা মাত্র তার পরিমাপের একককে পরিবর্তন করে এবং অতএব এর সহগ এর সাথে সম্পর্কিত ইউনিটগুলির সাথে সম্পর্কিত পরিবর্তনটি এটি দ্বারা ভাগ করে । যে প্রমাণ করে না দ্বারা বিভক্ত করা আবশ্যক , দুর্ভাগ্যবশত। যাইহোক, এই চিন্তার এই শৃঙ্খলা আমাদের মনে করিয়ে দিতে পারে যে একজন বিরুদ্ধে একাধিক পীড়ন চালানো যেতে পারে, যেখানে এটি স্পষ্ট যে দ্বারা বিভক্ত , এবং সুতরাং প্রমাণটি সম্পূর্ণ। β ββXjcβjcβ^jcβ^jc
whuber

@ হুবুহর, ফলাফলের স্বজ্ঞাততা স্পষ্ট করার পরেও মনে হচ্ছে একটি প্রমাণ দেওয়ার ক্ষেত্রে কিছুটা বীজগণিত অবশ্যই থাকতে হবে। সর্বোপরি, স্কেলিং ফ্যাক্টর উল্টানো দরকার। c
user795305

উত্তর:


11

যেহেতু উদ্ধৃতিতে জোর দেওয়া এর কলামগুলি পুনরুদ্ধার করা সম্পর্কিত বিবৃতিগুলির সংগ্রহ , সুতরাং আপনি সেগুলি একবারে প্রমাণ করতে পারেন। প্রকৃতপক্ষে, দৃ as়তার জেনারালাইজেশন প্রমাণ করতে এখন আর কোনও কাজ লাগে না:X

যখন একটি বিপরীত ম্যাট্রিক্স দ্বারা ডান-গুন করা হয় , তারপরে নতুন সহগ হিসাব সমান দ্বারা বাঁ-গুন ।একজন β একটি β একজন - 1XAβ^Aβ^A1

আপনার কেবলমাত্র বীজগণিত তথ্যগুলি হ'ল (সহজে প্রমাণিত, সুপরিচিত) যা any যে কোনও ম্যাট্রিকের জন্য এবং জন্য বিপরীত ম্যাট্রিক্স এবং । (আধুনিক একটি subtler সংস্করণ যখন সাধারণ inverses সঙ্গে কাজ প্রয়োজন হয়: বিপরীত জন্য এবং এবং কোন , । ) A B ( A B ) - 1 = B - 1 A - 1 A B A B X ( A X B ) - = B - 1 X - A - 1(AB)=BAAB(AB)1=B1A1ABABX(AXB)=B1XA1


বীজগণিতের দ্বারা প্রমাণ :

β^A=((XA)((XA))(XA)y=A1(XX)(A)1Ay=A1β^,

Qed। (এই প্রমাণটি পুরোপুরি সাধারণ হওয়ার জন্য, supers সুপারস্ক্রিপ্ট একটি সাধারণ বিপরীতকে বোঝায়))


জ্যামিতির দ্বারা প্রমাণ :

প্রদত্ত ঘাঁটি এবং এর এবং যথাক্রমে থেকে একটি রৈখিক রূপান্তর প্রতিনিধিত্ব করে থেকে । ডান গুণ দ্বারা হিসাবে বিবেচনা করা যেতে পারে এই রূপান্তর সংশোধন যাব কিন্তু পরিবর্তন করার (যে কলাম থেকে, )। সেই পরিবর্তনের ভিত্তিতে -তে যে কোনও ভেক্টর of এর প্রতিনিধিত্ব অবশ্যই বাম-গুণ দ্বারা by দ্বারা পরিবর্তন করতে হবে ,এন আর এন আর পি এক্স আর পি আর এন এক্সEpEnRnRpXRpRnXপি একটি পি একটি বিটাআর পি একটি - 1AEpAEpAβ^RpA1Qed

(এই প্রমাণটি কার্যকর হয়, মোড়বিহীন, এমনকি যখন প্রিম অবিচ্ছিন্ন না হয়))XX


উদ্ধৃতি বিশেষভাবে তির্যক ম্যাট্রিক্সের ক্ষেত্রে বোঝায় সঙ্গে জন্য এবং ।আই আই = আই জে জে = সিAAii=1ijAjj=c


সর্বনিম্ন স্কোয়ারের সাথে সংযোগ

ফলাফলটি অর্জনের জন্য এখানে প্রথম নীতিগুলি ব্যবহার করা হ'ল নীতিটি ন্যূনতম বর্গক্ষেত্রের সাথে: অনুমানের গুণাগুণগুলি অনুমান করে যা অবশিষ্টাংশের বর্গের যোগফলকে কমিয়ে দেয়।

আবার (বিশাল) সাধারণীকরণ প্রমাণ করা আর কোনও কঠিন প্রমাণিত হয় না এবং প্রকাশ করে aling ধরুন সত্যিকারের ভেক্টর স্পেসগুলির কোনও মানচিত্র (লিনিয়ার বা না) হ'ল এবং ধরুন on কোনও বাস্তব-মূল্যবান ফাংশন । যাক (সম্ভবত খালি) পয়েন্ট সেট হতে যার জন্য মিনিমাইজ করা হয়। কিউ ডব্লিউ এন ইউ ভী পি ভি প্রশ্ন ( φ ( বনাম ) )

ϕ:VpWn
QWnUVpvQ(ϕ(v))

ফলাফল: , যা কেবলমাত্র এবং দ্বারা নির্ধারিত হয় , ভেক্টরগুলির প্রতিনিধিত্ব করতে ব্যবহৃত ভিত্তির কোনও পছন্দের উপর নির্ভর করে না ।Q ϕ E p V pUQϕEpVp

প্রুফ: কিউইডি।

প্রমাণ করার মতো কিছুই নেই!

ফলাফলের প্রয়োগ: আসুন উপর একটি ধনাত্মক আধা চতুষ্কোণ রূপ হয় , যাক এবং ধরুন একটি লিনিয়ার মানচিত্র যা দ্বারা প্রতিনিধিত্ব করা হয় যখন of এর ঘাঁটি হয় এবং বেছে নেওয়া হয়েছে। সংজ্ঞায়িত করুন । ভিত্তি চয়ন করুন এবং ধরুন সেই ভিত্তিতে এর কিছু উপস্থাপনা । এটি সর্বনিম্ন স্কোয়ার : বর্গক্ষেত্রের দূরত্ব হ্রাস করে । কারণআর এন ওয়াই আর এন φ এক্স ভী পি = আর পি ডব্লিউ এন = আর এন কিউ ( এক্স ) = এফ ( Y , এক্স ) আর পি β বনাম ইউ এক্স = এক্স β এফ ( Y , এক্স ) এক্স আর পি এক্স একজন β একজন - 1FRnyRnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^vUx=Xβ^F(y,x)Xএকটি লিনিয়ার মানচিত্র, এর ভিত্তি পরিবর্তন করা কিছু বিপরীতমুখী ম্যাট্রিক্স দ্বারা ডান-গুণক সাথে সামঞ্জস্য । এটি , QED দ্বারা বাম-গুণ ।RpXAβ^A1


6

সর্বনিম্ন স্কোয়ারের অনুমানকারী Def , যেখানে ডিজাইন ম্যাট্রিক্স full সম্পূর্ণ র‌্যাঙ্ক। ধরে নিলাম যে স্কেলিং ম্যাট্রিক্স । ইনভারটিভেবল। এক্স আর এন × পি এস আর পি × Pβ^=argminβRpyXβ22XRn×pSRp×p

এই নতুন স্কেলড অনুমানকারীটিকে ine । এর অর্থ for all । ডিফাইনিং উপরের হিসাবে, আমরা পুনর্লিখন করতে এই প্রদর্শিত বৈষম্য সবার জন্য । অতএব ,, এবং এটি অনুসরণ করে যে সর্বনিম্ন স্কোয়ারের অনুমানকারী the স্কেলিং ম্যাট্রিক্স এর ইনভারটিভিটির কারণেY-এক্সএস ~ α 2 2 <Y-এক্সএসα 2 2 α ~ α ~ β =এস ~ αY-এক্স ˜ β 2 2 <y-α~=argminαRpyXSα22

yXSα~22<yXSα22
αα~β~=Sα~ β ~ β ~ β = ARG মিনিট β আর পি ~ α = এস - 1 বিটা বিটাটি 1
yXβ~22<yXβ22
ββ~β = ~ β = এস ~ αএসβ~=argminβRpyXβ22
β^=β~=Sα~.
S, এটি অনুসরণ করে যে । আমাদের ক্ষেত্রে, এই শুধুমাত্র পৃথক দ্বারা এন্ট্রি দ্বারা স্কেল করা হচ্ছে ।α~=S1β^β^kth1c

1
আমি এবং অনুরূপ ফাংশনগুলির সাথে যেমন কাজ করা উচিত সে বিষয়ে আমি পরিচিত নই - আপনি কি আপনার দ্বিতীয় থেকে তৃতীয় লাইনের সমীকরণের রূপান্তরটি ব্যাখ্যা করতে পারবেন? arg min
ক্লারিনেটিস্ট

আমি এটি কিছুটা ভিন্নভাবে লিখেছি, যা পদক্ষেপগুলি আরও স্পষ্ট করে তোলে।
ব্যবহারকারী795305

এটা সত্যিই চালাক। (+1)
ক্লারিনেটিস্ট

4

প্রশ্ন পোস্ট করার পরে আমি এটি বুঝতে পেরেছি। আমার কাজটি যদি সঠিক হয় তবে আমি দাবিটির ভুল ব্যাখ্যা দিয়েছি। শুধুমাত্র স্কেলিং এক উপাদান উপর ঘটে কলাম সংশ্লিষ্ট দ্বারা গুন করা হচ্ছে । βএক্স1cβXc

লক্ষ্য করুন যে , উপরের স্বরলিপিটিতে একটি তির্যক, প্রতিসাম ম্যাট্রিক্স এবং বিপরীত (কারণ এটি তির্যক) দ্রষ্টব্য a হল একটি ম্যাট্রিক্স। ধরা যাক ( পি + 1 ) × ( পি + 1 ) এস - 1 = [ 1S(p+1)×(p+1)( ˜ এক্স টি ˜ এক্স )-1(পি+1)×(পি+1)(এক্সটিএক্স)-1=[ জেড 1 জেড 2জেড কেz পি + 1 ]( ˜ এক্স টি ˜ এক্স )-1=[(এক্সএস)

S1=[1111c11].
(X~TX~)1(p+1)×(p+1)
(XTX)1=[z1z2zkzp+1].
এস - 1 ( এক্স টি এক্স ) - 1 = [ জেড 1)
(X~TX~)1=[(XS)TXS]1=(STXTXS)1=(SXTXS)1=S1(XTX)1S1.
অতএব, এবং এটি দ্বারা গুণ করে effect দ্বারা দ্বারা গুণিত করার সাথে একই প্রভাব রয়েছে - এটি একই থাকে, গুণিত হয়এস-1এক্সএস1
S1(XTX)1=[z1z21czkzp+1]
S1XS11czk এস-11c : সুতরাং, Β ~ এক্স
S1(XTX)1S1=[z1z21c2zkzp+1].
β^X~=S1(XTX)1S1(XS)Ty=[z1z21c2zkzp+1][x1Tyx2TycxkTyxp+1Ty]=[z1x1Tyz2x2Ty1czkxkTyzp+1xp+1Ty]
পছন্দ অনুযায়ী।

এ একটি টাইপ রয়েছে । আপনাকে স্থানান্তর করতে হবে । S1(XTX)1S1(XS)y(XS)
JohnK

3

সর্বকালের তুচ্ছ প্রমাণ

আপনি আপনার রৈখিক সমীকরণ দিয়ে শুরু করুন: এখন আপনি আপনার রেজিস্ট্রারগুলির স্কেল পরিবর্তন করতে চান, মেট্রিক সিস্টেম থেকে ইমপিরিয়ালে রূপান্তর করতে পারেন, আপনি কেজি কেজি পাউন্ড, মিটার থেকে গজ ইত্যাদি জানেন So রূপান্তর ম্যাট্রিক্স যেখানে প্রতিটি হ'ল ডিজাইন ম্যাট্রিক্স এ ভেরিয়েবল (কলাম) এর রূপান্তর সহগ ।

Y=Xβ+ε
S=diag(s1,s1,,sn)siiX

আসুন সমীকরণটি আবার লিখুন:

Y=(XS)(S1β)+ε

এখন এটি স্পষ্টভাবে স্পষ্ট হয়েছে যে স্কেলিংটি আপনার সমীকরণের রৈখিকতার সম্পত্তি, সহগের অনুমানের ওলএস পদ্ধতি নয়। রৈখিক সমীকরণের সাথে অনুমান পদ্ধতি নির্বিশেষে আপনার কাছে এটি রয়েছে যে রেজিস্ট্রারগণ হিসাবে মাপা হলে আপনার নতুন সহগগুলি হিসাবে হবেXSS1β

বীজগণিতের দ্বারা প্রমান কেবল ওএলএস এর জন্য

স্কেলিংটি হ'ল: যেখানে প্রতিটি ভেরিয়েবলের (কলাম) স্কেল ফ্যাক্টর এবং একটি পরিমিত সংস্করণ । আসুন ত্রিভুজ স্কেল ম্যাট্রিক্স । তোমার OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মূল্নির্ধারক হয় আসুন প্লাগ ছোটো ম্যাট্রিক্স পরিবর্তে এবং কিছু ব্যবহার ম্যাট্রিক্স বীজগণিত : সুতরাং, আপনি দেখেন যে নতুন সহগটি কীভাবে প্রত্যাশার মতো পুরানো সহগকে কমিয়ে দেওয়া হয়।

Z=Xdiag(s1,s2,...,sn)
siZXSdiag(s1,s2,...,sn)
β^=(XTX)1XTY
ZX
(ZTZ)1ZTY=(STXTXS)1STXTY=S1(XTX)1S1SXTY=S1(XTX)1XTY=S1β^

2
আমি আপনার পন্থাগুলি পছন্দ করি তবে "সর্বকালের সবচেয়ে তুচ্ছ প্রমাণ" দ্বারা অবিস্মৃত। আপনি স্পষ্টতই ধরে নিয়েছেন, এবং এখনও দেখাতে হবে যে, লিখিত মডেলটির অবশ্যই মূলের মতো একই ফিট থাকতে হবে it এটি আরও কঠোরভাবে বলা যায়: যদি আমরা কোনও ফিটনেস পদ্ধতিটিকে একটি ফাংশন হিসাবে দেখি , যেখানে হ'ল সমস্ত সম্ভাব্য ডেটার সেট (যা আমরা জোড় হিসাবে লিখতে পারি ) এবং সমস্ত সম্ভাব্য সহগ অনুমানের সেট, তারপরে আপনাকে এটি প্রদর্শন করতে হবে সমস্ত ইনভারটিবল , সমস্ত এবং সমস্ত । (এটি সর্বদা সত্য নয়!)δ:MRpM(X,Y)Rpδ(X,Y)=S1δ(XS,Y)এসএক্সওয়াই
হুঁশিয়ারি

@ হুবুহু, আসলে এটি অন্যভাবে: যুক্তিসঙ্গত ফিটিং পদ্ধতির এই শর্তটি পূরণ করা উচিত, অন্যথায় পরিমাপের এককের একটি সাধারণ পরিবর্তন একটি ভিন্ন পূর্বাভাস / অনুমান উত্পাদন করে। আমি আমার উত্তর আপডেট করব, এ সম্পর্কে কিছুটা
ভাবব

আমি সম্মত - কিন্তু আমি ক্ষেত্রে যেখানে ইন ব্যতিক্রম কল্পনা করতে পারেন পূর্ণ পদে নয়। এটাই আমার কাছে পরিস্থিতিটি ততটা তুচ্ছ নয় বলে মনে হয়েছিল suggested এক্স
whuber

3
রাজকীয় সাথী, রাজকন্যা নয় ...: ডি (চমৎকার উত্তর, +1)
usεr11852

@ usεr11852, আমি আজ কিছু শিখেছি :)
আকসকল

2

এই ফলাফলটি পাওয়ার সহজ মনে রাখতে হবে যে হ'ল এর কলাম স্পেসে এর প্রক্ষেপণ co সহগের ভেক্টর যখন a রৈখিক হিসাবে প্রকাশ করা হয় এর কলামগুলির সংমিশ্রণ । যদি কোনও কলামটি একটি ফ্যাক্টর দ্বারা স্কেল করা থাকে তবে এটি স্পষ্ট যে লিনিয়ার সংমিশ্রণে সংশ্লিষ্ট সহগ অবশ্যই দ্বারা স্কেল করা উচিত ।Y^Yএক্স β^Y^এক্স1/

যাক মান হতে এবং যখন একটি কলাম দ্বারা স্কেল করা হয় OLS ঔজ্জ্বল্যের প্রেক্ষাপটে সমাধান মান হতেβ একটি আমি1 x 1 + + + আমি এক্স আমি + + + বি এম x মি = একটি 1 এক্স 1 + একটি আমি (আমিβ^একটিআমি

1এক্স1+ ++ +আমিএক্সআমি+ ++ +মিএক্সমি=একটি1এক্স1+ +একটিআমি(এক্সআমি)+ ++ +একটিএনএক্সএন

বোঝায় যে যেখানে এবং , ধরে যে এর কলামগুলি স্বাধীন। জে আই বি i = আই সি এক্স=একটিআমিআমি=একটিআমিএক্স

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.