সাধারণ বিতরণের চেয়ে ভারী লেজযুক্ত টি-বিতরণ


10

আমার বক্তৃতার নোটগুলিতে বলা হয়েছে,

টি-ডিস্ট্রিবিউশনের মতো দেখতে সাধারণ লাগে, যদিও কিছুটা ভারী লেজ থাকে।

কেন জানি এটি সাধারণ দেখায় (কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের কারণে)। তবে গাণিতিকভাবে কীভাবে প্রমাণ করতে হয় যে এটি সাধারণ বিতরণের চেয়ে ভারী লেজ রয়েছে এবং এটি যদি সাধারণ বিতরণের চেয়ে কতটা ভারী measure

উত্তর:


12

প্রথমে করণীয় হ'ল "ভারী লেজ" বলতে আমরা কী বোঝি formal উভয় বন্টনকে একই অবস্থান এবং স্কেল (যেমন স্ট্যান্ডার্ড বিচ্যুতি) মানক করার পরে চূড়ান্ত লেজের মধ্যে ঘনত্ব কতটা উচ্চ তা কল্পিতভাবে দেখতে পারে:

এখানে চিত্র বর্ণনা লিখুন
( এই উত্তর থেকে , যা আপনার প্রশ্নের সাথে কিছুটা প্রাসঙ্গিকও )

[এই ক্ষেত্রে, স্কেলিংটি আসলে শেষ হয় না; টি খুব সাধারণ স্কেল ব্যবহার করা সত্ত্বেও টি স্বাভাবিকের চেয়ে "ভারী" হবে; স্বাভাবিক সবসময় অবশেষে কম যায়]

তবে, এই সংজ্ঞা - যদিও এটি এই নির্দিষ্ট তুলনার জন্য ঠিক কাজ করে - খুব ভাল জেনারেল হয় না।

আরো সাধারণভাবে, অনেক ভালো সংজ্ঞা হল এখানে whuber এর উত্তর । তাই যদিY এর চেয়ে ভারী-লেজু Xযেমন t পর্যাপ্ত পরিমাণে বড় হয়ে যায় (সবার জন্য t> কিছু t0), তারপর SY(t)>SX(t), কোথায় S=1F, কোথায় F সিডিএফ (ডানদিকে ভারী-লেজযুক্ত জন্য; অন্যদিকে একটি অনুরূপ, সুস্পষ্ট সংজ্ঞা রয়েছে)

এখানে চিত্র বর্ণনা লিখুন

এখানে এটি লগ-স্কেলে এবং সাধারণের কোয়ান্টাইল স্কেলে রয়েছে, যা আমাদের আরও বিশদটি দেখতে দেয়:

এখানে চিত্র বর্ণনা লিখুন

সুতরাং ভারী লেজুপাতের "প্রমাণ" সিডিএফএসের সাথে তুলনা করা এবং টি-সিডিএফের উপরের লেজটি সর্বদা স্বাভাবিকের উপরে থাকে এবং টি-সিডিএফের নীচের লেজ অবশেষে সর্বদা স্বাভাবিকের নীচে থাকে বলে জড়িত।

এক্ষেত্রে সহজ কাজটি হ'ল ঘনত্বগুলি তুলনা করা এবং তারপরে সিডিএফ (/ বেঁচে থাকা ফাংশন) এর সাথে সম্পর্কিত আপেক্ষিক অবস্থানটি অবশ্যই সেখান থেকে অনুসরণ করা উচিত।

সুতরাং উদাহরণস্বরূপ যদি আপনি যে বিতর্ক করতে পারেন (কিছু দেওয়া হয়) ν)

x2(ν+1)log(1+x2ν)>2log(k)

প্রয়োজনীয় ধ্রুবক জন্য k (এর একটি ফাংশন ν), সবার জন্য x> কিছু x0, তবে এর জন্য একটি ভারী লেজ স্থাপন সম্ভব হবে tν বৃহত্তর পরিপ্রেক্ষিতে সংজ্ঞা উপর 1F (বা আরও বড় F বাম লেজের উপর)।

(এই ফর্মটি ঘনত্বগুলির লগের পার্থক্য থেকে অনুসরণ করে, যদি এটি ঘনত্বগুলির অধীনে প্রয়োজনীয় সম্পর্ক রাখে)

[এটা আসলে তা দেখানোর জন্য সম্ভব কোন k (কেবলমাত্র প্রাসঙ্গিক ঘনত্বকে সাধারণীকরণের ধ্রুবক থেকে আসা বিশেষ বিশেষটি নয়), ফলস্বরূপ অবশ্যই ফলাফলটি রাখা উচিত k আমাদের দরকার.]


1
সাথে একটি গ্রাফ logS(x) (এবং সম্ভবত প্রসারিত) xকিছুটা) ভারী লেজগুলি আরও স্পষ্টভাবে প্রদর্শিত হতে পারে এবং স্বাধীনতার উচ্চতর ডিগ্রি নিয়েও কাজ করতে পারে
হেনরি

1
@ হেনরি আমি এমন একটি প্লট তৈরি করেছি তবে নিশ্চিত ছিলাম না এটির কতটা মূল্য যুক্ত হয়েছে তাই আমি এটি অন্তর্ভুক্ত করি নি। আমি এর মধ্যে নির্বাণ সম্পর্কে চিন্তা করব।
Glen_b -Reinstate মনিকা

1
@ হেনরি আমি প্লটটি অন্তর্ভুক্ত করেছি।
গ্লেন_বি -রিনস্টেট মনিকা

2

পার্থক্যটি দেখার একটি উপায় হ'ল মুহুর্তের ব্যবহার E{xn}.

"ভারী" লেজগুলি সমান পাওয়ার মুহুর্তগুলির জন্য উচ্চতর মানগুলি বোঝায় (পাওয়ার 4, 6, 8), যখন বৈকল্পিক একই হয়। বিশেষত, ৪ র্থ অর্ডার মুহুর্তকে (শূন্যের কাছাকাছি) কুর্তোসিস বলা হয় এবং কিছুটা সঠিক অর্থে লেজগুলির ভারাক্রমে তুলনা করা হয়।

বিশদগুলির জন্য উইকিপিডিয়া দেখুন ( https://en.wikedia.org/wiki/Kurtosis )


1
যদিও এ t-র সাথে বিতরণ 3 অথবা 4 স্বাধীনতার ডিগ্রি, কুর্তোসিস অসীম, যখন রয়েছে 2 স্বাধীনতার ডিগ্রি স্ট্যান্ডার্ড বিচ্যুতি অসীম তাই আপনি কুরটোসিস গণনা করতে পারবেন না, এবং সহ 1 স্বাধীনতার ডিগ্রি আপনি এমনকি গড় বা গণনা করতে পারবেন না 4মূহুর্ত
হেনরি

3
@ হেনরি তবুও এই ধারণাটি ভাল। শিক্ষার্থীর সিডিএফ সম্প্রসারণ করা হচ্ছেt(ν) চারপাশে বিতরণ + এটি অসম্পূর্ণভাবে আনুপাতিক shows xν। সুতরাং ওজনের সমস্ত নিখুঁত মুহুর্তের চেয়ে কম lessν অস্তিত্ব আছে এবং ওজনের সমস্ত পরম মুহুর্তগুলি এর চেয়ে বেশি νবিকিরণ ঘটে। সাধারণ বিতরণ সহ, সমস্ত পরম মুহূর্ত বিদ্যমান exist এটি সমস্ত শিক্ষার্থীর লেজগুলির একটি নির্দিষ্ট ক্রম সরবরাহ করেtবিতরণ এবং সাধারণ বিতরণ। কার্যকরভাবে, প্যারামিটারνএকটি লেজের ভারাক্রিয়া কীভাবে পরিমাপ করতে হয় সে সম্পর্কে মূল প্রশ্নের একটি উত্তর সরবরাহ করে।
হোবার

2

বেঁচে থাকার কার্যাবলির উপর ভিত্তি করে এখানে একটি আনুষ্ঠানিক প্রমাণ রয়েছে। আমি উইকিপিডিয়া দ্বারা অনুপ্রাণিত "ভারী লেজ" নিম্নলিখিত সংজ্ঞাটি ব্যবহার করি :

একটি এলোমেলো পরিবর্তনশীল Y বেঁচে থাকার ফাংশন সহ Sy(t) এলোমেলো ভেরিয়েবলের চেয়ে ভারী লেজ রয়েছে X বেঁচে থাকার ফাংশন সহ Sx(t) iff

limtSy(t)Sx(t)=

একটি এলোপাতাড়ি ভেরিয়েবলের বিবেচনা করুন গড় শূন্য, স্বাধীন ডিগ্রীগুলির স্টুডেন্টস টি হিসাবে বিতরণ করা এবং প্যারামিটার স্কেল । আমরা এটিকে এলোমেলো পরিবর্তনশীল সাথে তুলনা করি । উভয় ভেরিয়েবলের জন্য, বেঁচে থাকার কাজগুলি পৃথক able অতএব, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
যেখানে আমরা প্রতিস্থাপন করেছি । দ্রষ্টব্য যে একটি ধ্রুবক, এবং সুতরাং বীজগণিত সীমিত উপপাদ্য দ্বারা, u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

গুরুত্বপূর্ণভাবে, ফলাফলটি , এবং স্বেচ্ছাসেবী (সসীম) মানগুলির জন্য ধারণ করে , সুতরাং আপনার এমন পরিস্থিতি থাকতে পারে যেখানে বিতরণে একটি স্বাভাবিকের চেয়ে ছোট পার্থক্য থাকে তবে এখনও ভারী লেজ থাকে।aσ2ν


1
কেবল একটি নোট যে ভারী লেজগুলির এই "সংজ্ঞা" সর্বদা গ্রহণযোগ্য নয়। উদাহরণস্বরূপ, এই সংজ্ঞা অনুসারে এন (0,1) বন্টন, .9999 * ইউ (-1,1) + .0001 * ইউ (-1000, 1000) বিতরণের চেয়েও ভারী লেজ রয়েছে, যদিও পরবর্তী বিতরণটি উত্পাদন করে সীমাবদ্ধ সমর্থন থাকা সত্ত্বেও মাঝারি থেকে 175 স্ট্যান্ডার্ড বিচ্যুতি পর্যন্ত মাঝে মাঝে মানগুলি। অবশ্যই, এন (0,1) এ জাতীয় মানও উত্পাদন করে, তবে সম্ভাব্যতার সাথে নীচে যা ব্যবহারিক উদ্দেশ্যে প্রাসঙ্গিক বলে মনে করা যেতে পারে।
পিটার ওয়েস্টফল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.