এটি স্বাধীনতার ডিগ্রি এবং পরিসংখ্যানগত পরামিতিগুলির একটি গল্প এবং কেন এটি দু'জনের প্রত্যক্ষ সহজ সংযোগ রয়েছে তা চমৎকার।
Orতিহাসিকভাবে, " −1 " পদটি বিটা ফাংশনের অলারের গবেষণায় উপস্থিত হয়েছিল। তিনি এই প্যারামিটারাইজেশনটি 17৩৩ সালের মধ্যে ব্যবহার করছিলেন এবং অ্যাড্রিয়েন-মেরি লেজেন্ড্রেও ছিলেন: তাদের ব্যবহারের ফলে পরবর্তী গাণিতিক সম্মেলন প্রতিষ্ঠিত হয়েছিল। এই কাজটি সমস্ত পরিচিত পরিসংখ্যান অ্যাপ্লিকেশনকে অ্যান্টেট করে।
আধুনিক গাণিতিক তত্ত্ব বিশ্লেষণ, সংখ্যা তত্ত্ব এবং জ্যামিতির প্রয়োগগুলির সম্পদের মাধ্যমে যথেষ্ট সংকেত সরবরাহ করে যে " " পদটির আসলে কিছু অর্থ রয়েছে। আমি সেই মন্তব্যে কয়েকটি মন্তব্যে স্কেচ করেছি।−1
আরও আগ্রহের বিষয় হ'ল "সঠিক" পরিসংখ্যানগত প্যারামিটারাইজেশন হওয়া উচিত। এটি পুরোপুরি পরিষ্কার নয় এবং এটি গাণিতিক সম্মেলনের মতো হতে হবে না। সম্ভাব্যতা বিতরণের সাধারণভাবে ব্যবহৃত, সুপরিচিত, আন্তঃসম্পর্কিত পরিবারগুলির একটি বিশাল ওয়েব রয়েছে। সুতরাং, কনভেনশনগুলিতে একটি পরিবারের নামকরণ করা হত (যা প্যারামিটারাইজ করা হয়) সাধারণত সম্পর্কিত পরিবারের নাম সম্পর্কিত কনভেনশনগুলি বোঝায়। একটি প্যারামিটারাইজেশন পরিবর্তন করুন এবং আপনি সেগুলি পরিবর্তন করতে চাইবেন। আমরা তাই এই সম্পর্কগুলি ক্লুগুলির জন্য দেখতে পারি।
খুব কম লোকই দ্বিমত পোষণ করবে যে সবচেয়ে গুরুত্বপূর্ণ বিতরণ পরিবারগুলি সাধারণ পরিবার থেকে প্রাপ্ত। রিকল একটি এলোপাতাড়ি ভেরিয়েবলের যে হতে বলেন হয় "সাধারণত বিতরণ" যখন ( এক্স - μ ) / σ একটি সম্ভাব্যতা ঘনত্ব আছে চ ( এক্স ) সমানুপাতিক EXP ( - এক্স 2 / 2 ) । যখন σ = 1 এবং μ = 0 , এক্স একটি আছে বলা হয় মান স্বাভাবিক বন্টন।X(X−μ)/σf(x)exp(−x2/2)σ=1μ=0X
অনেকগুলি ডেটাসেট ডেটা এবং নিম্ন শক্তিগুলির (সাধারণত স্কোয়ার) যুক্তিযুক্ত সংশ্লেষের সাথে তুলনামূলকভাবে সহজ পরিসংখ্যান ব্যবহার করে অধ্যয়ন করা হয়। যখন সেই ডেটাগুলিকে একটি সাধারণ বিতরণ থেকে এলোমেলো নমুনা হিসাবে মডেল করা হয় - যাতে প্রতিটি x আমি একটি সাধারণ পরিবর্তনশীল এক্স i এর উপলব্ধি হিসাবে দেখা হয় , সমস্ত এক্স আমি একটি সাধারণ বিতরণ ভাগ করে নিই এবং স্বাধীন হয় - সেই পরিসংখ্যানগুলির বিতরণ যে সাধারণ বিতরণ দ্বারা নির্ধারিত হয়। বাস্তবে যেগুলি প্রায়শই উত্থিত হয় সেগুলিx1,x2,…,xnxiXiXi
,শিক্ষার্থীর টি বন্টনসঙ্গে ν = ঢ - 1 "। স্বাধীন ডিগ্রীগুলির" এটি পরিসংখ্যান t = ˉ X এর বিতরণtνtν=n−1 যেখানে ˉ এক্স =(এক্স1+এক্স2+⋯+এক্সএন)/nতথ্য এবংসে(এক্স)=(1/√)এর গড় মডেল করে
t = এক্স¯SE(X)
X¯=(X1+X2+⋯+Xn)/n হ'ল মধ্যমানের ত্রুটি। N-1দ্বারা বিভাজনটিদেখায় যেnঅবশ্যই2বা তার বেশিহতে হবে, যেহেতুνএকটি পূর্ণসংখ্যা1বা তার বেশি। সূত্রটি যদিও আপাতদৃষ্টিতে খানিকটা জটিল, তবে ডিগ্রি টু ডেটার তথ্যগুলির যৌক্তিক ফাংশনের বর্গমূল: এটি তুলনামূলকভাবে সহজ।se(X)=(1/n−−√)(X21+X22+⋯+X2n)/(n−1)−X¯2−−−−−−−−−−−−−−−−−−−−−−−−−−−−√n−1n2ν1
, χ 2 (চি-স্কোয়ারড) বন্টনসঙ্গে ν "স্বাধীন ডিগ্রীগুলির" (df প্রয়োগ)। এটি ν স্বতন্ত্র স্ট্যান্ডার্ড সাধারণ ভেরিয়েবলগুলিরবর্গের যোগফলের বিতরণ। এই ভেরিয়েবল স্কোয়ার গড় বিতরণের তাই হতে হবে χ 2 বন্টনের দ্বারা ছোটো 1 / ν : আমি একটি "স্বাভাবিক" এই পড়ুন হবে χ 2 বন্টন।χ2νχ2ννχ21/νχ2
, এফ পরামিতি সঙ্গে অনুপাত বন্টন ( ν 1 , ν 2 ) দুটি স্বাধীন সাধারণ অনুপাত χ 2 সঙ্গে ডিস্ট্রিবিউশন ν 1 এবং ν 2 স্বাধীন ডিগ্রীগুলির।Fν1,ν2F(ν1,ν2)χ2ν1ν2
গাণিতিক গণনাগুলি দেখায় যে এই তিনটি বিতরণের ঘনত্ব রয়েছে। গুরুত্বপূর্ণভাবে, বিতরণের ঘনত্ব গামার ( Γ ) ফাংশনটির অবিচ্ছেদ্য সংজ্ঞাতে ইলারের সংখ্যার সাথে সমানুপাতিক । আসুন তাদের তুলনা করুন:χ2νΓ
fχ2ν(2x)∝xν/2−1e−x;fΓ(ν)(x)∝xν−1e−x.
এ থেকে জানা যায় দুবার পরিবর্তনশীল পরামিতি সঙ্গে একটি গামা ডিস্ট্রিবিউশন আছে ν / 2 । অর্ধেকের ফ্যাক্টরটি যথেষ্ট বিরক্তিকর, তবে 1 টি বিয়োগ করা সম্পর্কটিকে আরও খারাপ করে তুলবে। ইতিমধ্যে প্রশ্ন করার জন্য একটি বাধ্যকারী উত্তর সরবরাহ: যদি আমরা একটি প্যারামিটার চান χ 2 বন্টন স্কোয়ারড সাধারন ভেরিয়েবল এটি (একটি গুণক পর্যন্ত উত্পাদন সংখ্যা গণনা করার জন্য 1 / 2 ) তাহলে তার ঘনত্ব ফাংশন আবশ্যক মধ্যে সূচক, যে গণনাটি অর্ধেকের চেয়ে কম হবে। χ2νν/21χ21/2
কেন ফ্যাক্টর পার্থক্য কম বিরক্তিজনক 1 ? কারণটি হ'ল যখন আমরা জিনিসগুলি যুক্ত করি তখন ফ্যাক্টরটি সুসংগত থাকবে। যদি n স্বতন্ত্র স্ট্যান্ডার্ড নরমালগুলির বর্গের যোগফল n ( প্যারামিটার এন (কয়েক গুণকে কিছু) দিয়ে গামা বিতরণের সাথে সমানুপাতিক হয় , তবে মি স্ট্যান্ডার্ড স্ট্যান্ডার্ড নরমালসের বর্গের যোগফল প্যারামিটার মিটার সাথে গামা বিতরণের সাথে সমানুপাতিক (একই ফ্যাক্টরের বার)) , যেহেতু সমস্ত এন + মি ভেরিয়েবলের বর্গের যোগফল প্যারামিটার মি + এন (এখনও একই ফ্যাক্টরের গুণমান) সহ গামা বিতরণের সাথে সমানুপাতিক । 1/21nnmmn+mm+nপ্যারামিটারগুলিকে এত ঘনিষ্ঠভাবে সংযোজন করে গণনাগুলি যুক্ত করার বিষয়টি খুব সহায়ক।
তবে, আমরা যদি গাণিতিক সূত্রগুলি থেকে সেই উদ্বেগজনক চেহারা " " সরিয়ে ফেলি তবে এই সুন্দর সম্পর্কগুলি আরও জটিল হয়ে উঠবে। উদাহরণস্বরূপ, যদি আমরা পরিবর্তন প্রকৃত ক্ষমতা উল্লেখ করতে গামা ডিস্ট্রিবিউশন এর একখান এক্স সূত্রে, যাতে একটি χ 2 1 বন্টন একটি "গামা এর সাথে সম্পর্কিত করা হবে ( 0 ) শক্তি যেহেতু" বন্টন ( এক্স তার পিডিএফটি 1 - 1 = 0 ), তারপরে তিন χ 2 1 বিতরণের যোগফলকে "গামা ( 2 ) বলা উচিত−1xχ21(0)x1−1=0χ21(2)"বিতরণ। সংক্ষেপে, গামা বিতরণগুলিতে স্বাধীনতার ডিগ্রি এবং প্যারামিটারের মধ্যে ঘনিষ্ঠ সংযুক্তি সম্পর্ক হ'ল সূত্র থেকে সরিয়ে এবং প্যারামিটারে শোষিত করে।−1
একইভাবে, অনুপাত বিতরণের সম্ভাব্যতা কার্যটি বিটা বিতরণের সাথে নিবিড়ভাবে সম্পর্কিত। বস্তুত, যখন ওয়াই একটি হয়েছে এফ অনুপাত বন্টন, বিতরণের জেড = ν 1 ওয়াই / ( ν 1 ওয়াই + + ν 2 ) একটি বিটা হয়েছে ( ν 1 / 2 , ν 2 / 2 ) বন্টন। এর ঘনত্বের কার্য সমানুপাতিকFYFZ=ν1Y/(ν1Y+ν2)(ν1/2,ν2/2)
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
উপরন্তু - একটি স্টুডেন্ট বর্গ - এই ধারনা দুষ্টচক্র গ্রহণ দিয়ে বন্টন ν df প্রয়োগ করেছে একটি এফ পরামিতি সঙ্গে অনুপাত বন্টন ( 1 , ν ) । আরও একবার স্পষ্ট যে প্রচলিত প্যারামিটারাইজেশন রাখা স্বাধীনতার ডিগ্রিতে অবদান রাখে এমন অন্তর্নিহিত গণনাগুলির সাথে একটি সুস্পষ্ট সম্পর্ক বজায় রাখে।tνF(1,ν)
একটি পরিসংখ্যানগত দৃষ্টিকোণ থেকে, তারপর, এবং বিটা বিতরণের প্রচলিত গাণিতিক প্যারামিটারাইজেশনগুলির বিভিন্নতা ব্যবহার করা সবচেয়ে প্রাকৃতিক এবং সরল হবে : আমাদের একটি Γ ( α ) বিতরণকে " Γ ( 2 α ) বিতরণ" বলা উচিত এবং বিটা ( α , β ) বিতরণকে "বিটা ( 2 α , 2 β ) বিতরণ বলা উচিত।" প্রকৃতপক্ষে, আমরা ইতিমধ্যে এটি করে ফেলেছি: এটি কারণেই আমরা "চি-স্কোয়ারড" এবং " এফ " নামগুলি ব্যবহার করতে থাকি thisΓΓ(α)Γ(2α)(α,β)(2α,2β)F"গামা" এবং "বিটা" এর পরিবর্তে অনুপাত "বিতরণ। নির্বিশেষে, কোনও ক্ষেত্রেই আমরা তাদের ঘনত্বের জন্য গাণিতিক সূত্রে উপস্থিত " "পদগুলি সরাতে চাই না ।−1 যদি আমরা এটি করি তবে আমরা সরাসরি সংযোগ হারাব ঘনত্বগুলির পরামিতিগুলির সাথে এবং ডেটা গণনার সাথে যার সাথে তারা জড়িত: আমরা সর্বদা এক হয়ে থাকব।