কীভাবে স্বাধীনতার ডিগ্রি বুঝবেন?


257

উইকিপিডিয়া থেকে , একটি পরিসংখ্যানের স্বাধীনতার ডিগ্রিগুলির তিনটি ব্যাখ্যা রয়েছে:

পরিসংখ্যানগুলিতে, স্বাধীনতার ডিগ্রির সংখ্যা হ'ল পরিসংখ্যানের চূড়ান্ত গণনায় মানগুলি যা পৃথক পৃথক পৃথক

পরিসংখ্যানগত পরামিতিগুলির অনুমানগুলি বিভিন্ন পরিমাণের তথ্য বা ডেটার উপর ভিত্তি করে তৈরি করা যেতে পারে। সংখ্যা তথ্য স্বাধীন টুকরা করে একটি পরামিতির হিসাব ঢোকা ফ্রিডম (df প্রয়োগ) ডিগ্রী বলা হয়। সাধারণভাবে, প্যারামিটারের একটি অনুমানের স্বাধীনতার ডিগ্রিগুলি স্বতন্ত্র স্কোরগুলির সংখ্যার সমান যা প্যারামিটারের নিজেই অনুমানের মধ্যবর্তী পদক্ষেপ হিসাবে ব্যবহৃত পরামিতিগুলির অনুমানের বিয়োগে যায় into যা (যা, নমুনা বৈকল্পিকভাবে, এক, যেহেতু নমুনা গড় একমাত্র মধ্যবর্তী পদক্ষেপ)।

গাণিতিকভাবে, স্বাধীনতার ডিগ্রি হ'ল একটি এলোমেলো ভেক্টরের ডোমেনের মাত্রা বা মূলত 'ফ্রি' উপাদানগুলির সংখ্যা: ভেক্টর সম্পূর্ণ নির্ধারণের আগে কতগুলি উপাদান জানা দরকার

সাহসী শব্দগুলি যা আমি বেশ বুঝতে পারি না। সম্ভব হলে কিছু গাণিতিক সূত্র ধারণাটি পরিষ্কার করতে সহায়তা করবে help

এছাড়াও তিনটি ব্যাখ্যা কি একে অপরের সাথে একমত হয়?



উত্তর:


242

এটি একটি সূক্ষ্ম প্রশ্ন। চিন্তাভাবনা করে এমন ব্যক্তির লাগে সেই উদ্ধৃতিগুলি না বুঝে! যদিও তারা প্রস্তাবনামূলক তবে দেখা যাচ্ছে যে এগুলির কোনওটিই ঠিক বা সাধারণভাবে সঠিক নয়। আমার কাছে পূর্ণ বিবরণ দেওয়ার মতো সময় নেই (এবং এখানে জায়গা নেই) তবে আমি এটির প্রস্তাবনা এবং একটি অন্তর্দৃষ্টি ভাগ করতে চাই।

স্বাধীনতার ডিগ্রি (ডিএফ) ধারণাটি কোথায় জন্মায়? প্রাথমিক চিকিত্সাগুলিতে এটি যে প্রসঙ্গে দেখা যায় সেগুলি হ'ল:

  • শিক্ষার্থীর t-test এর এবং এই ধরনের Behrens-ফিশার সমস্যা (যেখানে দুই জনগোষ্ঠী বিভিন্ন ভেরিয়ানস আছে) থেকে ওয়েলশ বা Satterthwaite সমাধান হিসেবে তার রূপের।

  • চি-স্কোয়ার ডিস্ট্রিবিউশন (স্বতন্ত্র স্ট্যান্ডার্ড সাধারণের স্কোয়ারের যোগফল হিসাবে সংজ্ঞায়িত), যা বৈকল্পিকের নমুনা বিতরণে জড়িত

  • এফ পরীক্ষা (আনুমানিক ভেরিয়ানস এর অনুপাতের)।

  • চি-স্কোয়ারড পরীক্ষা , আকস্মিকতার টেবিল সালে স্বাধীনতার এবং (খ) distributional অনুমান হইয়া ধার্মিকতা জন্য পরীক্ষার জন্য (ক) পরীক্ষার মধ্যে তার ব্যবহারসমূহ গঠিত।

আধ্যাত্মিকভাবে, এই পরীক্ষাগুলি নির্ভুল হওয়া থেকে (সাধারণ পরিবর্তনের জন্য শিক্ষার্থীর টি-টেস্ট এবং এফ-পরীক্ষা) ভাল সান্নিধ্য হিসাবে চালানো (স্টুডেন্ট টি-টেস্ট এবং ওয়েলচ / স্যাটারথওয়েট টেস্টগুলি খুব খারাপভাবে-স্কিউড ডেটা না করার জন্য) চালায় to ) অ্যাসিপটোটিক আনুমানিকতার (চি-স্কোয়ার্ড পরীক্ষা) ভিত্তিক হওয়া। এর কয়েকটিটির একটি আকর্ষণীয় দিক হ'ল অবিচ্ছেদ্য "স্বাধীনতার ডিগ্রি" (ওয়েলচ / স্যাটার্থওয়েট পরীক্ষা এবং যেমন আমরা দেখতে পাব, চি-স্কোয়ার্ড পরীক্ষা) উপস্থিতি। এই বিশেষ আগ্রহের কারণ এটি প্রথম ইঙ্গিতটি যে ডিএফ হয় না তা দাবি যে কোনো।

আমরা প্রশ্নের কিছু দাবি অবিলম্বে নিষ্পত্তি করতে পারি। যেহেতু "একটি পরিসংখ্যানের চূড়ান্ত গণনা" ভালভাবে সংজ্ঞায়িত করা হয়নি (এটি গণনার জন্য কোনওটি অ্যালগরিদম ব্যবহার করে তা স্পষ্টতই নির্ভর করে), এটি একটি অস্পষ্ট পরামর্শ ছাড়া আর কিছু হতে পারে না এবং এটির আর সমালোচনা করার মতো নয়। একইভাবে, "স্বতন্ত্র স্কোরগুলির সংখ্যা যা অনুমানের মধ্যে যায়" বা "মধ্যবর্তী পদক্ষেপ হিসাবে ব্যবহৃত প্যারামিটারের সংখ্যা" কোনওটিই সুসংজ্ঞায়িত হয় না।

"[প্রাক্কলিত অনুমানের মধ্যে থাকা তথ্যের স্বতন্ত্র টুকরোগুলি" মোকাবেলা করা কঠিন, কারণ এখানে "প্রাসঙ্গিক" সম্পর্কিত দুটি পৃথক তবে ঘনিষ্ঠভাবে সম্পর্কিত সংবেদন রয়েছে যা এখানে প্রাসঙ্গিক হতে পারে। একটি র্যান্ডম ভেরিয়েবলের স্বাধীনতা; অন্যটি হ'ল কার্যক্ষম স্বাধীনতা। পরেরটির একটি উদাহরণ হিসাবে, ধরুন আমরা বিষয় morphometric পরিমাপ সংগ্রহ করি - বলো, সরলতা জন্য তিনটি পাশ লেন্থ , , , পৃষ্ঠ এলাকা , এবং ভলিউম এর কাঠের ব্লক একটি সেট। তিন পাশের দৈর্ঘ্যগুলি স্বাধীন র্যান্ডম ভেরিয়েবল হিসাবে বিবেচনা করা যেতে পারে তবে সমস্ত পাঁচটি ভেরিয়েবল নির্ভরশীল আরভি। পাঁচটিও কার্যনির্বাহীওয়াই জেড এস = 2 ( এক্স ওয়াই + + ওয়াই জেড + + জেড এক্স ) ভী = এক্স ওয়াই জেড ( এক্স , ওয়াই , জেড , এস , ভি ) আর 5 ω আর 5 ω ω ω ( এক্স ( ψ ) , , ভি ( ψ ) ) = 0 গ্রাম ωXYZS=2(XY+YZ+ZX)V=XYZনির্ভরশীল কারণ codomain ( না ভেক্টর-মূল্যবান এলোপাতাড়ি ভেরিয়েবলের "DOMAIN"!) আউট একটি ত্রিমাত্রিক নানাবিধ ট্রেস । (সুতরাং, স্থানীয়ভাবে যে কোনও বিন্দুতে দুটি ফাংশন রয়েছে এবং যার জন্য এবং পয়েন্টের জন্য "" কাছাকাছি এবং এবং এর ডেরিভেটিভগুলি মূল্যায়ন করা হয়েছে(X,Y,Z,S,V)R5ωR5fωgωfω(X(ψ),,V(ψ))=0ψ ω এফgω(X(ψ),,V(ψ))=0ψωfω ( এক্স , এস , ভি )gωলিনিয়ারলি ইন্ডিপেন্ডেন্ট।) তবে - এখানে কিকারটি রয়েছে - ব্লকের উপর অনেকগুলি সম্ভাব্যতার জন্য, এর মতো ভেরিয়েবলের সাবসেটগুলি এলোমেলো ভেরিয়েবল হিসাবে নির্ভরশীল তবে কার্যত স্বতন্ত্র।(X,S,V)

এই সম্ভাব্য অস্পষ্টতা দ্বারা সজাগ হয়ে আসুন , আসুন পরীক্ষার জন্য ফিট-স্কোয়ার ধার্মিকতা ধরে রাখি , কারণ (ক) এটি সহজ, (খ) এটি সাধারণ পরিস্থিতিগুলির মধ্যে একটি যেখানে লোকেরা সত্যিকার অর্থে ডিএফ সম্পর্কে জানতে হবে পি-মান ডান এবং (গ) এটি প্রায়শই ভুলভাবে ব্যবহৃত হয়। এখানে এই পরীক্ষার সর্বনিম্ন বিতর্কিত প্রয়োগের সংক্ষিপ্তসার:

  • আপনার কাছে জনসংখ্যার নমুনা হিসাবে বিবেচিত ডেটা মানগুলির সংগ্রহ রয়েছে ।(x1,,xn)

  • আপনি কয়েকটি প্যারামিটার- অনুমান করেছেন । উদাহরণস্বরূপ, আপনি অনুমান করেছেন যে কোনও সাধারণ বন্টনের গড় এবং স্ট্যান্ডার্ড বিচ্যুতি , অনুমান করে জনসংখ্যা সাধারণত বিতরণ করা হয় তবে জানেন না (তথ্য প্রাপ্তির আগাম) কী বা হতে পারে।θ 1 θ 2 = θ পি θ 1 θ 2θ1,,θpθ1θ2=θpθ1θ2

  • আগাম, আপনি ডেটার জন্য "বিন" সেট তৈরি করেছেন । (এটি প্রায়শই সম্পন্ন হওয়া সত্ত্বেও, ডেটা দ্বারা বিনগুলি নির্ধারণ করা হলে এটি সমস্যাযুক্ত হতে পারে)) এই বিনগুলি ব্যবহার করে ডেটা প্রতিটি বিনের অভ্যন্তরে সংখ্যায় সেট হয়ে যায়। আসল মানগুলি কী হতে পারে তা অনুমান করে আপনি এটি সাজিয়ে রেখেছেন যাতে (আশা করা যায়) প্রতিটি বিন প্রায় একই গণনা পাবেন। (সম-সম্ভাব্যতা বিন্নিং চি-স্কোয়ার্ড বিতরণকে সত্যই বর্নিত হওয়া সম্পর্কে চি-স্কোয়ারের পরিসংখ্যানের সত্যিকারের বিতরণের একটি ভাল অনুমানের নিশ্চয়তা দেয়))( θ )k(θ)

  • আপনার কাছে প্রচুর ডেটা রয়েছে - এটি নিশ্চিত করার জন্য যথেষ্ট যে প্রায় সমস্ত ডাবের 5 বা ততোধিক গণনা হওয়া উচিত। (এটি, আমরা আশা করি, কিছু বিতরণ দ্বারা পর্যাপ্ত পরিমাণে পরিসংখ্যানের স্যাম্পলিং বিতরণ সক্রিয় করতে সক্ষম করবে ))χ 2χ2χ2

পরামিতি অনুমান ব্যবহার করে, আপনি প্রতিটি বিনে প্রত্যাশিত গণনা গণনা করতে পারেন। চি-স্কোয়ার স্ট্যাটিস্টিক হ'ল অনুপাতের যোগফল

(observedexpected)2expected.

এটি, অনেক কর্তৃপক্ষ আমাদের বলে, এটি (খুব কাছের কাছাকাছি) চি-স্কোয়ার বিতরণ হওয়া উচিত। তবে এই জাতীয় বিতরণের পুরো পরিবার আছে। তারা একটি প্যারামিটার দ্বারা পৃথকীকৃত হয় প্রায়ই হিসাবে উল্লেখ করা "স্বাধীন ডিগ্রীগুলির।" কীভাবে নির্ধারণ করবেন সে সম্পর্কে স্ট্যান্ডার্ড যুক্তিটি এরকম হয়ννν

আমি গন্য। এটা তথ্য টুকরোগুলি। তবে তাদের মধ্যে ( ক্রিয়ামূলক ) সম্পর্ক রয়েছে। শুরু করার জন্য, আমি আগে থেকেই জানি যে গণনাগুলির যোগফল অবশ্যই সমান হয় । এটাই এক সম্পর্ক। আমি ডেটা থেকে দুটি (বা , সাধারণত) পরামিতি অনুমান করেছি । এটি দুটি (বা ) অতিরিক্ত সম্পর্ক, টি সম্পূর্ণ সম্পর্ক দেয়। তারা (পরামিতি) হয় সাহসী সমস্ত ( বৈশিষ্ট্যগুলি ) স্বাধীন, যে শুধুমাত্র ছেড়ে ( বৈশিষ্ট্যগুলি ) স্বাধীন "স্বাধীন ডিগ্রীগুলির": যে জন্য ব্যবহার করতে মান ।কে এন পি পি পি + 1 কে - পি - 1 ν νkknppp+1kp1ν

এই যুক্তিটির সাথে সমস্যা (যা প্রশ্নে উদ্ধৃতিগুলি ইঙ্গিত করছে এমন গণনার ক্রম) এটি কিছু ভুল অতিরিক্ত শর্তগুলি ধরে রাখলে ভুল হয়। অধিকন্তু, ঐ অবস্থায় আছে কিছুই ডেটার "উপাদান" এর সংখ্যার স্বাধীনতার (কার্মিক বা পরিসংখ্যানগত) সঙ্গে করতে হবে, প্যারামিটার সংখ্যার, কিংবা কিছু দিয়ে অন্য মূল প্রশ্নে বলা হয়।

আমি একটি উদাহরণ দিয়ে আপনাকে দেখাতে দিন। (এটি যথাসম্ভব পরিষ্কার করার জন্য, আমি কয়েকটি সংখ্যক বিন্দু ব্যবহার করছি, তবে এটি অত্যাবশ্যক নয়)) আসুন ২০ টি স্বতন্ত্র এবং অভিন্নরূপে বিতরণ করা হবে (আইআইডি) স্ট্যান্ডার্ড সাধারণ প্রকারভেদগুলি এবং সাধারণ সূত্রগুলির সাথে তাদের গড় এবং মানক বিচ্যুতিটি অনুমান করুন ( গড় = যোগ / গণনা ইত্যাদি )। ফিটের সদ্ব্যবহার পরীক্ষা করতে, স্ট্যান্ডার্ড স্বাভাবিকের চতুর্দিকে কাটপয়েন্টগুলি সহ চারটি বিন তৈরি করুন: -0.675, 0, +0.657, এবং চি-স্কোয়ার স্ট্যাটিস্টিকস তৈরি করতে বিন সংখ্যাগুলি ব্যবহার করুন। ধৈর্য অনুমতি দেয় হিসাবে পুনরাবৃত্তি; আমার 10,000 টি পুনরাবৃত্তি করার সময় ছিল।

ডিএফ সম্পর্কে স্ট্যান্ডার্ড জ্ঞান বলছে যে আমাদের 4 টি বিন এবং 1 + 2 = 3 সীমাবদ্ধতা রয়েছে, এই 10,000 চি-স্কোয়ার পরিসংখ্যানের বিতরণকে বোঝায় যে 1 ডিএফ দিয়ে চি-স্কোয়ার বিতরণ অনুসরণ করা উচিত। হিস্টোগ্রামটি এখানে:

চিত্র 1

গা dark় নীল রেখার গ্রাফগুলি একটি বিতরণের পিডিএফ গ্রাফ করে - যা আমরা ভেবেছিলাম এটি কাজ করবে - যখন গা dark় লাল রেখার গ্রাফ একটি বিতরণের (যা ভাল হবে অনুমান করুন কেউ যদি আপনাকে বলে যে টি ভুল)। উভয়ই ডেটা ফিট করে না।χ 2 ( 2 ) ν = 1χ2(1)χ2(2)ν=1

আপনি ডেটা সেটগুলির ছোট আকারের ( = 20) বা বিনের সংখ্যার ছোট আকারের কারণে সমস্যাটি আশা করতে পারেন । তবে, সমস্যাটি খুব বড় ডেটাসেট এবং বৃহত সংখ্যক বিনের পরেও বজায় রয়েছে: এটি কেবলমাত্র একটি অ্যাসিম্পটোটিক আনুমানিক কাছে পৌঁছাতে ব্যর্থতা নয়।n

জিনিসগুলি ভুল হয়েছে কারণ আমি চি-স্কোয়ার পরীক্ষার দুটি প্রয়োজনীয়তা লঙ্ঘন করেছি:

  1. আপনাকে অবশ্যই পরামিতিগুলির সর্বাধিক সম্ভাবনার প্রাক্কলনটি ব্যবহার করতে হবে । (এই প্রয়োজনীয়তাটি বাস্তবে সামান্য লঙ্ঘন হতে পারে))

  2. আপনার অবশ্যই সেই অনুমানটি গণনার উপর ভিত্তি করে তৈরি করা উচিত , আসল ডেটাতে নয়! (এটি অত্যন্ত গুরুত্বপূর্ণ ।)

চিত্র ২

লাল হিস্টগ্রাম এই প্রয়োজনীয়তাগুলি অনুসরণ করে 10,000 টি পৃথক পুনরাবৃত্তির জন্য চি-স্কোয়ার পরিসংখ্যান চিত্রিত করে। নিশ্চিতভাবেই, এটি দৃশ্যত বক্ররেখাকে (গ্রহণযোগ্য পরিমাণে নমুনা ত্রুটির সাথে) অনুসরণ করে, যেমনটি আমরা প্রাথমিকভাবে আশা করি।χ2(1)

এই তুলনার মূল কথাটি - যা আমি আশা করি আপনি আগত দেখেছেন - এটি হ'ল পি-ভ্যালুগুলি গণনা করার জন্য সঠিক ডিএফ ব্যবহার করা বহুগুণের মাত্রা, কার্যকরী সম্পর্কের সংখ্যা বা সাধারণ পরিবর্তনের জ্যামিতি ব্যতীত অন্য অনেক কিছুর উপর নির্ভর করে । কিছু কার্যকরী নির্ভরতাগুলির মধ্যে একটি সূক্ষ্ম, সূক্ষ্ম মিথস্ক্রিয়া রয়েছে , যেমন পরিমাণের মধ্যে গাণিতিক সম্পর্কের মধ্যে পাওয়া যায়, এবং ডেটা বিতরণ , তাদের পরিসংখ্যান এবং এগুলি থেকে তৈরি অনুমানক। তদনুসারে, এটি এমনটি ঘটতে পারে না যে মাল্টিভারিয়েট স্বাভাবিক বিতরণগুলির জ্যামিতির ক্ষেত্রে, বা কার্যকরী স্বাধীনতার ক্ষেত্রে, বা পরামিতিগুলির পরিসংখ্যান হিসাবে বা এই প্রকৃতির অন্য কোনও কিছুর ক্ষেত্রে ডিএফ যথেষ্ট পরিমাণে ব্যাখ্যাযোগ্য।

আমাদের দেখতে পাওয়া যায় যে "স্বাধীনতার ডিগ্রি" নিছক একটি হিউরিস্টিক যা সূচিত করে যে (টি, চি-স্কোয়ার্ড, বা এফ) পরিসংখ্যানগুলির নমুনা বিতরণ কী হওয়া উচিত, তবে এটি বিতর্কিত নয়। বিশ্বাস করা যায় যে এটি নিষ্পত্তিমূলক গুরুতর ত্রুটির দিকে পরিচালিত করে। (উদাহরণস্বরূপ, "চি স্কোয়ারড গুডনেস অফ ফিট" অনুসন্ধানের সময় গুগলে শীর্ষস্থানীয় চিত্র হ'ল আইভি লীগ বিশ্ববিদ্যালয়টির একটি ওয়েব পৃষ্ঠা যা এটি পুরোপুরি ভুল হয়ে যায়! বিশেষত, এর নির্দেশাবলীর উপর ভিত্তি করে একটি সিমুলেশন দেখায় যে চি-স্কোয়ার্ড 7 ডিএফ থাকার ক্ষেত্রে এটিতে 9 ডিএফ রয়েছে বলে মানটি সুপারিশ করে)

এই আরও সংক্ষিপ্ত বোঝার সাথে, প্রশ্নে উইকিপিডিয়া নিবন্ধটি পুনরায় পড়ার পক্ষে এটি সার্থক: তার বিবরণে এটি জিনিসগুলি সঠিকভাবে পায়, যেখানে ডিএফ হিউরিস্টিক কোথায় কাজ করে এবং কোথায় হয় এটি প্রায় অনুমান বা আদৌ প্রয়োগ হয় না তা নির্দেশ করে।


এখানে চিত্রিত ঘটনাটির একটি উত্তম বিবরণ (চি-স্কোয়ারড জিওএফ পরীক্ষায় অপ্রত্যাশিতভাবে উচ্চ ডিএফ) কেন্ডাল অ্যান্ড স্টুয়ার্টের ৩ য় সংস্করণে প্রকাশিত হয়েছে । এই চমত্কার পাঠটিতে আমাকে ফিরিয়ে আনতে এই প্রশ্নটির সুযোগের জন্য আমি কৃতজ্ঞ, যা এই জাতীয় দরকারী বিশ্লেষণে পূর্ণ।


সম্পাদনা (জানুয়ারী 2017)

R"ডিএফ সম্পর্কে স্ট্যান্ডার্ড বুদ্ধি ..." অনুসরণ করে চিত্রটি তৈরি করার কোড এখানে রয়েছে

#
# Simulate data, one iteration per column of `x`.
#
n <- 20
n.sim <- 1e4
bins <- qnorm(seq(0, 1, 1/4))
x <- matrix(rnorm(n*n.sim), nrow=n)
#
# Compute statistics.
#
m <- colMeans(x)
s <- apply(sweep(x, 2, m), 2, sd)
counts <- apply(matrix(as.numeric(cut(x, bins)), nrow=n), 2, tabulate, nbins=4)
expectations <- mapply(function(m,s) n*diff(pnorm(bins, m, s)), m, s)
chisquared <- colSums((counts - expectations)^2 / expectations)
#
# Plot histograms of means, variances, and chi-squared stats.  The first
# two confirm all is working as expected.
#
mfrow <- par("mfrow")
par(mfrow=c(1,3))
red <- "#a04040"  # Intended to show correct distributions
blue <- "#404090" # To show the putative chi-squared distribution
hist(m, freq=FALSE)
curve(dnorm(x, sd=1/sqrt(n)), add=TRUE, col=red, lwd=2)
hist(s^2, freq=FALSE)
curve(dchisq(x*(n-1), df=n-1)*(n-1), add=TRUE, col=red, lwd=2)
hist(chisquared, freq=FALSE, breaks=seq(0, ceiling(max(chisquared)), 1/4), 
     xlim=c(0, 13), ylim=c(0, 0.55), 
     col="#c0c0ff", border="#404040")
curve(ifelse(x <= 0, Inf, dchisq(x, df=2)), add=TRUE, col=red, lwd=2)
curve(ifelse(x <= 0, Inf, dchisq(x, df=1)), add=TRUE, col=blue, lwd=2)
par(mfrow=mfrow)

40
এটি একটি আশ্চর্যজনক উত্তর। আপনি এই জন্য ইন্টারনেটে জয়।
আদম

6
@ কারাকাল: যেমন আপনি জানেন, মূল উপাত্তের জন্য এমএল পদ্ধতিগুলি রুটিন এবং বিস্তৃত: উদাহরণস্বরূপ, distribution এর এমএলই নমুনা গড় এবং ig এমএলই হ'ল নমুনা স্ট্যান্ডার্ড বিচ্যুতির বর্গমূল ( সাধারণ পক্ষপাত সংশোধন ছাড়াই ) গণনার উপর ভিত্তি করে অনুমানগুলি অর্জনের জন্য, আমি গণনাগুলির জন্য সম্ভাবনা ফাংশনটি গণনা করেছি - এর জন্য কাটপয়েন্টগুলিতে সিডিএফের গণনা মানগুলি প্রয়োজন, তাদের লগগুলি গ্রহণ করা, গণনাগুলি দ্বারা গুণ করা এবং যোগ করা - এবং জেনেরিক অপ্টিমাইজেশন সফ্টওয়্যার ব্যবহার করে এটি অনুকূলিতকরণ করা দরকার। σμσ
whuber

4
@ কারাকাল সম্ভবত আপনার এখন আর এটির প্রয়োজন নেই, তবে বিন্যাসিত ডেটার এমএল ফিটিংয়ের কোডের একটি উদাহরণ Rএখন সম্পর্কিত প্রশ্নে উপস্থিত হবে: stats.stackexchange.com/a/34894
whuber

1
"এই যুক্তিযুক্ত সমস্যাটি (যা প্রশ্নে উদ্ধৃতিগুলি ইঙ্গিত করছে এমন গণনার ক্রম) এটি কিছু ভুল অতিরিক্ত শর্ত থাকা ব্যতীত ভুল।" আমি এখন (প্রায়) লিনিয়ার মডেল সিকোয়েন্সের দুটি সেমিস্টারের মধ্য দিয়ে এসেছি এবং আমি চতুর্ভুজ আকারের "মাঝারি" ম্যাট্রিক্সের পদমর্যাদার হতে স্বাধীনতার ডিগ্রিগুলি বুঝতে পারি। এই "অতিরিক্ত শর্ত" কি?
ক্লারিনেটিস্ট

4
@ ক্লারিনেটিস্ট আমার উত্তরের মূল বক্তব্যটি হ'ল আপনাকে যা শিখানো হয়েছে তা ডিএফ-এর দুটি ধারণার বিভ্রান্তির উপর ভিত্তি করে। যদিও এই বিভ্রান্তিটি আদর্শ-তাত্ত্বিক সাধারণ-তত্ত্বের মডেলগুলির জন্য কোনও সমস্যা তৈরি করে না, এটি সাধারণ, সাধারণ পরিস্থিতিতে এমনকি তাত্পর্য টেবিলগুলির বিশ্লেষণের মতো ত্রুটি বাড়ে। এই ম্যাট্রিক্স র‌্যাঙ্কটি কার্যকরী ডিএফ দেয় । একটি সর্বনিম্ন-স্কোয়ার লিনিয়ার মডেলটিতে এফ টেস্টের মতো নির্দিষ্ট ধরণের পরীক্ষার জন্য সঠিক ডিএফ দেওয়ার ঘটনা ঘটে । চি-স্কোয়ার পরীক্ষার জন্য, বিশেষ শর্তগুলি উত্তর হিসাবে পয়েন্ট (1) এবং (2) হিসাবে পরে গণনা করা হয়।
whuber

74

বা সহজভাবে: সংখ্যার অ্যারেতে উপাদানগুলির সংখ্যা যা আপনাকে পরিবর্তনের অনুমতি দেয় যাতে পরিসংখ্যানের মান অপরিবর্তিত থাকে।

# for instance if:
x + y + z = 10

তোমার জন্য উদাহরণস্বরূপ, পরিবর্তন করতে পারেন এক্স এবং ওয়াই এলোমেলোভাবে, কিন্তু আপনি পরিবর্তন করতে পারবেন না z- র (আপনি যা করতে পারেন, কিন্তু না এলোমেলোভাবে, অতএব তুমি নও বিনামূল্যে এটি পরিবর্তন করতে - হার্ভি এর মন্তব্য দেখুন), 'কারন তুমি মান পরিবর্তন করব পরিসংখ্যানের (Σ = 10)। সুতরাং, এই ক্ষেত্রে df = 2।


19
"আপনি z পরিবর্তন করতে পারবেন না" বলা মোটেও ঠিক নয়। প্রকৃতপক্ষে, যোগফলটি 10 ​​এর সমান করতে আপনাকে জেড পরিবর্তন করতে হবে তবে এটি কী পরিবর্তিত হবে সে সম্পর্কে আপনার কোনও পছন্দ (স্বাধীনতা নেই)। আপনি যে কোনও দুটি মান পরিবর্তন করতে পারবেন তবে তৃতীয় নয়।
হার্ভে মোটুলস্কি

53

ডাইমেনশনাল ইউক্লিডিয়ান জ্যামিতি, উপগঠনগুলি এবং অরথোগোনাল অনুমানগুলির কিছুটা সাধারণ জ্ঞান দেওয়াতে ধারণাটি গাণিতিক যথাযথ করা মোটেই কঠিন নয় ।n

যদি একটি হল লম্ব অভিক্ষেপ থেকে আর এন একটি থেকে পি -dimensional subspace এল এবং এক্স হয় একটি অবাধ এন -vector তারপর পি এক্স হয় এল , এক্স - পি এক্স এবং পি এক্স লম্ব এবং হয় এক্স - পি এক্স এল হয় এল এর আর্থোগোনাল পরিপূরক । এই লম্ব সম্পূরক, মাত্রা এল হয় এন - পি । যদিPRnpLxnPxLxPxPxxPxLLLnp একটি এন- মাত্রিক স্থানেরক্ষেত্রে পৃথক হতে পারেতবে এক্স - পি x একটি এন - পি মাত্রিক স্থানেরমধ্যে পৃথক হতে পারে। এই কারণে আমরা বলি যে এক্স - পি এক্স হয়েছে এন - পি স্বাধীন ডিগ্রীগুলিরxnxPxnpxPxnp

এই কারণগুলো পরিসংখ্যান কাছে গুরুত্বপূর্ণ কারন যদি একটি হল এন -dimensional র্যান্ডম ভেক্টর এবং এল তার গড় একটি মডেল, যে, গড় ভেক্টর ( এক্স ) হয় এল , তাহলে আমরা কল এক্স - পি এক্স এর ভেক্টর অবশিষ্টাংশ , এবং আমরা বিভিন্নতা অনুমান করতে অবশিষ্টাংশ ব্যবহার করি। অবশিষ্টাংশ এর ভেক্টর হয়েছে এন - পি যে, এটা মাত্রা একটি subspace করতে বাধ্য করা হয় স্বাধীন ডিগ্রীগুলির, এন - পিXnLE(X)LXPXnpnp

স্থানাঙ্ক তাহলে স্বাধীন ও স্বাভাবিকভাবে একই ভ্যারিয়েন্স সঙ্গে বিতরণ করা হয় σ 2 তারপরXσ2

  • ভেক্টরগুলি এবং এক্স - পি এক্স স্বতন্ত্র।PXXPX
  • যদি অবশিষ্টাংশের ভেক্টরের বর্গাকার আদর্শের বিতরণ | | এক্স - পি এক্স | | 2 একটি হল χ 2 -distribution স্কেলের মাপদণ্ড সঙ্গে σ 2 এবং অন্য পরামিতি যে স্বাধীনতা ডিগ্রী হতে হবে এন - পিE(X)L||XPX||2χ2σ2np

এই তথ্যগুলির প্রমাণের স্কেচটি নীচে দেওয়া হল। দুটি বিতরণ সাধারণ বিতরণের উপর ভিত্তি করে পরিসংখ্যান তত্ত্বের আরও বিকাশের জন্য কেন্দ্রীয়। এও নোট করুন যে এই কারণেই ডিসট্রিবিউশনের এটির প্যারামিট্রিকরণ রয়েছে। এটি একটি হল Γ স্কেলের মাপদণ্ড সঙ্গে -distribution 2 σ 2 এবং আকৃতি প্যারামিটার ( এন - পি ) / 2 , কিন্তু প্রেক্ষাপটে উপরে এটা স্বাধীন ডিগ্রীগুলির পদ parametrize স্বাভাবিক।χ2Γ2σ2(np)/2

আমাকে অবশ্যই স্বীকার করতে হবে যে উইকিপিডিয়া নিবন্ধ থেকে উদ্ধৃত বিশেষভাবে আলোকিত করার মতো কোনও অনুচ্ছেদ আমি পাই না, তবে সেগুলি সত্যই ভুল বা বিপরীত নয়। তারা একটি যথাযথ নয় এমন বলতে, এবং একটি সাধারণ আলগা অর্থে, আমরা যখন ভ্যারিয়েন্স প্যারামিটারের অনুমান গনা, কিন্তু অবশিষ্টাংশ উপর ভিত্তি করে না, আমরা একটি ভেক্টর যে মাত্রা একটি স্থান তারতম্য শুধুমাত্র বিনামূল্যে উপর গণনার বেস যে np

রৈখিক সাধারণ মডেলগুলির তত্ত্বের বাইরে স্বাধীনতার ডিগ্রি ধারণার ব্যবহার বিভ্রান্তিকর হতে পারে। উদাহরণস্বরূপ, এটি বিস্তারের প্যারামিট্রাইজেশনে ব্যবহৃত হয় যা কোনও কিছুরই উল্লেখ রয়েছে যা স্বাধীনতার কোনও ডিগ্রি থাকতে পারে। আমরা যখন বিভাগীয় তথ্যের পরিসংখ্যানগত বিশ্লেষণ বিবেচনা করি তখন কোনও স্বাধীনতার আগে বা পরে কোনও "স্বতন্ত্র টুকরা" গণনা করা উচিত কিনা সে সম্পর্কে কিছুটা বিভ্রান্তি হতে পারে। তদুপরি, সীমাবদ্ধতার জন্য, এমনকি সাধারণ মডেলগুলির জন্যও, যা উপগতির সীমাবদ্ধতা নয়, কীভাবে স্বাধীনতার ডিগ্রিগুলির ধারণাকে প্রসারিত করা যায় তা স্পষ্ট নয়। স্বাধীনতার কার্যকর ডিগ্রিগুলির নামে বিভিন্ন পরামর্শ সাধারণত বিদ্যমান ।χ2

স্বাধীনতার ডিগ্রির অন্য কোনও ব্যবহার এবং অর্থ বিবেচনা করার আগে আমি রৈখিক সাধারণ মডেলগুলির প্রসঙ্গে এটির সাথে আত্মবিশ্বাসী হওয়ার দৃ recommend় পরামর্শ দেব। এই মডেল শ্রেণীর সাথে সম্পর্কিত একটি রেফারেন্স হল লিনিয়ার মডেল থিওরিতে একটি প্রথম কোর্স এবং লিনিয়ার মডেলগুলিতে অন্যান্য শাস্ত্রীয় বইয়ের বইয়ের প্রবন্ধে অতিরিক্ত রেফারেন্স রয়েছে।

উপরে ফলাফল প্রমাণ: যাক , নোট করুন যে ভ্যারিয়েন্স ম্যাট্রিক্স হয় σ 2 আমি এবং orthonormal ভিত্তিতে পছন্দ করে z- র 1 , ... , z- র পি এর এল এবং orthonormal ভিত্তিতে z- র পি + + 1 , ... , z- র এন এর এল । তারপরে z 1 , , z n হ'ল R n এর একটি orthonormal ভিত্তি । যাক ~ এক্সξ=E(X)σ2Iz1,,zpLzp+1,,znLz1,,znRnX~এই ভিত্তিতে এর সহগের ভেক্টরকে বোঝান , এটি হ'ল এটি হিসাবেও লেখা যেতে পারে যেখানে অর্থোগোনাল ম্যাট্রিক্স সহ কলামে 'র। তারপর আমরা যে ব্যবহার করতে হবে গড় সঙ্গে একটি স্বাভাবিক বন্টন হয়েছে কারণ এবং, লম্ব হয়, ভ্যারিয়েন্স ম্যাট্রিক্স । এটি সাধারণ বিতরণের সাধারণ লিনিয়ার রূপান্তর ফলাফল থেকে অনুসরণ করে। ভিত্তি নির্বাচিত হয়েছে যাতে এর কোফিসিয়েন্টস হয় জন্যn˜ এক্স আই = জেড টি আই এক্স ~ এক্স = জেড টি এক্স টু Z z- র আমি ~ এক্স টু Z টি ξ জেড σ 2 আমি পি এক্স ~ এক্স আমি আমি = 1 , ... , পৃঃ এক্স - পি এক্স ~ এক্স আমি আমি = P + + 1 , ... , এন পি এক্স = P ΣX

X~i=ziTX.
X~=ZTXZziX~ZTξZσ2IPXX~ii=1,,p, এবং এর জন্য । যেহেতু সহগগুলি অনিয়ন্ত্রিত এবং যৌথভাবে স্বাভাবিক, তারা স্বতন্ত্র এবং এর দ্বারা বোঝা যায় যে এবং স্বতন্ত্র। তদুপরি, যদি তবে জন্য কারণ এবং তাই । এই ক্ষেত্রে হল এর যোগফলXPXX~ii=p+1,,nX-PX= n i = p + 1 ˜ X izi| | এক্স-পিএক্স| | 2= n i = পি + 1 ˜ এক্স 2 iξএল( ˜ এক্স আই)=জেড টি আই ξ ξ
PX=i=1pX~izi
XPX=i=p+1nX~izi
||XPX||2=i=p+1nX~i2.
ξLআমি = P + + 1 , ... , এন z- র আমিএল z- র আমিξ | | এক্স - পি এক্স | | 2 এন - পি এন ( 0 , σ 2 ) χ 2 σ 2 এন - পিE(X~i)=ziTξ=0i=p+1,,nziLziξ||XPX||2npস্বতন্ত্র বিতরণযোগ্য এলোমেলো ভেরিয়েবল, যার বিতরণ সংজ্ঞা অনুসারে, স্কেল প্যারামিটার এবং স্বাধীনতার ডিগ্রি সহ একটি বিতরণ ।N(0,σ2)χ2σ2np

এনআরএইচ, ধন্যবাদ! (1) কেন ভিতরে থাকা প্রয়োজন ? (২) এবং কেন স্বাধীন? (3) এলোমেলো পরিবর্তনশীল প্রসঙ্গে ডফ তার ডিটারমিনিস্টিক ক্ষেত্রে ডফ থেকে সংজ্ঞায়িত হয়? উদাহরণস্বরূপ, এর কারণ কি ডফ কারণ এটি সত্য যখন একটি র্যান্ডম ভেরিয়েবলের পরিবর্তে একটি ডিস্ট্রিমেন্টিক ভেরিয়েবল হয়? (৪) আপনার মত একই / অনুরূপ মতামত আছে এমন কোন রেফারেন্স (বই, কাগজপত্র বা লিঙ্ক) রয়েছে? এল পি এক্স এক্স - পি এক্স | | এক্স - পি এক্স | | 2 এন - পি এক্সE(X)LPXXPX||XPX||2npX
টিম

@ টিম, এবং স্বতন্ত্র, যেহেতু এগুলি স্বাভাবিক এবং অসংরক্ষিত। এক্স - পি এক্সPXXPX
এমপিটকাস

@ টিম, আমি উত্তরটি কিছুটা উচ্চারণ করেছি এবং বর্ণিত ফলাফলগুলির একটি প্রমাণ দিয়েছি। বন্টন সম্পর্কে ফলাফল প্রমাণ করতে গড়ের থাকা দরকার এটি একটি মডেল অনুমান। সাহিত্যে আপনার রৈখিক সাধারণ মডেল বা সাধারণ রৈখিক মডেলগুলির সন্ধান করা উচিত তবে এখনই আমি কেবল কয়েকটি পুরানো, অপ্রকাশিত বক্তৃতার নোটগুলি স্মরণ করতে পারি। আমি দেখতে পাচ্ছি যদি আমি একটি উপযুক্ত রেফারেন্স পাই। χ 2Lχ2
এনআরএইচ

আশ্চর্য উত্তর। অন্তর্দৃষ্টি জন্য ধন্যবাদ। একটি প্রশ্ন: "গড় ভেক্টর এ " বাক্যাংশটি দিয়ে আপনি কী বোঝাতে চেয়েছিলেন তা হারিয়েছি । তুমি কি ব্যাখ্যা করতে পারো? আপনি কি সংজ্ঞায়িত করার চেষ্টা করছেন ? সংজ্ঞায়িত করতে ? অন্যকিছু? এই বাক্যটি আমার জন্য খুব বেশি করার বা খুব সংক্ষিপ্ত হওয়ার চেষ্টা করছে। আপনি উল্লিখিত প্রসঙ্গে এর সংজ্ঞা কী তা ব্যাখ্যা করতে পারেন : এটি কি কেবল ? আপনি কি তার উপর সম্প্রসারিত করতে পারেন (স্বাভাবিক IID স্থানাঙ্ক এর) এই প্রেক্ষাপটে? এটি কি কেবল ? এল এল ( এক্স 1 , এক্স 2 , , এক্স এন ) = ( এক্স 1 + এক্স 2 + + এক্স এন ) / এন এল এল = আরEXLELEE(x1,x2,,xn)=(x1+x2++xn)/nLL=R
DW

@ ডিডাব্লু হ'ল প্রত্যাশা অপারেটর। তাই ( এক্স ) এর coordinatewise প্রত্যাশা ভেক্টর হয় এক্স । উপ-স্থান এল হ'ল আর এন এর কোনও পি- মাত্রিক উপ-স্থান । এটি এন- ভেক্টরগুলির স্পেস এবং অবশ্যই আর নয় , তবে এটি খুব ভাল এক-মাত্রিক হতে পারে। সরলতম উদাহরণ সম্ভবত যখন এটি দ্বারা দৃশ্যও হয় 1 সব সময়ে একটি 1 -vector এন -coordinates। এটি একই গড় মানযুক্ত এক্স এর সমস্ত স্থানাঙ্কের মডেল , তবে আরও অনেক জটিল মডেল সম্ভব। EE(X)XLpRnnR1nX
এনআরএইচ

30

"স্বাধীনতার ডিগ্রি" শব্দটি অন্য কোনও ক্ষেত্রে যেভাবে কাজ করে তা থেকে এটি আসলেই আলাদা নয়। উদাহরণস্বরূপ, ধরুন আপনার চারটি ভেরিয়েবল রয়েছে: দৈর্ঘ্য, প্রস্থ, ক্ষেত্র এবং আয়তক্ষেত্রের পরিধি। আপনি কি সত্যিই চারটি জিনিস জানেন? না, কারণ এখানে মাত্র দুই ডিগ্রি স্বাধীনতা রয়েছে। আপনি যদি দৈর্ঘ্য এবং প্রস্থ জানেন, আপনি অঞ্চল এবং ঘেরটি পেতে পারেন। যদি আপনি দৈর্ঘ্য এবং ক্ষেত্রটি জানেন তবে আপনি প্রস্থ এবং ঘেরটি পেতে পারেন। যদি আপনি অঞ্চল এবং ঘেরটি জানেন তবে আপনি দৈর্ঘ্য এবং প্রস্থ (ঘূর্ণন অবধি) পেতে পারেন। যদি আপনার চারটি থাকে তবে আপনি বলতে পারেন যে সিস্টেমটি সুসংগত (সমস্ত ভেরিয়েবল একে অপরের সাথে একমত), বা অসঙ্গত (কোনও আয়তক্ষেত্র আসলে সমস্ত শর্ত পূরণ করতে পারে না)। একটি বর্গক্ষেত্র একটি আয়তক্ষেত্র যা স্বাধীনতার একটি ডিগ্রি অপসারণ করা হয়;

পরিসংখ্যানগুলিতে, জিনিসগুলি আরও अस्पष्ट হয়ে যায়, তবে ধারণাটি এখনও একই same কোনও ফাংশনের ইনপুট হিসাবে আপনি যে সমস্ত ডেটা ব্যবহার করছেন সেগুলির সমস্তই যদি স্বাধীন ভেরিয়েবল হয় তবে আপনার ইনপুটগুলির মতো স্বাধীনতা কত ডিগ্রি রয়েছে। তবে যদি তাদের কোনও উপায়ে নির্ভরতা থাকে, যেমন আপনার যদি এন - কে ইনপুট থাকে তবে আপনি বাকি কে খুঁজে পেতে পারেন, তবে আপনি প্রকৃতপক্ষে কেবলমাত্র n - কে ডিগ্রি স্বাধীনতা পেয়েছেন। এবং কখনও কখনও আপনার এটিকে বিবেচনায় নেওয়া দরকার, যাতে না আপনি নিজেকে বোঝাতে পারেন যে ডেটা আরও নির্ভরযোগ্য বা সত্যিকারের তুলনায় তার থেকে বেশি ভবিষ্যদ্বাণীপূর্ণ শক্তি রয়েছে, আপনার কাছে সত্যিকার অর্থে স্বাধীন বিটগুলির চেয়ে আরও বেশি ডেটা পয়েন্ট গণনা করে।

( Http://www.reddit.com/r/math/comments/9qbut/could_someone_explain_to_me_ কি_ডিগ্রিস_এফ/c0dxtbq ? context =3 এ একটি পোস্ট থেকে নেওয়া হয়েছে )

তদুপরি, তিনটি সংজ্ঞা প্রায় একই বার্তা দেওয়ার চেষ্টা করছে।


1
মূলত সঠিক, তবে আমি উদ্বিগ্ন যে মাঝের অনুচ্ছেদটি এমনভাবে পড়া যেতে পারে যা পারস্পরিক সম্পর্ক, স্বাধীনতা (এলোমেলো ভেরিয়েবলগুলির) এবং কার্যকরী স্বাধীনতা (বহুগুণের বহুগুণ )কে বিভ্রান্ত করে। পারস্পরিক সম্পর্ক-স্বাধীনতার পার্থক্য বজায় রাখা বিশেষভাবে গুরুত্বপূর্ণ।
whuber

@ শুভঃ এখন কি ঠিক আছে?
বায়োস্ট্যাট

3
এটি সঠিক, তবে এটি যেভাবে পদ ব্যবহার করে তা সম্ভবত কিছু লোককে বিভ্রান্ত করবে। এটি এখনও কার্যকরভাবে নির্ভরশীলতা থেকে এলোমেলো ভেরিয়েবলের নির্ভরতা আলাদাভাবে আলাদা করে না। উদাহরণস্বরূপ, ননজারো পারস্পরিক সম্পর্কের সাথে বিভরিয়াট সাধারণ বিতরণে দুটি ভেরিয়েবল নির্ভরশীল (এলোমেলো ভেরিয়েবল হিসাবে) তবে তারা এখনও দুটি ডিগ্রি স্বাধীনতা সরবরাহ করে।
whuber

5
এটি ২০০৯ সালে করা একটি reddit পোস্ট থেকে অনুলিপি করা হয়েছিল ।
hobbs

2
আমাদের সহায়তা কেন্দ্র অন্যের লিখিত উপাদানের কীভাবে রেফারেন্স দেবে সে সম্পর্কে সুস্পষ্ট নির্দেশনা সরবরাহ করে , তাই আমি আশা করি উপযুক্ত পদক্ষেপ নিতে এবং গঠনমূলক মিথস্ক্রিয়ায় লিপ্ত হওয়ার জন্য ওপি এই পোস্টে ফিরে আসবে (যদিও আমরা তাকে কিছুক্ষণ দেখিনি)।
chl

19

আমি স্ট্যাটিস্টিকাল অনুশীলনের লিটল হ্যান্ডবুকের প্রথম বাক্যটি পছন্দ করি । স্বাধীনতা অধ্যায়ের ডিগ্রি

একজন পরিচালক একজন গণিতের অসম্পূর্ণ দর্শকের কাছ থেকে যে প্রশ্নটি সবচেয়ে বেশি ভয় পান তা হ'ল "স্বাধীনতার ডিগ্রি আসলে কী?"

আমি মনে করি আপনি এই অধ্যায়টি পড়া থেকে স্বাধীনতার ডিগ্রি সম্পর্কে সত্যিই ভাল বুঝতে পারবেন।


6
স্বাধীনতার ডিগ্রি কেন তা গুরুত্বপূর্ণ তার চেয়ে বেশি ব্যাখ্যা করার জন্য এটি চমৎকার হবে। উদাহরণস্বরূপ, দেখানো হচ্ছে যে 1 / n এর সাথে বৈকল্পিকের প্রাক্কলন পক্ষপাতদুষ্ট তবে 1 / (n-1) ব্যবহার করে একটি পক্ষপাতহীন অনুমানক পাওয়া যায়।
ত্রিস্তান

9

উইকিপিডিয়া দৃser়ভাবে জানিয়েছে যে একটি এলোমেলো ভেক্টরের স্বাধীনতার ডিগ্রিগুলি ভেক্টর সাবস্পেসের মাত্রা হিসাবে ব্যাখ্যা করা যেতে পারে। আমি মূলত এটির মাধ্যমে উইকিপিডিয়ায় প্রবেশের একটি আংশিক উত্তর এবং বিবরণ হিসাবে ধাপে ধাপে যেতে চাই।

প্রস্তাবিত উদাহরণটি হ'ল বিভিন্ন বিষয়গুলির জন্য অবিচ্ছিন্ন ভেরিয়েবলের পরিমাপের সাথে সম্পর্কিত এলোমেলো ভেক্টরের, এটি উত্স থেকে প্রসারিত ভেক্টর হিসাবে প্রকাশিত । এটি ভেক্টর এর অরথোগোনাল প্রক্ষেপণ [ 1[abc]T একটি ভেক্টর ফলাফল পরিমাপ উপায়ে ভেক্টর (প্রজেকশন সমান ˉ এক্স = 1 / 3 ( একটি + + + + ) ), অর্থাৎ [ ˉ এক্স[111]Tx¯=1/3(a+b+c),1 ভেক্টরেরসাথে বিন্দুযুক্ত,[1][x¯x¯x¯]T1 এর ভেক্টর দ্বারা বিস্তৃত উপস্থানে এই প্রক্ষেপণটি 1 রয়েছে[111]Tঅবশিষ্টভেক্টর (গড় থেকে দূরত্ব) সম্মুখের লিস্ট স্কোয়ারগুলির অভিক্ষেপ হয় ( এন - 1 ) -dimensional লম্ব এই subspace সম্পূরক, এবং হয়েছে এন - 11degree of freedom(n1) , n ভেক্টরের মোট উপাদানগুলির সংখ্যা (আমাদের ক্ষেত্রে 3 যেহেতু আমরাউদাহরণে আর 3 তেআছি) .এটি [ ˉ x এর বিন্দু পণ্য প্রাপ্তির মাধ্যমে কেবল প্রমাণিত হতে পারেn1degrees of freedomn3R3মধ্যে পার্থক্য রয়েছে[[x¯x¯x¯]T এবং [ ˉ x[abc]T:[x¯x¯x¯]T

[x¯x¯x¯][ax¯bx¯cx¯]=

=[(a+b+c)3(a(a+b+c)3)]+[(a+b+c)3(b(a+b+c)3)]+[(a+b+c)3(c(a+b+c)3)]

=(a+b+c)3[(a(a+b+c)3)+(b(a+b+c)3)+(c(a+b+c)3)]

=(a+b+c)3[13(3a(a+b+c)+3b(a+b+c)+3c(a+b+c))]

=(a+b+c)3[13(3a3a+3b3b+3c3c)]=0

এবং এই সম্পর্কটি বিমানের অরথোগোনালের যে কোনও বিন্দুতে [ ˉ x x পর্যন্ত প্রসারিত । এই ধারণা কেন সেই ব্যাপারটি বুঝা গুরুত্বপূর্ণ1[x¯x¯x¯]T , টি-বন্টন (আহরণ একটি পদক্ষেপএখানেএবংএখানে)।1σ2((X1X¯)2++(XnX¯)2)χn12

আসুন বিন্দুটি ধরুন , তিনটি পর্যবেক্ষণের সাথে সম্পর্কিত গড় 55 , এবং ভেক্টর [ 55[355080]T55 স্বাভাবিক (লম্ব) একটি বিমান, হয় 55 এক্স + + 55 Y + + 55 z- র = ডি । পয়েন্টে প্লাগিং সমতল সমীকরণ, ডি = - 9075 এর সাথে স্থানাঙ্ক করে।[555555]T55x+55y+55z=DD=9075

এখন আমরা এই বিমানের অন্য কোনও বিন্দু চয়ন করতে পারি, এবং এর স্থানাঙ্কগুলির গড়টি হতে চলেছে , জ্যামিতিকভাবে এটি ভেক্টরের উপরে তার প্রক্ষেপণের সাথে সম্পর্কিত [ 155 । অত: পর যে অর্থ মানের জন্য (আমাদের উদাহরণে, 55 ) আমরা অসীম সংখ্যা নির্বাচন করতে পারবেনজোড়ামধ্যে স্থানাঙ্ক এর আর 2 বাধা ছাড়াই ( 2[111]T55R22degrees of freedomR3[555555]T

[555555]T[355080]T[80805][901560]2df55[111]T1df[555555]T


9

আমার ক্লাসে, আমি একটি "সাধারণ" পরিস্থিতি ব্যবহার করি যা আপনাকে অবাক করতে এবং সম্ভবত এক ডিগ্রি স্বাধীনতার অর্থ কী হতে পারে তার জন্য অন্তর অনুভূতি বিকাশ করতে পারে।

বিষয়টির কাছে এটি "ফরেস্ট গাম্প" পদ্ধতির মতো, তবে এটি চেষ্টা করার মতো।

X1,X2,,X10N(μ,σ2)μσ2

μσ2μμμX¯

σ2σ2X1X10

μσ2μμσ2

μX¯μX¯σ2S2σ

μσ2X¯μS2σ2

তবে আপনি ভুলের বিভিন্ন স্তরে হতে পারেন, কিছুটা ভুল থেকে সত্যই, সত্যই, সত্যিই খারাপভাবে ভুল হতে পারেন (ওরফে, "বাই-বাই, পেচেক; পরের সপ্তাহে দেখা হবে!")।

X¯μS2=2S2=20,000,000σ2σ2X¯ পরিবর্তন করতে।

μσ2μσ2

আপনি কিভাবে এটি লক্ষ্য করতে পারেন?

μσ

এবং এখানে এই লিজেরজিক গল্পটির বিরক্তিকর প্লটটি মোচড় দেওয়া: আপনি আপনার বাজির পরে তিনি আপনাকে তা বলেছিলেন । সম্ভবত আপনাকে আলোকিত করতে, সম্ভবত আপনাকে প্রস্তুত করার জন্য, সম্ভবত আপনাকে উপহাস করার জন্য। আপনি কিভাবে জানতে পারেন?

μσ2X¯S2μσ2

μX¯(X¯μ)

XiN(μ,σ2)X¯N(μ,σ2/10)(X¯μ)N(0,σ2/10)

X¯μσ/10N(0,1)
μσ2

μ(Xiμ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi

(Xiμ)/σN(0,1)μσ2

μσ2

[আমি ভাবতে পছন্দ করি যে আপনি পরবর্তীকালের কথা ভাবছেন]]

হ্যা এখানে!

μXiσ

(Xiμ)2σ2=(Xiμσ)2χ2
Z2ZN(0,1)μσ2

(X¯μ)2σ2/10=(X¯μσ/10)2=(N(0,1))2χ2
i=110(Xiμ)2σ2/10=i=110(Xiμσ/10)2=i=110(N(0,1))2=i=110χ2.
X1,,X10)। এই একক চি-স্কোয়ার ডিস্ট্রিবিউশনের প্রত্যেকটির যোগফলের প্রায় একই পরিমাণ অবদানের সাথে আপনি যে পরিমাণ এলোমেলো পরিবর্তনশীলতার মুখোমুখি হওয়া উচিত আশা করতে হবে তার একটি অবদান।

প্রতিটি অবদানের মান গণিতের ভিত্তিতে অন্যান্য নয়টির সমান নয়, তবে বিতরণের ক্ষেত্রে তাদের সবার সমান প্রত্যাশিত আচরণ রয়েছে। সেই অর্থে, তারা কোনওভাবে প্রতিসাম্যযুক্ত।

এই চি-স্কোয়ারগুলির প্রত্যেকটির খাঁটি, এলোমেলো পরিবর্তনশীলতার পরিমাণের জন্য একটি পরিমাণ অবদান যা আপনার সেই পরিমাণে আশা করা উচিত।

আপনার যদি 100 টি পর্যবেক্ষণ থাকে তবে উপরের যোগফলটি আরও বড় হবে বলে আশা করা যায় কারণ এটির আরও বেশি সংঘাতের উত্স রয়েছে

একই আচরণের সাথে "অবদানের উত্স "গুলির প্রত্যেককেই স্বাধীনতার ডিগ্রি বলা যেতে পারে ।

এখন এক বা দুটি পদক্ষেপ ফিরে নিন, আপনার অনুসন্ধানের- স্বাধীনতার ডিগ্রির হঠাৎ আগমনকে সামঞ্জস্য করার জন্য পূর্বের অনুচ্ছেদগুলি পুনরায় পড়ুন ।

μσ2

জিনিসটি হল, আপনি সেই পরিবর্তনশীলতার 10 টি সমমানের উত্সের আচরণের উপর নির্ভর করতে শুরু করেন। আপনার যদি 100 টি পর্যবেক্ষণ থাকে তবে আপনার যোগফলের জন্য কঠোরভাবে এলোমেলো ওঠানামার 100 টি স্বাধীন সমান-আচরণীয় উত্স থাকবে।

χ102χ12

μσ2

μσ2

বিষয়গুলি অদ্ভুত হয়ে উঠতে শুরু করে (হাহাহাহাহা; কেবল এখন!) যখন আপনি Godশ্বরের বিরুদ্ধে বিদ্রোহ করেন এবং চেষ্টা করেন এবং নিজের দ্বারা সমস্ত কিছু চালাবেন, তিনি তাঁর পৃষ্ঠপোষকতা না করে বলে।

X¯S2μσ2

X¯S2μσ2

i=110(XiX¯)2S2/10=i=110(XiX¯S/10)2,

μ(Xiμ)>0i=110(Xiμ)>0i=110(XiX¯)=0i=110Xi10X¯=10X¯10X¯=0

i=110(XiX¯)2i=110(Xiμ)2

XiX¯S/10
(XiX¯)2S2/10
i=110(XiX¯)2S2/10
X¯μS/10

"এটি কি কিছুই ছিল না?"

i=110(XiX¯)2σ2=i=110[Xiμ+μX¯]2σ2=i=110[(Xiμ)(X¯μ)]2σ2=i=110(Xiμ)22(Xiμ)(X¯μ)+(X¯μ)2σ2=i=110(Xiμ)2(X¯μ)2σ2=i=110(Xiμ)2σ2i=110(X¯μ)2σ2=i=110(Xiμ)2σ210(X¯μ)2σ2=i=110(Xiμ)2σ2(X¯μ)2σ2/10
i=110(Xiμ)2σ2=i=110(XiX¯)2σ2+(X¯μ)2σ2/10.

প্রথম পদটিতে 10 ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণ এবং শেষ মেয়াদে এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণ (!) রয়েছে।

আমরা কেবল দুটি ভাগে পরিবর্তনের 10 স্বতন্ত্র সমান-আচরণগত উত্স সহ একটি চি-স্কোয়ারকে বিভক্ত করি, উভয় ধনাত্মক: একটি অংশ চি-স্কোয়ার যার একটি তারতম্যের উত্স এবং অন্যটি আমরা প্রমাণ করতে পারি (বিশ্বাসের লাফ? ডাব্লু ওও দ্বারা জেতা)? ) 9 (= 10-1) স্বতন্ত্র সমান-আচরণগত উত্সের সাথে চি-স্কোয়ারও হতে হবে, উভয় অংশ একে অপরের থেকে পৃথক।

এটি ইতিমধ্যে একটি সুসংবাদ, এখন থেকে আমাদের এর বিতরণ রয়েছে।

σ2

S2=1101i=110(XiX¯)2,
i=110(XiX¯)2σ2=i=110(XiX¯)2σ2=(101)S2σ2χ(101)2
X¯μS/10=X¯μσ/10Sσ=X¯μσ/10S2σ2=X¯μσ/10(101)S2σ2(101)=N(0,1)χ(101)2(101),
(101)

t

[^ 1]: @ ভোবার নীচে দেওয়া মন্তব্যে বলেছিলেন যে গোসেট গণিতটি করেননি, তবে তার পরিবর্তে অনুমান করেছেন ! আমি জানি না সেই সময়ের জন্য কোন কীর্তি আরও অবাক হয়।

t(101)X¯μS2X¯

এই নাও. ভয়াবহ প্রযুক্তিগত বিশদ বিবরণ দিয়ে গুরুতরভাবে গালিচা পেছনে ছড়িয়ে পড়ে, তবে আপনার পুরো বেতনটি বিপজ্জনকভাবে বাজি রাখতে toশ্বরের হস্তক্ষেপের উপর নির্ভর করে না।


1
1010

আপনার মূল্যায়নের জন্য আপনাকে অনেক ধন্যবাদ, ওহো! আপনি যা লিখেছিলেন তা ভুলে গেলে কত টাইপস পপ আপ হয় তা অবাক করা। আপনার মূল্যায়ন সম্পর্কে, আমি কেবল চিন্তাভাবনার অন্য উপায়টি বর্ণনা করার ইচ্ছা নিয়েছিলাম - কিছু দিক থেকে কিছুটা কম গাণিতিক। এছাড়াও, আপনি কী বোঝাতে চেয়েছেন তা আমি পুরোপুরি উপলব্ধি করছি না আপনি যদি 10 টি স্বতন্ত্র চি-স্কোয়ার্ড ভেরিয়েটের পরিবর্তে 10 টি স্বতন্ত্র স্বাভাবিক প্রকরণের সংক্ষিপ্ত বিবরণ দান করেছিলেন তবে আপনি একটি সাধারণ পরিবর্তন - যার মাধ্যমে আমি আপনার মূল-পয়েন্টটি ধরে রাখার অনুমান করেছি । পোস্টটি উন্নত করার আশায় আমি এটি সম্পর্কে বিস্তারিত জানার চেষ্টা করব।
মার্সেলো ভেনচুরা

2

স্বাধীনতার ডিগ্রিগুলির একটি স্বজ্ঞাত ব্যাখ্যাটি হ'ল তারা আগ্রহের একটি প্যারামিটার (অর্থাত্ অজানা পরিমাণ) নির্ধারণের জন্য ডেটাতে প্রাপ্ত তথ্যের স্বতন্ত্র টুকরোগুলির প্রতিনিধিত্ব করে

উদাহরণ হিসাবে, ফর্মের একটি সাধারণ লিনিয়ার রিগ্রেশন মডেলটিতে:

Yi=β0+β1Xi+ϵi,i=1,,n

ϵiσβ0β1nn2n2σ


আমার উত্তরে আপনার সম্পাদনাগুলির জন্য অনেক ধন্যবাদ, @COOLSerdash!
ইসাবেলা ঘেমেন্ট

2

nX1,,Xni=1n(XiX¯n)2Xn12X¯n=1ni=1nXin1(X¯n=1ni=1nXi)

আরও তথ্যের জন্য দেখুন এই


0

আমার জন্য প্রথম ব্যাখ্যাটি আমি বুঝতে পেরেছিলাম:

আপনি যদি গড় বা ভিন্নতার মতো কিছু পরিসংখ্যানগত মান জানেন তবে প্রতিটি ভেরিয়েবলের মান জানার আগে আপনাকে কতগুলি ডাটা ভেরিয়েবলের জানা দরকার?

এটি এলএক্সা যেমন বলেছিল তেমনই, তবে কোনও ডেটা পয়েন্টকে একটি বিশেষ ভূমিকা না দিয়ে এবং উত্তরে দেওয়া তৃতীয় মামলার কাছাকাছি। এইভাবে একই উদাহরণ হবে:

আপনি যদি ডেটাটির মাধ্যম জানেন তবে আপনাকে সমস্ত ডেটা পয়েন্টের মান জানতে একটি ডেটা পয়েন্ট ছাড়া সকলের জন্য মানগুলি জানতে হবে।


পরিবর্তনীয় -> পর্যবেক্ষণ
রিচার্ড হার্ডি

0

xyVx,y=Vx+VyVx=SDx2Vx,ySDx,y=SDx2+SDy2SDx=i=1n(xix¯)2n1n=1x1x¯=0i=1n(xix¯)2n100xn=2x1x2x¯=x1+x22x¯x1x2nx¯nn1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.