কেন রেগ্রেশন রেখাটি অনুমান করার উদ্দেশ্যে অবশিষ্টাংশের স্বাভাবিকতা "সবেমাত্র গুরুত্বপূর্ণ"?


21

জেলম্যান এবং হিল (2006) পি 46 তে লিখুন যে:

সাধারণত কমপক্ষে গুরুত্বপূর্ণ এমন রিগ্রেশন অনুমানটি হ'ল ত্রুটিগুলি সাধারণত বিতরণ করা হয়। প্রকৃতপক্ষে, রিগ্রেশন লাইনটি অনুমান করার উদ্দেশ্যে (পৃথক ডেটা পয়েন্টগুলির পূর্বাভাস দেওয়ার তুলনায়) স্বাভাবিকতা অনুমান করা মোটেই সবে গুরুত্বপূর্ণ। সুতরাং, অনেকগুলি রিগ্রেশন পাঠ্যপুস্তকের বিপরীতে, আমরা রিগ্রেশন অবশিষ্টাংশগুলির স্বাভাবিকতা নির্ধারণের প্রস্তাব দিই না।

গেলম্যান এবং হিল এই পয়েন্টটি আরও ব্যাখ্যা করবে বলে মনে হয় না।

গেলম্যান এবং হিল কি সঠিক? যদি তাই হয় তবে:

  1. "সবেমাত্র গুরুত্বপূর্ণ" কেন? কেন এটি গুরুত্বপূর্ণ বা সম্পূর্ণ অপ্রাসঙ্গিক নয়?

  2. পৃথক ডেটা পয়েন্টের পূর্বাভাস দেওয়ার সময় কেন অবশিষ্টাংশের স্বাভাবিকতা গুরুত্বপূর্ণ?

গেলম্যান, এ।, এবং হিল, জে। (2006) রিগ্রেশন এবং মাল্টিলেভেল / শ্রেণিবদ্ধ মডেলগুলি ব্যবহার করে ডেটা বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস

উত্তর:


21

জন্য প্রাক্কলন স্বাভাবিক ঠিক অনুমান নয়, কিন্তু একটি প্রধান বিবেচনার দক্ষতা হবে; অনেক ক্ষেত্রে একটি ভাল রৈখিক প্রাক্কলনকারী জরিমানা করতে পারে এবং সেই ক্ষেত্রে (গাউস-মার্কভ দ্বারা) এলএস অনুমানটি সেই জিনিসগুলির মধ্যে সবচেয়ে ভাল হবে-যা-হবে-ঠিক আছে। (যদি আপনার লেজগুলি বেশ ভারী বা খুব হালকা হয় তবে অন্য কিছু বিবেচনা করার জন্য এটি বোধগম্য হতে পারে)

পরীক্ষাগুলি এবং সিআই-এর ক্ষেত্রে, যখন স্বাভাবিকতা অনুমান করা হয়, তবে সাধারণত এটি সমস্ত সমালোচনামূলক হয় না (আবার, যতক্ষণ না লেজ সত্যই ভারী বা হালকা হয় না, বা সম্ভবত প্রতিটির মধ্যে একটি), এতে কমপক্ষে খুব কম-না- ছোট নমুনা পরীক্ষাগুলি এবং সাধারণ সিআই তাদের নামমাত্র বৈশিষ্ট্যগুলির কাছাকাছি থাকে (দাবি করা তাত্পর্য স্তর বা কভারেজ থেকে খুব বেশি দূরে নয়) এবং ভাল সম্পাদন করে (আদর্শ পরিস্থিতিতে বা সিআই বিকল্পের তুলনায় খুব বেশি প্রশস্ত নয়) - আপনি সরানোর সাথে সাথে স্বাভাবিক ক্ষেত্রে শক্তি থেকে আরও একটি সমস্যা বেশি হতে পারে, এবং সেই ক্ষেত্রে বড় আকারের নমুনাগুলি সাধারণত আপেক্ষিক দক্ষতা উন্নত করতে পারে না, তাই প্রভাবের আকারগুলি এমন যে তুলনামূলকভাবে ভাল শক্তির সাথে একটি পরীক্ষায় শক্তি বিদ্রূপ করছে, এটি খুব খারাপ হতে পারে পরীক্ষাগুলি যা স্বাভাবিকতা ধরে নেয় for

পরীক্ষাগুলিতে সিআইএসের জন্য নামমাত্র বৈশিষ্ট্য এবং তাত্পর্য স্তরের কাছাকাছি থাকার প্রবণতা হ'ল বিভিন্ন উপাদান একসাথে পরিচালিত হওয়ার কারণে (যার মধ্যে একটি ভেরিয়েবলের রৈখিক সংমিশ্রণের প্রবণতা রয়েছে যতক্ষণ না প্রচুর মান জড়িত থাকে ততক্ষণ স্বাভাবিক বন্টনের কাছাকাছি থাকতে পারে এবং এগুলির কোনওোটাই সম্পূর্ণ বৈকল্পিকতার একটি বড় অংশকে অবদান রাখে না)।

তবে, সাধারণ অনুমানের উপর ভিত্তি করে পূর্বাভাস ব্যবধানের ক্ষেত্রে, স্বাভাবিকতা তুলনামূলকভাবে আরও সমালোচিত হয়, যেহেতু অন্তরালের প্রস্থ একক মানের বন্টনের উপর দৃ strongly়ভাবে নির্ভরশীল । যাইহোক, এমনকি সেখানে, খুব সাধারণ ব্যবধান আকারের (95% ব্যবধান) জন্য, অনেক আনমোডাল বিতরণগুলি প্রায় 2sd এর মধ্যে তাদের বিতরণের 95% এর খুব কাছাকাছি থাকার কারণে এমনকি একটি সাধারণ পূর্বাভাস ব্যবধানের যুক্তিসঙ্গত কর্মক্ষমতা ঘটায় even যখন বিতরণ স্বাভাবিক হয় না। [এটি এত সংকীর্ণ বা বিস্তৃত অন্তরগুলিতে এতটা ভালভাবে বহন করে না - যদিও 50% ব্যবধান বা 99.9% ব্যবধান বলুন]]


"ভেরিয়েবলের রৈখিক সংমিশ্রণের প্রবণতা স্বাভাবিক বিতরণের কাছাকাছি থাকার জন্য।" - আমি মনে করি এটি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের সাথে সংযুক্ত নেই। তাই কি? যদি তা না হয় তবে এই বিবৃতিটি কোন ধরণের "উপপাদ্য"?
হাইজেনবার্গ

1
@ হাইজেনবার্গের সিএলটি-র নির্দিষ্ট সংস্করণগুলির সাথে এটির সংযোগ রয়েছে, হ্যাঁ। (লায়াপুনভ এবং লিন্ডবার্গ সংস্করণগুলি এখানে দেখুন )। আপনি যদি সীমাবদ্ধ নমুনার জন্য কোনও উপপাদ্য প্রয়োগ করতে চান তবে আমরা বেরি-এসিন উপপাদনের একটি সংস্করণটি খুঁজছি। তবে বিবৃতিটি একটি উপপাদকের চেয়ে আরও বেশি পর্যবেক্ষণ (তাই "প্রবণতা" শব্দের ব্যবহার) করতে চেয়েছিল।
গ্লেন_বি

7

2: স্বতন্ত্র ডেটা পয়েন্টগুলির পূর্বাভাস দেওয়ার সময়, সেই ভবিষ্যদ্বাণীটির চারপাশের আত্মবিশ্বাসের ব্যবধান ধরে নেয় যে অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়।

আত্মবিশ্বাসের ব্যবধানগুলি সম্পর্কে সাধারণ অনুমানের তুলনায় এটি খুব বেশি আলাদা নয় - বৈধ হওয়ার জন্য আমাদের বিতরণটি বুঝতে হবে এবং সবচেয়ে সাধারণ ধারণাটি স্বাভাবিকতা is উদাহরণস্বরূপ, গড়ের চারপাশে একটি আদর্শ আত্মবিশ্বাসের ব্যবধান কাজ করে কারণ নমুনা বন্টন মানে স্বাভাবিকতার দিকে যায়, তাই আমরা এজে বা টি বিতরণ ব্যবহার করতে পারি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.