লিনিয়ার রিগ্রেশন-এ শিক্ষার্থীদের বা সাধারণ বিতরণ কখন ব্যবহার করবেন?


10

আমি কিছু সমস্যাগুলি দেখছি, এবং কিছুতে, সহগের পরীক্ষা করার জন্য, কখনও কখনও আমি লোকদের শিক্ষার্থীদের বিতরণ ব্যবহার করে দেখি এবং কখনও কখনও সাধারণ বিতরণও দেখি। বিধি কি?


3
এটি একটি উত্তর নয়, কিন্তু নোট যে -distribution ডিগ্রী অফ স্বাধীনতা প্যারামিটার হিসাবে সাধারন বন্টনের পন্থা বৃহত্তর বৃদ্ধি। গত , বিশেষত বেশিরভাগ হাইপোথিসিস-টেস্টিং ফ্রেমওয়ার্কগুলিতে কোনও প্রশংসনীয় পার্থক্য নেই। সীমাবদ্ধ আচরণটি "উপরে থেকে" এই অর্থে যে যদি এবং , তবেহয় কে স্টক্যাস্টিকালি বা অনির্দিষ্ট বৃহত্তর তুলনায়। টিνν30টি~টিνজেড~এন(0,1)| জেড ||টি||জেড|
কার্ডিনাল

উত্তর:


15

সাধারণ বিতরণ হ'ল বহু অর্থবহ পরিসংখ্যানগত সমস্যাগুলির মধ্যে বৃহত নমুনা বন্টন যা কেন্দ্রীয় সীমাবদ্ধতা উপপাদনের কিছু সংস্করণ জড়িত: আপনার কাছে (প্রায়) উত্তরটি পৌঁছানোর জন্য যোগ করা হচ্ছে এমন স্বাধীন তথ্যগুলির টুকরো রয়েছে। যদি প্যারামিটারের অনুমানগুলি অ্যাসেম্পোটোটিকভাবে স্বাভাবিক হয় তবে তাদের কার্যকারিতাও অ্যাসেম্পোটোটিকভাবে স্বাভাবিক হবে (নিয়মিত ক্ষেত্রে)।

অন্যদিকে, স্টুডেন্ট বিতরণ আইআইডি সাধারণ রিগ্রেশন ত্রুটির আরও নিয়ন্ত্রিত অবস্থার অধীনে নেওয়া হয়। আপনি যদি এই অনুমানটি কিনতে পারেন তবে আপনি লিনিয়ার রিগ্রেশন পরীক্ষার অনুমানের পরীক্ষার জন্য ব্যবহৃত ডিস্ট্রিবিউশন কিনতে পারেন । এই বিতরণটির ব্যবহার সাধারণ বিতরণের ব্যবহারের চেয়ে বিস্তৃত আস্থা অন্তর সরবরাহ করে। এর সংক্ষিপ্ত অর্থটি হ'ল ছোট নমুনায় আপনার অনিশ্চয়তার পরিমাপের অনুমান করা দরকার, রিগ্রেশনটির অর্থ স্কোয়ার ত্রুটি বা অবশিষ্টাংশগুলির মান বিচ্যুতি । (বড় আকারের নমুনায়, আপনার কাছে যতটা তথ্য রয়েছে ঠিক তেমন তথ্য রয়েছে, তাই বিতরণটি সাধারণ বিতরণে অবনমিত হয়))t σ tটিটিσটি

লিনিয়ার রিগ্রেশনে এমন কিছু অনুষ্ঠান রয়েছে, এমনকি সীমাবদ্ধ নমুনা সহ, যেখানে শিক্ষার্থীদের বিতরণ ন্যায়সঙ্গত হতে পারে না। তারা রিগ্রেশন ত্রুটিতে দ্বিতীয় আদেশ শর্ত লঙ্ঘনের সাথে সম্পর্কিত; যথা, এগুলি (1) ধ্রুব বৈকল্পিক এবং (2) স্বতন্ত্র। যদি এই অনুমানগুলি লঙ্ঘিত হয়, এবং আপনি হিটারোস্কেস্টাস্টিকের জন্য অিকার / হোয়াইট অনুমানক ব্যবহার করে , তবে স্বাধীন অবশিষ্টাংশগুলি ব্যবহার করে আপনার স্ট্যান্ডার্ড ত্রুটিগুলি সংশোধন করেন ; বা সিরিয়ালভাবে সম্পর্কিত ত্রুটিগুলি বা ক্লাস্টার স্ট্যান্ডার্ড ত্রুটিগুলির জন্য নিউই-ওয়েস্ট অনুমানকারীক্লাস্টার-সম্পর্কিত সম্পর্কিত ডেটার জন্য, আপনি শিক্ষার্থীদের বিতরণের কোনও যুক্তিসঙ্গত ন্যায়সঙ্গততা টানতে পারবেন না। যাইহোক, অ্যাসিম্পটোটিক নরমালটি আর্গুমেন্টের (ট্রেনিংুলার অ্যারে এবং এ জাতীয়) উপযুক্ত সংস্করণ নিয়োগের মাধ্যমে আপনি সাধারণ আনুষঙ্গিকতা প্রমাণ করতে পারেন (যদিও আপনার মনে থাকা উচিত যে আপনার আত্মবিশ্বাসের ব্যবধানগুলি খুব সম্ভবত সংকীর্ণ হবে)।


1
(+1) আমি বোঝাতে ভালোবাসি, তৃতীয় অনুচ্ছেদের খোলার সময়, সেই লিনিয়ার রিগ্রেশন অসীম (অ-"সসীম") নমুনাগুলি দিয়ে সম্পন্ন হয়!
হোবার

@ শুভ: :) আমার বইগুলিতে, যদি এটি স্বাভাবিক হয় তবে অবশ্যই এটি সিএলটি বা অ্যাসিম্পটোটিকের উপর নির্ভর করবে on অন্যথায়, এটি যতটা অর্থে তোলে এই
স্টাসকে

6

আমি একটি সাধারণ বিতরণ এবং গামা বিতরণের মিশ্রণ হিসাবে ছাত্র টি বিতরণের প্রতিনিধিত্ব করতে পছন্দ করি:

Student(x|μ,σ2,ν)=0Normal(x|μ,σ2ρ)Gamma(ρ|ν2,ν2)dρ

লক্ষ্য করুন গামা বিতরণের গড় এবং এই বন্টন ভ্যারিয়েন্স হয় । সুতরাং আমরা টি-বিতরণটিকে "অনুরূপ" বৈকল্পিক অনুমানের ধ্রুবক পরিবর্তনের অনুমানকে সাধারণীকরণ হিসাবে দেখতে পারি। মূলত নিয়ন্ত্রণ করে যে আমরা বৈকল্পগুলি কীভাবে হতে পারি। আপনি এটিকে "এলোমেলো ওজনযুক্ত" রিগ্রেশন হিসাবেও দেখেন, কারণ আমরা উপরের অবিচ্ছেদ্যটিকে "লুকানো ভেরিয়েবল" উপস্থাপনা হিসাবে ব্যবহার করতে পারি:ভি [ ρ | ν ] = 2E[ρ|ν]=1 νV[ρ|ν]=2νν

yi=μi+eiρi

যেখানে এবং সমস্ত পরিবর্তনশীল independent আসলে এটি মূলত টি-বিতরণের সংজ্ঞা, কারণρ iG a m m a ( νeiN(0,σ2)জিএকটিমিমিএকটি(νρiGamma(ν2,ν2)Gamma(ν2,ν2)1νχν2

আপনি দেখতে পাচ্ছেন যে এই ফলাফলটি কেন শিক্ষার্থীর তুলনায় সাধারণ বিতরণকে "শক্তিশালী" করে তোলে কারণ একটি বড় ত্রুটি এর একটি বড় মানের কারণে বা এর একটি ছোট মানের কারণে । এখন সমস্ত পর্যবেক্ষণের জন্য সাধারণ, তবে জন্য নির্দিষ্ট, সাধারণ "সাধারণ জ্ঞান" বিষয়টি উপসংহারে বলা যায় যে ছোট প্রমাণ । তদতিরিক্ত, আপনি যদি লিনিয়ার রিগ্রেশন , আপনি দেখতে পাবেন যে পর্যবেক্ষণের জন্য ওজন, অনুমান করে যে জানা আছে:yiμiσ2ρiσ2ρiρiμi=xiTβρiρi

β^=(iρixixiT)1(iρixiyi)

সুতরাং একজন ছোট প্রমাণ যার অর্থ ith পর্যবেক্ষণ কম ওজন পায়। অতিরিক্ত হিসাবে, একটি ছোট "আউটলেটর" - এমন একটি পর্যবেক্ষণ যা ভবিষ্যদ্বাণী করা / চেয়ে অনেক বেশি ভাল লাগানো - বড় large পক্ষে প্রমাণ গঠন করে । অতএব এই পর্যবেক্ষণটি রিগ্রেশনকে আরও ওজন দেওয়া হবে। এটি আউটলার বা একটি ভাল ডেটা পয়েন্টের সাথে স্বজ্ঞাতভাবে কী করবে তার সাথে সামঞ্জস্য।ρiρআমি

মনে রাখবেন যে এই বিষয়গুলি সিদ্ধান্ত নেওয়ার জন্য কোনও "বিধি" নেই, যদিও আমার এবং এই প্রশ্নের উত্তর অন্যরা সীমাবদ্ধ বৈকল্পিক পথ ধরে আপনি করতে পারেন এমন কিছু পরীক্ষার সন্ধানের জন্য কার্যকর হতে পারে (শিক্ষার্থীর টি স্বাধীনতার ডিগ্রি এর চেয়ে কম বা সমানরূপে অসীম বৈকল্পিক) দু 'জনের প্রতি).


+1: এটি সঠিক দেখাচ্ছে তবে আমার মনে হয় না যে আপনি একটি সাধারণ এবং গামা বিতরণের একটি মিশ্রণ বলবেন, বরং একটি সাধারণ-গামা-সাধারণ যৌগিক বিতরণ করুন এবং এই গর্জন বিতরণকে বলে যে এই নির্মাণকে অনুপ্রাণিত করুন সাধারণ বিতরণের আগে সংযুক্তি (গড় এবং নির্ভুলতার মাধ্যমে প্যারাম্যাট্রাইজড)।
নীল জি

হ্যাঁ, মিশ্রণটি সম্পর্কে পয়েন্টটি নেওয়া হয়েছে - যদিও আমি এখনই এটি সংশোধন করার জন্য অ-আনাড়ি উপায় সম্পর্কে ভাবতে পারি না। নোট করুন যে এই ফর্মটি বিতরণগুলি সংশ্লেষের পক্ষে অনন্য নয় - উদাহরণস্বরূপ আমরা যদি গামা পিডিএফকে একটি উল্টানো তাত্পর্য পিডিএফ দিয়ে প্রতিস্থাপন করি তবে আমরা ল্যাপস বিতরণটি পাই। এটি সাধারণ বিতরণকে চূড়ান্ত করার ফর্ম হিসাবে সর্বনিম্ন স্কোয়ারের পরিবর্তে "সর্বনিম্ন নিখুঁত বিচ্যুতি" বাড়ে। অন্যান্য বিতরণগুলি অন্যান্য "রোবিলিটিফিকেশন" এর দিকে পরিচালিত করবে - যদিও এটি বিশ্লেষণাত্মকভাবে শিক্ষার্থীর চেয়ে ততটা সুন্দর নয়।
সম্ভাব্যতাব্লোগিক

এক্স(ইউ/ν)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.