"ভেরিয়েবলগুলিতে ত্রুটি" শিরোনাম এবং প্রশ্নের বিষয়বস্তু পৃথক বলে মনে হচ্ছে, কারণ শর্তসাপেক্ষ প্রতিক্রিয়ার মডেলিং করার সময় আমরা পরিবর্তনের বিষয়টি কেন বিবেচনায় নিই না তা জিজ্ঞাসা করা হয় , এটি হ'ল রিগ্রেশন প্যারামিটারের পক্ষে। এই দুটি ব্যস্ততা আমার কাছে অর্থেগোনাল বলে মনে হচ্ছে, সুতরাং আমি এখানে সামগ্রীতে প্রতিক্রিয়া জানাব।X
আমি এর আগেও একইরকম প্রশ্নের জবাব দিয়েছি, রেজিস্ট্রারদের বনাম বনাম সংশোধন হিসাবে কন্ডিশনার মধ্যে পার্থক্য কী? , তাই আমি এখানে আমার উত্তরের অংশটি অনুলিপি করব:
আমি আরও আনুষ্ঠানিকভাবে রেজিস্ট্রারদেরকে কন্ডিশনার জন্য একটি যুক্তি প্রকাশ করার চেষ্টা করব। যাক একটি র্যান্ডম ভেক্টর হও, এবং সুদ রিগ্রেশন হয় উপর , যেখানে রিগ্রেশন এর শর্তাধীন প্রত্যাশা মানে নেওয়া হয় উপর । বহুবিধ অনুমানের অধীনে যা একটি লিনিয়ার ফাংশন হবে তবে আমাদের যুক্তিগুলি এর উপর নির্ভর করে না। আমরা সাধারণভাবে মতো যৌথ ঘনত্বের ফ্যাক্টরিং দিয়ে শুরু করি
তবে সেই ফাংশনগুলি জানা যায় না তাই আমরা একটি পরামিতি মডেল
যেখানে শর্তসাপেক্ষ বিতরণকে পরামিতি করে এবং(Y,X)YXYXf(y,x)=f(y∣x)f(x)
f(y,x;θ,ψ)=fθ(y∣x)fψ(x)
θψ এর প্রান্তিক বিতরণ । সাধারণ রৈখিক মডেলটিতে আমাদের কাছে তবে তা ধরে নেওয়া যায় না। এর পূর্ণ পরামিতি স্পেসটি হ'ল কারেটিশিয়ান পণ্য এবং দুটি পরামিতির কোনও মিল নেই।Xθ=(β,σ2)(θ,ψ)Θ×Ψ
এটি পরিসংখ্যানগত পরীক্ষার (বা ডেটা জেনারেশন প্রক্রিয়াকরণের, ডিজিপি) একটি কারণ হিসাবে ব্যাখ্যা করা যেতে পারে, প্রথম অনুযায়ী তৈরি করা হয় এবং দ্বিতীয় পদক্ষেপ হিসাবে শর্তসাপেক্ষ ঘনত্ব অনুযায়ী উত্পন্ন হয় । মনে রাখবেন যে প্রথম পদক্ষেপটি সম্পর্কে কোনও জ্ঞান ব্যবহার করে না , যা কেবলমাত্র দ্বিতীয় ধাপে প্রবেশ করে। পরিসংখ্যাত জন্য আনুষঙ্গিক হয় দেখুন https://en.wikipedia.org/wiki/Ancillary_statistic ।Xfψ(x)Yfθ(y∣X=x)θXθ
তবে, প্রথম পদক্ষেপের ফলাফলের উপর নির্ভর করে, দ্বিতীয় পদক্ষেপটি কম-বেশি সম্পর্কে তথ্যপূর্ণ হতে পারে । বন্টন কর্তৃক প্রদত্ত তাহলে খুব কম ভ্যারিয়েন্স আছে, বলুন, পর্যবেক্ষণ করা হয়েছে এর একটি ছোট অঞ্চলের, ঘনীভূত করা হবে যাতে এটি অনুমান করার জন্য আরো কঠিন হবে । সুতরাং, এই দ্বি-পদক্ষেপের পরীক্ষার প্রথম অংশটি নির্ভুলতা নির্ধারণ করে যা দিয়ে অনুমান করা যায়। অতএব রিগ্রেশন পরামিতিগুলি সম্পর্কে অনুমান করে এ শর্ত হওয়া স্বাভাবিক । এটিই শর্তযুক্ত যুক্তি এবং উপরের রূপরেখাটি তার অনুমানগুলি পরিষ্কার করে দেয়।θfψ(x)xθθX=x
নকশা করা পরীক্ষাগুলিতে এর অনুমানটি বেশিরভাগ পর্যবেক্ষণমূলক ডেটা না দিয়ে ধারণ করবে। সমস্যার কয়েকটি উদাহরণ হ'ল: ভবিষ্যদ্বাণীকারী হিসাবে পিছিয়ে থাকা প্রতিক্রিয়াগুলির সাথে রিগ্রেশন। এক্ষেত্রে ভবিষ্যদ্বাণীকারীদের উপর শর্ত জবাব দেওয়ার শর্তও রাখবে! (আমি আরও উদাহরণ যুক্ত করব)।
একটি সমস্যা যা এই সমস্যাগুলিকে অনেক বিশদে আলোচনা করে তা হ'ল তথ্য এবং ঘাতক পরিবারগুলি: ও। ই বারডরফ-নীলসেনের পরিসংখ্যানতত্ত্বে । বিশেষত অধ্যায় ৪ দেখুন। লেখক বলেছেন যে এই পরিস্থিতিতে বিচ্ছিন্নতার যুক্তি খুব কমই ব্যাখ্যা করা হলেও নিম্নলিখিত রেফারেন্স দেয়: আরএ ফিশার (১৯৫6) পরিসংখ্যান পদ্ধতি এবং বৈজ্ঞানিক অনুক্রম এবং সার্ভারড্রপ (১৯6666) সিদ্ধান্ত তত্ত্বের বর্তমান অবস্থা এবং নেইমন-পিয়ারসন তত্ত্ব ।§4.3
এখানে ব্যবহৃত পরিসংখ্যান যথেষ্ট পরিসংখ্যানের ফ্যাক্টরাইজেশন উপপাদ্যের সাথে কিছুটা মিল রয়েছে। যদি রিগ্রেশন প্যারামিটার এবং ফোকাসে এর বন্টন উপর নির্ভর করে না , তবে এর বিতরণ (বা তারতম্য) কীভাবে তথ্য থাকতে পারে ? θXθXθ
এই বিচ্ছেদ যুক্তিটিও সহায়ক কারণ এটি এটি যে ক্ষেত্রে ব্যবহার করা যায় না তার দিকে নির্দেশ করে, উদাহরণস্বরূপ ভবিষ্যদ্বাণীকারী হিসাবে পিছিয়ে থাকা প্রতিক্রিয়াগুলির সাথে রিগ্রেশন।