কেন "এক্স-এ ত্রুটি" মডেলগুলি আরও ব্যাপকভাবে ব্যবহৃত হয় না?


11

আমরা যখন কোনও রিগ্রেশন সহগের স্ট্যান্ডার্ড ত্রুটি গণনা করি, তখন আমরা নকশার ম্যাট্রিক্স এর এলোমেলোতার জন্য অ্যাকাউন্ট করি না । উদাহরণস্বরূপ OLS ঔজ্জ্বল্যের প্রেক্ষাপটে, আমরা নিরূপণ হিসাবেXvar(β^)var((XTX)1XTY)=σ2(XTX)1

যদি এলোমেলো বিবেচনা করা হয়, তবে সম্পূর্ণ ভিন্নতার আইনটি এক অর্থে, ভিন্নতার অতিরিক্ত অবদানেরও দাবি করবে। অর্থাতXX

var(β^)=var(E(β^|X))+E(var(β^|X)).

কোনটি, যদি ওএলএসের অনুমানকারী সত্যই নিরপেক্ষ থাকে তবে প্রত্যাশা একটি ধ্রুবক হওয়ায় প্রথম শব্দটি অদৃশ্য হয়ে যায়। দ্বিতীয় মেয়াদে আসলে হয়ে: ।σ2cov(X)1

  1. যদি জন্য কোনও প্যারাম্যাট্রিক মডেল পরিচিত হয় তবে আমরা কেন কে আসল কোভারিয়েন্স অনুমানের সাথে প্রতিস্থাপন করব না । উদাহরণস্বরূপ, যদি এলোমেলোভাবে চিকিত্সার কার্যভার হয়, তবে দ্বিপদী ভেরিয়েন্স আরও কার্যকর অনুমান করা উচিত?XXTXXE(X)(1E(X))

  2. আমরা কেন ওএলএস অনুমানের পক্ষপাতের সম্ভাব্য উত্সগুলি অনুমান করার জন্য নমনীয় ননপ্যারামেট্রিক মডেলগুলি ব্যবহার করার বিষয়টি বিবেচনা করি না এবং যথাযথভাবে প্রথম বিধি-বিধানের পুরো শর্তে ডিজাইনের সংবেদনশীলতার জন্য (যেমন এর বিতরণ ) অ্যাকাউন্ট ?Xvar(E(β^|X))


2
গাণিতিক আইন কেন কিছু দাবি করে? আমরা নির্দিষ্ট উদ্দেশ্যগুলিকে সম্বোধন করতে ডেটা দিয়ে যুক্তিতে একটি মডেল ব্যবহার করি। মুশরিকরা যখন ঐ বুঝতে বা শর্তাধীন একটি পর্যবেক্ষিত বা মাপা মান উপর ভিত্তি করে প্রতিক্রিয়া ভবিষ্যদ্বাণী করা হয় তারতম্য সামান্য হবে (যদি কিছু) এ সব বাস্তব প্রশ্ন দিয়ে কি করতে - প্রকৃতপক্ষে, আমাদের পদ্ধতি এই বৈচিত্র একত্রিত মনে হবে সম্পূর্ণ ভুল, বিভ্রান্তিকর, বা এমনকি সংবেদনহীন হতে। সুতরাং আপনার প্রশ্নের উত্তর দেওয়ার ফলে বিভিন্ন ধরণের পরিসংখ্যানগত সমস্যার মুখোমুখি হওয়া ফ্রিকোয়েন্সিগুলি মূল্যায়ন করতে দেখা যাচ্ছে। এক্সX,X
হোবার

1
@ হুবুহু আমার ফোকাস অনুমানের দিকে। অধ্যয়নের ফলাফলগুলির ঘনত্ববাদী ব্যাখ্যার সাথে মোট বৈকল্পিকতার আইনটি আরও ইনলাইন বলে মনে হচ্ছে। আমরা প্রায়শই "যদি গবেষণাটি প্রতিলিপি করা হত" এর কথা বলি ... ... গবেষণার অনুলিপি করা হয় তবে বিতরণে ভিন্ন হতে পারে এই সত্যের জন্য হিসাব না করেই । একটি নমুনায় যৌন ভারসাম্য 40% হতে পারে তবে অন্যভাবে 60% থাকতে পারে গবেষণাটি কীভাবে অর্জন করা হয়েছিল তার এলোমেলো ফলাফল হিসাবে। হাস্যকরভাবে, বুটস্ট্র্যাপ এটিকে প্রতিফলিত করে তবে কোভারিয়েটগুলির একটি বিশেষ সংমিশ্রণের জন্য পরিণতিতে কোনও পরিবর্তনশীলতা তৈরি করে নাX
অ্যাডামো

2
প্রথমত, অনেক গবেষণা পরীক্ষামূলক নিয়ন্ত্রণে রাখে, তাই এটি এলোমেলোও নয়। দ্বিতীয়ত, পর্যবেক্ষণমূলক স্টাডিজ (যেখানে এলোমেলো) প্রায়শই শর্তসাপেক্ষ বন্টন সম্পর্কে অনুমানের বিষয়ে আগ্রহী Thus পূর্ণ (যৌথ) বিতরণটি যখন আগ্রহী তখন আপনি দেখতে পাবেন অনেক লোক পরস্পর সম্পর্কিত বিশ্লেষণ বা বিভিন্ন বহুবিধ প্রক্রিয়া অবলম্বন করে। "বুটস্ট্র্যাপ" এর মতো কোনও জিনিস নেই, কারণ এই পরিস্থিতিতে আপনি কীভাবে পুনরায় নমুনা নিচ্ছেন তা আপনার লক্ষ্যগুলি এবং আপনার মডেলের উপর নির্ভর করে। এক্স ওয়াই XXY.
whuber

1
@whuber এক্সপেরিমেন্টাল নিয়ন্ত্রণ করা হয় এলোমেলোভাবে অধ্যয়ন এন্ট্রি সময়ে নির্ধারিত হয়। যেমনটি আমি উল্লেখ করেছি, এটি একটি জোরালো ঘটনা: বলুন যে এলোমেলোকরণটি বার্নোল্লি। কেন একটি অনুশীলনমূলক অনুমান ব্যবহার করবেন ? সর্বাধিক সম্ভাবনা ব্যবহার করুন: ? আপনি বুটস্ট্র্যাপ সম্পর্কে সঠিক, আমি নন-প্যারামেট্রিক (শর্তহীন) বুটস্ট্র্যাপ উল্লেখ করছি যেখানে "সারি" ডেটা প্রতিস্থাপনের সাথে নমুনাযুক্ত। কোভ ( এক্স ) = ( এক্স ) ( 1 - ( এক্স ) )cov(X)=XTXcov(X)=E(X)(1E(X))
অ্যাডামো

2
বিশেষ করে, ব্যতিক্রমী মামলার বাইরে, এটা না সত্যিই ব্যাপার যদি এলোমেলো হয়ে যায় আসলে একটি যদি হয় পরিমাপ ত্রুটি মধ্যে । যদি তা হয় তবে ওএলএস পদ্ধতিগুলি এর পক্ষপাতদুষ্ট এবং নিম্ন চালিত অনুমানের দিকে নিয়ে । সেক্ষেত্রে ভেরিয়েবলের পদ্ধতিতে ত্রুটি ব্যবহার করা উচিত। এক্স 1 β 1X1X1β1
গুং - মনিকা পুনরায়

উত্তর:


8

আপনার প্রশ্ন (আরও মন্তব্যগুলিতে আরও মন্তব্য) বেশিরভাগ ক্ষেত্রে সেই ক্ষেত্রে আগ্রহী বলে মনে হচ্ছে যেখানে আমাদের একটি এলোমেলোভাবে নিয়ন্ত্রিত বিচার রয়েছে যেখানে গবেষক এলোমেলোভাবে কিছু র্যান্ডমাইজেশন ডিজাইনের উপর ভিত্তি করে এক বা একাধিক ব্যাখ্যামূলক ভেরিয়েবল নির্ধারণ করে। এই প্রসঙ্গে, আপনি জানতে চান যে আমরা কেন এমন মডেল ব্যবহার করি যা বর্ণনামূলক পরিবর্তনশীল হিসাবে র্যান্ডমাইজেশন দ্বারা আরোপিত নমুনা বিতরণ থেকে এলোমেলো ভেরিয়েবল হিসাবে বিবেচনা করার পরিবর্তে পরিচিত ধ্রুবক হিসাবে বিবেচনা করে। (আপনার প্রশ্নটি এর চেয়ে আরও বিস্তৃত, তবে এটি ভাষ্যটির ক্ষেত্রে প্রাথমিক আগ্রহের বিষয় বলে মনে হচ্ছে, তাই এটিই আমি সম্বোধন করব))

এই প্রসঙ্গে, আমরা ব্যাখ্যামূলক ভেরিয়েবলগুলির শর্তের কারণটি হ'ল কোনও আরসিটি-র জন্য একটি রিগ্রেশন সমস্যায় আমরা ভবিষ্যদ্বাণীকারীদের দেওয়া প্রতিক্রিয়াশীল ভেরিয়েবলের শর্তাধীন বিতরণে আগ্রহী । প্রকৃতপক্ষে, একটি আরসিটিতে আমরা প্রতিক্রিয়াশীল ভেরিয়েবল উপর একটি ব্যাখ্যামূলক ভেরিয়েবল কার্যকারিতা প্রভাব নির্ধারণে আগ্রহী , যা আমরা শর্তসাপেক্ষ বিতরণ (বিভ্রান্তি রোধে কিছু প্রোটোকলের সাপেক্ষে) নির্ধারণের মাধ্যমে নির্ধারণ করতে যাচ্ছি। বর্ণনামূলক ভেরিয়েবল এবং যে কোনও বিভ্রান্তিকর ভেরিয়েবলের (যেমন, ব্যাক-ডোর অ্যাসোসিয়েশনগুলি রোধ করা) মধ্যে নির্ভরতা ভাঙার জন্য এ এলোমেলোকরণটি আরোপ করা হয় । XYX যাইহোক, সমস্যাটিতে অনুমানের অবজেক্টটি এখনও ব্যাখ্যামূলক ভেরিয়েবলগুলির প্রতিক্রিয়াশীল ভেরিয়েবলের শর্তযুক্ত বিতরণ । সুতরাং, এটি এখনও ইন্দ্রিয় তোলে এই শর্তসাপেক্ষ বিতরণে পরামিতি অনুমান করার জন্য, প্রাক্কলন পদ্ধতি inferring জন্য ভাল বৈশিষ্ট্য আছে যে ব্যবহার শর্তাধীন বিতরণ

এটি হ'ল স্বাভাবিক কেস যা রিগ্রেশন কৌশল ব্যবহার করে আরসিটি-র জন্য প্রয়োগ হয়। অবশ্যই কিছু পরিস্থিতি রয়েছে যেখানে আমাদের অন্যান্য আগ্রহ রয়েছে এবং আমরা সম্ভবত ব্যাখ্যামূলক ভেরিয়েবলগুলি সম্পর্কে অনিশ্চয়তা যুক্ত করতে চাই। ব্যাখ্যামূলক ভেরিয়েবলগুলিতে অনিশ্চয়তা সংযোজন সাধারণত দুটি ক্ষেত্রে ঘটে:

  • (1) আমরা যখন রিগ্রেশন বিশ্লেষণের বাইরে চলে যাই এবং বহুবিশ্লেষ বিশ্লেষণে যাই তখন আমরা আগ্রহী হ'ল বর্ণনামূলক এবং প্রতিক্রিয়াশীল ভেরিয়েবলগুলির যৌথ বন্টনে আগ্রহী , কেবল পূর্ববর্তীটির পরে দেওয়া শর্তসাপেক্ষে বিতরণ না করে। এমন অ্যাপ্লিকেশন থাকতে পারে যেখানে এটি আমাদের আগ্রহ, এবং সুতরাং আমরা তখন রিগ্রেশন বিশ্লেষণের বাইরে চলে যাব এবং ব্যাখ্যামূলক ভেরিয়েবলগুলির বিতরণ সম্পর্কিত তথ্য অন্তর্ভুক্ত করব।

  • (২) কিছু রিগ্রেশন অ্যাপ্লিকেশনগুলিতে আমাদের আগ্রহ একটি অন্তর্নিহিত অব্যক্ত বর্ণনামূলক ভেরিয়েবলের প্রতিক্রিয়ার পরিবর্তনশীল শর্তাধীন বিতরণে রয়েছে, যেখানে আমরা ধরে নিই যে পর্যবেক্ষণযোগ্য বর্ণনামূলক ভেরিয়েবলগুলি ত্রুটির ("ত্রুটি-ইন-ভেরিয়েবল") এর অধীন ছিল। এই ক্ষেত্রে আমরা "ত্রুটি-ইন-ভেরিয়েবলগুলি" এর মাধ্যমে অনিশ্চয়তা অন্তর্ভুক্ত করি। এর কারণ হ'ল এই ক্ষেত্রেগুলির প্রতি আমাদের আগ্রহ শর্তাধীন বিতরণে, একটি অননक्षित সংরক্ষিত অন্তর্ভুক্ত ভেরিয়েবলের শর্তাধীন

মনে রাখবেন যে এই দুটি ক্ষেত্রেই রিগ্রেশন বিশ্লেষণের চেয়ে গাণিতিকভাবে আরও জটিল, তাই আমরা যদি রিগ্রেশন বিশ্লেষণ ব্যবহার করে দূরে যেতে পারি তবে তা সাধারণত পছন্দনীয়। যাই হোক না কেন, রিগ্রেশন বিশ্লেষণের বেশিরভাগ অ্যাপ্লিকেশনগুলিতে লক্ষ্যটি পর্যবেক্ষণযোগ্য ব্যাখ্যামূলক ভেরিয়েবলগুলি প্রদত্ত প্রতিক্রিয়ার শর্তসাপেক্ষ বিতরণ সম্পর্কে একটি সূচনা করা, সুতরাং এই সাধারণীকরণ অপ্রয়োজনীয় হয়ে যায়।


ag ag নোট করুন যে এলোমেলোকরণ ভেরিয়েবল থেকে র্যান্ডমাইজড ভেরিয়েবলের কার্যকারিতা প্রভাবিত করে, তবে এটি এলোমেলো পরিবর্তনশীল থেকে বিভ্রান্তিকর ভেরিয়েবলগুলিতে কার্যকারিতা প্রভাব বিভক্ত করে না এবং তারপরে প্রতিক্রিয়াতেও আসে না। এর অর্থ হ'ল অন্যান্য প্রোটোকলগুলি (যেমন, প্লেসবোস, ব্লাইন্ডিং ইত্যাদি) কার্যকারণ বিশ্লেষণে সমস্ত ব্যাক-ডোর অ্যাসোসিয়েশনগুলি পুরোপুরি বিচ্ছিন্ন করার প্রয়োজন হতে পারে।


2
চমৎকার উত্তর. আমি এএফএআইকে যুক্ত করব যে আপনার যদি সাধারণ রিগ্রেশন পদ্ধতির চেয়ে গাউসীয় ত্রুটি-ইন-ভেরিয়েবল এবং গাউসীয় ত্রুটি-ইন-প্রতিক্রিয়া থাকে এবং এটি কেবল তখনই ইস্যুতে পরিণত হয় যদি আপনি ক) ত্রুটিবিহীন প্রতিক্রিয়া লক্ষ্য করেছেন খ) এর আলাদা প্রতিক্রিয়া বিতরণ আছে
মার্টিন Modrák

2

"ভেরিয়েবলগুলিতে ত্রুটি" শিরোনাম এবং প্রশ্নের বিষয়বস্তু পৃথক বলে মনে হচ্ছে, কারণ শর্তসাপেক্ষ প্রতিক্রিয়ার মডেলিং করার সময় আমরা পরিবর্তনের বিষয়টি কেন বিবেচনায় নিই না তা জিজ্ঞাসা করা হয় , এটি হ'ল রিগ্রেশন প্যারামিটারের পক্ষে। এই দুটি ব্যস্ততা আমার কাছে অর্থেগোনাল বলে মনে হচ্ছে, সুতরাং আমি এখানে সামগ্রীতে প্রতিক্রিয়া জানাব।X

আমি এর আগেও একইরকম প্রশ্নের জবাব দিয়েছি, রেজিস্ট্রারদের বনাম বনাম সংশোধন হিসাবে কন্ডিশনার মধ্যে পার্থক্য কী? , তাই আমি এখানে আমার উত্তরের অংশটি অনুলিপি করব:

আমি আরও আনুষ্ঠানিকভাবে রেজিস্ট্রারদেরকে কন্ডিশনার জন্য একটি যুক্তি প্রকাশ করার চেষ্টা করব। যাক একটি র্যান্ডম ভেক্টর হও, এবং সুদ রিগ্রেশন হয় উপর , যেখানে রিগ্রেশন এর শর্তাধীন প্রত্যাশা মানে নেওয়া হয় উপর । বহুবিধ অনুমানের অধীনে যা একটি লিনিয়ার ফাংশন হবে তবে আমাদের যুক্তিগুলি এর উপর নির্ভর করে না। আমরা সাধারণভাবে মতো যৌথ ঘনত্বের ফ্যাক্টরিং দিয়ে শুরু করি তবে সেই ফাংশনগুলি জানা যায় না তাই আমরা একটি পরামিতি মডেল যেখানে শর্তসাপেক্ষ বিতরণকে পরামিতি করে এবং(Y,X)YXYX

f(y,x)=f(yx)f(x)
f(y,x;θ,ψ)=fθ(yx)fψ(x)
θψ এর প্রান্তিক বিতরণ । সাধারণ রৈখিক মডেলটিতে আমাদের কাছে তবে তা ধরে নেওয়া যায় না। এর পূর্ণ পরামিতি স্পেসটি হ'ল কারেটিশিয়ান পণ্য এবং দুটি পরামিতির কোনও মিল নেই।Xθ=(β,σ2)(θ,ψ)Θ×Ψ

এটি পরিসংখ্যানগত পরীক্ষার (বা ডেটা জেনারেশন প্রক্রিয়াকরণের, ডিজিপি) একটি কারণ হিসাবে ব্যাখ্যা করা যেতে পারে, প্রথম অনুযায়ী তৈরি করা হয় এবং দ্বিতীয় পদক্ষেপ হিসাবে শর্তসাপেক্ষ ঘনত্ব অনুযায়ী উত্পন্ন হয় । মনে রাখবেন যে প্রথম পদক্ষেপটি সম্পর্কে কোনও জ্ঞান ব্যবহার করে না , যা কেবলমাত্র দ্বিতীয় ধাপে প্রবেশ করে। পরিসংখ্যাত জন্য আনুষঙ্গিক হয় দেখুন https://en.wikipedia.org/wiki/Ancillary_statisticXfψ(x)Yfθ(yX=x)θXθ

তবে, প্রথম পদক্ষেপের ফলাফলের উপর নির্ভর করে, দ্বিতীয় পদক্ষেপটি কম-বেশি সম্পর্কে তথ্যপূর্ণ হতে পারে । বন্টন কর্তৃক প্রদত্ত তাহলে খুব কম ভ্যারিয়েন্স আছে, বলুন, পর্যবেক্ষণ করা হয়েছে এর একটি ছোট অঞ্চলের, ঘনীভূত করা হবে যাতে এটি অনুমান করার জন্য আরো কঠিন হবে । সুতরাং, এই দ্বি-পদক্ষেপের পরীক্ষার প্রথম অংশটি নির্ভুলতা নির্ধারণ করে যা দিয়ে অনুমান করা যায়। অতএব রিগ্রেশন পরামিতিগুলি সম্পর্কে অনুমান করে এ শর্ত হওয়া স্বাভাবিক । এটিই শর্তযুক্ত যুক্তি এবং উপরের রূপরেখাটি তার অনুমানগুলি পরিষ্কার করে দেয়।θfψ(x)xθθX=x

নকশা করা পরীক্ষাগুলিতে এর অনুমানটি বেশিরভাগ পর্যবেক্ষণমূলক ডেটা না দিয়ে ধারণ করবে। সমস্যার কয়েকটি উদাহরণ হ'ল: ভবিষ্যদ্বাণীকারী হিসাবে পিছিয়ে থাকা প্রতিক্রিয়াগুলির সাথে রিগ্রেশন। এক্ষেত্রে ভবিষ্যদ্বাণীকারীদের উপর শর্ত জবাব দেওয়ার শর্তও রাখবে! (আমি আরও উদাহরণ যুক্ত করব)।

একটি সমস্যা যা এই সমস্যাগুলিকে অনেক বিশদে আলোচনা করে তা হ'ল তথ্য এবং ঘাতক পরিবারগুলি: ও। ই বারডরফ-নীলসেনের পরিসংখ্যানতত্ত্বে । বিশেষত অধ্যায় ৪ দেখুন। লেখক বলেছেন যে এই পরিস্থিতিতে বিচ্ছিন্নতার যুক্তি খুব কমই ব্যাখ্যা করা হলেও নিম্নলিখিত রেফারেন্স দেয়: আরএ ফিশার (১৯৫6) পরিসংখ্যান পদ্ধতি এবং বৈজ্ঞানিক অনুক্রম এবং সার্ভারড্রপ (১৯6666) সিদ্ধান্ত তত্ত্বের বর্তমান অবস্থা এবং নেইমন-পিয়ারসন তত্ত্ব§4.3


এখানে ব্যবহৃত পরিসংখ্যান যথেষ্ট পরিসংখ্যানের ফ্যাক্টরাইজেশন উপপাদ্যের সাথে কিছুটা মিল রয়েছে। যদি রিগ্রেশন প্যারামিটার এবং ফোকাসে এর বন্টন উপর নির্ভর করে না , তবে এর বিতরণ (বা তারতম্য) কীভাবে তথ্য থাকতে পারে ? θXθXθ

এই বিচ্ছেদ যুক্তিটিও সহায়ক কারণ এটি এটি যে ক্ষেত্রে ব্যবহার করা যায় না তার দিকে নির্দেশ করে, উদাহরণস্বরূপ ভবিষ্যদ্বাণীকারী হিসাবে পিছিয়ে থাকা প্রতিক্রিয়াগুলির সাথে রিগ্রেশন।


1
আমি ওএলএস-এর উপর কেন্দ্রীভূত প্রশ্নটির প্রশংসা করি, তবে আমি আপনার উত্তরটির প্রভাবগুলি বুঝতে পেরেছি তা নিশ্চিত করার জন্য আমি ভাবছিলাম যে এটি আংশিক ন্যূনতম স্কোয়ারের রিগ্রেশনটিতে কীভাবে খেলবে? যেহেতু ডেটা হ্রাস আংশিকভাবে উপর নির্ভরশীল তার অর্থ কি এই হবে যে এবং সাধারণ পরামিতি রয়েছে? ওয়াই θ ψXYθψ
রিনিব্যাট

আমি পিএলএস সম্পর্কে জানি না, তবে এটি সম্পর্কে চিন্তা করার চেষ্টা করব
kjetil b halvorsen

1
সুন্দর উত্তর! ...
রিচার্ড হার্ডি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.