ইন্ডিপেন্ডেন্ট ভেরিয়েবল = এলোমেলো পরিবর্তনশীল?


25

আমি সামান্য বিভ্রান্ত করছি যদি একটি স্বাধীন পরিবর্তনশীল একটি পরিসংখ্যানগত মডেল (এছাড়াও predictor বা বৈশিষ্ট্য বলা হয়), উদাহরণস্বরূপ রৈখিক রিগ্রেশনে , একটি দৈব চলক হয়?ওয়াই = β 0 + β 1 এক্সXY=β0+β1X


12
রৈখিক মডেলটি শর্তসাপেক্ষ , তাই এটি এলোমেলো কিনা তা বিবেচনা করা উচিত নয়। X
শি'য়ান

4
পরীক্ষা করে দেখুন এই । ভাল প্রশ্ন, বিটিডাব্লু।
আন্তনি পরল্লদা

@ শিয়ান, ফিক্সড ডিজাইনে লিনিয়ার মডেল অনুমানগুলি শর্তযুক্ত নয় , আমার উত্তর দেখুন। সুতরাং, এটি অনেক কিছু যায় আসে। এই কারণেই পর্যবেক্ষণের গবেষণার ফলাফলের চেয়ে পরীক্ষাগুলি ব্যাখ্যা করা এত সহজX
আকসাকাল

উত্তর:


19

লিনিয়ার রিগ্রেশন এর দুটি সাধারণ সূত্র রয়েছে। ধারণাগুলিগুলিতে ফোকাস করতে, আমি সেগুলি কিছুটা বিমূর্ত করব। গাণিতিক বিবরণটি ইংরাজী বর্ণনার চেয়ে কিছুটা বেশি জড়িত, সুতরাং আসুন শুরু করা যাক:

লিনিয়ার রিগ্রেশন একটি মডেল, যার মাধ্যমে কোনো প্রতিক্রিয়া একটি ডিস্ট্রিবিউশনের সাথে regressors দ্বারা নির্ধারিত র্যান্ডম গণ্য করা হয় এর মাধ্যমে একটি রৈখিক মানচিত্র এবং, সম্ভবত, অন্যান্য পরামিতি দ্বারা ।YXβ(X)θ

বেশিরভাগ ক্ষেত্রে সম্ভাব্য বিতরণের সেট হ'ল প্যারামিটারগুলির সাথে একটি পরিবার পরিবার এবং এবং প্যারামিটারটি দেয় । প্রত্নতাত্ত্বিক উদাহরণটি সাধারণ রিগ্রেশন , যেখানে বিতরণের সেটটি সাধারণ পরিবার এবং μ = β ( এক্স ) রেজিস্ট্রারগুলির একটি লিনিয়ার ফাংশন।αθβ(X)αN(μ,σ)μ=β(X)

কারণ আমি এখনো গাণিতিক ভাবে বর্ণনা করা আছে, এটা এখনও একটি খোলা প্রশ্ন গাণিতিক বস্তু কি ধরণের এর X , Y , β , এবং θ পড়ুন - এবং আমি বিশ্বাস করি যে এই থ্রেড প্রধান বিষয়। যদিও কেউ বিভিন্ন (সমতুল্য) পছন্দ করতে পারে তবে বেশিরভাগই নিম্নলিখিত বর্ণনার সমতুল্য বা বিশেষ ক্ষেত্রে হবে।


  1. স্থির রেজিস্ট্রার। Regressors বাস্তব ভেক্টর হিসাবে প্রতিনিধিত্ব করা হয় XRpপ্রতিক্রিয়া একটি র্যান্ডম পরিবর্তনশীল Y:ΩR (যেখানে Ω একটি সিগমা ক্ষেত্র ও সম্ভাবনা সঙ্গে অন্বিত হয় না)। মডেল একটি ফাংশন f:R×ΘMd (যদি আপনি চান, ফাংশন একটি সেট বা, RMd দ্বারা স্থিতিমাপ Θ )। Mdসম্ভাব্যতা বিতরণের জায়গার মাত্রার d এর একটি সীমাবদ্ধ মাত্রিক টপোলজিকাল (সাধারণত দ্বিতীয় ডিফারেনটেবল) সাবম্যানিফোল্ড (বা সাবমানিফোল্ড-সহ-সীমানা) d f সাধারণত অবিচ্ছিন্ন হতে হয় (বা যথেষ্ট পার্থক্যযোগ্য)। হ'লΘRd1 "উপদ্রব পরামিতি"। মনে করা হয়, বিতরণ Y হয় f(β(X),θ) কিছু অজানা দ্বৈত ভেক্টর জন্য βRp "রিগ্রেশন কোফিসিয়েন্টস") এবং অজানা θΘ। আমরা এই Y f ( β ( X ) , θ ) লিখতে পারি

    Yf(β(X),θ).

  2. এলোমেলো রেজিস্ট্রার। নিবন্ধক এবং প্রতিক্রিয়া হ'ল p+1 মাত্রিক ভেক্টর-মূল্যবান র্যান্ডম ভেরিয়েবল Z=(X,Y):ΩRp×R । মডেল f আগের মত একই ধরণের বস্তু, তবে এখন এটি শর্তযুক্ত সম্ভাবনা Y দেয় | এক্স এফ ( β ( এক্স ) , θ )

    Y|Xf(β(X),θ).

গাণিতিক বিবরণটি কোনও প্রেসক্রিপশন ছাড়াই অকেজো যে এটি কীভাবে ডেটাতে প্রয়োগ করার উদ্দেশ্যে। সংশোধন করা হয়েছে regressor ক্ষেত্রে আমরা কল্পনা X পরীক্ষায় দ্বারা নির্দিষ্ট মাত্র। সুতরাং এটি দেখতে হলে সাহায্য করতে পারে Ω একটি পণ্য হিসাবে Rp×Ω একটি পণ্য সিগমা বীজগণিত সঙ্গে অন্বিত। পরীক্ষায় নির্ধারণ X ও প্রকৃতি নির্ধারণ করে (কিছু অজানা, বিমূর্ত) ωΩ । এলোমেলো রেজিস্ট্রার ক্ষেত্রে, প্রকৃতি ωΩ নির্ধারণ করে , এলোমেলো পরিবর্তনশীল π এক্স ( জেড) এর X উপাদানπX(Z(ω)) নির্ধারণ করেX (যা "পালন" হয়), এবং আমরা এখন একটি আদেশ যুগল আছে(X(ω),ω))Ω ঠিক সংশোধন regressor ক্ষেত্রে হিসাবে।


বহু রৈখিক প্রত্যাবৃত্তি (যা আমি বরং এই আরও সাধারণ এক তুলনায় অবজেক্টের জন্য মান স্বরলিপি ব্যবহার প্রকাশ হবে) এর archetypical উদাহরণ যে

f(β(X),σ)=N(β(x),σ)
কিছু ধ্রুবক জন্য σΘ=R+ । হিসাবে x সর্বত্র পরিবর্তিত হয় Rp একটি - তার ইমেজ differentiably এক মাত্রিক উপসেট আউট ট্রেস বক্ররেখা সাধারন ডিস্ট্রিবিউশন এর দ্বি-মাত্রিক নানাবিধ --in।

যখন - কোনো ফ্যাশন whatsoever-- মধ্যে β হিসাবে অনুমান করা হয় β এবং σ যেমন σ , মান β ( এক্স ) হয় পূর্বাভাস মান এর ওয়াই সঙ্গে যুক্ত এক্স --whether এক্স পরীক্ষায় দ্বারা নিয়ন্ত্রিত হয় (কেস 1 ) বা কেবল পালন করা হয় (কেস 2)। আমরা হয় একটি মান (কেস 1) সেট বা উপলব্ধি (কেস 2) পালন তাহলে x এর এক্স , তারপর প্রতিক্রিয়া ওয়াই যে সঙ্গে যুক্ত এক্স একটি এলোপাতাড়ি ভেরিয়েবলের যার বন্টন হয় এন (β^σσ^β^(x)YxxxX YXN(β(x),σ) , যা অজানা কিন্তুআনুমানিকহতেN(β^(x),σ^)


আমি কেবল উল্লেখ করতে পারি, এটি একটি দুর্দান্ত উত্তর (তবে সম্ভবত সবার জন্য নয়)।
l7ll7

2
পিএস আপনি কি এমন কোনও বই জানেন, যেখানে এই মৌলিক প্রশ্নটি এখানে আপনি যেমন করেছিলেন ঠিক তেমন ব্যাখ্যা করা হয়? একজন গণিতবিদ হিসাবে আমি যে সমস্ত বই পেয়েছি সেগুলির এখানে অন্যান্য উত্তরগুলি প্রতিবিম্বিত হয়েছে, এটি গাণিতিক দৃষ্টিকোণ থেকে খুব কম সুনির্দিষ্ট। (এটি তাদের খারাপ করে না, অবশ্যই, এই বইগুলি আমার পক্ষে নয় - আমি এমন একটি বই পছন্দ করব যা এই উত্তরের মতো আরও সুনির্দিষ্ট।)
l7ll7

শেষ অনুচ্ছেদ প্রথম বাক্যে নয় β ( এক্স ) জন্য পূর্বাভাস মান Y (দৈব চলক একটি আদায় ওয়াই না জন্য আগাম অনুমান মান) এক্স ? নাকি আমি আপনার ভাষায় অনেকেই ভুল বুঝে ভাবেন, এবং "জন্য আগাম অনুমান মূল্য আছে এক্স মানে হলো" "পূর্বাভাস মান যখন এক্স সেট (উদযাপিত) মান এক্স ?" β^(x)yYxxxX
চাদ

1
@ চাদ অস্পষ্ট ভাষা দেখানোর জন্য আপনাকে ধন্যবাদ। অর্থটি স্পষ্ট করতে আমি এই বাক্যটি সম্পাদনা করেছি, যা আপনার বোঝার সাথে সামঞ্জস্যপূর্ণ।
হোয়বার

7

প্রথমত, @ হুবার একটি দুর্দান্ত উত্তর দিয়েছেন। আমি এটি একটি ভিন্ন গ্রহণ করব, সম্ভবত কোনও অর্থে সহজ, কোনও পাঠ্যের রেফারেন্স সহ।

অনুপ্রেরণা

এলোমেলো বা রেগ্রেশন গঠনের ক্ষেত্রে স্থির থাকতে পারে। এটি আপনার সমস্যার উপর নির্ভর করে। তথাকথিত পর্যবেক্ষণমূলক অধ্যয়নের জন্য এটি এলোমেলো হতে হবে, এবং পরীক্ষার জন্য এটি সাধারণত স্থির হয় isX

একটি উদাহরণ। আমি একটি ধাতব অংশের কঠোরতার উপর বৈদ্যুতিন বিকিরণের সংস্পর্শের প্রভাব অধ্যয়ন করছি। সুতরাং, আমি ধাতব অংশের কয়েকটি নমুনা নিয়েছি এবং এর বিকিরণের বিভিন্ন স্তরের প্রকাশ করি। আমার এক্সপোজার স্তরটি এক্স, এবং এটি ঠিক করা হয়েছে , কারণ আমি যে স্তরগুলিকে বেছে নিয়েছি আমি সেট করেছি। আমি পুরোপুরি পরীক্ষার শর্তগুলি নিয়ন্ত্রণ করি, বা কমপক্ষে চেষ্টা করি। তাপমাত্রা এবং আর্দ্রতার মতো অন্যান্য পরামিতিগুলির সাথেও আমি এটি করতে পারি।

উদাহরণ দুটি। আপনি ক্রেডিট কার্ড অ্যাপ্লিকেশনগুলিতে জালিয়াতির ঘটনার ফ্রিকোয়েন্সিতে অর্থনীতির প্রভাব অধ্যয়ন করছেন। সুতরাং, আপনি জালিয়াতির ইভেন্টটি জিডিপিতে গণনা করেছেন। আপনি জিডিপি নিয়ন্ত্রণ করেন না, আপনি পছন্দসই স্তরে সেট করতে পারবেন না। তদতিরিক্ত, আপনি সম্ভবত মাল্টিভারিয়েট রিগ্রেশনগুলি দেখতে চান, সুতরাং আপনার অন্যান্য পরিবর্তনশীল যেমন বেকারত্ব রয়েছে, এবং এখন আপনার এক্সে মানগুলির সংমিশ্রণ রয়েছে, যা আপনি পর্যবেক্ষণ করেন তবে নিয়ন্ত্রণ করতে পারেন না। এই ক্ষেত্রে এক্স এলোমেলো

উদাহরণ তিন। আপনি ক্ষেতে নতুন কীটনাশকের কার্যকারিতা অধ্যয়ন করছেন, যেমন ল্যাব শর্তে নয়, প্রকৃত পরীক্ষামূলক খামারে। এই ক্ষেত্রে আপনি কিছু নিয়ন্ত্রণ করতে পারেন, উদাহরণস্বরূপ আপনি কীটনাশক লাগাতে হবে তার পরিমাণ নিয়ন্ত্রণ করতে পারেন। তবে আপনি সবকিছু নিয়ন্ত্রণ করেন না, যেমন আবহাওয়া বা মাটির পরিস্থিতি। ঠিক আছে, আপনি কিছুটা পরিমাণে মাটি নিয়ন্ত্রণ করতে পারেন তবে পুরোপুরি নয়। এটি একটি অভ্যন্তরীণ ক্ষেত্রে, যেখানে কিছু শর্ত পালন করা হয় এবং কিছু শর্ত নিয়ন্ত্রণ করা হয় । গবেষণার এই পুরো ক্ষেত্রটি পরীক্ষামূলক ডিজাইন নামে পরিচিত যা সত্যই এই তৃতীয় মামলার দিকে দৃষ্টি নিবদ্ধ করে, যেখানে কৃষি গবেষণা এটির সবচেয়ে বড় প্রয়োগ applications

গণিত

এখানে একটি উত্তরের গাণিতিক অংশ রয়েছে। অনুমানের একটি সেট রয়েছে যা সাধারণত লিনিয়ার রিগ্রেশন অধ্যয়ন করার সময় উপস্থাপিত হয়, যাকে গৌস-মার্কভ শর্ত বলে। এগুলি খুব তাত্ত্বিক এবং তারা কোনও ব্যবহারিক সেট আপ আছে কিনা তা প্রমাণ করতে কোনও মাথা ঘামায় না। তবে এগুলি সাধারণ ন্যূনতম স্কোয়ারগুলি (ওএলএস) পদ্ধতির সীমাবদ্ধতা বুঝতে খুব কার্যকর very

সুতরাং, অনুমানের সেটটি এলোমেলো এবং স্থির এক্সের জন্য পৃথক, যা পর্যবেক্ষণ বনাম পরীক্ষামূলক গবেষণার সাথে মোটামুটি মিলিয়ে যায়। মোটামুটিভাবে, কারণ যেমনটি আমি তৃতীয় উদাহরণে দেখিয়েছি, কখনও কখনও আমরা চূড়ান্ততার মধ্যেই থাকি। স্যালকাইন্ডের এনসাইক্লোপিডিয়া অফ রিসার্চ ডিজাইনের "গাউস-মার্কোভ" উপপাদ্য বিভাগটি পাওয়া শুরু করার জন্য ভাল জায়গা, এটি গুগল বুকসে উপলব্ধ

Y=Xβ+ε

  • E[ε]=0
  • E[ε2]=σ2
  • E[εi,εj]=0

বনাম। এলোমেলো ডিজাইনে একই অনুমানগুলি:

  • E[ε|X]=0
  • E[ε2|X]=σ2
  • E[εi,εj|X]=0

আপনি দেখতে পাচ্ছেন পার্থক্যটি এলোমেলো ডিজাইনের জন্য নকশার ম্যাট্রিক্সের উপর অনুমানগুলি কন্ডিশনে রয়েছে। কন্ডিশনিং এই শক্তিশালী অনুমান তৈরি করে। উদাহরণস্বরূপ, আমরা কেবল ঠিক ডিজাইনের মতোই বলছি না যে ত্রুটির শূন্য অর্থ রয়েছে; এলোমেলো নকশায় আমরা এও বলি যে তারা এক্স, কোভেরিয়েটগুলির উপর নির্ভরশীল নয়।


2

পরিসংখ্যানগুলিতে একটি এলোমেলো পরিবর্তনশীল পরিমাণ হয় যা কোনওভাবে এলোমেলোভাবে পরিবর্তিত হয়। আপনি এই দুর্দান্ত সিভি থ্রেডে একটি ভাল আলোচনা খুঁজে পেতে পারেন: একটি "এলোমেলো পরিবর্তনশীল" বলতে কী বোঝায়?


Y=β0+β1X+εwhere εN(0,σ2)
εYX

XXε

পিএস আমি লিঙ্ক থেকে সমস্ত ব্যাখ্যা তাকালাম এবং খুব আলোকিত কেউ না: কেন? কারণ কোনওটি এলোমেলো ভেরিয়েবলের মধ্যে সংযোগ তৈরি করে না কারণ সম্ভাব্যবিদরা এটি বনাম বুঝতে পারে। পরিসংখ্যানবিদরা এটি কীভাবে বোঝেন। সুতরাং কিছু উত্তর স্ট্যান্ডার্ড, সুনির্দিষ্ট সম্ভাবনা তত্ত্বের সংজ্ঞা পুনরুদ্ধার করে, আবার অন্যেরা (আমার কাছে এখনও অস্পষ্ট) অস্পষ্ট পরিসংখ্যান সংজ্ঞা পুনরুদ্ধার করে। তবে এই দুটি ধারণার মধ্যে সংযোগের সত্যিকার অর্থে কেউই ব্যাখ্যা করতে পারে না । (একমাত্র ব্যতিক্রম লম্বা টিকিট-ইন-বক্সের মডেল উত্তর, যা কিছু প্রতিশ্রুতি দেখাতে পারে, তবুও [...]
l7ll7

পার্থক্যটি স্পষ্টভাবে আলোকিত করার জন্য যথেষ্ট পরিষ্কারভাবে প্রকাশ করা হয়নি; এর কোনও মূল্য আছে কিনা তা দেখার জন্য আমাকে এই নির্দিষ্ট উত্তরে ধ্যান করতে হবে)
l7ll7

X

না, এটি সম্পর্কে অ-র্যান্ডম পরিবর্তনশীল পদ্ধতি কার্যকর হয় না, দুটি কারণে: একটি, উপরের মন্তব্যে যেমন আমি যুক্তি দিয়েছিলাম, গণিতে "ভেরিয়েবল" বলে কোনও জিনিস নেই, এবং দুটি, এমনকি এটি থাকলেও , তবে সেই ক্ষেত্রে সংযোজনটি সংজ্ঞায়িত করা হয়নি, যেমন আমি উপরের মন্তব্যে যুক্তি দিয়েছিলাম।
l7ll7

1

আমি প্রশ্নটি বুঝতে পেরেছি কিনা তা নিশ্চিত নই, তবে আপনি যদি কেবল জিজ্ঞাসা করছেন, "অবশ্যই একটি স্বাধীন চলক সর্বদা একটি এলোমেলো পরিবর্তনশীল হওয়া উচিত", তবে উত্তরটি নেই।

স্বতন্ত্র পরিবর্তনশীল একটি পরিবর্তনশীল যা নির্ভরশীল ভেরিয়েবলের সাথে সম্পর্কিত হতে অনুমান করা হয়। তারপরে আপনি পরীক্ষা করে দেখুন মডেলিংয়ের মাধ্যমে এটি সম্ভবত ঘটনা (সম্ভবত রিগ্রেশন বিশ্লেষণ)।

এখানে অনেক জটিলতা এবং "ifs, buts এবং maybes" রয়েছে, তাই আমি রিগ্রেশন বিশ্লেষণকে আচ্ছাদন করে একটি মৌলিক একনোমেট্রিক্স বা পরিসংখ্যান বইয়ের একটি অনুলিপি পেতে এবং এটি পুরোপুরি পড়ার পরামর্শ দেব বা অন্যথায় কোনও মৌলিক পরিসংখ্যান / একনোমেট্রিক্স থেকে ক্লাস নোটগুলি পাওয়া সম্ভব হলে অনলাইন।


XXYXYX

xxxxX

মনে হচ্ছে আপনি আমার চেয়ে গণিত সম্পর্কে অনেক বেশি বোধগম্য। আমি আপনাকে কেবলমাত্র স্ট্যান্ডার্ড বিশ্ববিদ্যালয় স্নাতক ইকোনোমেট্রিক্স / পরিসংখ্যানের উত্তর দিচ্ছি। আমি ভাবছি যদি সম্ভবত আপনি এটি কিছুটা বিবেচনা করছেন তবে কমপক্ষে বাস্তব বিশ্লেষণের দৃষ্টিকোণ থেকে। এই বইয়ের উদ্ধৃতি সম্পর্কে, আমার এটির ব্যাখ্যাটি হ'ল যে নির্দিষ্ট x এবং y এর সাথে তিনি উল্লেখ করছেন তা এলোমেলো - তবে এর অর্থ এই নয় যে কোনও এক্স বা কোনও y এলোমেলো।
স্ট্যাটাসনালিস্ট

উদাহরণস্বরূপ, যুক্তরাজ্যের রাজনীতিতে ভোটদানের প্রবণতার মডেলটিতে নির্ভরশীল পরিবর্তনশীল হ'ল প্রতিটি আসনে রক্ষণশীল প্রার্থীর প্রাপ্ত ভোট সংখ্যা (কানাডিয়ানদের কাছে যাত্রা, আমেরিকানদের কাছে জেলা), এবং স্বাধীন পরিবর্তনশীল বাড়ির দাম হতে পারে (এর জন্য প্রক্সি) সম্পদ / যুক্তরাজ্যে আয়)। এগুলির কোনওটিই "এলোমেলো" পরিবর্তনশীল হিসাবে আমি এটি বুঝতে পারি না, তবে এটি মডেল করার জন্য একদম যুক্তিসঙ্গত জিনিস হবে।
স্ট্যাটাসনালিস্ট

ঠিক আছে, একনোমেট্রিক্স / পরিসংখ্যান বিভাগগুলিতে আমি কী ধরণের উত্তর আশা করতে পারি / এটি মানক তা আমি জেনে রাখা ভাল এবং আমি সেই প্রতিক্রিয়াটির খুব প্রশংসা করি (আমি আবারও উত্সাহ দিতে পারব, তবে আমি করতে পারি না যেহেতু আমি ইতিমধ্যে করেছি)। গণিতের সমস্যাটি হ'ল "একবার কালো হয়ে গেলে আপনি আর ফিরে যাবেন না": গাণিতিক যথাযথতার জন্য দীর্ঘকালীন প্রশিক্ষণ যদি কোনওরকম স্বচ্ছতা অর্জন না করে কিছু স্ফটিক-স্পষ্টভাবে প্রকাশিত না হয় তবে [...]
l7ll7
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.