লিনিয়ার রিগ্রেশন কেন রেসপন্স ভেরিয়েবল অবিচ্ছিন্ন হতে হবে?


13

আমি জানি যে লিনিয়ার রিগ্রেশন এ রেসপন্স ভেরিয়েবল অবশ্যই অবিচ্ছিন্ন হতে পারে তবে কেন এটি এমন? আমি অনলাইনে এমন কিছু খুঁজে পাচ্ছি না যা ব্যাখ্যা করে যে আমি কেন প্রতিক্রিয়ার ভেরিয়েবলের জন্য পৃথক ডেটা ব্যবহার করতে পারি না।

উত্তর:


25

আপনার পছন্দের সংখ্যার দুটি কলামে লিনিয়ার রিগ্রেশন ব্যবহার করা থামিয়ে দেওয়ার কিছু নেই। এমন সময় আছে যখন এটি এমনকি যথেষ্ট বুদ্ধিমান পছন্দ হতে পারে।

তবে, আপনি যা বের করবেন তার বৈশিষ্ট্যগুলি অগত্যা কার্যকর হবে না (উদাহরণস্বরূপ আপনি তাদের হতে চান এমন সমস্ত কিছু হবে না)।

সাধারণত রিগ্রেশন সহ আপনি Y এর শর্তাধীন গড় এবং ভবিষ্যদ্বাণীকের মধ্যে কিছুটা ফিট করার চেষ্টা করছেন - অর্থাত্ কিছু আকারের ; তর্কসাপেক্ষে শর্তসাপেক্ষ প্রত্যাশা আচরণ মডেলিং কি 'রিগ্রেশন' হল হয় । [আপনি যখন জি এর জন্য একটি নির্দিষ্ট ফর্ম নেন তখন লিনিয়ার রিগ্রেশন হয় ]E(Y|x)=g(x)g

উদাহরণস্বরূপ, বিচক্ষণতার চরম ক্ষেত্রে বিবেচনা করুন, একটি প্রতিক্রিয়া পরিবর্তনশীল যার বন্টন 0 বা 1 হয় এবং যা সম্ভাব্যতার সাথে মান 1 গ্রহণ করে যা কিছু ভবিষ্যদ্বাণীকারী ( ) পরিবর্তনের হিসাবে পরিবর্তিত হয়। এটি হ'ল E ( Y | x ) = P ( Y = 1 | X = x )xE(Y|x)=P(Y=1|X=x)

আপনি যদি লিনিয়ার রিগ্রেশন মডেলটির সাথে এই ধরণের সম্পর্কের উপযুক্ত হন তবে একটি সংকীর্ণ বিরতি বাদে এটি মানগুলি অসম্ভব বলে পূর্বাভাস দেবে - হয় 0 এর নীচে বা 1 এর উপরে :E(Y)01

0-1 ডেটা এবং সর্বনিম্ন স্কোয়ার ফিট করে

প্রকৃতপক্ষে, এটিও দেখতে পাওয়া যায় যে প্রত্যাশা সীমানার কাছে যাওয়ার সাথে সাথে মানগুলি আরও বেশি বার বার সেই সীমানায় মান গ্রহণ করতে পারে, সুতরাং এর প্রকরণটি যদি প্রত্যাশা মাঝের কাছাকাছি থাকে তার চেয়ে কম হয়ে যায় - বৈকল্পিকটি কমতে হবে 0 এ সুতরাং একটি সাধারণ প্রতিরোধের ওজন ভুল হয়ে যায়, শর্তাধীন প্রত্যাশা 0 বা 1 এর নিকটবর্তী অঞ্চলে ডেটা ওজন কমিয়ে দেয়, আপনার যদি a এবং b এর মধ্যে সীমাবদ্ধ পরিবর্তনশীল থাকে তবে বলুন (যেমন প্রতিটি পর্যবেক্ষণ একটি পৃথক গণনা হিসাবে রয়েছে) যে পর্যবেক্ষণের জন্য একটি সম্ভাব্য মোট সম্ভাব্য গণনার বাইরে)

তদতিরিক্ত, আমরা সাধারণত শর্তাধীন মানে উপরের এবং নিম্ন সীমাগুলির প্রতি asympote বোঝাতে আশা করি, যার অর্থ সম্পর্কটি সাধারণত বাঁকানো হবে, সোজা নয়, সুতরাং আমাদের লিনিয়ার রিগ্রেশন সম্ভবত এটি ডেটার সীমার মধ্যেও ভুল হয়ে যায়।

একই ধরণের সমস্যাগুলি ডেটা নিয়ে ঘটে যা কেবলমাত্র একদিকে আবদ্ধ থাকে (উদাহরণস্বরূপ যে গণনাগুলির একটি উচ্চ সীমানা থাকে না) যখন আপনি সেই এক সীমানার কাছাকাছি থাকেন।

এটা সম্ভব (যদি বিরল) বিযুক্ত তথ্য যে হয় প্রান্তে বেষ্টিত না আছে; যদি চলকটি বিভিন্ন মান গ্রহণ করে তবে তারতম্যের মডেলটির বর্ণনা এবং বৈকল্পিকতা যুক্তিসঙ্গত হওয়ায় বিচ্ছিন্নতা অপেক্ষাকৃত সামান্য পরিণতি হতে পারে।

এখানে একটি উদাহরণ রয়েছে যে এটিতে লিনিয়ার রিগ্রেশন ব্যবহার করা সম্পূর্ণ যুক্তিসঙ্গত হবে:

এক্সের ক্রিয়াকলাপ হিসাবে পৃথক y প্রদর্শন করার প্লট যেখানে লিনিয়ার রিগ্রেশন বোঝা যায়

যদিও এক্স-মানগুলির যে কোনও পাতলা স্ট্রিপগুলিতে কেবল কয়েকটি পৃথক ওয়াই-মান পর্যবেক্ষণ হওয়ার সম্ভাবনা রয়েছে (সম্ভবত প্রস্থ 1 এর অন্তর জন্য 10 এর কাছাকাছি), প্রত্যাশাটি ভাল-অনুমান করা যেতে পারে, এমনকি মান ত্রুটি এবং পি- মান এবং আত্মবিশ্বাসের ব্যবধানগুলি এই বিশেষ ক্ষেত্রে কম বেশি যুক্তিসঙ্গত হবে। ভবিষ্যদ্বাণী ব্যবধানগুলি কিছুটা কম ভাল কাজ করার প্রবণতা রাখবে (কারণ সেই ক্ষেত্রে অ-স্বাভাবিকতা আরও বেশি সরাসরি প্রভাব ফেলবে)

-

যদি আপনি হাইপোথিসিস টেস্টগুলি সম্পাদন করতে চান বা আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তরগুলি গণনা করতে চান তবে স্বাভাবিক পদ্ধতিগুলি স্বাভাবিকতার অনুমান করে। কিছু পরিস্থিতিতে, এটি গুরুত্বপূর্ণ হতে পারে। যাইহোক, এটি নির্দিষ্ট ধারণা না করে অনুমান করা সম্ভব।


আপনাকে ধন্যবাদ, আপনি যা বলেছেন তা আমি বুঝতে পেরেছি তা নিশ্চিত নয় তবে আমি এটিতে কাজ করব।
ilovestats 8

3
আপনার যদি নির্দিষ্ট প্রশ্ন থাকে তবে আমি তাদের উত্তর দেওয়ার চেষ্টা করতে পারি
Glen_b -Rininstate Monica

@ আইলওয়েস্ট্যাটস আমার একনোমেট্রিক্সে এমএ আছে এবং আমি আপনাকে নিশ্চিত করতে পারি যে এই উত্তরটি প্রতিটি শব্দ বোঝার জন্য উপযুক্ত। লজিস্টিক রিগ্রেশন প্রবর্তন করার জন্য একটি সহজ সিগ / ভাল ফাউন্ডেশন সহ দুর্দান্ত উত্তর।
d8aninja

3

আমি মন্তব্য করতে পারি না, তাই আমি উত্তর দেব: সাধারণ রৈখিক প্রতিক্রিয়ার মধ্যে প্রতিক্রিয়া পরিবর্তনশীল অবিচ্ছিন্ন হওয়া দরকার না , আপনার অনুমান নয়:

y=β0+β1x

তবে হ'ল:

E[y]=β0+β1x.

সাধারণ লিনিয়ার রিগ্রেশনটি বর্গক্ষেত্রের অবশিষ্টাংশের ক্ষুদ্রায়ন থেকে প্রাপ্ত, যা ধারাবাহিক এবং পৃথক পৃথক ভেরিয়েবলের জন্য উপযুক্ত বলে মনে করা হয় (গাউস-মার্কফ তত্ত্বটি দেখুন)। অবশ্যই সাধারণত ব্যবহৃত আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তর এবং হাইপোথিসিস টেস্টগুলি সাধারণ বিতরণ অনুমানের উপর নির্ভর করে যেমন গ্লেন_বি সঠিকভাবে উল্লেখ করেছেন, তবে পরামিতিগুলির ওএলএস অনুমানগুলি তা দেয় না।


2

xxy

y=β0+β1x+ϵ

ϵy

অন্যদিকে, সাধারণ রৈখিক মডেলটিতে , প্রতিক্রিয়া পরিবর্তনশীলটি পৃথক / শ্রেণীবদ্ধ (লজিস্টিক রিগ্রেশন) হতে পারে। বা গণনা (পোয়েসন রিগ্রেশন)।


চিহ্ন 999 এবং রিম্যাপের মন্তব্যে ঠিকানা সম্পাদনা করুন।

লিনিয়ার রিগ্রেশন একটি সাধারণ শব্দ যা লোকেরা এটি আলাদাভাবে ব্যবহার করতে পারে। আমাদের এটি পৃথক ভেরিয়েবলে ব্যবহার করতে বাধা দেওয়ার কিছু নেই বা স্বাধীন পরিবর্তনশীল এবং নির্ভরশীল পরিবর্তনশীল লিনিয়ার নয়।

আমরা যদি কিছু না ধরে এবং লিনিয়ার রিগ্রেশন চালাই তবে আমরা ফলাফল পেতে পারি। এবং যদি ফলাফলগুলি আমাদের প্রয়োজনগুলি পূরণ করে তবে পুরো প্রক্রিয়াটি ঠিক আছে। তবে, যেমন গ্লান_বি ড

যদি আপনি হাইপোথিসিস টেস্টগুলি সম্পাদন করতে চান বা আত্মবিশ্বাস বা ভবিষ্যদ্বাণী অন্তরগুলি গণনা করতে চান তবে স্বাভাবিক পদ্ধতিগুলি স্বাভাবিকতার অনুমান করে।

আমার এই উত্তরটি হ'ল কারণ আমি ধরেই নিয়েছি ওপি ক্লাসিক্যাল স্ট্যাটিস্টিক বই থেকে লিনিয়ার রিগ্রেশন জিজ্ঞাসা করছে যেখানে লিনিয়ার রিগ্রেশন শেখানোর সময় আমাদের সাধারণত এই ধারণা থাকে।


আপনাকে ধন্যবাদ, আমি আপনার ব্যাখ্যা বুঝতে পেরেছি। সর্বাধিক প্রশংসা
ilovestats 8

1
আপনি কী ব্যাখ্যা করতে পারেন যে ব্যাখ্যাযোগ্য পরিবর্তনশীল কেন অবিচ্ছিন্ন বা বিযুক্ত হতে পারে (অনেকগুলি প্রকাশনা বলে)? আপনার ব্যাখ্যায় আপনি বলেছেন (এবং এটি বোধগম্য হয়) যে স্বাধীন ভেরিয়েবল এক্স অবিচ্ছিন্ন।
ilovestats

2
এই উত্তরটি সঠিক বলে আমি মনে করি না। প্রতিক্রিয়াশীল ভেরিয়েবলটি ব্যাখ্যামূলক ভেরিয়েবল (গুলি) এর একটি নির্ধারিত ফাংশন হিসাবে ধরে নেওয়া হয় না এবং ব্যাখ্যামূলক চলক (গুলি) ধারাবাহিকভাবে ধরে রাখার দরকার নেই।
999

2
ফলাফলটি পৃথক বা বিতর্ক হতে পারে, এই উত্তরটি সরল ভুল
পুনর্বিবেচনা করুন

@ আপনার মন্তব্যের জন্য রেপমেট ধন্যবাদ, আমার সম্পাদনা পরীক্ষা করুন।
হাইতাও ডু

0

এটা হয় না। মডেল যদি কাজ করে তবে কে যত্ন করে?

তাত্ত্বিক দৃষ্টিভঙ্গি থেকে উপরের উত্তরগুলি সঠিক are যাইহোক, ব্যবহারিক বিবেচনায়, এটি সমস্ত আপনার ডেটার ডোমেন এবং আপনার মডেলের ভবিষ্যদ্বাণীপূর্ণ শক্তির উপর নির্ভর করে।

একটি বাস্তব জীবনের উদাহরণ পুরানো এমডিএস দেউলিয়ার মডেল। এটি গ্রাহক creditণদাতাদের দ্বারা প্রারম্ভিক ঝুঁকিপূর্ণ স্কোরগুলির মধ্যে একটি ছিল যে কোনও .ণগ্রহীতা দেউলিয়া ঘোষণা করার সম্ভাবনাটি পূর্বাভাস দেয়। এই মডেলটি periodণগ্রহীতার creditণ প্রতিবেদন থেকে বিশদ ডেটা এবং ভবিষ্যদ্বাণী সময়কালে দেউলিয়া হওয়ার জন্য একটি বাইনারি 0/1 পতাকা ব্যবহার করে। তারপরে সেই তথ্যটি ... হ্যাঁতে খাওয়ানো হয়েছে .. আপনি এটি অনুমান করেছিলেন।

একটি সমতল পুরাতন লিনিয়ার রিগ্রেশন

আমি একবার এই মডেলটি তৈরি করে এমন একজনের সাথে কথা বলার সুযোগ পেয়েছি। অনুমানের লঙ্ঘন সম্পর্কে আমি তাকে জিজ্ঞাসা করেছি। তিনি ব্যাখ্যা করেছিলেন যে এটি অবশিষ্টাংশ ইত্যাদির অনুমানগুলি পুরোপুরি লঙ্ঘন করেছে যদিও তিনি তার যত্ন নেন নি।

প্রস্থান...

এই 0/1 লিনিয়ার রিগ্রেশন মডেল (যখন স্ট্যান্ডার্ড করা যায় / সহজেই পড়ার স্কোরকে মাপানো হয় এবং উপযুক্ত কাট অফ দিয়ে জোড় করা হয়) ডেটা হোল্ডআউট নমুনার বিরুদ্ধে পরিষ্কারভাবে বৈধতা দেওয়া হয় এবং দেউলিয়ার পক্ষে ভাল / খারাপ বৈষম্যমূলক হিসাবে সম্পাদিত হয়।

মডেলটি বছরের পর বছর ধরে ২ য় ক্রেডিট স্কোর হিসাবে bankণ-রক্ষার জন্য এফিকোর ঝুঁকিপূর্ণ স্কোর (যা +০+ দিনের ক্রেডিট ডিনিকোয়েন্সি পূর্বাভাসের জন্য ডিজাইন করা হয়েছিল) পাশাপাশি রক্ষার জন্য ব্যবহৃত হয়েছিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.