লিনিয়ার রিগ্রেশন কীভাবে সাধারণ বিতরণ ব্যবহার করে?


26

লিনিয়ার রিগ্রেশন-এ, প্রতিটি পূর্বাভাসকৃত মান সম্ভাব্য মানের একটি সাধারণ বিতরণ থেকে নেওয়া হয়েছে বলে ধরে নেওয়া হয়। নিচে দেখ.

তবে কেন প্রতিটি পূর্বাভাসিত মানটি একটি সাধারণ বিতরণ থেকে এসেছে বলে ধরে নেওয়া হয়? লিনিয়ার রিগ্রেশন কীভাবে এই অনুমানটি ব্যবহার করে? যদি সম্ভব মানগুলি সাধারণত বিতরণ না করা হয় তবে কী হবে?

এখানে চিত্র বর্ণনা লিখুন


2
কেবল ত্রুটিগুলি একটি সাধারণ বিতরণ অনুসরণ করে (যা বোঝায় যে এক্স প্রদত্ত ওয়াইয়ের শর্তসাপেক্ষ সম্ভাবনাটিও স্বাভাবিক)। কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য সম্পর্কিত কারণে সম্ভবত এটি প্রচলিত। তবে আপনি যেকোন প্রতিসাম্যিক সম্ভাব্যতা বিতরণের সাথে স্বাভাবিককে প্রতিস্থাপন করতে পারেন এবং কমপক্ষে স্কোয়ারগুলির মাধ্যমে সহগের একই অনুমান পেতে পারেন। তবে কী কী পৃথক হবে তা অবশিষ্টাংশের স্ট্যান্ডার্ড ত্রুটি, ফিটের ধার্মিকতা এবং আপনি যেভাবে অনুমানগুলি যাচাই করেছেন।
কিয়ান

4
সাধারণ অনুমানগুলি মূলত অনুমানের মধ্যে আসে - হাইপোথিসিস টেস্টিং, সিআই, পিআই। আপনি যদি বিভিন্ন ধারনা করেন তবে সেগুলি কমপক্ষে ছোট নমুনায় আলাদা হবে।
গ্লেন_বি -রাইনস্টেট মনিকা

7
ঘটনাক্রমে, সাধারণ লিনিয়ার রিগ্রেশন জন্য আপনার চিত্রটি স্বাভাবিক বক্ররেখা আঁকানো উচিত, তির্যক নয়।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


29

লিনিয়ার রিগ্রেশন নিজেই সাধারণ (গাউসিয়ান) অনুমানের প্রয়োজন হয় না, অনুমানকারীকে এই ধরনের অনুমানের কোনও প্রয়োজন ছাড়াই (লিনিয়ার সর্বনিম্ন স্কোয়ারগুলি দ্বারা) গণনা করা যায়, এবং এটি ছাড়া নিখুঁত ধারণা তৈরি করে।

তবে তারপরে, পরিসংখ্যানবিদ হিসাবে আমরা এই পদ্ধতির কয়েকটি বৈশিষ্ট্য বুঝতে চাই, এমন প্রশ্নের উত্তর যেমন: ন্যূনতম বর্গাকার অনুমানকারী কোনও অর্থে অনুকূল ? বা আমরা কিছু বিকল্প অনুমানক দিয়ে আরও ভাল করতে পারি? তারপরে, ত্রুটির শর্তগুলির স্বাভাবিক বন্টনের অধীনে, আমরা দেখাতে পারি যে এই অনুমানকারীরা প্রকৃতপক্ষে অনুকূল, উদাহরণস্বরূপ তারা "ন্যূনতম বৈকল্পিকতাহীন" বা সর্বাধিক সম্ভাবনা। সাধারণ অনুমান ছাড়া এ জাতীয় কোনও বিষয় প্রমাণিত হতে পারে না।

এছাড়াও, আমরা যদি আত্মবিশ্বাসের অন্তর বা হাইপোথিসিস পরীক্ষার (এবং এর বৈশিষ্ট্যগুলির বিশ্লেষণ) তৈরি করতে চাই, তবে আমরা সাধারণ অনুমানটি ব্যবহার করি। তবে, আমরা এর পরিবর্তে বুটস্ট্র্যাপিংয়ের মতো অন্য কোনও উপায়ে আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করতে পারি। তারপরে, আমরা সাধারণ অনুমানটি ব্যবহার করি না, তবে হায়, এগুলি ছাড়া, আমরা কি হতে পারি যে আমাদের কমপক্ষে স্কোয়ারগুলির চেয়ে কিছু অন্যান্য অনুমানক ব্যবহার করা উচিত, সম্ভবত কিছু শক্তিশালী অনুমানকারী?

অনুশীলনে, অবশ্যই, সাধারণ বিতরণ সর্বাধিক একটি সুবিধাজনক কল্পকাহিনী। সুতরাং, সত্যই গুরুত্বপূর্ণ প্রশ্নটি হল, উপরে বর্ণিত ফলাফলগুলি ব্যবহার করার জন্য দাবি করার জন্য আমাদের কতটা স্বাভাবিকের প্রয়োজন? এটাই অনেক জটিল প্রশ্ন! Optimality ফলাফল নয় শক্তসমর্থ , তাই এমনকি স্বাভাবিক থেকে একটি খুব ছোট বিচ্যুতি optimality হত্যা করতে পারে। এটি শক্তিশালী পদ্ধতির পক্ষে একটি যুক্তি। এই প্রশ্নে আর একটি পরীক্ষার জন্য, আমার উত্তরটি দেখুন কেন আমাদের ত্রুটিগুলি স্বাভাবিক ত্রুটির পরিবর্তে ব্যবহার করা উচিত?

আরেকটি প্রাসঙ্গিক প্রশ্ন হ'ল কেন রেগ্রেশন রেখাটি অনুমানের উদ্দেশ্যে অবশিষ্টাংশের স্বাভাবিকতা "সবেমাত্র গুরুত্বপূর্ণ"?

 EDIT

এই উত্তরটি একটি বৃহত্তর আলোচনার-মন্তব্যে পরিচালিত করে, যা আবার আমার নতুন প্রশ্নের দিকে পরিচালিত করে: লিনিয়ার প্রতিরোধ: কোনও সাধারণ বিতরণ ওএলএস এবং এমএলইয়ের পরিচয় দেয়? যা অবশেষে (তিন) উত্তর পেয়েছে, উদাহরণ দেয় যেখানে অ-স্বাভাবিক বিতরণগুলি সর্বনিম্ন বর্গ অনুমানকারীকে নিয়ে যায়।


স্বল্প স্কোয়ার ত্রুটিটি একটি সাধারণ অনুমানের সমতুল্য।
নীল জি

4
এরকম কোনও দ্বন্দ্ব নেই। উদাহরণস্বরূপ, গাউস-মার্কভ উপপাদ্য বলেছেন যে লিনিয়ার ন্যূনতম স্কোয়ারগুলি কোনও রৈখিক অনুমানের (বিদ্যমান বৈকল্পিকতা ব্যতীত) সমস্ত রৈখিক অনুমানকারীদের মধ্যে অনুকূল (কমপক্ষে বৈকল্পিক অর্থে) is সর্বনিম্ন স্কোয়ারগুলি এমন একটি সংখ্যাগত প্রক্রিয়া যা কোনও সম্ভাব্য মডেলের চেয়ে পৃথকভাবে সংজ্ঞায়িত করা যায়! সম্ভাব্য মডেলটি তখন একটি পরিসংখ্যানগত দৃষ্টিকোণ থেকে এই পদ্ধতিটি বিশ্লেষণ করতে ব্যবহৃত হয়।
কেজেটিল বি হালওয়ারসেন

2
@ নীলজি অবশ্যই স্বাভাবিকের জন্য এমএলই কমপক্ষে স্কোয়ার তবে এর দ্বারা বোঝা যায় না যে সর্বনিম্ন স্কোয়ারগুলি অবশ্যই স্বাভাবিকতার অনুমানের প্রয়োজন হয়। অন্যদিকে, স্বাভাবিকতা থেকে বড় বিচ্যুতিগুলি সর্বনিম্ন স্কোয়ারগুলিকে দুর্বল পছন্দ করে তুলতে পারে (যখন সমস্ত লিনিয়ার অনুমানক খারাপ)।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ নীলজি আমি যা বলেছি তা কোনওভাবেই এলএস এবং স্বাভাবিকতার সমার্থকতা বোঝায় না, তবে আপনি স্পষ্টতই বলছেন যে এগুলি সমতুল্য, তাই আমি সত্যিই ভাবি না যে আমাদের দুটি বক্তব্য টোটোলজিকের কাছাকাছিও রয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ নীল আপনি কি বলতে পারেন যে আপনার বক্তব্যটি আমি যা বলেছিলাম তা বাস্তবে কীভাবে কার্যকর হয়? আমি সত্যিই এটি দেখতে না।
গ্লেন_বি -রিনস্টেট মনিকা

3

এই আলোচনাটি যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় তবে Y হয় না? এই প্রশ্নটি ভালভাবে সম্বোধন করেছে।

সংক্ষেপে, একটি রিগ্রেশন সমস্যার জন্য, আমরা কেবল ধরে নিই যে প্রতিক্রিয়াটি এক্স এর মানকে নিয়ে শর্তযুক্ত। এটি স্বাধীন বা প্রতিক্রিয়াশীল ভেরিয়েবলগুলি স্বাধীন হওয়ার দরকার নেই।


1
  1. তবে কেন প্রতিটি পূর্বাভাসিত মানটি একটি সাধারণ বিতরণ থেকে এসেছে বলে ধরে নেওয়া হয়?

এর কোনও গভীর কারণ নেই এবং আপনি বিতরণযোগ্য অনুমানগুলি পরিবর্তন করতে, জিএলএমগুলিতে চলে যেতে বা শক্তিশালী প্রতিরোধে মুক্ত হতে পারেন। এলএম (সাধারণ বিতরণ) জনপ্রিয় কারণ এটি গণনা করা সহজ, বেশ স্থিতিশীল এবং অবশিষ্টাংশগুলি প্রায়শই কম বেশি স্বাভাবিক ব্যবহার করা হয়।

  1. লিনিয়ার রিগ্রেশন কীভাবে এই অনুমানটি ব্যবহার করে?

যে কোনও রিগ্রেশন হিসাবে, লিনিয়ার মডেল (= সাধারণ ত্রুটির সাথে রিগ্রেশন) প্রদত্ত বন্টন অনুমানের সম্ভাবনাটিকে অনুকূল করে এমন পরামিতিগুলি অনুসন্ধান করে। লিনিয়ার মডেলের সম্ভাবনার সুস্পষ্ট গণনার উদাহরণের জন্য এখানে দেখুন । আপনি যদি লিনিয়ার মডেলের লগ সম্ভাবনা গ্রহণ করেন তবে এটি স্কোয়ারের যোগফলের সাথে সমানুপাতিক হতে দেখা যায় এবং এর অপ্টিমাইজেশনটি বেশ সুবিধাজনকভাবে গণনা করা যায়।

  1. যদি সম্ভব মানগুলি সাধারণত বিতরণ না করা হয় তবে কী হবে?

আপনি যদি বিভিন্ন ডিস্ট্রিবিউশনের সাথে কোনও মডেল ফিট করতে চান তবে পরবর্তী পাঠ্যপুস্তক পদক্ষেপগুলিকে সাধারণীকরণ করা হবে রৈখিক মডেল (জিএলএম), যা বিভিন্ন ডিস্ট্রিবিউশন, বা সাধারণ লিনিয়ার মডেলগুলি সরবরাহ করে যা এখনও স্বাভাবিক, তবে স্বাচ্ছন্দ্য স্বাচ্ছন্দ্য দেয়। অন্যান্য অনেক বিকল্প সম্ভব। আপনি যদি কেবলমাত্র বহিরাগতদের প্রভাব হ্রাস করতে চান তবে উদাহরণস্বরূপ আপনি শক্তিশালী প্রতিরোধকে বিবেচনা করতে পারেন।


0

প্রশ্নটি আবার পর্যালোচনা করার পরে, আমি মনে করি যে আপনি যদি রিগ্রেশন প্যারামিটার সম্পর্কে কোনও প্রকার অনুমান করতে না চান তবে সাধারণ বিতরণটি ব্যবহার করার কোনও কারণ নেই। এবং আপনি লিনিয়ার রিগ্রেশন প্রয়োগ করতে পারেন এবং শব্দ শব্দটির বিতরণ উপেক্ষা করতে পারেন।


2
আমার কাছে খুব একটা বোঝায় না।
স্মলচেস

0

(এক্সআমি,Yআমি)Y=βএক্স+ +βΣআমি(Yআমি-Σআমিβএক্সআমি-)2ηআমি=Yআমি-(βএক্সআমি+ +)βββββ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.