কোয়ান্টাইল রিগ্রেশন কখন ওএলএসের চেয়ে খারাপ হয়?


22

কিছু অনন্য পরিস্থিতি বাদে যেখানে আমাদের অবশ্যই শর্তাধীন মধ্যস্থ সম্পর্কের বিষয়টি বুঝতে হবে, কোয়ান্টাইল রিগ্রেশন নিয়ে কোনও গবেষকের ওএলএস বাছাই করা পরিস্থিতি কী?

আমি "লেজের সম্পর্কগুলি বোঝার কোনও ব্যবহার না হলে" এর উত্তরটি চাই না, কারণ আমরা কেবল ওএলএস বিকল্প হিসাবে মিডিয়ান রিগ্রেশনকে ব্যবহার করতে পারি।


4
আমি মনে করি বেশিরভাগ গবেষক ওএলএস এবং কোয়ান্টাইল রিগ্রেশন উভয়ই উপভোগ করবেন; পদ্ধতির মধ্যে পার্থক্যগুলি আপনি কী মডেল করার চেষ্টা করছেন তার উপর আলোকপাত করবে। ওএলএসের প্রতি শ্রদ্ধার সাথে আপনি যদি স্বাভাবিক অনুমানের মধ্যে টস করেন তবে বেশিরভাগ পরিসংখ্যান প্যাকেজগুলিতে উপলভ্য প্রচুর পরিমাণে নথিভুক্ত এবং পুরো পরীক্ষার পদ্ধতি পাবেন।
জোনাথন লিসিক

উত্তর:


18

আপনি যদি গড়ের প্রতি আগ্রহী হন তবে ওএলএস ব্যবহার করুন, যদি মিডিয়েন থাকে তবে কোয়ান্টাইল ব্যবহার করুন।

একটি বড় পার্থক্য হ'ল গড়টি বহিরাগতদের এবং অন্যান্য চরম ডেটা দ্বারা বেশি প্রভাবিত হয়। কখনও কখনও, আপনি কি চান। একটি উদাহরণ হ'ল যদি আপনার নির্ভরশীল পরিবর্তনশীল কোনও পাড়ার সামাজিক রাজধানী হয়। প্রচুর সামাজিক মূলধন সহ একক ব্যক্তির উপস্থিতি পুরো পাড়ার জন্য খুব গুরুত্বপূর্ণ হতে পারে।


6
আমাকে আপনার প্রথম বাক্যটি চ্যালেঞ্জ করুন। উভয় OLS ঔজ্জ্বল্যের প্রেক্ষাপটে এবং সমাংশক রিগ্রেশন (কিউ) আনুমানিক হিসাব করা হয় একটি ডাটা উৎপাদিত প্রক্রিয়ার জন্য Y = এক্স β + + ε । ত্রুটি বন্টন ভারী মুদ্রার উলটা পিঠ আছে, তাহলে β প্রশ্ন আর অধিক কার্যকরী হয় β হে এল এস । তথাপি যা শর্তাধীন বিতরণ মুহূর্ত পি ( Y | এক্স ) আমরা আগ্রহী, আমরা একটি ব্যবহার করা উচিত নয় β হে এল এস এবং β প্রশ্ন আরβY=এক্সβ+ +εβ^প্রশ্নঃআরβ^হেএলএসপি(Y|এক্স)β^হেএলএসβ^প্রশ্নঃআরযে আরও দক্ষ।
রিচার্ড হার্ডি

@RichardHardy এর এই প্রতিক্রিয়ার সমালোচনা উপর অনুসরণ মধ্যমা শুধুমাত্র এক quantiles যে শ্রদ্ধেয় হয়। এই হ্যান্ডম্যান পেপারটি এমন একটি পদ্ধতির পরিচয় দিয়েছিল যা তিনি অ্যাডিটিভ কোয়ান্টাইল রিগ্রেশনকে বুস্টিং বলেছিলেন যা পুরো পরিমাণের পরিমাণের অন্বেষণ করে, বিদ্যুত্ স্মার্ট মিটার ডেটাতে অনিশ্চয়তার পূর্বাভাস অ্যাডিটিভ কোয়ানটাইল রিগ্রেশন ( যেমনeexplore.ieee.org/docament/7423794 ) বুস্টিং দ্বারা
মাইক হান্টার

15

প্রশ্নের ভিত্তিতে কোনও বিভ্রান্তি রয়েছে বলে মনে হচ্ছে। দ্বিতীয় অনুচ্ছেদে বলা হয়েছে, "আমরা কেবল ওএলএস বিকল্প হিসাবে মিডিয়ান রিগ্রেশন ব্যবহার করতে পারি"। নোট করুন যে এক্স-এর শর্তসাপেক্ষ মিডিয়াকে পুনরায় চাপিয়ে দেওয়া হল (এক ধরণের) কোয়ান্টাইল রিগ্রেশন।

অন্তর্নিহিত ডেটা উত্পাদন প্রক্রিয়াতে ত্রুটিটি যদি সাধারণত বিতরণ করা হয় (যা অবশিষ্টাংশগুলি স্বাভাবিক কিনা তা যাচাই করে মূল্যায়ন করা যেতে পারে), তবে শর্তসাপেক্ষ মানে কন্ডিশনাল মিডিয়ানকে সমান করে। তদুপরি, আপনার আগ্রহী কোনও কোয়ান্টাইল (উদাহরণস্বরূপ, 95 তম পার্সেন্টাইল বা 37 তম শতাংশ), স্ট্যান্ডার্ড ওএলএস পদ্ধতিতে এক্স মাত্রায় প্রদত্ত পয়েন্টের জন্য নির্ধারিত হতে পারে। কোয়ান্টাইল রিগ্রেশনের মূল আবেদনটি হ'ল এটি ওএলএসের চেয়ে বেশি শক্তিশালী। নেতিবাচক দিকটি হ'ল যদি সমস্ত অনুমানগুলি মেটানো হয় তবে এটি কম দক্ষ হবে (এটি হ'ল একই শক্তি অর্জনের জন্য আপনার আরও বৃহত্তর নমুনার আকারের প্রয়োজন হবে / আপনার অনুমানগুলি কম সুনির্দিষ্ট হবে)।


12

উভয় OLS ঔজ্জ্বল্যের প্রেক্ষাপটে এবং সমাংশক রিগ্রেশন (কিউ) সহগ ভেক্টর আনুমানিক হিসাব জন্য প্রাক্কলন কৌশল আছে রৈখিক রিগ্রেশনের মডেল Y = এক্স β + + ε (জন্য QR ক্ষেত্রে Koenker (1978), পৃ। 33, দ্বিতীয় অনুচ্ছেদ দেখুন)।β

Y=এক্সβ+ +ε

β^প্রশ্নঃআরβ^হেএলএসβ^হেএলএসপিওয়াই(Y|এক্স)β^হেএলএসβ^প্রশ্নঃআর

β^হেএলএসβ^প্রশ্নঃআরβ^হেএলএসβ^প্রশ্নঃআর

তথ্যসূত্র:

  • কোয়েঙ্কার, রজার এবং গিলবার্ট বাসেট জুনিয়র "রিগ্রেশন কোয়ান্টাইলস" " ইকোনোমেট্রিক: একনোমেট্রিক সোসাইটির জার্নাল (1978): 33-50।

3

পিটার ফ্লমের একটি দুর্দান্ত এবং সংক্ষিপ্ত উত্তর ছিল, আমি কেবল এটি প্রসারিত করতে চাই। প্রশ্নের সবচেয়ে গুরুত্বপূর্ণ অংশটি হল "কীভাবে খারাপ" সংজ্ঞা দেওয়া যায়।

আরও খারাপ সংজ্ঞা দেওয়ার জন্য, আমাদের কিছু মেট্রিক থাকতে হবে এবং ফিটিংগুলিকে ক্ষতির ফাংশনগুলি কতটা খারাপ বা খারাপ বলা হয় তা গণনা করার জন্য ফাংশনটি দরকার।

আমাদের ক্ষতির কার্যকারিতার বিভিন্ন সংজ্ঞা থাকতে পারে এবং প্রতিটি সংজ্ঞায় কোনও সঠিক বা ভুল নেই, তবে আলাদা সংজ্ঞা বিভিন্ন প্রয়োজন পূরণ করে। দুটি সুপরিচিত ক্ষতি ফাংশন হ'ল স্কোয়ার ক্ষতি এবং পরম মান হ্রাস।

এলগুলিকুই(Y,Y^)=Σআমি(Yআমি-Y^আমি)2
এলএকটিগুলি(Y,Y^)=Σআমি|Yআমি-Y^আমি|

যদি আমরা সাফল্যের পরিমাপ হিসাবে স্কোয়ারস ক্ষতি ব্যবহার করি তবে কোয়ান্টাইল রিগ্রেশন ওএলএসের চেয়ে খারাপ হবে। অন্যদিকে, আমরা যদি নিরঙ্কুশ মান হ্রাস ব্যবহার করি তবে কোয়ান্টাইল রিগ্রেশন আরও ভাল হবে।

কোনটি পিটার ফলমের উত্তর:

আপনি যদি গড়ের প্রতি আগ্রহী হন তবে ওএলএস ব্যবহার করুন, যদি মিডিয়েন থাকে তবে কোয়ান্টাইল ব্যবহার করুন।


আমি মনে করি যে আপনার উদাহরণটি বিভ্রান্তিকর হতে পারে কারণ এটি ইন-স্যাম্পল ফিট (যেটি ইতিমধ্যে আমাদের নমুনাটি নিখুঁতভাবে জেনে গেছে) এটির জন্য নতুন পর্যবেক্ষণের (যখন লক্ষ্যটি পূর্বাভাস দেওয়া হয়) বা প্যারামিটার ভেক্টরের অনুমানের ক্ষতির পরিবর্তে ক্ষতি হওয়ার চেয়ে (যেটি আগ্রহের বিষয় নয়) যখন লক্ষ্যটি ব্যাখ্যা হয়)। আরও তথ্যের জন্য পিটার ফ্লমের উত্তর এবং আমার উত্তরের অধীনে মন্তব্য করতে পারেন দেখুন।
রিচার্ড হার্ডি

3

ওয়াই2π

আপনি যদি গড়টি অনুমান করতে চান তবে আপনি কোয়ান্টাইল রিগ্রেশন থেকে তা পেতে পারেন না।

আপনি যদি ন্যূনতম অনুমানের সাথে গড় এবং কোয়ান্টাইলগুলি অনুমান করতে চান (তবে কোয়ান্টাইল রিগ্রেশনের চেয়ে বেশি অনুমান) তবে আরও দক্ষতা থাকলে সেমিপাটারমেট্রিক অর্ডিনাল রিগ্রেশন ব্যবহার করুন। এটি আপনাকে ছাড়িয়ে যাওয়ার সম্ভাবনাও দেয়। একটি বিস্তৃত কেস স্টাডি আমার আরএমএস কোর্সের নোটগুলিতে রয়েছে যেখানে এটি একটি ডেটাসেটে দেখানো হয় যে বেশ কয়েকটি পরামিতিগুলির (গড় পরিমাণ এবং গড়) গড় গড় গড় নিখুঁত অনুমানের ত্রুটিটি সাধারণ রিগ্রেশন দ্বারা অর্জিত হয়। তবে কেবল গড় অনুমান করার জন্য, ওএলএস সর্বোত্তম এবং কেবল কোয়ান্টাইলগুলি অনুমান করার জন্য, কোয়ান্টাইল রিগ্রেশন সেরা ছিল।

ওয়াই

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.