ড্যানিয়েল উইলকস (২০১১) কেন প্রধান উপাদানগুলির প্রতিরোধ "পক্ষপাতদুষ্ট হবে" বলে?


13

ইন বায়ুমণ্ডলীয় বিজ্ঞান মধ্যে পরিসংখ্যানগত পদ্ধতি , ড্যানিয়েল Wilks নোট একাধিক রৈখিক রিগ্রেশনের সমস্যা হতে পারে যে, যদি ভবিষ্যতবক্তা মধ্যে খুব শক্তিশালী intercorrelations (3 য় সংস্করণ, পৃষ্ঠা 559-560) আছেন:

একটি প্যাথলজি যা একাধিক লিনিয়ার রিগ্রেশনে সংঘটিত হতে পারে তা হ'ল দৃ corre় পারস্পরিক সম্পর্কযুক্ত প্রেডিক্টর ভেরিয়েবলগুলির একটি সেট অস্থির রিগ্রেশন সম্পর্কের গণনার ফলে ঘটতে পারে।

(...)

তারপরে তিনি মূল উপাদানগুলির প্রতিরোধের পরিচয় দেন:

এই সমস্যার প্রতিকারের জন্য একটি পদ্ধতি হল ভবিষ্যদ্বাণীকারীদের তাদের প্রধান উপাদানগুলিতে রূপান্তর করা, যার মধ্যে পারস্পরিক সম্পর্কগুলি শূন্য।

এ পর্যন্ত সব ঠিকই. তবে এরপরে, তিনি এমন কিছু বক্তব্য দেন যা তিনি ব্যাখ্যা করেন না (বা কমপক্ষে আমার বোঝার জন্য পর্যাপ্ত বিবরণে নয়):

যদি সমস্ত মূল উপাদানগুলি মূল উপাদানগুলির রিগ্রেশনটিতে ধরে রাখা হয় তবে সম্পূর্ণ প্রেডিক্টর সেট অনুসারে প্রচলিত সর্বনিম্ন-স্কোয়ারের চেয়ে কিছুই লাভ হয় না।

(..) এবং:

মূল ভবিষ্যদ্বাণীকারীদের ক্ষেত্রে মূল-উপাদান উপাদানগুলির রিগ্রেশনকে পুনরায় প্রকাশ করা সম্ভব হয়, তবে ফলাফলটি কেবলমাত্র এক বা কয়েকটি প্রধান উপাদান ভবিষ্যদ্বাণী ব্যবহার করা হলেও সাধারণভাবে সমস্ত মূল ভবিষ্যদ্বাণী ভেরিয়েবলকে জড়িত করে। এই পুনর্গঠিত রিগ্রেশন পক্ষপাতমূলক হবে, যদিও প্রায়শই বৈকল্পিকতা অনেক কম থাকে, ফলস্বরূপ সামগ্রিকভাবে একটি ছোট এমএসই হয়।

আমি এই দুটি বিষয় বুঝতে পারি না।

অবশ্যই, যদি সমস্ত মূল উপাদান ধরে রাখা হয়, আমরা ভবিষ্যদ্বাণীকারীদের যখন তাদের আসল জায়গায় ব্যবহার করছিলাম তখন আমরা একই তথ্য ব্যবহার করি। তবে পারস্পরিক সম্পর্কের সমস্যাটি মূল উপাদান স্থানে কাজ করে মুছে ফেলা হয়। আমাদের এখনও অতিরিক্ত উপসর্গ থাকতে পারে, তবে এটাই কি একমাত্র সমস্যা? কেন কিছুই লাভ হয় না?

দ্বিতীয়ত, এমনকি যদি আমরা প্রধান উপাদানগুলি ছাঁটাই করি (সম্ভবত শব্দ হ্রাস এবং / বা অতিরিক্ত চাপ প্রতিরোধের জন্য), কেন এবং কীভাবে এই পক্ষপাতদু পুনর্গঠিত প্রতিরোধের দিকে পরিচালিত করে? কীভাবে পক্ষপাতদুষ্ট?


বইয়ের উত্স: ড্যানিয়েল এস উইলকস, বায়ুমণ্ডলীয় বিজ্ঞানের পরিসংখ্যানগত পদ্ধতি, তৃতীয় সংস্করণ, ২০১১. আন্তর্জাতিক জিওফিজিক্স সিরিজের খণ্ড 100, একাডেমিক প্রেস।


4
(+1) দ্বিতীয় উদ্ধৃতিতে, "পক্ষপাতদুষ্ট হবে" যৌক্তিকভাবে অনুসরণ করে না: আরও ভাল একটি মৃদু বিবৃতি যেমন "পক্ষপাতদুষ্ট হওয়ার সম্ভাবনা।" আমি সন্দেহ করি এর পিছনে যুক্তি "প্যারামিটার অনুমানের মধ্যে লিনিয়ার সম্পর্ক আরোপ করায়, সেই অনুমানগুলি ওএলএসের অনুমানের থেকে পৃথক হতে পারে; এবং ওএলএসের অনুমানটি পক্ষপাতদুষ্ট, এর অর্থ, পিসিআর অনুমান পক্ষপাতমূলক হবে।" স্বজ্ঞাতভাবে এটি একটি ভাল ধর্মতাত্ত্বিক তবে এটি মোটেই সঠিক নয়।
whuber

এটি কি বলা যেতে পারে যে "পিসিআর পক্ষপাতদুষ্ট হবে" যদি (ক) ডেটা পয়েন্টগুলি নির্বাচিত সংখ্যক পিসির তুলনায় লিনিয়ার নিম্ন বা সমমানের বহুগুণে অধিষ্ঠিত না হয় এবং (খ) ডেটা পয়েন্টগুলি পুরোপুরি অসম্পর্কিত না হয়? আর কীভাবে?
সোরেন হাভেলুন্ড ওয়েলিং

উত্তর:


15

সমস্ত পিসি ব্যবহার করা হয় তখন কী হয়?

যদি সমস্ত পিসি ব্যবহার করা হয়, তবে ফলাফল প্রাপ্ত রিগ্রেশন সহগগুলি ওএলএস রিগ্রেশন সহ প্রাপ্তদের সাথে সমান হবে এবং সুতরাং এই পদ্ধতিটিকে আরও "প্রিন্ট উপাদান উপাদান রিগ্রেশন" বলা উচিত নয়। এটি স্ট্যান্ডার্ড রিগ্রেশন, কেবল একটি চক্রাকার উপায়ে সঞ্চালিত।

আপনি জিজ্ঞাসা করছেন যে পিসিএর পরে ভবিষ্যদ্বাণীগুলি অরথোগোনাল হয়ে যাওয়ার পরে কীভাবে কীভাবে অর্জন করা সম্ভব? শয়তান পিসিএ স্পেস থেকে আসল স্থানটিতে রিগ্রেশন সহগের ব্যাক-ট্রান্সফর্মেশনে লুকিয়ে থাকে। আপনার যা জানা দরকার তা হ'ল অনুমানিত রিগ্রেশন সহগগুলির বিবর্তন বিপরীতভাবে ভবিষ্যদ্বাণীকারীদের কোভারিয়েন্স ম্যাট্রিক্সের উপর নির্ভর করে। পিসিএ-রুপান্তরিত ভবিষ্যদ্বাণীগুলি, আসুন তাদের , তির্যক কোভেরিয়েন্স ম্যাট্রিক্স রাখুন (কারণ তারা অসম্পর্কিত)। সুতরাং জন্য সমস্ত রিগ্রেশন সহগজেড এক্স এক্স iZZএছাড়াও নিরবিচ্ছিন্ন; উচ্চ-ভেরিয়েন্স পিসিগুলির সাথে সম্পর্কিতগুলির মধ্যে কম বৈকল্পিক থাকে (অর্থাত্ নির্ভরযোগ্যভাবে অনুমান করা হয়) এবং লো-ভেরিয়েন্স পিসিগুলির সাথে সম্পর্কিতগুলির মধ্যে উচ্চতর বৈকল্পিক থাকে (অর্থাত অবিশ্বাস্যভাবে অনুমান করা হয়)। এই গুণাগুণগুলি যখন মূল ভবিষ্যদ্বাণীকারী -তে ফিরে আসে , তখন ভবিষ্যদ্বাণীকারীদের প্রতিটি অবিশ্বাস্য অনুমানের কিছু অংশ পাবে এবং সুতরাং সমস্ত সহগের অবিশ্বস্ত হয়ে উঠতে পারেXXi

সুতরাং কিছুই লাভ হয় না।

যখন মাত্র কয়েকটি পিসি ব্যবহার করা হয় তখন কী ঘটে?

যখন সব পিসিতে পিসিআর অপরিবর্তিত রাখা হয়, তারপর ফলে সমাধান সাধারণভাবে মান সাধারণ লিস্ট স্কোয়ার সমাধান সমান হবে । এটি একটি স্ট্যান্ডার্ড ফলাফল যে ওএলএস সমাধানটি পক্ষপাতহীন : গাউস-মার্কভের উপপাদ্যটি দেখুন । "নিরপেক্ষ" এর অর্থ হ'ল গড়পড়তা সঠিক , যদিও এটি খুব শোরগোল হতে পারে। যেহেতু পিসিআর সমাধানটি এর থেকে পৃথক, তাই এটি পক্ষপাতদুষ্ট হবে , যার অর্থ এটি গড়ে ভুল হবে। তবে এটি প্রায়শই ঘটে থাকে যে এটি যথেষ্ট কম গোলমাল, সামগ্রিক আরও সঠিক ভবিষ্যদ্বাণীগুলির দিকে পরিচালিত করে। β হেএলএস ββ^PCRβ^হেএলএসβ^

এটি পক্ষপাত-বৈকল্পিক বাণিজ্য বন্ধের একটি উদাহরণ । দেখুন কেন সংকোচন কাজ করে? আরও কিছু সাধারণ আলোচনার জন্য।

মন্তব্য সালে @whuber উল্লেখ করেছিলেন যে, পিসিআর সমাধান নেই আছে OLS ঔজ্জ্বল্যের প্রেক্ষাপটে এক থেকে পৃথক তাই নয় আছে পক্ষপাতমূলক হবে। প্রকৃতপক্ষে, যদি নির্ভরশীল পরিবর্তনশীল পিসিআর মডেলের অন্তর্ভুক্ত নয় এমন সমস্ত নিম্ন-বৈকল্পিক পিসিগুলির সাথে (জনসংখ্যায়, নমুনায় নয়) সাথে সম্পর্কযুক্ত হয় তবে এই পিসিগুলি বাদ দেওয়া পক্ষপাতদুষ্টতা প্রভাবিত করবে না। তবে, এটি বাস্তবে হওয়ার সম্ভাবনা নেই: পিসিএ কে বিবেচনায় না নিয়েই পরিচালিত হয় যাতে এটি যুক্তিযুক্ত যে সমস্ত পিসিগুলির সাথে কিছুটা সম্পর্কযুক্ত হতে পারে reasony yYYY

উচ্চ-ভেরিয়েন্স পিসি ব্যবহার কেন মোটেই ভাল ধারণা?

এটি প্রশ্নের অংশ ছিল না, তবে আপনি আরও পড়ার জন্য নিম্নলিখিত থ্রেডে আগ্রহী হতে পারেন: শীর্ষস্থানীয় প্রধান উপাদানগুলি নির্ভরশীল পরিবর্তনশীল (বা আরও ভাল পূর্বাভাসের দিকেও যেতে পারে) এর উপর ভবিষ্যদ্বাণীী শক্তি কীভাবে ধরে রাখতে পারে?


আপনার শেষ অনুচ্ছেদে মন্তব্য শর্তসাপেক্ষ বিতরণের লজ্জা দেয় প্রদর্শিত এর মান (regressors দিকে) ডেটাসেটে। ওয়াইওয়াইওয়াই
whuber

@ শুভ, সত্যই আমি সেই অনুচ্ছেদটি আবার লিখেছি, আশা করি এটি এখন আরও বোধগম্য। ধন্যবাদ।
অ্যামিবা বলেছেন মনিকা

হুম, ঠিক আছে। পক্ষপাতদুষ্টভাবে মূলত কিছু পয়েন্ট অন্যদের তুলনায় অনেক সমান, যা আমরা যদি শব্দ এবং আউটলিয়ারের প্রভাব হ্রাস করতে চাই তবে আমরা যা চাই (যা আমি এখনও নিশ্চিত নই যে পিসিএই সেরা হাতিয়ার কিনা)।
অঙ্কুর

@ জারিট আপনি লিখেছেন যেন পক্ষপাত ওজন করার সমান, তবে এগুলি পৃথক বিষয় things এই প্রসঙ্গে বায়াস সহগের অনুমানের প্রত্যাশিত মান এবং তাদের প্রকৃত মানগুলির মধ্যে যে কোনও পার্থক্য বোঝায়।
হোবার

1
মডেলটি মনে করে যে প্রতিক্রিয়াগুলি এলোমেলো পরিবর্তনশীল। এটি আনুমানিক সহগ তৈরি করে - কোনও পদ্ধতি ব্যবহার করে - এলোমেলো ভেরিয়েবলগুলিও। তাদের প্রত্যাশিত মানগুলি যেকোন র্যান্ডম ভেরিয়েবল হিসাবে সংজ্ঞায়িত করা হয়। সংজ্ঞা অনুসারে, পক্ষপাত হ'ল প্রত্যাশিত মান এবং সত্য মানের মধ্যে পার্থক্য। ওএলএস সহগের অনুমানের শূন্যের পক্ষপাতিত্ব রয়েছে। অন্য কিছু পদ্ধতির পক্ষপাতটি এখনও শূন্য হতে পারে। উদ্ধৃতিটির যুক্তিটি হ'ল একটি প্রক্রিয়া যা ওএলএসের মতো লিনিয়ার, তবে সহগের মধ্যে সম্পর্ক চাপিয়ে দেয়, অগত্যা পক্ষপাতদুষ্ট হবে। এই উপসংহারটি অনেক ক্ষেত্রে সত্য, তবে সমস্ত নয়।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.