আপনি যখন অনুমানকারী ভেরিয়েবলগুলি করতে পারেন তবে বিভিন্ন নমুনা আকারের সাথে গ্রুপ গড়ের ভিত্তিতে আপনি কী করতে পারেন?


14

একটি শাস্ত্রীয় তথ্য বিশ্লেষণ সমস্যা বিবেচনা করুন যেখানে আপনি একটি ফলাফল আছে Yi এবং কিভাবে এটা ভবিষ্যতবক্তা একটি নম্বর সঙ্গে সম্পর্কযুক্ত Xi1,...,Xip । এখানে মূল ধরণের প্রয়োগের বিষয়টি মনে রাখবেন

  1. Yi কিছু গ্রুপ পর্যায়ের ফলাফল যেমন শহরে অপরাধের হারi

  2. ভবিষ্যদ্বাণীকারীরা গ্রুপের স্তরের বৈশিষ্ট্যগুলি যেমন শহর এর ডেমোগ্রাফিক বৈশিষ্ট্য i

প্রাথমিক লক্ষ্যটি একটি রিগ্রেশন মডেল ফিট করা (সম্ভবত এলোমেলো প্রভাব সহ তবে এটি এখনই ভুলে যান):

E(Yi|Xi)=β0+β1Xi1+...+βpXip

ভবিষ্যদ্বাণীকারীদের মধ্যে একটি (বা আরও) যখন প্রতিটি ইউনিটের জন্য আলাদা আলাদা নমুনা মাপের সমীক্ষার ফলাফল হয় তখন কি কিছু প্রযুক্তিগত সমস্যা দেখা দেয়? উদাহরণ স্বরূপ, ধরুন Xi1 শহরের জন্য একটি সারসংক্ষেপ স্কোর হল i যে শহর থেকে ব্যক্তি একটি নমুনা থেকে গড় প্রতিক্রিয়া i কিন্তু নমুনা মাপ এই গড় উপর ভিত্তি করে দুর্দান্তভাবে বিভিন্ন আছেন:

CitySample size120210033004553

যেহেতু ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি একরকম অর্থ নয়, কিছুটা অর্থে, প্রতিটি শহরের জন্য, আমি আশঙ্কা করি যে এই ভেরিয়েবলগুলিকে একটি রিগ্রেশন মডেল হিসাবে কন্ডিশনিং করার ফলে তারা সমস্ত "সমানভাবে তৈরি" হলেও কিছু বিভ্রান্তিমূলক ধারণা তৈরি করতে পারে।

এই ধরণের সমস্যার কোনও নাম আছে? যদি তা হয় তবে কীভাবে এটি পরিচালনা করতে হবে তা নিয়ে গবেষণা আছে?

আমার ধারণাটি এটিকে ত্রুটিযুক্ত পরিমাপক ভবিষ্যদ্বাণী হিসাবে পরিবর্তনশীল হিসাবে বিবেচনা করা এবং এই লাইনগুলি বরাবর কিছু করা কিন্তু পরিমাপের ত্রুটিগুলিতে ভিন্নতা আছে, সুতরাং এটি খুব জটিল হবে। আমি এটি ভুল পদ্ধতিতে ভাবতে পারি বা এটি এটিকে আরও জটিল করে তুলতে পারি তবে এখানে যে কোনও আলোচনা সহায়ক হতে পারে।


8
একে বলা হয় "হেটেরোসেসটেস্টিক ত্রুটি-ইন-ভেরিয়েবল" সমস্যা। (এই বাক্যাংশটি গুগল অনুসন্ধানের জন্য একটি ভাল লক্ষ্য)) সম্প্রতি (২০০)), ডেলাগল এবং মিস্টার একটি জাসার নিবন্ধে একটি ননপ্যারামেট্রিক কার্নেল ঘনত্বের অনুমানের প্রস্তাব করেছিলেন । কিছু প্যারাম্যাট্রিক পদ্ধতি (মুহুর্ত এবং এমএলইয়ের পদ্ধতি) সম্পর্কে একটি বিমূর্ততা কিছু অতিরিক্ত পদ্ধতির পরামর্শ দেয়: বিজ্ঞান / দ্য ডটকম / সায়েন্স / পার্টিকাল / পিআইআই / এস 1572312709000045 । (আমি গবেষণা কিভাবে আপনি আপনার নির্দিষ্ট ডেটা সেটটি হ্যান্ডেল করতে সম্পর্কে একটি প্রামাণিক জবাব দিতে না পরিচিত যথেষ্ট নই।)
whuber

1
উভয় মন্তব্যের জন্য @ হুইবার +1 আমি মনে করি যে "ত্রুটি-ইন-ভেরিয়েবলগুলি" হ'ল আমি যে কীওয়ার্ডটি সন্ধান করছি তা ছিল। আমি যদি স্বীকার করতে পারি তার নীচে যদি কোনও দৃ answer় উত্তর না দেয় তবে আমি সাহিত্যে সন্ধান করব এবং উত্তর হিসাবে যা কিছু শেষ করব তা পোস্ট করতে ফিরে আসব।
ম্যাক্রো

উত্তর:


2

"সমীকরণ ত্রুটিযুক্ত একটি ভিন্ন ভিন্ন কাঠামোগত ত্রুটি-ইন-ভেরিয়েবল মডেল" কাগজটি লেখকের পৃষ্ঠায় ডাউনলোড করা যেতে পারে:

http://www.ime.usp.br/~patriota/curriculo-eng.html#Published_papers

অসামঞ্জস্যপূর্ণ অনুমানকারী, অবিশ্বাস্য হাইপোথিসিস পরীক্ষা এবং আত্মবিশ্বাসের ব্যবধানগুলি এড়াতে মূলত আপনাকে অবশ্যই উভয় ভেরিয়েবলের পরিবর্তনশীলতার বিষয়টি বিবেচনা করতে হবে।


0

এটির সাথে মোকাবিলা করার একটি উপায় মনে করা পৃথক প্রতিক্রিয়ার জন্য প্রতিটি শহরে একই বৈচিত্র্য with 2 সহ বিতরণ রয়েছে । তারপর প্রতিটি শহরের গড় পরিমাপ এক্স আমি predictor জন্য ভ্যারিয়েন্স হবে σ 2 / এন আমি যেখানে, এন আমি শহরের জন্য গড় ব্যক্তির সংখ্যা আমি । হিটারোস্কেস্টাস্টিটির সাথে ডিল করার সহজ উপায়। রিগ্রেশন সমস্যার এই ফর্মটির জন্য আমি কোনও বিশেষ নাম জানি না।σ2Xiσ2/ninii


এটি যুক্তিসঙ্গত বলে মনে হচ্ছে যদিও আমি পরিমাপের ত্রুটি মোটেও মডেল করা এড়াতে চাইছিলাম। যদি আমি সেই দিকে না চলে যাই তবে আপনি কোন ত্রুটিযুক্ত পরিমাপক এর প্রভাব অনুমান করার জন্য কী ব্যবহার করবেন? আমি সিমেক্স নামে একটি পদ্ধতি ব্যবহার করেছি তবে এটি অস্বাভাবিক বলে মনে হচ্ছে এবং অন্য বিকল্প আছে কিনা তা নিয়ে আমি ভাবছি।
ম্যাক্রো

@ ম্যাক্রো অনুমান করার জন্য একটি বৈকল্পিক ফাংশন সহ মডেলিংয়ের মডেলিংয়ের জন্য নির্দিষ্ট সফ্টওয়্যারগুলির সাথে আমি পরিচিত নই।
মাইকেল আর চেরনিক

3
ম্যাক্রো, হোমোসেসেস্টেস্টিক ত্রুটি-ইন-ভেরিয়েবল রিগ্রেশন এর থাম্বের নিয়ম হিসাবে, ডিভিতে ত্রুটির তুলনায় আইভিতে ত্রুটিগুলি যদি ছোট হয় তবে আপনি প্রাক্তনটিকে নিরাপদে উপেক্ষা করতে পারেন এবং সাধারণ রিগ্রেশন অবলম্বন করতে পারেন। এটি আপনাকে সমস্যার ত্রুটিযুক্ত করার একটি দ্রুত এবং সহজ উপায় দেয়।
whuber

1
@ শুভ, ধন্যবাদ - এটি দরকারী। দেখে মনে হচ্ছে যে থাম্বের সেই নিয়মটি যদি বোঝায় তবে "ডিভিতে ত্রুটির পরিবর্তনের তুলনায় আইভিতে সবচেয়ে বড় ত্রুটি বিচ্যুতি যদি ছোট হয় তবে আপনি নিরাপদে সমস্যাটিকে উপেক্ষা করতে পারবেন" থাম্বের একটি যুক্তিসঙ্গত নিয়ম যা এমন একটি শর্ত যা আমি যে ডেটাতে দেখছি তাতে সন্তুষ্ট হতে পারে।
ম্যাক্রো

1
σ211/n(.05,1)Yi
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.