জরিপের প্রতিক্রিয়াগুলিতে সিস্টেমেটিক ত্রুটির জন্য অ্যাকাউন্টে অনুদান


9

আমার একটি বড় সমীক্ষা রয়েছে যাতে অন্যান্য বিষয়গুলির মধ্যেও তাদের মায়ের শিক্ষার স্তরটি সম্পর্কে শিক্ষার্থীদের জিজ্ঞাসা করা হয়েছিল। কিছু এটি এড়িয়ে গেছে, এবং কেউ ভুল উত্তর দিয়েছে। আমি এটি জানি, কারণ সেখানে প্রাথমিক উত্তরদাতাদের মায়ের একটি উপ-নমুনা পরে সাক্ষাত্কার নেওয়া হয়েছিল এবং একই প্রশ্ন জিজ্ঞাসা করেছিল। (আমি নিশ্চিত মায়েদের প্রতিক্রিয়াগুলির সাথে যুক্ত কিছুটা, অল্প পরিমাণে ত্রুটি রয়েছে))

আমার চ্যালেঞ্জ, কীভাবে এই দ্বিতীয়, আরও নির্ভরযোগ্য তথ্যের উত্সটি সর্বোত্তমভাবে গ্রহণ করা যায় তা স্থির করা। আমি যদি কেবলমাত্র সম্পূর্ণ মামলার উপর নির্ভর করতে পারি তবে তার থেকে আমি খুব বেশি বুদ্ধিমানভাবে ডেপুটি ডেটা গুনতে ব্যবহার করতে পারি। তবে "আমার মা প্রাথমিক বিদ্যালয়টি কখনই শেষ করেননি" বলে প্রতিক্রিয়া জানাতে পারে এমন বাচ্চাদের 3/4 শিশু যদি তাদের মায়ের উত্তরটির বিরোধিতা করে, তবে মনে হয় সেখানে অনিশ্চয়তা কাটানোর জন্য একাধিক ডেটাসেট তৈরি করার জন্য আমার অনুশাসনটি ব্যবহার করা উচিত। [যুক্ত: আমি একটি কথা বলতে 3/4 বলেছি, তবে এখন আমি যে ডেটাটি পরীক্ষা করেছি তা পাশাপাশি আমি আপনাকে বলতে পারি যে 40% এর কাছাকাছি অপ্রয়োজনীয়]

আমি ব্যক্তিগতভাবে মিক্সের শিক্ষাকে একটি মিশ্র মডেল হিসাবে ভবিষ্যদ্বাণী হিসাবে ব্যবহার করব, তবে অন্য পরিস্থিতিতে সম্পর্কে যদি কিছু বলার থাকে তবে আমি সেগুলি সম্পর্কেও শিখতে চাই।

আমি ব্রডস্ট্রোক বা স্পেসিফিকেশনে পরামর্শ পেতে পছন্দ করব। ধন্যবাদ!

আপডেট : আমি আপাতত প্রশ্নটি সমাধান না করে ছেড়ে দিচ্ছি, যদিও আমি উইল এবং কনজুগেট_প্রিয়রের প্রতিক্রিয়ার প্রশংসা করি, তবে আমি আরও সুনির্দিষ্ট এবং প্রযুক্তিগত প্রতিক্রিয়ার আশা রাখছি।

নীচের স্ক্যাটারপ্ল্লট আপনাকে 10,000 টি ক্ষেত্রে উভয় বিদ্যমান যেখানে দুটি ভেরিয়েবল সম্পর্কিত তা সম্পর্কে একটি ধারণা দেবে। 100 টিরও বেশি স্কুলে তারা বাসা বেঁধেছে। তারা 0.78 এ শিখিয়েছেন, শিক্ষার্থীর উত্তর- অর্থ: 5.12 এসডি = 2.05, মায়ের উত্তর, গড় = 5.02, এসডি = 1.92 শিক্ষার্থীর উত্তর প্রায় 15% ক্ষেত্রে অনুপস্থিত।

এখানে চিত্র বর্ণনা লিখুন


কৌতূহলবশত, "আমার মা প্রাথমিক বিদ্যালয়টি কখনই শেষ করেননি" এই প্রশ্নের প্রশ্নে প্রথম প্রতিক্রিয়া বিকল্প ছিল? যদি তা হয় তবে আমি সেই পরীক্ষার্থীদের জন্য আপনার পরীক্ষার বাকি ফলাফলের নির্ভুলতা সম্পর্কে উদ্বিগ্ন।
মিশেল

"সে স্কুলে কতদূর গিয়েছিল?" - 1) অষ্টম শ্রেণি বা তার চেয়ে কম
মাইকেল বিশপ

আপনার কাছে সম্ভবত পরীক্ষার্থীদের একটি উপসেট রয়েছে যারা প্রতিটি প্রশ্নের প্রথম প্রতিক্রিয়া বিকল্পটিকে টিক দিয়েছিলেন। আপনি এটি পরীক্ষা করতে পারেন?
মিশেল

এই প্লটটি খুব অন্তর্দৃষ্টিযুক্ত। এটি মোটামুটি প্রতিসাম্যযুক্ত বলে মনে হচ্ছে যা আপনি প্রত্যাশা করেন না যদি বাস্তবে একগুচ্ছ বাচ্চারা প্রথম উত্তরটি টিক করে দেয়। যদি এটি হয় তবে কেসগুলি নীচের সারি বরাবর গুচ্ছ হতে থাকে। অবশ্যই 'সন্ধান করা' প্রতিসাম্যটি এটির নিশ্চয়তা দেয় না তবে এটি একটি দুর্দান্ত শুরু। মা এবং সন্তানের প্রতিক্রিয়ার মধ্যে আপনি যে দৃ corre় সম্পর্কটি লক্ষ্য করেন তাও এর সাথে সামঞ্জস্যপূর্ণ।
উইল

1
আহা। আমি দেখি. তারপরে আমি বিদ্যমান তথ্যগুলি গণনা
conjugateprior

উত্তর:


2

প্রথমে লক্ষ্য করার বিষয়টি হল আপনার ভেরিয়েবলগুলি হ'ল: "শিক্ষার্থী মায়ের শিক্ষার বিষয়ে যা বলেছিল" এবং "শিক্ষার্থীর মা তার শিক্ষার্থীর মায়ের শিক্ষার বিষয়ে যা বলেছিলেন"। তাদের যথাক্রমে এস এবং এম কল করুন এবং মায়ের শিক্ষার অরক্ষিত সত্য স্তরের টি হিসাবে লেবেল করুন।

এস এবং এম উভয়ই অনুপস্থিত মান পেয়েছে এবং এম এবং এসকে একটি অনুবর্তনকারী মডেলটিতে রাখার সাথে তবে পরবর্তী বিশ্লেষণে কেবল সেগুলির মধ্যে একটি ব্যবহার করে কোনও ভুল নেই (নীচে পর্যবেক্ষণের মডুলো)। অন্য উপায় প্রায় সর্বদা অবিশ্বাস্য হবে।

এটি অন্য তিনটি প্রশ্নের থেকে পৃথক:

  1. অনুপস্থিত মানটির অর্থ কি শিক্ষার্থীরা তাদের মায়েদের সম্পর্কে বেশি কিছু জানতে বা জানতে চায় না?
  2. টি সম্পর্কে জানতে কীভাবে এস এবং এম ব্যবহার করবেন?
  3. একাধিক অনুশাসনকে কাজ করার অনুমতি দেওয়ার জন্য আপনার কি সঠিক অনুপস্থিতি রয়েছে?

অজ্ঞতা এবং নিখোঁজতা

আপনি টি তে আগ্রহী হতে পারেন, তবে আপনার এমনটি হওয়ার দরকার নেই: শিক্ষাগত অর্জনের উপলব্ধি (এস এবং সম্ভবত এম এর মাধ্যমে) বা শিক্ষার্থীর জ্ঞানের অভাব টি এর চেয়ে বেশি কার্যকরী আকর্ষণীয় হতে পারে। অনুমিতকরণ প্রথমটির জন্য বুদ্ধিমান রুট হতে পারে তবে দ্বিতীয়টির জন্যও হতে পারে। আপনি সিদ্ধান্ত নিতে হবে।

টি সম্পর্কে শিখছি

বলুন যে আপনি আসলে টি তে আগ্রহী are সোনার মানক পরিমাপের অভাবে (যেহেতু আপনি কখনও কখনও এমকে সন্দেহ করেন) আপনি কীভাবে অ-স্বেচ্ছায় এস এবং এমকে টি সম্পর্কে জানতে সম্মিলন করতে পারেন তা জানা কঠিন If অন্যদিকে, আপনি যদি ছিলেন এমটি উপলভ্য হলে এমকে সঠিক হিসাবে বিবেচনা করতে ইচ্ছুক হন, তারপরে আপনি এমকে একটি শ্রেণিবদ্ধ মডেলটিতে এম এর পূর্বাভাস দিতে ব্যবহার করতে পারেন যা শিক্ষার্থীদের অন্যান্য তথ্য রয়েছে এবং তারপরে চূড়ান্ত বিশ্লেষণে এস এর পরিবর্তে এম ব্যবহার করতে পারে। এখানে উদ্বেগটি হ'ল আপনি প্রশিক্ষণপ্রাপ্ত ক্ষেত্রে বাছাই পক্ষপাতিত্ব সম্পর্কে, যা তৃতীয় সমস্যার দিকে নিয়ে যায়:

Missingness

একাধিক অনুবর্তন কাজ করতে পারে কিনা তা নির্ভর করে ডেটাটি এলোমেলোভাবে (এমসিএআর) পুরোপুরি অনুপস্থিত বা এলোমেলোভাবে (এমএআর) অনুপস্থিত কিনা on এস কি এলোমেলোভাবে (এমএআর) অনুপস্থিত? সম্ভবত তা নয়, যেহেতু শিক্ষার্থীরা তাদের মায়ের শিক্ষার অভাব সম্পর্কে উত্তর দিতে এবং লজ্জা পেতে লজ্জা পেতে পারে। তারপরেই মানটি নির্ধারণ করে যে এটি অনুপস্থিত হবে এবং একাধিক অনুবর্তন এখানে সহায়তা করতে পারে না। অন্যদিকে, যদি কিছু কম শিক্ষা covaries হয় জিজ্ঞাসা এবং আংশিকভাবে জরিপ উত্তর আয়ের কিছু সূচকটি the, তারপর মার্চ অধিক যুক্তিসঙ্গত এবং একাধিক নিন্দা হতে পারে একটি খপ্পর পেতে কিছু আছে। এম এলোমেলোভাবে অনুপস্থিত? একই বিবেচনা প্রযোজ্য।

অবশেষে, আপনি টিতে আকর্ষণীয় হন এবং শ্রেণিবিন্যাসের পদ্ধতি অবলম্বন করলেও আপনি এখনও সেই মডেলটি ফিট করতে চান।


1

আপনি যদি ধরে নিতে চলেছেন যে "দ্বন্দ্বের হার" পুরো নমুনার জন্য একই, যেমনটি সেই গ্রাহকের জন্য যাঁর মায়েদের পোল দেওয়া হয়েছিল, তবে অবশ্যই সাবস্কুলটি এলোমেলোভাবে আঁকতে হবে। আপনার বিবরণে আপনি বলবেন না, তাই আমি এই বিষয়টি উত্থাপন করেছি কারণ আমি মনে করি এটি কীভাবে বা শিক্ষার্থীদের সম্পূর্ণ নমুনা সম্পর্কে সিদ্ধান্তগুলি আঁকতে সাবমায়াল থেকে এই তথ্যটি ব্যবহার করতে পারে তার জন্য তার গুরুত্বপূর্ণ জরুরী বিষয় রয়েছে।

আমার কাছে মনে হয় যে এই বৈপরীত্য বিষয়টির তিনটি দিক রয়েছে।

1 হ'ল দ্বন্দ্বের হার। সত্যিই কি এই ঘটনাটি ঘটে যে 3/4 / এর শিক্ষার্থীরা ভুল অনুমান করেছিল?

2 হ'ল অন্যায়ের ডিগ্রি - এটি বলা একটি বিষয় যা সত্যই আপনার পড়াশুনা শেষ হওয়ার পরে আপনার মা কখনই প্রাথমিক বিদ্যালয় শেষ করেননি কিন্তু সেখানেই থেমেছিলেন এবং অন্যথায় বলতে পারেন যে তিনি পিএইচডি করার পরে প্রাথমিক বিদ্যালয়টি কখনই সম্পন্ন করেননি say

3 সেই নমুনার অনুপাত যা আপনি ক্রস-চেক করতে পারেন। যদি আপনি এই সিদ্ধান্তগুলি 20 এর সাবসাম্পল এ আঁকেন তবে আমি বাজি ধরব অনুমানগুলি মোটামুটি অস্থির এবং সম্ভবত খুব বেশি দামের নয়।

আমার কাছে মনে হচ্ছে আপনি যা করবেন তা আপনার উত্তর এবং এই প্রশ্নের প্রথম দিকে উত্থাপিত প্রশ্নের উপর নির্ভর করবে। উদাহরণস্বরূপ, যদি 1 টি বেশ উচ্চতর হয় এবং 3 টি বেশ উচ্চ হয় তবে আমি কেবল সাবসামেলটি ব্যবহার করতে পারি এবং এটি দিয়ে শেষ হয়ে যেতে পারি। যদি 1 টি উচ্চ হয় তবে 2 কম হয় তবে সমস্যাটি এত খারাপ বলে মনে হচ্ছে না এবং এটি আবার বিরক্ত করার মতো নয়।

ত্রুটিটি এলোমেলো বা নিয়মতান্ত্রিক কিনা তা সম্ভবত জানাও মূল্যবান। যদি শিক্ষার্থীরা তাদের মায়ের পড়াশোনাটি নিয়মিতভাবে অনুমানের দিকে ঝুঁকে থাকে তবে তারা কখনও কখনও সম্পূর্ণ ভুল হয়ে যায় তার চেয়ে এটি আরও বেশি সমস্যাযুক্ত।

আমি কয়েকটি কাগজপত্রের জন্য কিছু অনুমান করেছি এবং দেখে মনে হচ্ছে ফলস্বরূপ আমি সবসময় নিজের জন্য আরও ঝামেলা সৃষ্টি করি। আমার অঞ্চলে পর্যালোচকগণ, কমপক্ষে, পদ্ধতিটিতে প্রায়শই ভাল হ্যান্ডেল রাখেন না এবং এটির ব্যবহার সম্পর্কে সন্দেহজনক। আমি মনে করি কখনও কখনও প্রকাশনার দৃষ্টিকোণ থেকে সমস্যাটি স্বীকার করে এগিয়ে যাওয়া আরও ভাল। তবে এক্ষেত্রে আপনি সত্যিকার অর্থে 'অনুপস্থিত ডেটা বোঝাচ্ছেন না' তবে ভেরিয়েবলের জন্য এক প্রকার পূর্বাভাসযুক্ত ত্রুটি বৈচিত্রটি প্রবর্তন করছেন। এটি একটি খুব আকর্ষণীয় প্রশ্ন এবং সমস্ত উদ্বেগকে একপাশে রেখে আমিও নিশ্চিত নই যে আমি যদি সিদ্ধান্ত নিই যে এটিই সর্বোত্তম কর্মের কৌশল ছিল তবে আমি কীভাবে এই বিষয়ে যাব I'm


1
থ্যাঙ্কস উইল, আমি আমার মূল পোস্টে কিছু বিষয় পরিষ্কার করে দিয়েছি। উপ-নমুনা এলোমেলো। আমি একটি টুপি তৈরি করতে টুপি থেকে 3/4 স্ট্যাটটি টানলাম। সত্য স্ট্যাট কম। আমি প্রায় 10,000 মামলা ক্রস-চেক করতে পারি। আমি নিশ্চিত ত্রুটিটি নিখুঁতভাবে এলোমেলো নয়।
মাইকেল বিশপ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.