কিছু লোক কেন তাদের কাঁচা ডেটাতে রিগ্রেশন-জাতীয় মডেল অনুমানগুলি পরীক্ষা করে এবং অন্যান্য লোকেরা তাদের অবশিষ্টাংশে পরীক্ষা করে?


12

আমি পরীক্ষামূলক মনোবিজ্ঞানের পিএইচডি শিক্ষার্থী এবং আমার ডেটা কীভাবে বিশ্লেষণ করতে হয় তা সম্পর্কে আমার দক্ষতা এবং জ্ঞানের উন্নতি করার জন্য আমি কঠোর চেষ্টা করি।

মনোবিজ্ঞানে আমার 5 ম বছর অবধি, আমি ভেবেছিলাম যে রিগ্রেশন-জাতীয় মডেলগুলি (যেমন, আনোভা) নিম্নলিখিত জিনিসগুলি ধরে নিয়েছে:

  • তথ্য স্বাভাবিকতা
  • ডেটা এবং এর জন্য বৈকল্পিক একজাতীয়তা

আমার স্নাতক কোর্সগুলি আমাকে বিশ্বাস করতে পরিচালিত করে যে অনুমানগুলি ডেটা সম্পর্কে ছিল। তবে আমার 5 তম বছরে, আমার কিছু প্রশিক্ষক এই সত্যটি গুরুত্ব দিয়েছিলেন যে অনুমানগুলি ত্রুটি সম্পর্কে রয়েছে (অবশিষ্টাংশ দ্বারা অনুমান করা হয়েছে) এবং কাঁচা তথ্য নয়।

সম্প্রতি আমি আমার কয়েকজন সহকর্মীর সাথে অনুমানের প্রশ্নে কথা বলছিলাম যারা স্বীকৃতও হয়েছিল যে তারা কেবল বিশ্ববিদ্যালয়ের শেষ বছরগুলিতে অবশিষ্টাংশের উপর অনুমানগুলি যাচাইয়ের গুরুত্ব আবিষ্কার করেছিল।

যদি আমি ভালভাবে বুঝতে পারি তবে রিগ্রেশন-জাতীয় মডেলগুলি ত্রুটির উপর অনুমান করে। সুতরাং অবশিষ্টাংশের উপর অনুমানগুলি যাচাই করে বোঝা যায়। যদি তা হয় তবে কেন কিছু লোক কাঁচা ডেটা ধরে অনুমানগুলি পরীক্ষা করে? এটা কি কারণ এই জাতীয় পরীক্ষার পদ্ধতি অনুমানীয় যাচাই করে আমরা কী পেতে পারি?

আমি আমার সহকর্মী এবং আমি অপেক্ষা আরও সঠিক জ্ঞান আছে এমন কিছু লোকের সাথে এই ইস্যুটি সম্পর্কে একটি বিতর্ক করতে চাইছি your আপনার উত্তরগুলির জন্য আমি আগাম আপনাকে ধন্যবাদ জানাই।

উত্তর:


13

মূলত, আপনি সঠিক পথে আছেন। নির্ভরশীল ভেরিয়েবলের স্বাভাবিকতা = অবশিষ্টাংশের স্বাভাবিকতা সম্পর্কে আপনি স্বাভাবিকতার দিকটি সম্পর্কে একটি আলোচনা পাবেন ?

ক্লাসিক রৈখিক মডেলের কিছু অনুমানগুলি ত্রুটি সম্পর্কে প্রকৃতপক্ষে (অবশিষ্টাংশগুলি তাদের বাস্তব হিসাবে ব্যবহার করে):

  • তারা কি অসামঞ্জস্যিত? (ওএলএস-অনুমানকারীদের অনুমান এবং অনুকূলতার জন্য প্রাসঙ্গিক)
  • তাদের কি সমান বৈচিত্র আছে? (ওএলএস-অনুমানকারীদের অনুমান এবং অনুকূলতার জন্য প্রাসঙ্গিক)
  • এগুলি কি প্রায় 0 কেন্দ্রিক? (নিরপেক্ষ অনুমানক এবং পূর্বাভাস পাওয়ার মূল ধারণা)
  • যদি নমুনা খুব ছোট হয়: এগুলি কি স্বাভাবিক বা কমপক্ষে প্রতিসৃতভাবে বিতরণ করা হয়? (অনুমানের জন্য প্রাসঙ্গিক)

অন্যান্য শর্তগুলি "কাঁচা ডেটা" সম্পর্কে:

  • রেজিস্ট্রারগুলিতে কি কোনও স্থূল আউটিলার নেই? (উচ্চ উত্তোলনের পর্যবেক্ষণগুলি পুরো মডেলটিকে ধ্বংস করতে পারে)
  • নিখুঁত মাল্টিকোলাইনারিটি নেই? (কমপক্ষে কয়েকটি সফ্টওয়্যার প্যাকেজে গণ্য সমস্যা সৃষ্টি করবে)

এখন, আপনার আন্ডারগ্র্যাড শিক্ষকও সঠিক হতে পারে:

  • হতে পারে আপনি এক-নমুনা টি-পরীক্ষার মতো অদম্য পরীক্ষার দিকে মনোনিবেশ করছিলেন। সেখানে অনুমানগুলি কাঁচা তথ্য সম্পর্কে।
  • যদি টি বেশ কম হয় এবং প্রতিক্রিয়ার পরিবর্তনশীলটি সবকিছু স্বাভাবিক ব্যতীত দেখায়, তবে সম্ভবত সম্ভবত অবশিষ্টাংশগুলির ক্ষেত্রেও এটি সত্য।R2
  • কাঁচা তথ্যের ভিত্তিতে আপনি কীভাবে সমকামিতা ইত্যাদি পরীক্ষা করবেন? আপনি তাকে বা তাকে ভুল বুঝে থাকতে পারেন।

ঠিক আছে আপনার উত্তর এবং খুব দরকারী যে লিঙ্কটির জন্য আপনাকে অনেক ধন্যবাদ। আমার এবং আমার কয়েকজন সহকর্মী সম্প্রতি পর্যন্ত বিশ্বাস করেছিলেন যে কাঁচা তথ্যের সমান বৈকল্পিক হওয়া উচিত। যেমনটি আপনি বলেছিলেন আমরা সম্ভবত আমাদের কোর্সে কিছু মিস করেছি। কিছু বইতে আমরা নিম্নলিখিতটি পড়তে পারি:
সাইকোকওয়াক

"বেশিরভাগ সাধারণ পরিসংখ্যানগত পদ্ধতি দুটি বিষয় অনুমান করে যা এই বিষয়ের সাথে প্রাসঙ্গিক: (ক) একটি অনুমান যে ভেরিয়েবলগুলি (বা তাদের ত্রুটির শর্তাদি, আরও প্রযুক্তিগতভাবে) সাধারণত বিতরণ করা হয়, এবং (খ) বৈকল্পিকতার সমতা অনুমান (সমকামিতা বা সমজাতীয়তা) বৈকল্পিক), এর অর্থ হ'ল ভেরিয়েবলের বৈকল্পিক কিছু অন্যান্য ভেরিয়েবলের পর্যবেক্ষিত পরিসরের উপরে স্থির থাকে। " এর অর্থ কি এই যে যখন কেউ "ভেরিয়েবল" সম্পর্কে কথা বলেন তখন সে বা সে পদ্ধতিগতভাবে "তাদের ত্রুটির শর্তাবলী" সম্পর্কে কথা বলে? যদি তাই হয় তবে আমি এটির সাথে ঠিক আছি তবে স্পষ্টভাবে উল্লেখ না করে এটি সুস্পষ্ট থেকে দূরে (কমপক্ষে আমার পক্ষে)।
সাইকোকওয়াক

অবশেষে, আমি আপনার উত্তর সম্পর্কে একটি শেষ প্রশ্ন আছে। যদি টি-টেস্ট এবং এএনওওএ হ'ল রিগ্রেশনের বিশেষ ঘটনা, অনুমানগুলি কেন এক-নমুনা টি-টেস্টের ডেটা সম্পর্কে? আপনার দরকারী উত্তরের জন্য আবার ধন্যবাদ।
সাইকোকওয়াক

1
আপনার শেষ মন্তব্যের জবাব দিতে: এক-নমুনা টি-পরীক্ষাটি রিগ্রেশনের একটি বিশেষ কেস হিসাবেও দেখা যেতে পারে। মডেলটি কেবল বিরতি (= গড়) এবং ত্রুটি শব্দটি নিয়ে গঠিত, অর্থাত প্রতিক্রিয়া স্থানান্তরিত ত্রুটি। যেহেতু শিফটগুলি কোনও অনুমানের জন্য অপ্রাসঙ্গিক, তাই এটি ডেটা বা অবশিষ্টাংশ সম্পর্কে কথা বলার সমতুল্য।
মাইকেল এম

4

আমি উভয়ই আপনার প্রকৃত নমুনায় আরও অন্তর্নিহিত জনসংখ্যার বিতরণকেই বেশি উল্লেখ না করায় অবশেষ এবং অপরিশোধিত তথ্যগুলির মধ্যে পার্থক্য খুঁজে পেয়েছি। কিছু প্রয়োজনীয়তা "গোষ্ঠীগত অনুমানের মধ্যে" এবং অন্যদের "গ্রুপ অনুমানের মধ্যে" হওয়াই আরও ভাল better

উদাহরণস্বরূপ, ভেরিয়েন্স হোমোনিটিটিটি হ'ল "গ্রুপ-গ্রুপ অনুমান", যেহেতু এটি বলে যে গ্রুপের ভেরিয়েন্সটি সমস্ত গ্রুপের জন্য একই same

স্বাভাবিকতা হ'ল "গ্রুপের মধ্যে" অনুমান যা প্রতিটি গ্রুপের মধ্যে yকে সাধারণত বিতরণ করা দরকার।

নোট করুন যে আপনার পুরো কাঁচা ওয়াইয়ের উপর স্বাভাবিকতা থাকার অর্থ সাধারণত আপনার কোনও প্রভাব নেই - স্ত্রী এবং পুরুষদের মধ্যে পার্থক্য ছাড়াই লিঙ্গ বিতরণ দেখুন। শক্তিশালী লিঙ্গ প্রভাবের কারণে এটি সাধারণত বিতরণ করা হবে না। তবে প্রতিটি লিঙ্গের মধ্যে এটি বেশ ভালভাবে ধারণ করে।


1
আপনার উত্তরের জন্য ধন্যবাদ। প্রশ্নটি দেখার একটি আকর্ষণীয় উপায়। আমি স্বাভাবিকভাবেই এ জাতীয় উপায়ে কখনই ভাবিনি (যেমন, "পুরো কাঁচা ওয়াইয়ের উপর স্বাভাবিকতা থাকার অর্থ [আমাদের] কোনও প্রভাব ফেলবে না")।
সাইকোকওয়াক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.