আনোভা কেন এমনভাবে পড়ানো / ব্যবহার করা হয় যেন লিনিয়ার রিগ্রেশন এর তুলনায় এটি আলাদা গবেষণা পদ্ধতি?


91

আনোভা উপযুক্ত ডামি ভেরিয়েবলগুলির ব্যবহারের সাথে লিনিয়ার রিগ্রেশনের সমতুল্য। আপনি আনোভা বা লিনিয়ার রিগ্রেশন ব্যবহার না করেই সিদ্ধান্তগুলি একই রকম থাকে।

তাদের সমতার আলোকে, লিনিয়ার রিগ্রেশন পরিবর্তে আনোভা ব্যবহার করার কোনও কারণ আছে কি?

দ্রষ্টব্য: আমি লিনিয়ার রিগ্রেশন পরিবর্তে আনোভা ব্যবহারের প্রযুক্তিগত কারণগুলি সম্পর্কে বিশেষত আগ্রহী ।

সম্পাদন করা

একমুখী আনোভা ব্যবহার করে এখানে একটি উদাহরণ। ধরুন, আপনি জানতে চান পুরুষ এবং স্ত্রীলোকের গড় উচ্চতা একই কিনা। আপনার অনুমানের জন্য পরীক্ষা করার জন্য আপনি পুরুষ এবং স্ত্রীলোকের এলোমেলো নমুনা থেকে ডেটা সংগ্রহ করবেন (প্রতিটি 30 বলুন) এবং এএনওওএ বিশ্লেষণ (অর্থাত্, লিঙ্গ এবং ত্রুটির জন্য স্কোয়ারের যোগফল) কার্যকর করবেন কিনা তা সিদ্ধান্ত নিতে whether

আপনি নিম্নলিখিতটির জন্য এটি পরীক্ষার জন্য লিনিয়ার রিগ্রেশন ব্যবহার করতে পারেন:

সংজ্ঞায়িত করুন: যদি উত্তরদাতা পুরুষ হয় এবং অন্যথায় হয়। যেখানে:Gender=10

Height=Intercept+βGender+error
errorN(0,σ2)

তারপরে কিনা আপনার অনুমানের সমতূল্য পরীক্ষা কিনা তা পরীক্ষা করে।β=0


2
যদি আমি ভুল না হয়ে থাকি তবে লিনিয়ার রিগ্রেশন হ'ল গুণাগুণগুলির অনুমান যা X থেকে Y পর্যন্ত একটি ভাল রৈখিক মানচিত্রকে সংজ্ঞায়িত করে AN আপনি কি তাদেরকে একই বলে মনে করেন আমাদের ব্যাখ্যা করতে পারেন?
রবিন গিরার্ড

28
আনোভা লিনিয়ার রিগ্রেশন মডেলগুলির একটি বিশেষ সাবগ্রুপের জন্য "সিনট্যাকটিক চিনি" হিসাবে দেখা যেতে পারে। আনোভা নিয়মিত গবেষকরা ব্যবহার করেন যারা প্রশিক্ষণের মাধ্যমে পরিসংখ্যানবিদ নন। তারা এখন "প্রাতিষ্ঠানিক" এবং আরও সাধারণ প্রতিনিধিত্ব ব্যবহার করে তাদেরকে আবার রূপান্তর করা কঠিন ;-)
সানকুলসু

3
আপনার মন্তব্যকে উজ্জীবিত করেছেন, তবে পরীক্ষামূলকরা আমার চেয়েও বেশি ক্রেজি যা তাদের ধারণা ছিল সিনট্যাকটিক চিনি কিনা! কোন সংস্করণটি আরও স্বজ্ঞাত .... OV : এএনওভা অনুমানের পরীক্ষা: অব্যক্ত বিবর্তনের বর্ণিত পরিবর্তনের অনুপাতটি কি যথেষ্ট বেশি? একটি রিগ্রেশন মডেলের শর্তে টি-টেস্ট : প্রভাব শূন্যের থেকে যথেষ্ট আলাদা? এবং, পরবর্তী সূত্রের সাহায্যে আপনি পরিবর্তনের দিকনির্দেশও পান। এবং, যদি আপনাকে ডেটাটি রূপান্তর করতে হয় তবে আপনি প্যারামিটারের প্রাক্কলনটিকে শারীরিকভাবে অর্থবহ পরিমাণে ব্যাক-ট্রান্সফর্ম করতে পারেন। এসএসের মতো নয়। βββ
f1r3br4nd

উত্তর:


55

একজন অর্থনীতিবিদ হিসাবে, বৈকল্পিক বিশ্লেষণ (এএনওওএ) সাধারণত লিনিয়ার রিগ্রেশন (যেমন আর্থার গোল্ডবার্গারের এ কোর্স ইন ইকোনোমেট্রিক্স ) এর ক্ষেত্রে শেখানো হয় এবং বোঝা যায় । অর্থনীতিবিদ / একনোমেট্রিকগণ সাধারণত এএনওওএকে আগ্রহহীন হিসাবে দেখেন এবং সরাসরি রিগ্রেশন মডেলগুলিতে যেতে পছন্দ করেন। লিনিয়ার (বা এমনকি জেনারালাইজড লিনিয়ার) মডেলগুলির দৃষ্টিকোণ থেকে, আনোভা ব্যাচগুলিতে সহগকে নিয়োগ করে, প্রতিটি ব্যাচ আনোভা পরিভাষায় একটি "পরিবর্তনের উত্সের সাথে" মিলিয়ে।

সাধারণত আপনি আঙ্গো ব্যবহার করে আনোভা থেকে প্রাপ্ত যে অনুলিপিগুলি প্রতিলিপি করতে পারেন তবে সর্বদা ওএলএস রিগ্রেশন নয়। "স্প্লিট-প্লট ডিজাইন" এর মতো শ্রেণিবিন্যাসের ডেটা স্ট্রাকচার বিশ্লেষণের জন্য মাল্টিলেভেল মডেলগুলির প্রয়োজন যেখানে গ্রুপ-ইফেক্টের সাথে গ্রুপ-স্তরীয় ত্রুটির সাথে তুলনা করা হয় এবং গ্রুপ-এফেক্টের সাথে ডেটা-স্তরের ত্রুটির সাথে তুলনা করা হয়। গেলম্যানের কাগজ [১] এই সমস্যাটি সম্পর্কে দুর্দান্ত বিশদে যায় এবং কার্যকরভাবে যুক্তি দেয় যে আনোভা একটি গুরুত্বপূর্ণ পরিসংখ্যান সরঞ্জাম যা এখনও নিজের স্বার্থে শেখানো উচিত।

বিশেষত জেলম্যান যুক্তি দেখিয়েছেন যে আনোভা মাল্টিলেভেল মডেলগুলি বোঝার এবং কাঠামোগত করার একটি উপায়। অতএব আনোভা হতাশার বিকল্প নয় বরং জটিল উচ্চ-মাত্রিক সূচনা সংক্ষিপ্তকরণ এবং অনুসন্ধানের ডেটা বিশ্লেষণের একটি সরঞ্জাম হিসাবে।

গেলম্যান একজন সম্মানিত পরিসংখ্যানবিদ এবং তার দৃষ্টিতে কিছু বিশ্বাসযোগ্যতা দেওয়া উচিত। যাইহোক, প্রায়শই আমি যে অভিজ্ঞতাবাদী কাজ করি তা লিনিয়ার রিগ্রেশন দ্বারা সমানভাবে পরিবেশিত হবে এবং তাই আমি দৃ it়ভাবে এটিকে কিছুটা অর্থহীন হিসাবে দেখার শিবিরে পড়ি। জটিল অধ্যয়ন ডিজাইন (যেমন মনোবিজ্ঞান) সহ কিছু শাখা আনোভা দরকারী বলে মনে করতে পারে।

[1] গেলম্যান, এ। (2005)। বৈকল্পিক বিশ্লেষণ: কেন এটি আগের চেয়ে বেশি গুরুত্বপূর্ণ (আলোচনার সাথে)। পরিসংখ্যানগুলির বার্তা 33, 1-55। ডোই: 10.1214 / 009053604000001048


1
জেলম্যান রেফারেন্সের জন্য ধন্যবাদ। আমি তার কাগজ পড়তে হবে। তবে, আমরা ক্লাসিকাল সর্বাধিক সম্ভাবনা ব্যবহার করে মাল্টিলেভেল মডেলগুলি বিশ্লেষণ করতে পারি না? আমি একমত যে ওএলএস বহু-স্তরের মডেলের জন্য অদক্ষ / অনুপযুক্ত।

3
@ শ্রিকান্ট - মাল্টিলেভাল ডেটা এবং গেলম্যান এই ক্ষেত্রের "রাজা" ডিল করার অনেকগুলি উপায় আছে। তাঁর বক্তব্যটি হ'ল আনোভা জটিল এবং শ্রেণিবিন্যাস সম্পর্কিত তথ্য কাঠামো বা অধ্যয়ন নকশার মূল বৈশিষ্ট্যগুলি ক্যাপচার করার একটি সহজ / স্পষ্ট পদ্ধতি এবং আনোভা মূল ফলাফল উপস্থাপনের একটি সহজ / স্পষ্ট উপায়। এই অর্থে এর ভূমিকা পরিপূরক বা অনুসন্ধানমূলক।
গ্রাহাম কুকসন

1
একটি সুন্দর পরিষ্কার উত্তরের জন্য +1। অনুচ্ছেদ 3 মূলত আমাকে অ্যানোভা কাঠামোর মধ্যে অবিচ্ছিন্ন এবং বিভাগীয় স্বতন্ত্র ভেরিয়েবলগুলির সংমিশ্রণের স্বাচ্ছন্দ্যের সাথে জোর দিয়ে জৈব স্নাতক হিসাবে শেখানো হয়েছিল।
ফ্রেইয়া হ্যারিসন

23

আমি মনে করি গ্রাহামের দ্বিতীয় অনুচ্ছেদটি বিষয়টিটির কেন্দ্রবিন্দুতে পেয়েছে। আমি সন্দেহ করি এটি historicalতিহাসিকের চেয়ে বেশি প্রযুক্তিগত নয়, সম্ভবত " গবেষণা কর্মীদের জন্য পরিসংখ্যানগত পদ্ধতি " এর প্রভাব এবং পরীক্ষামূলক বিশ্লেষণে নন-স্ট্যাটিসটিকানদের জন্য সরঞ্জামটি প্রয়োগ করার পদ্ধতি বা মডেল বিল্ডিংয়ের দিকে তাকাতে না পারার পরিবর্তে প্রয়োগের বিশ্লেষণে সহজতর। এবং সম্পর্কিত সরঞ্জাম পরিসংখ্যানগুলিতে, অ্যাএনওওয়াকে সাধারণত রিগ্রেশনের একটি বিশেষ কেস হিসাবে শেখানো হয়। (আমি মনে করি এটি কেন বায়োস্ট্যাটাস্টিক্স মডেল বিল্ডিংয়ের উপর জোর দেওয়ার পরিবর্তে অগণিত "টেস্টস" সহ অগণিত সংখ্যায় ভরা হয়))


14

আমি বলব যে আপনি যখন সাধারণ লিনিয়ার মডেলটি ব্যবহার করেন তখন আপনার মধ্যে কেউ কেউ রিগ্রেশন শব্দটি ব্যবহার করছেন। আমি রিগ্রেশনকে এমন এক গ্ল্যাম হিসাবে ভাবি যাতে ধারাবাহিক কোভেরিয়েট জড়িত। যখন অবিচ্ছিন্ন কোভেরিয়েটগুলি ডামি ভেরিয়েবলগুলির সাথে একত্রিত করা হয় যা সমবায় বিশ্লেষণ বলা উচিত। যদি কেবল ডামি ভেরিয়েবলগুলি ব্যবহার করা হয় তবে আমরা গ্যার্মের সেই বিশেষ রূপটি বৈকল্পিক বিশ্লেষণ হিসাবে উল্লেখ করি। আমি মনে করি মডেল টার্ম উপাদানগুলিতে এবং ত্রুটির মেয়াদী উপাদানগুলির মধ্যে পরিবর্তনের ক্ষয় ব্যবহার করে কোনও গ্ল্যামের উল্লেখযোগ্য সহগের জন্য পরীক্ষার পদ্ধতি হিসাবে বৈকল্পিক বিশ্লেষণের একটি পৃথক দ্বিতীয় অর্থ রয়েছে।


2
(+1) আমি পুরো আলোচনার মধ্যে অবিলম্বে অস্পষ্ট পরিভাষা "রিগ্রেশন" নোট করেছি।
স্টাফেন লরেন্ট

1
(+1) জিএলএম বিভিন্ন অর্থ ছড়িয়ে দেওয়ার সর্বোত্তম উপায় হতে পারে। এটিও লক্ষ করা উচিত যে আনোভা ইতিহাসের গণনা পদ্ধতিগুলি ব্যবহার করা হয়েছিল যেগুলি ওএলএস এবং আনোভা সম্পর্কিত সম্পর্ককে অস্পষ্ট করেছিল। নামকরণটি historicalতিহাসিক কারণে ন্যায়সঙ্গত হতে পারে।
জাঙ্ক

10

আনোভা শ্রেণিবদ্ধ ব্যাখ্যামূলক ভেরিয়েবল (কারণ) যা 2 টিরও বেশি মান (স্তর) নিয়ে থাকে তার সাথে ব্যবহার করা যেতে পারে এবং একটি মৌলিক পরীক্ষা দেয় যে প্রতি প্রতিক্রিয়া প্রতিটি মানের জন্য একই। এটি সেই স্তরের মধ্যে একাধিক পেয়ারওয়াস টি-টেস্ট বহন করার ক্ষেত্রে রিগ্রেশন সমস্যা এড়িয়ে চলে:

  • একটি নির্দিষ্ট 5% তাত্পর্য স্তরের একাধিক টি-পরীক্ষা, তাদের মধ্যে প্রায় 5% ভুল ফলাফল দেয়।
  • এই পরীক্ষাগুলি একে অপরের থেকে স্বতন্ত্র নয়। এ এর স্তরগুলিকে বি এর সাথে তুলনা করা এ এর ​​সি এর সাথে তুলনা করার সাথে সংযুক্ত, কারণ এ এর ​​ডেটা উভয় পরীক্ষায় ব্যবহৃত হয়।

আপনি যে ফ্যাক্টর স্তরটি পরীক্ষা করতে চান তাতে বিভিন্ন সংমিশ্রণের জন্য বৈসাদৃশ্যগুলি ব্যবহার করা ভাল ।


1
আপনি এই উত্তরটি পরিষ্কার করতে ইচ্ছুক হতে পারেন; লিখিত হিসাবে, আমি 3 টি সমস্যা দেখতে। প্রথম 2 সামান্য নিট-পিক, তবে এটি সম্পাদনা করা উচিত, তৃতীয়টি এই আলোচনার প্রসঙ্গে যথেষ্ট। (1) আনোভা কেবলমাত্র 2 টি গ্রুপের সাথে ব্যবহার করা যেতে পারে (যদিও বেশিরভাগ লোকেরা তখন টি-টেস্ট চালায়)। (২) একাধিক টি-টেস্ট ডাব্লু / প্রকৃত পার্থক্য নেই যেখানে এই বিপরীতে 5% এর জন্য তাত্পর্যপূর্ণভাবে টাইপ 1 ত্রুটি উত্পন্ন করবে ; কত ত্রুটি ঘটবে তা নির্ভর করে কত নাল সত্য on α=.05
গাং

7
(3) আপনার উত্তরটি বোঝায় যে একাধিক তুলনার সমস্যাটি ওএলএসের প্রতিরোধের ক্ষেত্রে প্রযোজ্য, যা সঠিকভাবে পরিচালিত হওয়ার পরে তা হয় না। কোনও রিগ্রেশন প্রসঙ্গে একটি ফ্যাক্টর পরীক্ষা করার সঠিক উপায় হ'ল নেস্টেড মডেলটিকে সমস্ত ফ্যাক্টর ডমিগুলি অন্তর্ভুক্ত করে পুরো মডেলের বিপরীতে বাদ দেওয়া সমস্ত মডেল পরীক্ষা করে। এই পরীক্ষাটি একটি আনোভা পরিচালিত হওয়ার মতো। এটি সত্য যে আপনার স্বতন্ত্র ডামি ভেরিয়েবলগুলির পরীক্ষা করা উচিত নয় (যা আমি সন্দেহ করি যা আপনি এখানে বর্ণনা করার চেষ্টা করছেন)।
গাং

3

আনোভা আপনি পরীক্ষা করছেন যে জনসংখ্যার মধ্যে উল্লেখযোগ্য পার্থক্য রয়েছে কিনা ধরে নেওয়া মানে আপনি দুটি জনসংখ্যার চেয়ে বেশি তুলনা করছেন মানে, তবে আপনি একটি এফ পরীক্ষা ব্যবহার করতে যাচ্ছেন।

রিগ্রেশন বিশ্লেষণে আপনি স্বাধীন ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি মডেল তৈরি করেন। চার স্তরের সাথে যদি আপনার একটি স্বতন্ত্র ভেরিয়েবল থাকে তবে আপনি তিনটি ডামি ভেরিয়েবল ব্যবহার করতে পারেন এবং একটি রিগ্রেশন মডেল চালাতে পারেন। রিগ্রেশন মডেলটির তাত্পর্যপূর্ণ পরীক্ষার জন্য যে এফ-টেস্ট ব্যবহার করা হয় তা জনসংখ্যার পার্থক্যের জন্য পরীক্ষার সময় আপনি যে এফ পেয়েছিলেন তা হ'ল। আপনি যদি স্টেপওয়াস রিগ্রেশন চালনা করেন তবে কিছু ডামি ভেরিয়েবলগুলি মডেল থেকে বাদ পড়তে পারে এবং আপনি এএনওওয়া পরীক্ষা করার সময় আপনার এফ-ভ্যালু থেকে আলাদা হবে।


5
এটি আওোভাকে একটি পরীক্ষামূলক পদ্ধতি এবং রিগ্রেশনকে মডেলিং পদ্ধতি হিসাবে চিহ্নিত করে যাতে আপনি পরীক্ষা চালিয়ে যেতে পারেন। তবে আনোভা'র একটি অন্তর্নিহিত মডেলও রয়েছে, এটি সমস্ত প্রারম্ভিক চিকিত্সায় জোর দেওয়া হয় কিনা তা নির্বিশেষে। সুতরাং, এই উত্তরটি তাদের মধ্যে কোনও পার্থক্য ধরা দেয় না। এমনকি এটিকে প্রশ্নেও সম্বোধন করা হচ্ছে না, এ কারণেই তাদের দৃ strong় মিলগুলি নির্বিশেষে ভিন্ন হিসাবে শেখানো হয়।
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.