আনোভা অনুমানগুলি (বৈচিত্রের সাম্যতা, অবশিষ্টাংশের স্বাভাবিকতা) কেন গুরুত্বপূর্ণ?


15

একটি আনোভা চলাকালীন আমাদের জানানো হয় যে এটি ডেটাতে প্রযোজ্য হওয়ার জন্য পরীক্ষার নির্দিষ্ট অনুমান অবশ্যই উপস্থিত থাকতে হবে। পরীক্ষার কাজ করার জন্য নিম্নলিখিত অনুমানগুলি কেন প্রয়োজনীয় ছিল তা আমি কখনই বুঝতে পারি নি:

  1. আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) এর প্রকরণটি ডিজাইনের প্রতিটি কক্ষে সমান হওয়া উচিত

  2. আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) ডিজাইনের প্রতিটি কক্ষের জন্য সাধারণত বিতরণ করা উচিত

আমি বুঝতে পেরেছি যে এই অনুমানগুলি পূরণ করা দরকার কিনা তবে কিছুটা ধূসর অঞ্চল রয়েছে তবে যুক্তির স্বার্থে যদি এই অনুমানগুলি নির্দিষ্ট উপাত্ত সেটটিতে পুরোপুরি পূরণ না করা হয় তবে একটি এএনওওএ ব্যবহার করে কী সমস্যা হবে? ?


আপনার অধ্যয়নের লক্ষ্য কি?
সুভাষ সি। দাবার

উত্তর:


8

অনুমানগুলি অনির্বচনীয় কারণ তারা অনুমানের পরীক্ষার বৈশিষ্ট্যগুলিকে প্রভাবিত করে (এবং অন্তরগুলি) আপনি ব্যবহার করতে পারেন যার নলের অধীনে যার বিতরণ বৈশিষ্ট্যগুলি সেই অনুমানগুলির উপর নির্ভর করে গণনা করা হয়।

বিশেষত, হাইপোথিসিস পরীক্ষার জন্য, আমরা যে বিষয়গুলির বিষয়ে যত্ন নিতে পারি তা হ'ল আমরা যা চাই তা থেকে সত্য তাৎপর্য স্তরটি কতদূর হতে পারে এবং আগ্রহের বিকল্পগুলির বিরুদ্ধে শক্তি ভাল কিনা।

আপনি যে অনুমানগুলি সম্পর্কে জিজ্ঞাসা করেছেন সেগুলির সাথে সম্পর্কিত:

1. বৈচিত্রের সমতা

আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) এর প্রকরণটি ডিজাইনের প্রতিটি কক্ষে সমান হওয়া উচিত

এটি অবশ্যই তাৎপর্য স্তরে প্রভাব ফেলতে পারে, কমপক্ষে যখন নমুনার আকারগুলি অসম হয়।

(সম্পাদনা করুন) একটি আনোভা এফ-পরিসংখ্যান হ'ল বৈকল্পিকের দুটি অনুমানের অনুপাত (বিভাজনের বিভাজন এবং তুলনাকেই কেন এটি বৈকল্পিক বিশ্লেষণ বলা হয়)। ডিনোমিনেটরটি অনুমান-সাধারণ-থেকে-সমস্ত-কোষের ত্রুটির প্রকরণের অনুমান (অবশিষ্টগুলি থেকে গণনা করা হয়), তবে সংখ্যার পরিবর্তনের উপর ভিত্তি করে অঙ্কটির দুটি উপাদান থাকবে, একটি জনসংখ্যার পরিবর্তনের থেকে এবং একটি ত্রুটি বৈকল্পিক কারণে। যদি নালটি সত্য হয় তবে দুটি বৈকল্পিক যা অনুমান করা হচ্ছে তা একই হবে (সাধারণ ত্রুটির পরিবর্তনের দুটি অনুমান); এই সাধারণ তবে অজানা মানটি বাতিল হয়ে যায় (কারণ আমরা একটি অনুপাত নিয়েছি), একটি এফ-পরিসংখ্যান রেখে যা ত্রুটিগুলির বিতরণের উপর নির্ভর করে (যা অনুমানের অধীনে আমরা এফ বন্টন দেখাতে পারি। (অনুরূপ মন্তব্য টি-তে প্রযোজ্য আমি উদাহরণ হিসাবে পরীক্ষা ব্যবহার।)

[আমার উত্তরে এখানে সেই তথ্যের কিছুটা সম্পর্কে আরও কিছু বিশদ রয়েছে ]

তবে, এখানে দুটি জনসংখ্যার বৈকল্পিক দুটি ভিন্ন-আকারের নমুনাগুলির মধ্যে পৃথক। ডিনোনিয়েটর বিবেচনা করুন (আনোভাতে এফ-পরিসংখ্যান এবং একটি টি-টেস্টে টি-স্ট্যাটিস্টিকগুলির) - এটি দুটি ভিন্ন ভিন্ন অনুমানের সমন্বয়ে গঠিত, একটি নয়, সুতরাং এটির "ডান" বিতরণ থাকবে না (একটি ছোট আকারের চি -এফ এর ক্ষেত্রে স্কোয়ার এবং এর স্কোয়ার রুটের ক্ষেত্রে - আকার এবং স্কেল উভয়ই বিষয়)।

ফলস্বরূপ, এফ-পরিসংখ্যান বা টি-স্ট্যাটিস্টিকের আর এফ- বা টি-বিতরণ থাকবে না, তবে এটি যেভাবে প্রভাবিত হয়েছে তা বিভিন্ন বা বৃহত্তর ছোট নমুনাটি জনসংখ্যার সাথে আঁকা ছিল কিনা তার উপর নির্ভর করে is বৃহত্তর বৈকল্পিকতা। এটি পরিবর্তিতভাবে পি-মানগুলির বিতরণকে প্রভাবিত করে।

শূন্যের অধীনে (অর্থাত্ যখন জনসংখ্যার অর্থ সমান হয়), পি-মানগুলির বিতরণ সমানভাবে বিতরণ করা উচিত। তবে, যদি রূপগুলি এবং নমুনার আকারগুলি অসম হয় তবে উপায়গুলি সমান (তাই আমরা নালটিকে প্রত্যাখ্যান করতে চাই না), পি-মানগুলি সমানভাবে বিতরণ করা হয় না। কী ঘটে তা আপনাকে দেখানোর জন্য আমি একটি ছোট সিমুলেশন করেছি। এই ক্ষেত্রে, আমি মাত্র 2 টি গ্রুপ ব্যবহার করেছি যাতে আনোভা সমান বৈকল্পিক অনুমানের সাথে একটি দুটি-নমুনা টি-পরীক্ষার সমতুল্য। সুতরাং আমি দুটি সাধারণ বিতরণ থেকে নমুনাগুলি সমিত করেছিলাম যার মধ্যে একটি স্ট্যান্ডার্ড বিচ্যুতি সঙ্গে অন্যটির চেয়ে দশগুণ বড়, তবে সমান উপায়ে হয়।

বাম পাশের প্লটের জন্য, বৃহত্তর ( জনসংখ্যা ) স্ট্যান্ডার্ড বিচ্যুতিটি n = 5 এর জন্য এবং ছোট স্ট্যান্ডার্ড বিচ্যুতিটি n = 30 এর জন্য। ডান পাশের প্লটের জন্য বৃহত্তর স্ট্যান্ডার্ড বিচ্যুতি n = 30 এবং ছোট এন = 5 এর সাথে চলেছে। আমি প্রত্যেককে 10000 বার সিমুলেটেড করে প্রতিবার পি-মানটি পাই। প্রতিটি ক্ষেত্রে আপনি হিস্টোগ্রামটি সম্পূর্ণ সমতল (আয়তক্ষেত্রাকার) হতে চান, যেহেতু এর অর্থ সমস্ত তাত্পর্য কিছু তাত্পর্যপূর্ণ স্তরে পরিচালিত হয় আসলে সেই ধরণের প্রথম ত্রুটির হার পান। বিশেষত ধূসররেখার নিকটবর্তী থাকার জন্য হিস্টোগ্রামের বামতম অংশগুলি সবচেয়ে গুরুত্বপূর্ণ:α

সিমুলেটেড নমুনার জন্য পি-মানগুলির হিস্টোগ্রাম ms

যেমনটি আমরা দেখতে পাই, বাম দিকের প্লট (ছোট নমুনায় বৃহত্তর বৈচিত্র) পি-মানগুলি খুব ছোট থাকে - নালটি সত্য হলেও আমরা নাল অনুমানটি প্রায়শই প্রত্যাখ্যান করি (প্রায় উদাহরণ হিসাবে প্রায় অর্ধেক সময়) । এটি হ'ল আমাদের তাত্পর্য স্তরগুলি আমরা যা চেয়েছিলাম তার চেয়ে অনেক বড়। ডান পাশের প্লটটিতে আমরা দেখতে পাই পি-মানগুলি বেশিরভাগ বড় (এবং তাই আমাদের তাত্পর্য স্তরটি আমরা যা চেয়েছিলাম তার চেয়ে অনেক ছোট) - বাস্তবে দশ হাজার সিমুলেশনে একবারও আমরা 5% স্তরে প্রত্যাখ্যান করি নি (সবচেয়ে ক্ষুদ্রতম) পি-মান এখানে ছিল 0.055)। [এটি এমন খারাপ জিনিসের মতো নাও লাগতে পারে, যতক্ষণ না আমরা মনে রাখি যে আমাদের খুব কম তাত্পর্যপূর্ণ স্তরের সাথে যাওয়ার জন্য আমাদেরও খুব কম শক্তি থাকবে ]]

এটা বেশ পরিণতি। এই কারণে ওয়েলচ-স্যাটার্থওয়েট টাইপ টি-টেস্ট বা আনোভা ব্যবহার করা ভাল ধারণা যখন আমাদের কাছে ধারণা করার কোনও ভাল কারণ নেই যে বৈকল্পিকগুলি সমান হয়ে যাবে - তুলনা করে এটি এই পরিস্থিতিতে সবেই প্রভাবিত হয়েছে (I এই ক্ষেত্রেও সিমুলেটেড; সিমুলেটেড পি-ভ্যালুগুলির দুটি বিতরণ - যা আমি এখানে দেখাইনি - ফ্ল্যাটের খুব কাছাকাছি এসেছিল)।

২. প্রতিক্রিয়ার শর্তসাপেক্ষ বিতরণ (ডিভি)

আপনার নির্ভরশীল পরিবর্তনশীল (অবশিষ্টগুলি) ডিজাইনের প্রতিটি কক্ষের জন্য সাধারণত বিতরণ করা উচিত

এটি কিছুটা কম সরাসরি সমালোচনামূলক - স্বাভাবিকতা থেকে পরিমিত বিচ্যুতির জন্য, তাত্পর্য স্তরটি বড় আকারের নমুনাগুলিতে এতটা প্রভাবিত হয় না (যদিও শক্তি হতে পারে!)।

এখানে একটি উদাহরণ রয়েছে, যেখানে মানগুলি তাত্ক্ষণিকভাবে বিতরণ করা হয় (অভিন্ন বিতরণ এবং নমুনা আকার সহ), যেখানে আমরা দেখতে পারি এই তাত্পর্য স্তর স্তরটি ছোট এ যথেষ্ট কিন্তু বড় এন দিয়ে হ্রাস করা ।nn

এইচ 0 টি সত্য হয়ে গেলে পি-মানগুলির হিস্টোগ্রাম তবে প্রতিটি গ্রুপের বিতরণগুলি হ'ল

আমরা দেখতে পাই যে এন = 5 এ যথেষ্ট পরিমাণে খুব কম পি-ভ্যালু রয়েছে (5% পরীক্ষার জন্য তাত্পর্য স্তর এটি হওয়া উচিত প্রায় অর্ধেক হবে), তবে এন = 50 এ সমস্যা হ্রাস পেয়েছে - 5% এর জন্য এই ক্ষেত্রে পরীক্ষার প্রকৃত তাৎপর্য স্তরটি প্রায় 4.5%।

সুতরাং আমরা "ভাল, এটি ভাল," যদি এন এর তাত্পর্য স্তরটি খুব কাছাকাছি হওয়ার জন্য যথেষ্ট পরিমাণে "বলার জন্য প্রলুব্ধ হতে পারে তবে আমরা একটি শক্তির একটি ভাল চুক্তিও ফেলতে পারি। বিশেষত, এটি জানা যায় যে ব্যাপকভাবে ব্যবহৃত বিকল্পগুলির সাথে তুলনামূলকভাবে টি-টেস্টের অ্যাসেম্পটোটিক আপেক্ষিক দক্ষতা 0 এ যেতে পারে This এর অর্থ এটি হল যে আরও ভাল পরীক্ষার পছন্দগুলি এটি পেতে প্রয়োজনীয় নমুনা আকারের বর্ধনযোগ্য ছোট ভগ্নাংশের সাথে একই শক্তি পেতে পারে means টি-পরীক্ষা। বিকল্প পরীক্ষার সাথে আপনার যেমন প্রয়োজন তেমন শক্তির তুলনায় দ্বিগুণ ডেটা বলার চেয়ে সাধারণের বাইরে আপনার আর কিছু দরকার নেই - জনসংখ্যা বিতরণে স্বাভাবিকভাবে খুব কম ভারী - এবং মাঝারিভাবে বড় নমুনাগুলি এটি করার জন্য যথেষ্ট হতে পারে।

(বিতরণের অন্যান্য পছন্দগুলি তাত্পর্য স্তরটিকে তার চেয়ে বেশি উচ্চতর করতে পারে, বা আমরা এখানে যা দেখলাম তার চেয়ে যথেষ্ট কম করতে পারে))


বিস্তারিত প্রতিক্রিয়া জন্য গ্লেন ধন্যবাদ। আমি কৌতূহল যে আপনার বর্ণনার যে ত্রুটিগুলি যদি অনুমানগুলি পূরণ না হয় তবে কেন তা ঘটতে পারে তা সম্পর্কে আমি কৌতূহল বোধ করি: আপনার লেখাটি গ্রহণ করার ক্ষেত্রে আমি কি সঠিক ?? বৃহত্তর বৈকল্পিকতা হ'ল (সেইসাথে ডেটা পয়েন্টগুলির সংখ্যা সাধারণভাবে ছোট হওয়া যেমন এন = 5) যে ছোট নমুনায় দেখা বৃহত্তর বৈচিত্রটি জনসংখ্যা স্তরে পরিবর্তনের প্রতিনিধি হিসাবে গণনা করা হচ্ছে।
পেপাররকবাজুকা

(অংশ 2) এটি মূলত একটি প্রতিনিধি নমুনা এবং একটি আন্ডার রিপ্রেজেন্টেটিভ নমুনার (তুলনামূলকভাবে কথা বলা) মধ্যে অপ্রতিদ্বন্দ্বী তুলনা যা আনোভা প্রক্রিয়াজাতকরণের কারণে টাইপ 1 ত্রুটির দিকে পরিচালিত করতে পারে।
পেপাররকবাজুকা

@ পেপার আমি এখানে সমস্যা বলে মনে করি না। এটি ছোট নমুনায় নমুনার বৈকল্পিকতার প্রতিনিধিত্বশীলতা নয় (উদাহরণস্বরূপ যদি উভয় নমুনা সমানভাবে ছোট হয়, তবে আপনার প্রতিনিধিত্বশীলতার সাথে দ্বিগুণ সমস্যা হত তবে এই সমস্যাটি অনুপস্থিত থাকবে)। সমস্যাটি কীভাবে আরও বিশদে উত্থিত হয় তা বোঝাতে আমি আমার উত্তরে কয়েকটি অনুচ্ছেদ যুক্ত করেছি।
গ্লেন_বি -রিনস্টেট মনিকা

4

সংক্ষেপে, আনোভা যুক্ত করছে , স্কোয়ারিং করছে এবং গড় রেসিড্যুয়েজ করছে । আপনার মডেল ডেটা কতটা ফিট করে তা অবশিষ্টাংশ আপনাকে বলে tell এই উদাহরণের জন্য, আমি এতে PlantGrowthডেটাসেট ব্যবহার করেছি R:

একটি নিয়ন্ত্রণের অধীনে প্রাপ্ত ফলন (গাছের শুকনো ওজন দ্বারা পরিমাপকৃত) তুলনা করার জন্য একটি পরীক্ষার ফলাফল এবং দুটি পৃথক চিকিত্সা শর্তাদি।

এই প্রথম প্লটটি আপনাকে তিনটি চিকিত্সা স্তরের জুড়েই দুর্দান্ত গড় দেখায়:

এখানে চিত্র বর্ণনা লিখুন

লাল রেখাগুলি হল অবশিষ্টাংশ । এখন সেই স্বতন্ত্র লাইনের দৈর্ঘ্য স্কোয়ার করে এবং যোগ করার মাধ্যমে আপনি একটি মান পাবেন যা আপনাকে বোঝায় যে কীভাবে গড় (আমাদের মডেল) ডেটা বর্ণনা করে। একটি অল্প সংখ্যক, আপনাকে মিডিয়াটি আপনার ডেটার পয়েন্টগুলি ভালভাবে বর্ণনা করে বলে দেয়, একটি বড় সংখ্যা আপনাকে তার ডেটাটি এত ভালভাবে বর্ণনা না করার উপায় বলে tells এই সংখ্যাটিকে স্কোয়ারের মোট সমষ্টি বলা হয় :

SStotal=(xix¯grand)2xix¯grand

আপনার চিকিত্সার অবশিষ্টাংশের জন্য এখন আপনি একই জিনিসটি করুন ( স্কোয়ারের রেসিডুয়াল সামস , যা চিকিত্সা স্তরের শব্দ হিসাবেও পরিচিত ):

এখানে চিত্র বর্ণনা লিখুন

এবং সূত্র:

SSresiduals=(xikx¯k)2xikikx¯k

শেষ অবধি, আমাদের ডেটাতে সিগন্যাল নির্ধারণ করতে হবে, যা স্কোয়ারের মডেল সামস হিসাবে পরিচিত , যা পরে গণনার জন্য ব্যবহার করা হবে যে চিকিত্সার উপায়গুলি গ্র্যান্ড অর্থ থেকে আলাদা কিনা:

এখানে চিত্র বর্ণনা লিখুন

এবং সূত্র:

SSmodel=nk(x¯kx¯grand)2nknkx¯kx¯grand

স্কোয়ারের যোগফলগুলির সাথে অসুবিধা হ'ল নমুনার আকার বাড়ার সাথে সাথে তারা বড় হয়। ডেটা সেটে পর্যবেক্ষণের সংখ্যার সাথে সম্পর্কিত স্কোয়ারগুলির এই পরিমাণগুলি প্রকাশ করার জন্য, আপনি তাদের স্বাধীনতার ডিগ্রি দ্বারা তাদের বিভিন্ন রূপে রূপান্তরিত করেন। সুতরাং আপনার ডেটা পয়েন্টগুলি স্কোয়ারিং এবং যুক্ত করার পরে আপনি এখন তাদের ডিগ্রি অফ ডিগ্রি ব্যবহার করে গড় করছেন:

dftotal=(n1)

dfresidual=(nk)

dfmodel=(k1)

nk

এটির ফলাফলটি মডেল মিইন স্কোয়ার এবং রেসিডুয়াল মিইন স্কোয়ারে (উভয় প্রকারের রূপ) বা শব্দের অনুপাতের সংকেত, যা এফ-মান হিসাবে পরিচিত:

MSmodel=SSmodeldfmodel

MSresidual=SSresidualdfresidual

F=MSmodelMSresidual

এফ-মান শব্দের অনুপাতের সংকেতকে বর্ণনা করে বা চিকিত্সার অর্থ গ্র্যান্ড অর্থ থেকে কোনও পৃথক কিনা। এফ-মানটি এখন পি-মানগুলি গণনা করার জন্য ব্যবহৃত হয় এবং চূড়ান্তভাবে চিকিত্সার কোনও একটি উপায় গ্র্যান্ড অর্থ থেকে উল্লেখযোগ্যভাবে আলাদা হবে কিনা তা সেগুলি সিদ্ধান্ত নেবে।

এখন আমি আশা করি আপনি বুঝতে পারবেন অনুমানগুলি অবশিষ্টাংশের সাথে গণনার ভিত্তিতে এবং সেগুলি কেন গুরুত্বপূর্ণ। আমরা যেহেতু যোগ , বর্গ এবং গড় অবশিষ্টাংশ, আমরা করা উচিত নিশ্চিত করুন যে আগে আমরা এই কাজ হয়, তখন সে চিকিত্সা গ্রুপ ডাটা অনুরূপ আচরণ করবে , অথবা অন্য এফ মান এই এফ মান থেকে টানা কিছু ডিগ্রী এবং মতামতে উপনীত করার পক্ষপাতমূলক হতে পারে বৈধ হবে না।

সম্পাদনা করুন: আমি ওপির প্রশ্ন 2 এবং 1 টি আরও নির্দিষ্টভাবে সম্বোধনের জন্য দুটি অনুচ্ছেদ যুক্ত করেছি

সাধারণ অনুমান : গড় (বা প্রত্যাশিত মান) প্রায়শই একটি বন্টনের কেন্দ্র বর্ণনা করতে পরিসংখ্যানগুলিতে ব্যবহৃত হয়, তবে এটি খুব দৃust় এবং সহজেই বহিরাগতদের দ্বারা প্রভাবিত হয় না। গড়টি হ'ল সহজতম মডেল যা আমরা ডেটাতে ফিট করতে পারি। আনোভাতে যেহেতু আমরা অবশিষ্টাংশ এবং বর্গাকার অঙ্কগুলি গণনা করার জন্য মাধ্যমটি ব্যবহার করছি (উপরের সূত্রগুলি দেখুন) তাই তথ্যগুলি প্রায় সাধারণভাবে বিতরণ করা উচিত (স্বাভাবিকতা অনুমান)। যদি এটি না হয় তবে ডেটাগুলির জন্য গড়টি উপযুক্ত মডেল নাও হতে পারে কারণ এটি আমাদের নমুনা বিতরণের কেন্দ্রে একটি সঠিক অবস্থান দেয় না। পরিবর্তে একবার উদাহরণস্বরূপ ব্যবহার করতে পারেন (প্যারামিমেট্রিক পরীক্ষার পদ্ধতিগুলি দেখুন)।

ভেরিয়েন্স অনুমানের সাদৃশ্য : পরে যখন আমরা গড় স্কোয়ারগুলি (মডেল এবং অবশিষ্টাংশ) গণনা করি, তখন আমরা চিকিত্সার স্তরগুলি থেকে পৃথক পরিমাণ স্কোয়ারগুলি পুল করি এবং সেগুলি গড় করি (উপরের সূত্রগুলি দেখুন)। পুলিং এবং গড়ের মাধ্যমে আমরা পৃথক চিকিত্সা স্তরের বৈচিত্রগুলি এবং গড় স্কোয়ারগুলিতে তাদের অবদানের তথ্য হারাচ্ছি। সুতরাং, আমাদের চিকিত্সার সমস্ত স্তরের মধ্যে প্রায় একই রকমের পার্থক্য থাকা উচিত যাতে গড় স্কোয়ারগুলিতে অবদান একই রকম হয়। যদি সেই চিকিত্সা স্তরের মধ্যে বৈচিত্রগুলি পৃথক হয়, তবে ফলাফলের ফলাফলগুলি স্কোয়ার এবং এফ-মান পক্ষপাতমূলক হবে এবং এই পি-মানগুলি থেকে প্রশ্নযুক্ত প্রশ্নাবলীর পি-ভ্যালুগুলি তৈরির হিসাবকে প্রভাবিত করবে (এছাড়াও @ শুভরের মন্তব্য এবং দেখুন) @ গ্লেন_ বি এর উত্তর)

আমি নিজের জন্য এটি এইভাবে দেখি। এটি 100% সঠিক নাও হতে পারে (আমি কোনও পরিসংখ্যানবিদ নই) তবে এটি আমাকে বুঝতে সাহায্য করে যে কেন আনোভা সম্পর্কে অনুমানগুলি সন্তুষ্ট করা গুরুত্বপূর্ণ।


FFFFF

FF

ধন্যবাদ স্টেফান আমি আপনাকে সঠিকভাবে বুঝতে পারছি কিনা তা দেখতে চাই। আনোভা মূলত সেটের সমস্ত ডেটা পয়েন্টগুলির মধ্যে একটি দুর্দান্ত গড় তৈরি করে এবং তুলনা করে যে প্রতিটি গ্রুপ এই গ্র্যান্ড অর্থ থেকে কতটা পৃথক পৃথকভাবে বুঝতে পারছে যে তাদের মধ্যে একটি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ কিনা understand যদি আলোচিত অনুমানগুলি পূরণ না করা হয়, তবে গ্রুপগুলি তুলনা করার পক্ষে দুর্দান্ত
গড়টি

@ পেপাররোকবাজুকা একটি আনোভাতে আপনি শব্দকে সংকেতের সাথে তুলনা করছেন। যদি আপনি কোনও সিগন্যাল সনাক্ত করতে না পারেন, অর্থাত আপনার চিকিত্সার প্রভাবের ফলাফল, তবে আপনি ডেটা বর্ণনা করার জন্য মডেল হিসাবে গ্র্যান্ড অর্থ গ্রহণ করতে পারেন। আমরা গ্র্যান্ড গড় ( এর সাথে ডেটা পয়েন্টের পার্থক্যটি ব্যবহার করছিSStotalSSresidualSSmodel) শব্দ অনুপাতের সংকেত নির্ধারণ করতে। হাত দিয়ে একটি সহজ ওয়ানওয়ে আনোভা গণনা করার চেষ্টা করুন। এটি আমাকে আরও ভালভাবে বুঝতে সাহায্য করেছে।
স্টিফান

0

আনোভা এটি কেবল একটি পদ্ধতি, এটি আপনার নমুনা থেকে এফ-পরীক্ষা গণনা করে এবং এটি এফ-বিতরণের সাথে তুলনা করে। আপনি কী তুলনা করতে চান তা নির্ধারণ করতে এবং পি-মানগুলি গণনা করার জন্য আপনাকে কিছু অনুমানের প্রয়োজন।

যদি আপনি এই অনুমানগুলি পূরণ না করেন তবে আপনি অন্যান্য জিনিস গণনা করতে পারেন তবে এটি কোনও আনোভা হবে না।

সর্বাধিক দরকারী বিতরণটি হ'ল সাধারণ (সিএলটি-র কারণে), এজন্য এটি সবচেয়ে বেশি ব্যবহৃত হয়। যদি আপনার ডেটা এটিকে সাধারণত বিতরণ করা না হয় তবে কোনও কিছুর গণনা করার জন্য আপনাকে কমপক্ষে এর বিতরণ কী তা জানতে হবে।

হোমোসেসডেস্টিটিটি রিগ্রেশন বিশ্লেষণেও একটি সাধারণ অনুমান, এটি কেবল জিনিসগুলিকে সহজ করে তোলে। শুরু করার জন্য আমাদের কিছু অনুমান প্রয়োজন।

আপনার যদি সমকামিতা না থাকে আপনি এটি অর্জনের জন্য আপনার ডেটা ট্রান্সফর্ম করার চেষ্টা করতে পারেন।

আনোভা এফ-পরীক্ষা মিথ্যা ইতিবাচক ত্রুটির একটি নির্দিষ্ট হারের জন্য মিথ্যা নেতিবাচক ত্রুটিগুলি হ্রাস করার অর্থে প্রায় অনুকূল হিসাবে পরিচিত


"আনোভা" বলতে স্কোয়ারের যোগফলগুলিকে ব্যাখ্যামূলক উপাদানগুলিতে বিভক্ত করার প্রক্রিয়া বোঝায়। বিতরণীয় অনুমানগুলি নির্বিশেষে, তবে, একটি অ্যানোভা একটি আনোভা।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.