আমি আনোভা শিখতে চাই অ্যালগরিদম কীভাবে কাজ করে (কী গণনা করতে হবে) এবং এটি কেন কাজ করে তা শিখার আগে আমি প্রথমে জানতে চাই যে আমরা আসলে এনওভা দিয়ে কোন সমস্যাটি সমাধান করব, বা আমরা কোন উত্তর দেওয়ার চেষ্টা করব। অন্য কথায়: ইনপুট কী এবং অ্যালগরিদমের আউটপুট কী?
আমরা কী ইনপুট হিসাবে ব্যবহার করি তা বুঝতে পারি না। আমাদের সংখ্যার সেট আছে। প্রতিটি সংখ্যা এক বা একাধিক শ্রেণীবদ্ধ ভেরিয়েবলের মান সহ আসে ("ফ্যাক্টর" নামেও পরিচিত)। উদাহরণ স্বরূপ:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
এটি কি ঠিক বলা যায় যে আনোভা নাল অনুমানের পি-মান গণনা করে যা বলে যে মানগুলির গড়ের উপর কারণগুলির কোনও প্রভাব নেই? অন্য কথায়, আমরা উপরের প্রদত্ত ডেটাটি অ্যালগরিদমকে দেব এবং ফলস্বরূপ আমরা নাল অনুমানের পি-মান পাই?
যদি এটি হয় তবে আমরা পি-মান গণনা করতে আসলে কোন পরিমাপ ব্যবহার করি। উদাহরণস্বরূপ আমরা বলতে পারি যে নাল হাইপোথিসিস এম দেওয়া মাত্র 1% ক্ষেত্রে সুযোগ দ্বারা পর্যবেক্ষিত হিসাবে একটি (বা আরও উচ্চতর) হতে পারে। এম কি?
আমরাও এএনওওএ-র উপাদানগুলি আলাদাভাবে তদন্ত করি না? আনোভা কি বলতে পারে যে ফ্যাক্টর_এর একটি প্রভাব রয়েছে তবে ফ্যাক্টর_2 নেই? আনোভা কি বলতে পারে যে প্রদত্ত ফ্যাক্টর মানগুলির সাথে সম্পর্কিত যা মান "এ", "বি" এবং "সি" হিসাবে পরিসংখ্যানগতভাবে পৃথক হয় (উদাহরণস্বরূপ একই অর্থ হয়) তবে মান "ডি" এর প্রভাব আছে?