আমার কাজকালে, যখন ব্যক্তিরা কোনও ডেটা সেটের "গড়" মান বোঝায়, তারা সাধারণত পাটিগণিত গড়কে বোঝায় (অর্থাত "গড়", বা "প্রত্যাশিত মান")। যদি আমি জ্যামিতিক গড় সরবরাহ করি তবে লোকেরা সম্ভবত মনে করবে যে আমি ফাঁদহীন বা অ-সহায়ক, কারণ "গড়" এর সংজ্ঞাটি আগে থেকেই জানা গেছে।
আমি একটি ডেটা সেট "মিডিয়ান" এর একাধিক সংজ্ঞা আছে কিনা তা নির্ধারণ করার চেষ্টা করছি। উদাহরণস্বরূপ, এমনকি কোনও সংখ্যক উপাদান সহ একটি সেট সেট ডেটার মিডিয়ান সন্ধানের জন্য কোনও সহকর্মীর দ্বারা প্রদত্ত সংজ্ঞাগুলির মধ্যে একটি হ'ল:
অ্যালগরিদম 'এ'
- দুটি করে উপাদানগুলির সংখ্যা দুটি ভাগ করে নিন round
- সেই মানটি হ'ল মাঝারিটির সূচক।
- উদাহরণস্বরূপ, নিম্নলিখিত সেট জন্য, মিডিয়ান হবে
5
। [4, 5, 6, 7]
এটি বোধগম্য বলে মনে হচ্ছে, যদিও বৃত্তাকার-ডাউন দিকটি কিছুটা নির্বিচারে মনে হচ্ছে।
অ্যালগরিদম 'বি'
যাই হোক না কেন, অন্য সহকর্মী একটি পৃথক অ্যালগরিদম প্রস্তাব করেছেন, যা তাঁর (নাম এবং লেখকের নাম প্রয়োজন) এর একটি স্ট্যাটাস পাঠ্যপুস্তকে ছিল:
- উপাদানগুলির সংখ্যা 2 দ্বারা ভাগ করুন, এবং বৃত্তাকার আপ এবং বৃত্তাকার-ডাউন পূর্ণসংখ্যাগুলির একটি অনুলিপি রাখুন। তাদের নাম দিন
n_lo
এবংn_hi
। - উপাদানগুলিতে গাণিতিক গড় নিন
n_lo
এবংn_hi
। - উদাহরণস্বরূপ, নিম্নলিখিত সেট জন্য, মিডিয়ান হবে
(5+6)/2 = 5.5
। [4, 5, 6, 7]
যদিও এটি ভুল হিসাবে মনে হয়, মিডিয়ান মান হিসাবে, এক্ষেত্রে 5.5
আসলে মূল ডেটা সেটে নেই। যখন আমরা কিছু পরীক্ষার কোডে 'বি' এর জন্য অ্যালগরিদম 'এ' সরিয়ে আনি, তখন এটি ভয়াবহভাবে ভেঙে যায় (যেমনটি আমরা প্রত্যাশা করেছিলাম)।
প্রশ্ন
কোনও ডেটা সেটের মাধ্যম গণনা করার জন্য এই দুটি পদ্ধতির কোনও আনুষ্ঠানিক "নাম" আছে? অর্থাত্ "মিড-অফ-দ্য মিডিয়ান" বনাম "গড়-মিডল-এলিমেন্টস-এবং-মেক-নতুন-ডেটা মিডিয়ান"?