মূলের ধারণাগত বোঝার অর্থ স্কোয়ার ত্রুটি এবং বায়াস বিচ্যুতি মানে


13

আমি রুট মিন স্কোয়ার্ড ত্রুটি (আরএমএসই) এবং মিন বায়াস ডেভিয়েশন (এমবিডি) সম্পর্কে একটি ধারণামূলক ধারণা অর্জন করতে চাই। আমার নিজস্ব উপাত্তের সাথে তুলনা করার জন্য এই ব্যবস্থাগুলি গণনা করে, আমি প্রায়শই হতবাক হয়ে গিয়েছিলাম যে আরএমএসই উচ্চ (উদাহরণস্বরূপ, 100 কেজি), এমবিডি কম (উদাহরণস্বরূপ, 1% এরও কম)।

আরও নির্দিষ্টভাবে, আমি একটি রেফারেন্স খুঁজছি (অনলাইনে নয়) যা এই ব্যবস্থাগুলির গণিতের তালিকা ও আলোচনা করে। এই দুটি পদক্ষেপ গণনা করার জন্য সাধারণত গৃহীত উপায় কী এবং আমি কীভাবে জার্নাল নিবন্ধের কাগজে তাদের প্রতিবেদন করব?

এই দুটি পদক্ষেপের গণনা বর্ণনা করতে একটি "খেলনা" ডেটাসেট ব্যবহার করা এই পোস্টের প্রসঙ্গে সত্যই সহায়ক হবে।

উদাহরণস্বরূপ, ধরুন যে আমি অ্যাসেমব্লিং লাইনের দ্বারা উত্পাদিত 200 উইজেটের ভর (কেজিতে) খুঁজে পাচ্ছি। আমার কাছে একটি গাণিতিক মডেলও রয়েছে যা এই উইজেটগুলির বৃহত্তর পূর্বাভাস দেওয়ার চেষ্টা করবে। মডেলটি অভিজ্ঞতাশীল হতে হবে না এবং এটি শারীরিক ভিত্তিক হতে পারে। আমি আরএমএসই এবং এমবিডি প্রকৃত পরিমাপ এবং মডেলের মধ্যে গণনা করি, আরএমএসি 100 কেজি এবং এমবিডি 1% হয় তা খুঁজে পেয়েছি। এর ধারণাটি কী বোঝায় এবং আমি কীভাবে এই ফলাফলটির ব্যাখ্যা করব?

এখন ধরা যাক আমি এই পরীক্ষার ফলাফল থেকে জানতে পারি যে আরএমএসই 10 কেজি, এবং এমবিডি 80%। এর অর্থ কী, এবং এই পরীক্ষাটি সম্পর্কে আমি কী বলতে পারি?

এই ব্যবস্থাগুলির অর্থ কী এবং এ দু'টি (একত্রে নেওয়া) কী বোঝায়? আরএমএসইয়ের সাথে বিবেচনা করা হলে এমবিডি অতিরিক্ত কোন তথ্য দেয়?


2
আপনি কি আমাদের সাইট নিকোলাসের চারপাশে দেখেছেন? Stats.stackexchange.com/a/17545 থেকে শুরু করে বিবেচনা করুন এবং তারপরে আমি আপনার প্রশ্নে যুক্ত করেছি এমন কিছু ট্যাগ অন্বেষণ করুন।
whuber

@ হুইবার: থ্যাঙ্কস হোবার! আমি সাইটটির আশেপাশে দেখেছি, তবে আমার নিজের গবেষণার প্রসঙ্গে আসলে কী বোঝানো হয়েছে তা বুঝতে আমার এখনও এটি কিছুটা চ্যালেঞ্জিং মনে হচ্ছে।
নিকোলাস কিনার

উত্তর:


21

আমি মনে করি এই ধারণাগুলি ব্যাখ্যা করা সহজ easy সুতরাং আমি বরং এটি এখানে বর্ণনা করব। আমি নিশ্চিত যে অনেকগুলি প্রাথমিক পরিসংখ্যানের বইতে এটি আমার বই "চিকিত্সক, নার্স এবং ক্লিনিশিয়ানদের জন্য বায়োস্ট্যাটাস্টিকস এর এসেন্সিয়ালস" সহ অন্তর্ভুক্ত রয়েছে।

মাঝখানে একটি ষাঁড়-চোখের সাথে লক্ষ্য লক্ষ্য করুন। গড় বর্গ ত্রুটি লক্ষ্য এবং কেন্দ্রের তীর শট থেকে গড় বর্গক্ষেত্রের দূরত্বকে উপস্থাপন করে। এখন যদি আপনার তীরগুলি কেন্দ্রের চারপাশে সমানভাবে ছড়িয়ে পড়ে তবে শ্যুটারের লক্ষ্যমাত্রার পক্ষপাত নেই এবং গড় বর্গ ত্রুটিটি বৈকল্পের মতো same

তবে সাধারণভাবে তীরগুলি লক্ষ্য থেকে এক পয়েন্ট দূরে ছড়িয়ে দিতে পারে। তীরের কেন্দ্র থেকে তীরগুলির গড় বর্গক্ষেত্রের দূরত্বটি হ'ল বৈচিত্র্য। এই কেন্দ্রটি শুটারের লক্ষ্য বিন্দু হিসাবে দেখা যেতে পারে। এই শ্যুটার কেন্দ্র বা লক্ষ্য কেন্দ্রের মধ্যবর্তী স্থানে দূরত্ব পক্ষপাতের পরম মান।

একটি সমকোণ বর্গক্ষেত্র যেখানে দুটি পক্ষের বর্গক্ষেত্রের যোগফল, সেখানে একটি ত্রিভুজ হিসাবে চিন্তা করা। সুতরাং লক্ষ্য থেকে তীর থেকে একটি বর্গক্ষেত্রের দূরত্ব হ'ল তীর থেকে লক্ষ্য বিন্দু থেকে দূরত্বের বর্গক্ষেত্র এবং লক্ষ্যটির কেন্দ্র এবং অ্যামপয়েন্টের মধ্যবর্তী দূরত্বের বর্গক্ষেত্র। এই সমস্ত বর্গক্ষেত্রের দূরত্বের গড় বায়ুমণ্ডল বর্ধনের যোগফল এবং বৈকল্পিক হিসাবে গড় বর্গ ত্রুটি দেয়।


ধন্যবাদ; এটি খুব প্রশংসা করা হয়। আরএমএসই এবং এমবিডি-র মধ্যে পার্থক্য কী তা বোঝার জন্য আমি এখনও কিছুটা চ্যালেঞ্জিং খুঁজে পেয়েছি। আমি যেমন এটি বুঝতে পেরেছি, আরএমএসই পরীক্ষামূলক তথ্যগুলির সাথে কোন মডেলের কতটা নিকটবর্তী তা পরিমাপ করে, তবে এমবিডির ভূমিকা কী? হতে পারে আমার ভুল বোঝাবুঝি কেবল পরিভাষার সাথে জড়িত।
নিকোলাস কিনার

1
আপনি এটি হিসাবে ডাক হিসাবে গড় পক্ষপাত বিচ্যুতি আমি বর্ণিত পক্ষপাত শব্দ। এটি পরিমাপ করে যে এ্যামপয়েন্টটি লক্ষ্য থেকে কত দূরে রয়েছে। বায়াস শটটি ভুল করতে অবদান রাখে।
মাইকেল আর চেরনিক

মাইকেল আবার ধন্যবাদ। সুতরাং একটি উচ্চ আরএমএসই এবং একটি কম এমবিডি বোঝায় যে এটি একটি ভাল মডেল?
নিকোলাস কিনার

কোনও উচ্চতর আরএমএসই এবং একটি নিম্ন এমবিডি কেবল এটি বলে না যে মডেলটি বড় পক্ষপাতের চেয়ে বড় বৈকল্পিকতার কারণে দুর্বল। আরএমএসই হল এমন নম্বর যা মডেলটি কতটা ভাল তা স্থির করে।
মাইকেল আর চেরনিক

1
@ বাব্বালাইনা: এগুলি উপরের / নীচে এবং বাম / ডানদিকে স্বাধীনভাবে একইভাবে তথ্যের টুকরো। আপনার প্রশ্নটি জিজ্ঞাসার মতো "যদি কোনও বিন্দু উল্লম্বভাবে কেন্দ্রীভূত হয় এবং বাম দিকে যেতে হয় তবে এটি মাঝখানে?" , বা "যদি কোনও বিন্দু উঁচুতে হয় তবে অনুভূমিকভাবে কেন্দ্রে থাকে তবে এটি কি মাঝখানে?"
nnot101

1

আরএমএসই হ'ল এটি পরিমাপের একটি উপায় যা আমাদের ভবিষ্যদ্বাণীমূলক মডেলটি প্রকৃত উপাত্তের তুলনায় কতটা ভাল, ছোট আরএমএসই মডেলটির আচরণের আরও ভাল উপায়, এটি যদি আমরা পরীক্ষা করে দেখি যে কোনও নতুন ডেটা সেট (আমাদের প্রশিক্ষণ সেটে নয়) তবে তারপরে আবার ০.১ থেকে ১ এর পরিসরের তুলনায় ০.০7 এর একটি আরএমএসই, আরও ভাল মডেল হিসাবে 0.01 এর আরএমএসই থাকার বিপরীতে প্রচুর ত্রুটির কারণ হয়ে থাকে। BIAS অত্যধিক মূল্যায়ন বা অবমূল্যায়নের জন্য।


আপনি দয়া করে আরও বিশদ এবং একটি কাজের অভিজ্ঞতা উদাহরণ প্রদান করতে পারেন? ওপি তার অনুমানের সমস্যার বিপরীতে, 100, এর একটি আরএমএসই এর অর্থের অন্তর্নিহিত ব্যাখ্যা খুঁজছে।
শি'আন

এটি খুব স্বজ্ঞাত সরবরাহ করে বলে মনে হচ্ছে না। আপনি আরও ব্যাখ্যা করতে পারেন?
গ্লেন_বি -রিনস্টেট মনিকা

0

আমি যতদূর বুঝতে পারি, একটি আরএমএসই মডেল এবং পর্যবেক্ষণের মধ্যে ত্রুটির একটি আরও সঠিক মান দেয় তবে বিআইএএস ত্রুটির একটি মান দেওয়ার পাশাপাশি (আরএমএসইয়ের চেয়ে কম নির্ভুল )ও নির্ধারণ করতে পারে যে মডেলটি কিনা ধনাত্মক পক্ষপাত বা নেতিবাচক পক্ষপাত, যদি মডেলটি পর্যবেক্ষণকৃত মানগুলিকে অবমূল্যায়ন বা অত্যধিক মূল্যায়ন করে।


না, আপনি আরএমএসইকে কোনও মডেলের "যথার্থতা" হিসাবে ভাবতে পারেন - যেমন এর পূর্বাভাসের ত্রুটির মধ্যে কতটা স্প্রেড বিদ্যমান রয়েছে (দ্রষ্টব্য: যথার্থতাটি বৈকল্পিকের বিপরীত - উচ্চতর বৈকল্পিক = কম নির্ভুলতা)। এবং আপনি বায়াসকে মডেলটির পদ্ধতিগত ত্রুটি হিসাবে ভাবতে পারেন - যেমন সমস্ত ত্রুটির গড় মূল্য the "যথার্থতা" রচনাটি উভয়ের উভয়েরই একটি অস্পষ্ট সংমিশ্রণ এবং তাই প্রচুর বিভ্রান্তির সৃষ্টি করে।
nnot101
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.