আমি ডেটা বিশ্লেষণের ক্লাসে যোগ দিচ্ছি এবং আমার কয়েকটি ভাল-ধারণা ধারণাকে কাঁপানো হচ্ছে। যথা, ত্রুটি (এপসিলন) এবং সেই সাথে অন্য কোনও প্রকারের ধারণাগুলি কেবলমাত্র (তাই আমি ভেবেছিলাম) একটি গোষ্ঠীতে (একটি নমুনা বা পুরো জনসংখ্যা) প্রয়োগ করে। এখন, আমাদের শিখানো হচ্ছে যে রিগ্রেশন অনুমানগুলির মধ্যে একটি হ'ল বৈচিত্রটি "সমস্ত ব্যক্তির জন্য সমান"। এটি আমার কাছে একরকম হতবাক। আমি সবসময়ই ভেবেছিলাম যে এক্স এর সমস্ত মান জুড়েই এটি ওয়াইয়ের বিভিন্নতা যা ধ্রুবক হিসাবে ধরে নেওয়া হয়েছিল।
আমি প্রফেসরের সাথে চ্যাট করেছি, যিনি আমাকে বলেছিলেন যে আমরা যখন রিগ্রেশন করি তখন আমরা আমাদের মডেলটিকে সত্য বলে ধরে নিই। এবং আমি মনে করি এটি জটিল অংশ। আমার কাছে, ত্রুটি শব্দটি (এপসিলন) সবসময় "কিছু উপাদান যা আমরা জানি না এবং এটি আমাদের পরিণতি পরিবর্তনশীল, এবং কিছু পরিমাপের ত্রুটিকে প্রভাবিত করতে পারে" এর মতো কিছু বোঝায়। যেভাবে ক্লাসটি শেখানো হয়, সেখানে "অন্যান্য জিনিস" বলে কিছুই নেই; আমাদের মডেল সত্য এবং সম্পূর্ণ বলে ধরে নেওয়া হয়। এর অর্থ হ'ল সমস্ত অবশিষ্টাংশের প্রকরণকে পরিমাপের ত্রুটির একটি পণ্য হিসাবে বিবেচনা করতে হবে (এইভাবে, কোনও ব্যক্তিকে 20 বার পরিমাপের সময় 20 ব্যক্তিকে এক বার পরিমাপ করার মতো একই বৈচিত্র্য তৈরি করা আশা করা যায়)।
আমি কোথাও কোথাও ভুল অনুভব করছি, আমি এ সম্পর্কে কিছু বিশেষজ্ঞের মতামত রাখতে চাই ... ত্রুটি শব্দটি ধারণাগতভাবে বলতে গেলে কী তা বোঝার জন্য কিছু জায়গা আছে?