উত্তরটি হ'ল না , কারণ পক্ষপাত এবং প্রকরণটি মডেল প্যারামিটারগুলির বৈশিষ্ট্য, পরিবর্তে তাদের হিসাবের জন্য ব্যবহৃত ডেটা। সেই বক্তব্যটির একটি আংশিক ব্যতিক্রম রয়েছে যা পূর্বাভাসকারী স্থানের মাধ্যমে পক্ষপাত এবং বৈচিত্র্য পরিবর্তিত (হ্যাঁ!) এর সাথে সম্পর্কিত; নীচে যে আরও। নোট করুন যে ভবিষ্যদ্বাণীকারী এবং প্রতিক্রিয়া ভেরিয়েবল সম্পর্কিত কিছু "সত্য" ফাংশন জানার সাথে এর পুরোপুরি কিছুই করার নেই।
হিসেব বিবেচনা রৈখিক রিগ্রেশনের মধ্যে , যেখানে একটি হল ভবিষ্যতবক্তা ম্যাট্রিক্স, একটি হল পরামিতি অনুমান ভেক্টর, এবং একটি প্রতিক্রিয়াগুলির একটি ভেক্টর। আসুন তর্কের পক্ষে ধরে নেওয়া যাক যে আমাদের কাছে অঙ্কনের মতো অগণিত জনসংখ্যা রয়েছে (এটি পুরোপুরি হাস্যকর নয়, যাইহোক - যদি আমরা কিছু শারীরিক প্রক্রিয়া থেকে সক্রিয়ভাবে ডেটা রেকর্ড করতাম তবে আমরা দ্রুত হারে ভবিষ্যদ্বাণী এবং প্রতিক্রিয়া ডেটা রেকর্ড করতে পারতাম , এভাবে ব্যবহারিকভাবে এই অনুমানটি সন্তুষ্ট করা)। সুতরাং আমরা পর্যবেক্ষণগুলি আঁকব , প্রতিটি একক প্রতিক্রিয়ার মান এবং এর প্রতিটিটির জন্য একটি মানββ^=(XTX)−1XTYXN×Pβ^P×1YN×1NP ভবিষ্যদ্বাণী। তারপরে আমরা আমাদের অনুমান গণনা এবং মানগুলি রেকর্ড করি। আসুন আমরা এই পুরো প্রক্রিয়াটি গ্রহণ করি এবং এটি বার পুনরাবৃত্তি করি , প্রতিবার জনসংখ্যার থেকে আলাদা করে তোলে । আমরা অনুমানগুলি জমা করব যার উপর দিয়ে আমরা প্যারামিটার ভেক্টরের প্রতিটি উপাদানের বৈচিত্র গণনা করতে পারি। নোট করুন যে এই প্যারামিটার অনুমানের বৈকল্পিকটি পূর্বাভাসীদের অরথোগোনালটি ধরে ধরে উল্টোভাবে আনুপাতিক সমানুপাতিক এবং সমানুপাতিক ।β^NiterNNiterβ^NP
প্রতিটি প্যারামিটারের পক্ষপাতটি একইভাবে অনুমান করা যায়। যদিও আমাদের "সত্য" ফাংশনে অ্যাক্সেস নাও থাকতে পারে, ধরে নেওয়া যাক আমরা গণনা করার জন্য জনসংখ্যার থেকে নির্বিচারে বড় অঙ্কন করতে পারি , যা "সত্য" পরামিতি মানের জন্য প্রক্সি হিসাবে কাজ করবে । আমরা ধরে নেব যে এটি নিরপেক্ষ অনুমান (সাধারণ সর্বনিম্ন স্কোয়ার) এবং ব্যবহার করা পর্যবেক্ষণের সংখ্যাটি যথেষ্ট পরিমাণে এত বেশি যে এই অনুমানের বৈচিত্রটি নগন্য। প্রত্যেকের জন্য পরামিতি, আমরা কম্পিউট , যেখানে থেকে রেঞ্জ থেকে । আমরা এই পার্থক্যগুলির গড়টিকে সংশ্লিষ্ট প্যারামিটারের পক্ষপাতের অনুমান হিসাবে নিই।β^bestPβ^bestj−β^jj1Niter
উপাত্তের সাথে পক্ষপাত এবং বৈকল্পিক সম্পর্কিত সম্পর্কিত উপায় রয়েছে তবে তারা কিছুটা জটিল। আপনি দেখতে পাচ্ছেন যে লিনিয়ার মডেলগুলির জন্য পক্ষপাত এবং বৈকল্পিক অনুমান করা যেতে পারে তবে আপনার বেশ কয়েকটি হোল্ড-আউট ডেটা লাগবে। আরও কুখ্যাত সমস্যাটি হ'ল সত্য যে আপনি একবারে কোনও নির্দিষ্ট ডেটাसेट নিয়ে কাজ শুরু করার পরে, আপনার বিশ্লেষণগুলি আপনার ব্যক্তিগত বৈচিত্র দ্বারা দূষিত হয়ে যাবে , আপনি ইতিমধ্যে কাঁটা পথের বাগানে ঘুরে বেড়াতে শুরু করেছেন এবং কীভাবে তা জানার উপায় নেই knowing বহির্মুখী নমুনাটির প্রতিলিপি তৈরি করবে (যদি না আপনি কেবলমাত্র একটি একক মডেল নিয়ে এসেছেন এবং এই বিশ্লেষণ চালিয়েছেন এবং এটির পরে এটি একা রেখে যাওয়ার প্রতিশ্রুতিবদ্ধ) না।
ডেটাগুলির বিষয়গুলি নিজেরাই নির্দেশ করে, সর্বাধিক সঠিক (এবং তুচ্ছ) উত্তরটি হ'ল যদি এবং between between এর মধ্যে কোনও পার্থক্য থাকেYY^, আপনার আরও জটিল মডেল প্রয়োজন (ধরে নিচ্ছেন যে আপনি সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণীকে সঠিকভাবে সনাক্ত করতে পারেন; আপনি পারবেন না)। "ত্রুটি" এর দার্শনিক প্রকৃতির উপর বিরক্তিকর কোনও গ্রন্থে না গিয়ে নীচের লাইনটি এমন কিছু ঘটেছিল যা আপনার মডেলটির চিহ্নটি হারিয়ে ফেলল। সমস্যাটি হ'ল জটিলতা যুক্তকরণের ফলে বৈকল্পিকতা বৃদ্ধি পায় যা এটি অন্যান্য ডেটার পয়েন্টগুলিতে চিহ্নটি মিস করতে পারে। অতএব, পৃথক ডেটা পয়েন্ট পর্যায়ে ত্রুটিযুক্তি সম্পর্কে উদ্বেগ প্রকাশ করা কোনও ফলস্বরূপ প্রচেষ্টা হওয়ার সম্ভাবনা নেই। ব্যতিক্রম (প্রথম অনুচ্ছেদে উল্লিখিত) থেকে দেখা যায় যে পক্ষপাত এবং বৈকল্পিকতা আসলে ভবিষ্যদ্বাণীকারীদের নিজস্ব ফাংশন, তাই আপনার কাছে ভবিষ্যদ্বাণীকারী জায়গার এক অংশে বড় পক্ষপাত এবং অন্যটিতে ছোট পক্ষপাত থাকতে পারে (বৈকল্পিকতার জন্য একই)।Y−Y^অনেক সময় (যেখানে এবং উপর ভিত্তি করে অনুমান করা হয়নি ) এবং এর মানগুলির কার্যকারিতা হিসাবে এর পক্ষপাত (গড়) এবং বৈকল্পিকের পরিকল্পনা করা হয় । যাইহোক, আমি মনে করি এটি একটি বিশেষ বিশেষজ্ঞ উদ্বেগ।Y^=Xβ^β^ YX