অবশিষ্টাংশগুলি কি "পূর্বাভাস বিয়োগের প্রকৃত" বা "প্রকৃত বিয়োগের পূর্বাভাস" আছে


46

আমি "অবশিষ্টাংশগুলি" হ'ল "পূর্বাভাস বিয়োগ আসল মান" বা "প্রকৃত বিয়োগের পূর্বাভাসিত মান" বলে বিভিন্নভাবে সংজ্ঞায়িত দেখেছি। উদাহরণের উদ্দেশ্যে, উভয় সূত্রই বহুল ব্যবহৃত হয়েছে তা দেখাতে, নিম্নলিখিত ওয়েব অনুসন্ধানগুলির সাথে তুলনা করুন:

বাস্তবে, এটি প্রায় কোনও ক্ষেত্রেই তাত্পর্যপূর্ণ হয় না, যেহেতু অবিশ্বাস্যর অবশিষ্টাংশগুলির সাইন সাধারণত গুরুত্বপূর্ণ হয় না (যেমন তারা স্কোয়ারযুক্ত বা পরম মানগুলি নেওয়া হয়) values যাইহোক, আমার প্রশ্ন: এই দুটি সংস্করণের মধ্যে একটি (ভবিষ্যদ্বাণী প্রথম বনাম প্রকৃত প্রথম) "স্ট্যান্ডার্ড" হিসাবে বিবেচিত হয়? আমি আমার ব্যবহারের সাথে সামঞ্জস্য রাখতে চাই, সুতরাং যদি কোনও প্রতিষ্ঠিত প্রচলিত মান থাকে তবে আমি এটি অনুসরণ করতে পছন্দ করব। যাইহোক, যদি কোনও মান না থাকে তবে আমি উত্তর হিসাবে এটি গ্রহণ করে খুশি, যদি এটি দৃ conv়তার সাথে প্রমাণ করা যায় যে কোনও মানক সম্মেলন নেই।


8
যেহেতু অবশিষ্টাংশটি মডেলের ত্রুটির সাথে সংযুক্ত রয়েছে, আমরা যখন লিখি তখন এটি আমাদের মনে করে যে একটি "স্থির অংশ" প্লাস একটি "এলোমেলো অংশ" তাই বাকীটি হ'ল বিয়োগফল । y y a + b xy=a+bx+ϵyya+bx
অ্যাডমো

পূর্বঘোষিত বিয়োগ প্রকৃত বা প্রকৃত বিয়োগ পূর্বাভাস হবে ভবিষ্যদ্বাণী ত্রুটি (অথবা নেতিবাচক উহার), যখন লাগানো বিয়োগ প্রকৃত বা প্রকৃত বিয়োগ লাগানো অবশিষ্ট হবে (বা উহার নেতিবাচক)। স্টিফেন কোলাসার উত্তরে একটি কারণে পূর্বাভাসের ত্রুটির কথা উল্লেখ করা হয়েছে ।
রিচার্ড হার্ডি

আমি (পূর্বাভাস-বাস্তব) সাথে কাজ করা আরও সুবিধাজনক বলে মনে করি। প্রায়শই আপনাকে কিছু পরামিতিগুলির সাথে শ্রদ্ধার সাথে অবশিষ্টাংশের ডেরাইভেটিভগুলি গণনা করতে হবে। আপনি যদি (প্রকৃত-পূর্বাভাস) ব্যবহার করেন, তবে বিয়োগ চিহ্নগুলি প্রদর্শিত হবে যে আপনাকে অবশ্যই আপনার বাকি গণনাগুলি অবলম্বন করতে হবে, আরও বেশি বন্ধনী ব্যবহারের প্রয়োজন হবে, ডাবল নেতিবাচক ঘটনাগুলি উপস্থিত হওয়ার পরে তা বাতিল করার বিষয়টি নিশ্চিত করে রাখা উচিত এবং এরপরেও। আমার অভিজ্ঞতায় এটি আরও ত্রুটির দিকে পরিচালিত করে
নিক অ্যালগার

উত্তর:


42

অবশিষ্টাংশগুলি সর্বদা প্রকৃত বিয়োগের পূর্বাভাস হয়। মডেলগুলি হ'ল: are তাই, অবশিষ্টাংশগুলি are , যা ত্রুটির অনুমান : ε ε ε = Y - Y

y=f(x;β)+ε
ε^ε
ε^=yy^y^=f(x;β^)

আমি @ ভুবার সাথে একমত যে এই চিহ্নটি গাণিতিকভাবে সত্যই আসে না। যদিও এটি একটি সম্মেলন করা ঠিক। এবং বর্তমান সম্মেলনটি আমার জবাব হিসাবে রয়েছে।

যেহেতু ওপি এই বিষয়ে আমার কর্তৃত্বকে চ্যালেঞ্জ করেছে, তাই আমি কিছু উল্লেখ যুক্ত করছি:

  • " (২০০৮) অবশিষ্ট
  • ফিশার এর 1925 "রিসার্চ কর্মীদের জন্য পরিসংখ্যানগত পদ্ধতি", একই সংজ্ঞা খুব আছে, ধারা 26 দেখুন এই 1934 সংস্করণ । নির্দোষ শিরোনাম সত্ত্বেও, এটি historicalতিহাসিক প্রসঙ্গে একটি গুরুত্বপূর্ণ কাজ

3
আমি কিছু নমুনা ওয়েব অনুসন্ধান যুক্ত করতে আমার প্রশ্ন সম্পাদনা করেছি যা স্পষ্টভাবে দেখায় যে অবশিষ্টাংশগুলি সর্বদা প্রকৃত বিয়োগের পূর্বাভাস নয়; বিকল্পটিও প্রায়শই ঘন ঘন হয় - তাই আমার বিভ্রান্তি। আমার প্রশ্নটি হ'ল সঠিক কনভেনশনের কোনও অনুমোদনের ডকুমেন্টেশন রয়েছে, যা দুর্ভাগ্যক্রমে, আপনার উত্তর সরবরাহ করে না।
ত্রিপরিটো

5
আমার পড়া পর্যবেক্ষণে পূর্বাভাস হ'ল পরিসংখ্যানগুলিতে সর্বাধিক আধুনিক সম্মেলন। তবে এটি লক্ষণীয় যে গৌস বিপরীত সম্মেলনটি ব্যবহার করেছিলেন: স্বাভাবিকভাবে স্কোয়ারের অবশিষ্টাংশগুলি ন্যূনতম বর্গক্ষেত্র, বর্গাকার পরিমাণ বা গড় বর্গের প্রেক্ষাপটে একইভাবে হয়। যদিও 19 শতকের এবং পূর্বের নজিরগুলি পৃথক অবশিষ্টাংশগুলি দেখার জন্য রয়েছে, তবুও যত্ন নেওয়া এবং বিশেষত অবলম্বনকারী প্লটগুলি 1960 এর দশকের প্রথমদিকে ব্যাপক এবং রুটিন হয়ে উঠেনি। অর্থাত্, যখনই অবশিষ্টাংশের চিহ্নটি দেখা যায় তবে কারও কী প্রয়োজন তা যত্নশীল হওয়া দরকার।
নিক কক্স

18
+1 টি। অবশিষ্টাংশের ধারণাটি "একটি অবশিষ্টাংশ; যা পিছনে রয়েছে" থেকে আসে : অন্য কথায়, ভবিষ্যদ্বাণী করার পরে ডেটাতে যা থেকে যায় তার জন্য দায়বদ্ধ হয়। এটি পরামর্শ দেয় যে যে কেউ এই পরিমাণগুলির একটি "অবশিষ্টাংশ" নামকরণ করেছে তার মনে "ডেটা মান মাইনাস লাগানো মান"।
whuber

3
@ নিককক্স, আপনি দয়া করে উত্তর হিসাবে আপনার মন্তব্য একটি উত্তর হিসাবে আনুষ্ঠানিক করতে পারেন? আমার প্রশ্নটি প্রকৃতপক্ষে পরিসংখ্যান সম্পর্কে এতটা নয় যেমন এটি বৈজ্ঞানিক সম্মেলনের বিষয়ে, সুতরাং আপনার মন্তব্যে যে ধরণের historicalতিহাসিক এবং ব্যবহারের অন্তর্দৃষ্টি নির্দেশিত হয়েছে সেগুলি আমি যে ধরণের উত্তর খুঁজছি তা answers
ত্রিপরিটো

6
শব্দটি অবশিষ্ট, দীর্ঘ, দীর্ঘ সালাসবুর্গের পূর্বাভাস দেয়। আমাকে বলতে হবে যে তাঁর বইটি যদিও মাঝে মাঝে বিনোদনমূলক হলেও লেখক থেকে অনেক দূরে। আগ্রহী হলে আপনি বায়োমেট্রিক্স jstor.org/stable/3068274
নিক কক্স

22

আমি শুধু জুড়ে এসেছিল জোরালো এক কারণ হতে এক উত্তরের জন্য সঠিক অন্যতম।

রিগ্রেশন (এবং কোনও ধরণের সর্বাধিক পরিসংখ্যানের মডেলগুলি) কীভাবে প্রতিক্রিয়াটির শর্তাধীন বিতরণগুলি ব্যাখ্যাযোগ্য ভেরিয়েবলের উপর নির্ভর করে concern এই বিতরণগুলির বৈশিষ্ট্যটির একটি গুরুত্বপূর্ণ উপাদানটি কিছুটা পরিমাপ যা সাধারণত "স্কিউনেস" নামে পরিচিত (যদিও বিভিন্ন এবং বিভিন্ন সূত্রগুলি দেওয়া হয়ে থাকে): এটি প্রতিযোগিতার থেকে বহনকারী আকারটি সর্বাধিক প্রাথমিক উপায়টিকে বোঝায়। ইতিবাচকভাবে স্কিউড শর্তাধীন প্রতিক্রিয়া সহ দ্বিবিভক্ত ডেটা (একটি প্রতিক্রিয়া এবং একক ব্যাখ্যামূলক ভেরিয়েবল ) এর উদাহরণ এখানে রয়েছে :xyx

! [চিত্র 1: সর্বনিম্ন স্কোয়ার লাইনের একটি স্ক্র্যাপরপ্লট।

নীল বক্ররেখা সাধারণ ন্যূনতম স্কোয়ার ফিট fit এটি লাগানো মানকে প্লট করে।

যখন আমরা কোনও প্রতিক্রিয়া এবং এর লাগানো মান এর মধ্যে পার্থক্যটি গণনা করি , আমরা শর্তযুক্ত বিতরণের অবস্থানটি স্থানান্তর করি, তবে অন্যথায় এর আকার পরিবর্তন করি না। বিশেষত, এর skewness unaltered হবে।Yyy^

চিত্র 2: অবশিষ্টাংশ বনাম পূর্বাভাসিত মান।

এটি একটি স্ট্যান্ডার্ড ডায়াগোনস্টিক প্লট যা পরিবর্তিত শর্তাধীন বিতরণ কীভাবে পূর্বাভাসিত মানগুলির সাথে পরিবর্তিত হয় তা দেখায়। জ্যামিতিকভাবে, এটি পূর্ববর্তী স্ক্র্যাটারপ্লটকে "অবধি" প্রায় সমান।

পরিবর্তে আমরা যদি অন্য ক্রমের মধ্যে পার্থক্যটি গণনা করি, এটি স্থানান্তরিত হবে এবং তারপরে শর্তযুক্ত বিতরণের আকারটি বিপরীত করবে। এর স্কিউনেস আসল শর্তযুক্ত বিতরণের নেতিবাচক হবে।y^y,

চিত্র 3: অবশিষ্ট প্লটগুলি অবহেলিত

এটি পূর্ববর্তী চিত্র হিসাবে একই পরিমাণ দেখায়, কিন্তু অবশিষ্টাংশগুলি তাদের ফিট থেকে ডেটা বিয়োগ করে গণনা করা হয়েছে - অবশ্যই পূর্ববর্তী অবশিষ্টগুলি অবহেলা করার মতোই।

যদিও পূর্ববর্তী উভয় পরিসংখ্যান প্রতিটি ক্ষেত্রে গাণিতিকভাবে সমতুল্য - নীল দিগন্ত জুড়ে পয়েন্টগুলি ফ্লিপ করে একজনকে অন্যটিতে রূপান্তরিত করা হয় - তাদের মধ্যে একটি মূল প্লটের সাথে আরও সরাসরি প্রত্যক্ষ দৃশ্যধারণ সম্পর্ক বহন করে।

ফলস্বরূপ, যদি আমাদের লক্ষ্যটি অবশিষ্ট তথ্যগুলির বন্টনকারী বৈশিষ্ট্যগুলি মূল ডেটার বৈশিষ্ট্যের সাথে সম্পর্কিত করে - এবং প্রায় সর্বদা এটি হয় - তবে প্রতিক্রিয়াগুলি স্থানান্তরিত করার পরিবর্তে কেবল স্থানান্তর করা আরও ভাল।

সঠিক উত্তরটি পরিষ্কার: আপনার অবশিষ্টাংশগুলিকে হিসাবে গণনা করুনyy^.


1
আমি মনে করি না যে আমি এখানে স্কিউনেস সম্পর্কে বিশেষ কি তা অনুসরণ করি - মূল প্লটের সাথে মিলে যাওয়া অবশিষ্টাংশগুলি সম্পর্কে আপনার যুক্তি এখুনি নিজেই দাঁড়ায় না?
মাইকেলচিরিকো

2
@ মিশেল আপনি যথেষ্ট সঠিক স্কোইনেস পয়েন্টটি চিত্রিত করার জন্য দরকারী, কারণ এটি বিতরণকে তার নেতিবাচক আকার থেকে স্পষ্ট করে আলাদা করে দেয়।
whuber

10

গ্রিন অ্যান্ড তাশম্যান (২০০৮, দূরদর্শিতা ) পূর্বাভাস ত্রুটির জন্য অভিন্ন প্রশ্নে একটি ছোট জরিপের প্রতিবেদন। আমি তাদের দ্বারা প্রতিবেদন হিসাবে উভয় সম্মেলনের জন্য যুক্তি সংক্ষিপ্ত করব:

"প্রকৃত-পূর্বাভাস" জন্য যুক্তি

  1. পরিসংখ্যানগত কনভেনশন হ'ল ।y=y^+ϵ
  2. সিসমোলজির অন্তত একজন প্রতিক্রিয়া লিখেছেন যে এটি সিসমিক ওয়েভ ভ্রমণের সময় মডেলিংয়ের কনভেনশনও। "যখন মডেল দ্বারা পূর্বাভাসের পূর্বে আসল ভূমিকম্পের তরঙ্গ উপস্থিত হয় তখন আমাদের নেতিবাচক ভ্রমণের সময় অবশিষ্ট থাকে (ত্রুটি) থাকে।" ( sic )

  3. আমরা যদি বাজেট, পরিকল্পনা বা লক্ষ্য হিসাবে interpret ব্যাখ্যা করি তবে এই কনভেনশনটি । এখানে, ইতিবাচক ত্রুটির অর্থ হল বাজেট / পরিকল্পনা / লক্ষ্যকে ছাড়িয়ে গেছে।y^

  4. এই কনভেনশনটি ক্ষতিকারক স্মুথ করার সূত্রগুলিকে কিছুটা স্বজ্ঞাত করে তোলে । আমরা একটি চিহ্ন ব্যবহার করতে পারি । অন্যান্য সম্মেলনের সাথে সাথে, আমাদের একটি চিহ্ন ব্যবহার করতে হবে ।+

"পূর্বাভাস-আসল" পক্ষে যুক্তি

  1. যদি তবে একটি ইতিবাচক ত্রুটি ইঙ্গিত দেয় যে পূর্বাভাসটি খুব বেশি ছিল। এটি কনভার্সের চেয়ে স্বজ্ঞাত।y=y^ϵ

    সম্পর্কিত, যদি কোনও ধনাত্মক পক্ষপাতটিকে ইতিবাচক প্রত্যাশিত ত্রুটি হিসাবে সংজ্ঞায়িত করা হয় তবে এর অর্থ এই হবে যে এই সম্মেলনের সাথে পূর্বাভাস গড়ে খুব বেশি।

    এবং এটি এই সম্মেলনের জন্য দেওয়া একমাত্র যুক্তি। তারপরে আবারও ভুল বোঝাবুঝির কারণে অন্যান্য সম্মেলন হতে পারে (ইতিবাচক ত্রুটিগুলি = খুব কম পূর্বাভাস), এটি একটি শক্তিশালী।

শেষ পর্যন্ত, আমি যুক্তি দিয়ে বলব যে আপনার অবশেষে কার সাথে যোগাযোগ করতে হবে তা আপনার কাছে নেমে আসে। এবং প্রদত্ত যে এই আলোচনার অবশ্যই দুটি পক্ষ রয়েছে, আপনি কোন সম্মেলনটি অনুসরণ করেন তা স্পষ্টভাবে লক্ষ করা বোধগম্য।


7
আকর্ষণীয় বিষয়, তবে যখনই কেউ "স্বজ্ঞাত" বলেন আমি সেই অনুবাদটি "আমার সাথে পরিচিত" হিসাবে অনুবাদ করি এবং অনুবাদটি প্রায়শই বেশি দৃ .়প্রত্যয়ী হয় এবং কখনও কম হয় না। এটি চেষ্টা করে দেখুন: আইনস্টাইন শীর্ষ সম্মেলন স্বজ্ঞাত। আপনি যখন অভ্যস্ত হয়ে উঠবেন কেবল তখনই। ঘড়ির কাঁটার বিপরীতে অক্ষ থেকে কোণগুলি পরিমাপ করা স্বজ্ঞাত। ভূগোলবিদ বা যে কেউ সমন্বয় জ্যামিতি অধ্যয়নের আগে কোনও কম্পাস ব্যবহার করতে শিখেছে তাদের নয়। x
নিক কক্স

3
@ নিককক্স: বিমূর্তভাবে, আপনি ঠিক বলেছেন। তবে, একটি বিশাল সংখ্যক লোককে নিয়ে তাদের জিজ্ঞাসা করুন: "আজকের তাপমাত্রার আবহাওয়ার পূর্বাভাসে একটি বড় ইতিবাচক ত্রুটি ছিল had আপনি কি বিশ্বাস করেন যে পূর্বাভাসটি (এ) খুব বেশি বা (বি) খুব কম ছিল ?" আমি মনে করি আমি পূর্বাভাস দিতে পারি যে (ক) বা (বি) একটি অপ্রতিরোধ্য সংখ্যাগরিষ্ঠ চয়ন করবে।
এস। কোলাসা - মনিকা

6
হ্যাঁ - এবং যদি আপনি ফ্রেজ ছিল যে হিসাবে প্রশ্ন "তোমরা কি বিশ্বাস কর তাপমাত্রা (ক) ছিল উচ্চতর বা (খ) কম পূর্বাভাস চেয়ে," তুমি ভাল করেই ঠিক প্রাপ্ত পারে বিপরীত উত্তর! একটি "ইতিবাচক ত্রুটি" উল্লেখ করা কেবল "ত্রুটিটি কী" এর প্রশ্ন উত্থাপন করে এবং এটি আমাদের - পুরোপুরি বিজ্ঞপ্তিতে - আসল প্রশ্নে ডেকে আনে।
whuber

2
@ যে প্রশ্নটি যদিও এটি একটি বরং অপ্রাকৃত phra "পর্যবেক্ষণ করা" "স্থির" হিসাবে দেওয়া, এটির সাথে মডেলটির সম্পর্ক অন্য চারপাশের চেয়ে প্রাকৃতিক বলে মনে হয়। "গতির সীমা আমার গতির নীচে ছিল" এর পরিবর্তে খুব দ্রুত যাওয়ার জন্য আমি দ্রুত গতির টিকিট পাই। প্রাকৃতিক ভাষার যুক্তিগুলির অবশ্যই প্রযুক্তিগত শর্তাদি / ভাষার ক্ষেত্রে সীমাবদ্ধ প্রয়োগ রয়েছে যদিও
এমবিআরআইবি

2
@ শুভ আমি যা বলছি তা হ'ল প্রশ্নটি বানানোর একটি উপায় পরিষ্কারভাবে আরও প্রাকৃতিক (কমপক্ষে ইংরেজিতে)।
এমবিআরিগ

4

বিভিন্ন পরিভাষা বিভিন্ন সম্মেলনের পরামর্শ দেয়। "রেসিডুয়াল" শব্দটি বোঝায় যে সমস্ত ব্যাখ্যামূলক ভেরিয়েবলগুলি অ্যাকাউন্টে নেওয়ার পরে যা অবশিষ্ট ছিল, অর্থাত্ প্রকৃত-পূর্বাভাস। "ভবিষ্যদ্বাণী ত্রুটি" বোঝায় যে এটি ভবিষ্যদ্বাণীটি প্রকৃত অর্থাত্ ভবিষ্যদ্বাণী-প্রকৃত থেকে কতটা বিচ্যুত হয়।

মডেলিংয়ের ক্ষেত্রে কারও ধারণাটি প্রভাবিত করে যে কোন কনভেনশনটি বেশি প্রাকৃতিক। ধরুন আপনি এক বা একাধিক বৈশিষ্ট্য কলাম সহ একটি dataframe আছে , প্রতিক্রিয়া কলাম , এবং Prediction কলাম ।X=x1,x2...yy^

একটি ধারণাটি হ'ল হ'ল "আসল" মান এবং কেবল একটি রূপান্তরিত সংস্করণ । এই ধারণায়, এবং উভয়ই এলোমেলো পরিবর্তনশীল ( একটি উদ্ভূত উদ্ভূত)। যদিও এক আসলে আমরা প্রতি আগ্রহ দেখিয়েছেন হয়, এক আমরা মান্য করতে পারেন, তাই হয় এর জন্য একটি প্রক্সি হিসাবে ব্যবহার করা হয় । "ত্রুটি" কত হয় এই "সত্য" মান থেকে বিচ্যুত । এটি এই বিচ্যুতির দিক অনুসরণ হিসাবে ত্রুটি সংজ্ঞায়িত করার পরামর্শ দেয়, যেমন ।yy^Xyy^y^yy^y^yy^ye=y^y

তবে, আরও একটি ধারণা আছে যা কে "আসল" মান বলে মনে করে। অর্থাত্, কিছু নির্মূল প্রক্রিয়ার মাধ্যমে y উপর নির্ভর করে ; একটি নির্দিষ্ট রাজ্য একটি নির্দিষ্ট নির্বিচার মানের জন্ম দেয়। এই মানটি তখন কিছু এলোমেলো প্রক্রিয়া দ্বারা বিভ্রান্ত হয়। সুতরাং আমাদের কাছে । এই ধারণায়, হ'ল "আসল" মান। উদাহরণস্বরূপ, ধরুন আপনি মাধ্যাকর্ষণজনিত কারণে জি এর মান, ত্বরণকে গণনা করার চেষ্টা করছেন। আপনি একগুচ্ছ বস্তু ফেলে দিন, আপনি মাপলেন যে তারা কতটা দূরে পড়েছিলেন ( ) এবং তাদের পড়তে কত সময় লেগেছিল ( )। তারপরে আপনি y = model মডেলটি দিয়ে ডেটা বিশ্লেষণ করুনy^XXxf(X)f(X)+error()y^Xy2xg। আপনি দেখতে পাচ্ছেন যে জি এর কোনও মান নেই যা এই সমীকরণটি ঠিকঠাক করে তোলে। সুতরাং আপনি এই হিসাবে মডেল

y^=2xg
y=y^+error

অর্থাৎ আপনি পরিবর্তনশীল Y গ্রহণ করা এবং একটি "বাস্তব" মান সেখানে হতে বিবেচনা হয় যে আসলে শারীরিক আইন দ্বারা উত্পন্ন হচ্ছে, এবং তারপর কিছু অন্যান্য মান হল যে কিছু স্বাধীন দ্বারা পরিবর্তন যেমন পরিমাপ ত্রুটি বা বায়ু gusts বা যাই হোক না কেন।y^yy^X

এই ধারণায়, আপনি y = reality বাস্তবতা "কী" করা উচিত তা হওয়ার জন্য নিচ্ছেন এবং যদি আপনি উত্তর পেয়ে থাকেন যা এর সাথে একমত নয় তবে ভাল, বাস্তবতা পেয়েছে ভুল উত্তর. এই উপায়টি রাখার সময় এখন অবশ্যই এটি নির্বোধ এবং অহঙ্কারী বলে মনে হতে পারে তবে এই ধারণাটি চালিয়ে নেওয়ার জন্য ভাল কারণ রয়েছে এবং এটি এইভাবে চিন্তা করা কার্যকর হতে পারে। এবং শেষ পর্যন্ত, এটি কেবল একটি মডেল; পরিসংখ্যানবিদরা অগত্যা মনে করেন না যে এটি আসলে পৃথিবী কীভাবে কাজ করে (যদিও সম্ভবত এমন কিছু রয়েছে যারা করেন)। এবং সমীকরণটি দেওয়া হয়েছে , এটি অনুসরণ করে যে ত্রুটিগুলি প্রকৃত বিয়োগের পূর্বাভাস।2xgy=y^+error

এছাড়াও মনে রাখবেন যে আপনি যদি দ্বিতীয় ধারণার "বাস্তবতাটি ভুল পেয়েছে" দিকটি পছন্দ না করেন তবে আপনি এটি হিসাবে দেখতে পারেন "আমরা এমন কিছু প্রক্রিয়া চিহ্নিত করেছি যার মাধ্যমে y উপর নির্ভর করে তবে আমরা পাচ্ছি না ঠিক সঠিক উত্তর, সুতরাং অবশ্যই কিছু অন্যান্য প্রক্রিয়া জি থাকতে পারে যা y কেও প্রভাবিত করে। " এই প্রকরণে,X

Y= Y + +(?)=Y - Yy^=f(X)
y=y^+g(?)
g=yy^


4

@ আকসাকালের উত্তর সম্পূর্ণ সঠিক, তবে আমি কেবল একটি অতিরিক্ত উপাদান যুক্ত করব যা আমার (এবং আমার শিক্ষার্থীদের) সাহায্য করে।

মূলমন্ত্র: পরিসংখ্যান "নিখুঁত"। হিসাবে, আমি সর্বদা নিখুঁত পূর্বাভাস সরবরাহ করতে পারি (আমি জানি কিছু চক্ষু-ব্রাউজ এই মুহূর্তে উত্থাপন করছে ... সুতরাং আমাকে শুনুন)।

আমি আমার পর্যবেক্ষণকৃত মানগুলি পূর্বাভাস দিতে যাচ্ছি । কিছু রূপের মডেল সহ, আমি প্রতিটি পর্যবেক্ষণকৃত মানের জন্য একটি পূর্বাভাসযুক্ত মান উত্পন্ন করব, আমি বলব । একমাত্র সমস্যাটি হ'ল সাধারণত (সর্বদা) সুতরাং, আমরা একটি নতুন পরিবর্তনশীল যুক্ত করব যাতে সাম্যতা ধরে থাকে ... তবে আমার কাছে মনে হয় এর চেয়ে ভাল বিকল্পটি এটি যুক্ত করা to আমাদের "পূর্বাভাসীকৃত" ("তৈরি") মানটিকে আসল মানটিতে যুক্ত করার পরিবর্তে (প্রকৃত মান থেকে যোগ বা বিয়োগ যেমন শারীরিকভাবে সম্ভব না হয় ... নীচের মন্তব্য দেখুন): এখন, আমাদের কাছে "নিখুঁত" ভবিষ্যদ্বাণী রয়েছে ... আমাদের "চূড়ান্ত" মানটি আমাদের পর্যবেক্ষণের মানের সাথে মেলে।Y আমি Y আমিY আমি ε আমি Y আমি = Y আমি + + ε আমিyiy^i

yiy^i
ϵi
yi=y^i+ϵi

স্পষ্টতই, এটি যা চলছে তা অন্তর্নিহিত পরিসংখ্যানগত তত্ত্বের এক বিশাল পরিমাণের উপর দিয়ে সজ্জিত ... তবে এটি এই ধারণার উপর জোর দেয় যে পর্যবেক্ষণকৃত মানটি দুটি স্বতন্ত্র অংশের একটি সংশ্লেষ (একটি নিয়মতান্ত্রিক অংশ এবং একটি এলোমেলো অংশ)। আপনি এই ফর্মটি এটা মনে রাখবেন, আপনি সবসময় যে অবশিষ্ট থাকবে , পর্যবেক্ষিত বিয়োগ পূর্বাভাস নেই।ϵi


2
অনেক সময়, যখন এটি অন্যভাবে লেখা হয়, , এটি প্রায়শই এমন কিছু গণনার সাথে জড়িত থাকে যা চিহ্নটি জড়িত করে না (যেমন আপনি যখন অবশিষ্টাংশের বা পরের অংশগুলির সাথে নিরঙ্কুশতার সাথে কাজ করছেন) )। y^iyi
গ্রেগ এইচ

6
"কেন এটি আমাদের পূর্বাভাসিত মানটিতে যুক্ত করা ভাল"? "আমাদের ভবিষ্যদ্বাণীটির সাথে একমত হওয়ার জন্য ডেটামকে কতটা সামঞ্জস্য করা দরকার তা দেখুন না" কেন? কোনও পদ্ধতিরই অপরটির চেয়ে বেশি স্পষ্ট, অর্থবহ বা "স্বজ্ঞাত" বলে দাবি রয়েছে বলে মনে হয় না।
whuber

2
@ এক আইটেমটি "রিয়েল" (পর্যবেক্ষণ, কংক্রিট), অন্যটি হ'ল (অনুমান) যদি আমরা ওজনের উপর ভিত্তি করে উচ্চতার মডেলিং করছিলাম, তবে someone ইঞ্চি দ্বারা কাউকে কেবল "সংকুচিত" করা কি তার প্রকৃত / পর্যবেক্ষিত উচ্চতার সাথে কিছু (কাল্পনিক) পূর্বাভাসের মানের সাথে মিলিয়ে দেওয়া যুক্তিসঙ্গত হবে?
গ্রেগ এইচ

2
হ্যাঁ - এটি ডেটা নিয়ে চিন্তা করার একটি সাধারণ উপায়। আমি কেবল এই সম্ভাবনাটিই দেখানোর চেষ্টা করছি যে লোকেরা কীভাবে এই প্রশ্নটি উপলব্ধি করবে এবং "সেরা" এর অর্থ বুঝতে পারে সে সম্পর্কে আপনার অনুমানগুলি অনুমানমূলক এবং বিষয়গত হতে পারে।
whuber

ফেয়ার পয়েন্ট ... সংক্ষিপ্ত মন্তব্যে আপডেট হবে
গ্রেগ এইচ

2

আমি সর্বনিম্ন স্কোয়ারের লিনিয়ার রিগ্রেশন এর বিশেষ ব্যবহার করতে যাচ্ছি। যদি আমরা আমাদের মডেলটিকে হিসাবে গ্রহণ করি তবে @ অ্যাক্সকলের উল্লেখ হিসাবে আমরা স্বাভাবিকভাবেই তাই । পরিবর্তে যদি আমরা আমাদের মডেল হিসাবে গ্রহণ করি, যা আমরা অবশ্যই নির্দ্বিধায় মুক্ত হয়ে থাকি তবে আমরা টু পেয়ে থাকি । এই মুহুর্তে ওভার জন্য অস্পষ্ট পছন্দকে বাদ দিয়ে অন্যের চেয়ে বেশি পছন্দ করার কোনও কারণ নেই ।Y=Xβ+εε=YXβε^=YY^Y=Xβεε=XβYε^=Y^Y11

তবে যদি তবে আমরা আমাদের অবশিষ্টাংশগুলি মাধ্যমে , যেখানে একটি আদর্শ আদর্শ ম্যাট্রিক্স যা ডিজাইনের ম্যাট্রিক্স কলাম স্পেসে অ প্রজেক্ট করে । আমরা যদি এর পরিবর্তে তবে আমরা । তবে নিজেই । সুতরাং সত্যিই একটি প্রোজেকশন ম্যাট্রিক্সের নেতিবাচক, যথা । সুতরাং আমি এটিকে ব্যবহার করে চালু হওয়া নেতিবাচকটিকে পূর্বাবস্থায়ী হিসাবে দেখছি , সুতরাং পার্সিমনিটির জন্য কেবল ব্যবহার করা ভাল betterε^=YY^(IPX)YIPXXY=Xβεε^=(PXI)YPXIপি এক্স - আমি আমি - পি এক্স ওয়াই = এক্স β - ε ওয়াই = এক্স β + + ε ওয়াই - ওয়াই(PXI)2=PX22PX+I=(PXI)PXIIPXY=XβεY=Xβ+ε যা পরিবর্তিত হিসাবে আমাদের দেয় ।YY^

অন্যত্র যেমন উল্লেখ করা হয়েছে এটা কোন কিছুই বিরতি মত নয় যদি আমরা ব্যবহার , কিন্তু আমরা এই ডবল নেতিবাচক অবস্থা যা আমি মনে করি শুধু ব্যবহার করার জন্য একটি ভাল যথেষ্ট কারণ নেই দিয়ে শেষ ।ওয়াই - ওয়াইY^YYY^


কিন্তু লেখার কিছু নির্দিষ্ট মান লক্ষণ সঙ্গে কিছুই করার আছে কোনো লেখা বাদ দিয়েও অঙ্গীকার বা ধৃষ্টতা যে বা বাস্তবে ইতিবাচক হয়। এটি একই সমীকরণ হতে পারে তবে সাইন ইন বিপরীতে। y = β 0 + β 1 এক্স β 0 β 1+eey=β0+β1xβ0β1e
নিক কক্স

@ নিককক্স আপনার মন্তব্যের জন্য আপনাকে ধন্যবাদ জানায়, আমি বুঝতে পেরেছিলাম যে আমরা আমাদের মডেল ps ওয়ারেপসিলন লিখতে চাই এই ধারণায় আমার উত্তরটি পূর্বাভাস দিয়েছিলাম । আমি এটিকে Y=Xβ+ε
সম্বোধন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.