টাইম সিরিজের মডেলগুলিতে আর-স্কোয়ার ব্যবহারে সমস্যা কী?


12

আমি পড়েছি যে টাইম সিরিজের জন্য আর-স্কোয়ার ব্যবহার করা উপযুক্ত নয় কারণ একটি সময়ের সিরিজের প্রসঙ্গে (আমি জানি যে অন্যান্য প্রসঙ্গ আছে) আর-স্কোয়ার আর অনন্য নয় unique কেন? আমি এটি সন্ধান করার চেষ্টা করেছি, কিন্তু কিছুই পাইনি। সাধারণত আমি যখন আমার মডেলগুলি মূল্যায়ন করি তখন আমি আর-স্কোয়ার্ড (বা অ্যাডজাস্টেড আর-স্কোয়ার্ড) তে খুব বেশি মূল্য রাখি না, তবে আমার অনেক সহকর্মী (অর্থাৎ বিজনেস মেজর) আর-স্কোয়ারের সাথে একেবারে প্রেমে আছেন এবং আমি সক্ষম হতে চাই তাদেরকে ব্যাখ্যা করুন কেন সময় সিরিজের প্রেক্ষিতে আর-স্কোয়ার উপযুক্ত নয়।


3
গুগল অনুসন্ধান: "একোমেট্রিক্সে উত্সাহী রিগ্রেশন"। অথবা গ্রেঞ্জার এবং নিউবোল্ডের কাগজটি পরীক্ষা করে দেখুন । অন্যরা উত্তরে আরও বিশদ সরবরাহ করতে পারে।
গ্রেম ওয়ালশ

@ রিচার্ড হার্ডি আপনি দয়া করে বিস্তারিত বলতে পারেন "যদি আমরা জনসংখ্যার অংশের একটি পরিমাপ হিসাবে নমুনা আর 2 গ্রহণ করি তবে এটি সংহত সময় সিরিজের অধীনে ভেঙে যায়।"
সিদ্ধার্থ কৃষ্ণমূর্তি

উত্তর:


18

ইস্যুটির কয়েকটি দিক:

যদি কেউ আমাদের সংখ্যার ভেক্টর দেয় y এবং সংখ্যার একটি মতামতী ম্যাট্রিক্স X, চিকিত্সা করে কিছু অনুমান বীজগণিত সম্পাদন করার জন্য তাদের মধ্যকার সম্পর্ক কী তা আমাদের জানতে হবে না yনির্ভরশীল পরিবর্তনশীল হিসাবে। এই সংখ্যাগুলি ক্রস-বিভাগীয় বা সময় সিরিজ বা প্যানেল ডেটা উপস্থাপন করে বা ম্যাট্রিক্স নির্বিশেষে, বীজগণিতের ফলাফল হবেX এর পিছনে থাকা মানগুলি রয়েছে y প্রভৃতি

সংকল্পের সহগের মৌলিক সংজ্ঞা R2 হয়

R2=1SSresSStot

কোথায় SSres কিছু অনুমান পদ্ধতি থেকে বর্গাকার অবশিষ্টাংশের যোগফল এবং SStot এটির নমুনা গড় থেকে নির্ভরশীল ভেরিয়েবলের স্কোয়ার বিচ্যুতির যোগফল।

সংমিশ্রণ, R2একটি নির্দিষ্ট ডেটা নমুনার জন্য, ভেরিয়েবলের মধ্যে সম্পর্কের একটি নির্দিষ্ট সূত্র, এবং একটি নির্দিষ্ট অনুমানের পদ্ধতির জন্য সর্বদা অনন্যভাবে গণনা করা হবে, কেবলমাত্র অনুমান পদ্ধতিটি শর্ত সাপেক্ষে এটি জড়িত অজানা পরিমাণের বিন্দু অনুমান সরবরাহ করে ( এবং অতএব নির্ভরশীল পরিবর্তনশীলগুলির অনুমানগুলি নির্দেশ করে এবং সুতরাং অবশিষ্টাংশগুলির অনুমানগুলি নির্দেশ করে)। যদি এই তিনটি দিকের কোনও পরিবর্তন হয় তবে এর গাণিতিক মানR2 সাধারণ পরিবর্তন হবে - তবে এটি কেবল টাইম-সিরিজ নয়, কোনও ধরণের ডেটা ধরে রাখে।

তাই বিষয়টি নিয়ে R2এবং সময়-সিরিজ, এটি "অনন্য" কিনা তা নয় (যেহেতু সময়-সিরিজের ডেটার জন্য সর্বাধিক অনুমানের পদ্ধতিগুলি বিন্দুর অনুমান সরবরাহ করে)। সমস্যাটি হল "সাধারণ" সময় সিরিজের স্পেসিফিকেশন কাঠামোটি প্রযুক্তিগতভাবে বন্ধুত্বপূর্ণ কিনা isR2, এবং কিনা R2 কিছু দরকারী তথ্য সরবরাহ করে।

এর ব্যাখ্যা R2যেহেতু "নির্ভরশীল ভেরিয়েবলের অনুপাত ব্যাখ্যা করা হয়েছে" অবশিষ্টাংশগুলিতে শূন্য পর্যন্ত যুক্ত হওয়ার উপর নির্ভর করে। লিনিয়ার রিগ্রেশন (যেকোন প্রকারের ডেটা নিয়ে) এবং সাধারণ স্বল্প স্কোয়ারের অনুমানের প্রসঙ্গে, স্পেসিফিকেশনটিতে রেজিস্ট্রার ম্যাট্রিক্সের একটি ধ্রুবক শব্দ অন্তর্ভুক্ত থাকলে (সময়-সিরিজের পরিভাষায় "" ড্রিফ্ট ") কেবল এটির গ্যারান্টিযুক্ত। অটোরিগ্রেসিভ টাইম-সিরিজের মডেলগুলিতে, একটি প্রবাহ অনেক ক্ষেত্রে অন্তর্ভুক্ত থাকে না।

আরও সাধারণভাবে, যখন আমরা সময়-সিরিজের ডেটার মুখোমুখি হই, "স্বয়ংক্রিয়ভাবে" আমরা কীভাবে সময়-সিরিজ ভবিষ্যতে বিবর্তিত হবে তা নিয়ে ভাবতে শুরু করি। সুতরাং আমরা অতীতের মূল্যবোধগুলির তুলনায় এটি কতটা ভাল ফিট করে তার চেয়ে ভবিষ্যতের মানগুলি কতটা ভালভাবে ভবিষ্যদ্বাণী করে তার উপর ভিত্তি করে একটি টাইম-সিরিজ মডেলকে মূল্যায়ন করার প্রবণতা করি । কিন্তুR2প্রধানত পরেরটি প্রতিফলিত করে, পূর্বের নয়। সুপরিচিত সত্য যেR2রেজিস্ট্রার সংখ্যায় অ-হ্রাস হ'ল এর অর্থ হ'ল আমরা কোনও রেজিস্ট্রার ( কোনও রেজিস্ট্রার, অর্থাৎ কোনও সিরিজের সংখ্যা, সম্ভবত নির্ভরশীল ভেরিয়েবলের সাথে সম্পূর্ণরূপে সম্পর্কিত নয়) যুক্ত রেখে একটি উপযুক্ত ফিট অর্জন করতে পারি । অভিজ্ঞতা দেখায় যে এইভাবে প্রাপ্ত একটি নিখুঁত ফিট, নমুনার বাইরেও অস্বাভাবিক পূর্বাভাস দেয়।

স্বজ্ঞাতভাবে, এটি সম্ভবত পাল্টা-স্বজ্ঞাত বাণিজ্য বন্ধ হয়ে যায় কারণ নির্ভরশীল পরিবর্তনশীলটির পুরো পরিবর্তনশীলতাটিকে একটি আনুমানিক সমীকরণে ক্যাপচারের মাধ্যমে আমরা সিস্টেমেটিক পরিবর্তনশীলতাকে ভবিষ্যদ্বাণী হিসাবে (এখানে "সিস্টেমেটিক" আমাদের জ্ঞানের তুলনায় বোঝা উচিত) - একটি নিখরচায় নির্দশনীয় দার্শনিক দৃষ্টিকোণ থেকে "সিস্টেমেটিক ভেরিয়েবিলিটি" বলে কিছু নেই। তবে আমাদের সীমিত জ্ঞান কিছুটা পরিবর্তনশীলতাটিকে "সিস্টেমেটিক" হিসাবে বিবেচনা করতে বাধ্য করে, তবুও তবুও এটিকে একটি নিয়মতান্ত্রিক রূপান্তরিত করার প্রয়াস উপাদান, পূর্বাভাস বিপর্যয় এনেছে)।

আসলে এটি কারও কারও কাছে দেখানোর সম্ভবত সবচেয়ে দৃinc়প্রত্যয়ী উপায় R2 সময় সিরিজের সাথে কাজ করার সময় মূল ডায়াগনস্টিক / মূল্যায়ন সরঞ্জাম হওয়া উচিত নয়: রেজিস্ট্রার সংখ্যা এমন একটি বিন্দু পর্যন্ত বাড়ান যেখানে R21। তারপরে আনুমানিক সমীকরণটি গ্রহণ করুন এবং নির্ভরশীল ভেরিয়েবলের ভবিষ্যতের মানগুলি পূর্বাভাস দেওয়ার চেষ্টা করুন।


ভাল ব্যাখ্যা তবে তবে এটি কেন পরিসংখ্যান প্যাকেজে সফ্টওয়্যারটির একটি স্ট্যান্ডার্ড আউটপুট হিসাবে যুক্ত করা হয়েছে

@ ব্রিজেশ রিগ্রেশন-traditionতিহ্য, আমি বলব।
অ্যালেকোস পাপাদোপল্লোস 20'15

দুর্দান্ত উত্তর! তবে এটিতে সামান্য তথ্য রয়েছে যা সময় সিরিজের জন্য বিশেষ। প্রেডিকশন বনাম ইন-স্যাম্পেল ফিট অন্যান্য ডেটা ধরণের ক্ষেত্রে প্রযোজ্য সম্ভবত সময় সিরিজের মতোই। অন্যদিকে, সময় সিরিজের জন্য একটি বিশেষ দিকটি অনুপস্থিত। আমি ইন্টিগ্রেটেড ভেরিয়েবলগুলি পুনরায় চাপিয়ে দেওয়ার অর্থ। আমরা যদি নমুনা নিইR2এর জনসংখ্যার অংশ হিসাবে পরিমাপ হিসাবে, এটি সংহত সময় সিরিজের অধীনে ভেঙে যায়। (আমি এটি উত্তর হিসাবে লিখতে পারলাম তবে এখনই সময় নেই))
রিচার্ড হার্ডি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.