ভেরিয়েবল পার্থক্য করা হয় যখন সাধারণ রিগ্রেশন বনাম রিগ্রেশন


13

আমি যখন ভেরিয়েবলগুলি পৃথক করা হয় তখন সাধারণ একাধিক / সাধারণ রিগ্রেশন বনাম একাধিক / সরল রিগ্রেশন এর মধ্যে সম্পর্ক কী তা বোঝার চেষ্টা করছি am

উদাহরণস্বরূপ, আমি আমানত ভারসাম্য ( ) বনাম বাজারের হারের ( আর টি ) মধ্যে সম্পর্ক বিশ্লেষণ করছি যদি আমি একটি সাধারণ লিনিয়ার রিগ্রেশন চালনা করি তবে পারস্পরিক সম্পর্কটি নেতিবাচক এবং বেশ তাৎপর্যপূর্ণ (প্রায় -.74.৪) তবে আমি যদি তা গ্রহণ করি তবে লগ এবং নির্ভরশীল ভেরিয়েবলের পার্থক্য এবং স্বতন্ত্র ভেরিয়েবলের পার্থক্য, সুতরাং আমার সমীকরণ এখন d isYTRT দিয়ে সংঘবদ্ধ হওয়া ddln(YT) , আমার পারস্পরিক সম্পর্ক এবং আর ^ 2 এর মোটেও তাৎপর্যপূর্ণ নয় ( আর 2 = .004 )।dR(T)R2=.004

আমি কেবল ভাবছিলাম যে এই নিম্ন এমনকি কিছু মানে? এর অর্থ কি আমার মডেলটি ভাল ফিট নয়, বা আমি যখন ডিফারেনড ডেটার দিকে তাকিয়ে আছি তখন কি আমি আর 2 এড়িয়ে যাব? আমি তথ্য থেকে জানি যে মূল দুটি ভেরিয়েবলের মধ্যে একটি গুরুত্বপূর্ণ পারস্পরিক সম্পর্ক রয়েছে, তবুও আমার মডেলের জন্য আমার তাত্ক্ষণিক পার্থক্যগুলি দেখতে হবে, সুতরাং কীভাবে এটি করা যায় তা নিয়ে ভাবছি।R2R2

উত্তর:


16

সহজ সংস্করণটি হ'ল যে কোনও দুটি ভেরিয়েবল যা সময়ের সাথে সাথে এক দিকের পরিবর্তনের প্রবণতা দেখা দেয় সেগুলির মধ্যে কোনও সংযোগ আছে কিনা তা পরস্পর সম্পর্কযুক্ত বলে মনে হবে। নিম্নলিখিত পরিবর্তনশীল বিবেচনা করুন:

set.seed(1)
time = seq(from=1, to=100, by=1)
x  = .5 + .3*time +        rnorm(100)
y1 =  3 + .3*time +        rnorm(100)
y2 =  7 + .1*time + .8*x + rnorm(100)

হল সময় মাত্র একটি ফাংশন, হিসাবে ওয়াই 1y 2 সময় এবং এক্স উভয়েরই ফাংশন। বিন্দুটি কোড থেকে সনাক্ত করা যায় যে x এবং y 2 এর মধ্যে সত্যই একটি সম্পর্ক রয়েছেএবং x এবং y 1 এর মধ্যে কোনও সম্পর্ক নেই। এখন নীচের চিত্রটি দেখুন, তিনটি লাইনই ভয়ঙ্করভাবে অনুরূপ দেখাচ্ছে, তাই না?xy1y2xxy2xy1

এখানে চিত্র বর্ণনা লিখুন

R2xy1R2xy2xy1xy2সুতরাং, আমরা কীভাবে নিখুঁত উপস্থিতি থেকে বাস্তবকে আলাদা করতে পারি? এখানেই ভিন্নতা আসে any যে কোনও দুটি ভেরিয়েবলের জন্য, যেহেতু তারা উভয়ই সময়ের সাথে সাথে যেতে থাকে, এটি খুব তথ্যবহুল নয়, তবে একটি নির্দিষ্ট পরিমাণে বেড়ে যায়, তা কি আমাদের জানায় যে অন্যটি কতটা উপরে যায়? পার্থক্য আমাদের সেই প্রশ্নের উত্তর দিতে দেয়। নিম্নলিখিত দুটি চিত্র নোট করুন, স্ক্রেটারপ্লটগুলি আমি তিনটি ভেরিয়েবলকে আলাদা করার পরে তৈরি করেছিলাম।

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

xy2R2=.43xy1R2=.07R2

কিছু অন্যান্য বিষয়: পরিসংখ্যানগুলিতে, আমি একটি বিষয় উল্লেখ করছি যে এগুলি যুগপত পরিবর্তনগুলি। এতে কোনও ভুল নেই এবং আমি সমস্যাটি সেট আপ করার পদ্ধতিটি অনুসরণ করে, তবে সাধারণত লোকেরা কিছুটা পিছনে প্রভাব নিয়ে আগ্রহী। (এটি হ'ল, সময়ে এক পর্যায়ে একটি জিনিসে পরিবর্তন পরবর্তী সময়ে অন্য কোনও পরিবর্তনের দিকে পরিচালিত করে)) দ্বিতীয়ত, আপনি আপনার সিরিজের কোনওটির লগ নেওয়ার কথা উল্লেখ করেছেন। লগটি নেওয়া আপনার ডেটা স্তর থেকে হারে সরিয়ে দেয়। এবং এইভাবে, যখন আপনি পার্থক্য করেন, আপনি স্তরগুলির পরিবর্তে হারের পরিবর্তনের দিকে লক্ষ্য করছেন। এটি খুব সাধারণ, তবে আমি আমার প্রদর্শনীতে সেই উপাদানটি অন্তর্ভুক্ত করি নি; আমি আলোচিত ইস্যুগুলির কাছে এটি অর্থেগোনাল। সবশেষে, আমি স্বীকার করতে চাই যে সময় প্রদর্শন সিরিজের ডেটা প্রায়শই আমার জটিলতার চেয়ে জটিল হয়।


10

@ গুং একটি দুর্দান্ত উত্তর দেয়, তবে আপনি যা পরামর্শ দিচ্ছেন তাতে আমি কয়েকটি ক্যাভেট দিতে চাই।

পার্থক্যটি বেশিরভাগ ইউনিট শিকড়ের সমস্যা মোকাবেলায় ব্যবহৃত হয়, উদাহরণস্বরূপ, যখন প্রক্রিয়াটি এআর (1) এর 1 এর সহসংস্থান সহগ সহ হয় যখন ত্রুটি শব্দটি সাদা শব্দ হয় তখন একটি লিনিয়ার সময় প্রবণতা অপসারণের জন্য পার্থক্য কার্যকরভাবে ব্যবহার করা যেতে পারে বিশেষত, এটি কোনও ক্রমিক সম্পর্কিত সম্পর্ক প্রদর্শন করে না), যেমন উপরের @ গুং শো shows তবে, যদি ত্রুটির শব্দটির সাথে নিখুঁত মান 1 এর কম সংযোগ সহগের সাথে ক্রমিক সম্পর্ক থাকে, লিনিয়ার সময় প্রবণতা অপসারণের জন্য পৃথক পৃথক ব্যবহার করে খুব জটিল কাঠামোর সাথে ত্রুটি তৈরি হয়। এক্ষেত্রে সঠিক স্ট্যান্ডার্ড ত্রুটিগুলি পাওয়া এবং বৈধ সূত্রগুলি পাওয়া শক্ত।

ফলস্বরূপ, প্রথমে একটি ইউনিটের মূলের জন্য পরীক্ষা করা ভাল এবং যদি এটি সনাক্ত করা হয় তবে এটি পৃথক করে আলাদা করে ঠিক করা ভাল। এর পরে, লিনিয়ার সময় প্রবণতা জন্য পরীক্ষা করুন। অবতরণ করে এই সমস্যাটি ঠিক করুন। দ্বিতীয়টি না করেই আপনি বাদ দেওয়া ভেরিয়েবল-ধরণের সমস্যার জন্য উন্মুক্ত যা @ গুং সুন্দরভাবে বর্ণনা করেছেন।


1
+1 এটি আমার উত্তরের একটি সুন্দর পরিপূরক। আমি আমার উত্তরটি সহজ এবং স্বজ্ঞাত রাখার চেষ্টা করেছি। তবে এটি অবশ্যই সত্য যে আমি আলোচনা করার চেয়ে আরও জটিলতা রয়েছে এবং সেগুলি খুব গুরুত্বপূর্ণ হতে পারে। আমার চূড়ান্ত অনুচ্ছেদে এটি স্বীকার করা উচিত ছিল। আমাকে সৎ রাখার জন্য ধন্যবাদ
গুং - মনিকা পুনরায়

1

যখন উদ্দেশ্যটি দুটি বা ততোধিক সিরিজের মধ্যে সম্পর্ক গঠনের / চিহ্নিত করা হয়, তখন এটির শব্দে রূপান্তর করার জন্য একজনকে অবশ্যই এক্স ভেরিয়েবল ফিল্টার করতে হবে। এটি একটি দুটি পদক্ষেপ প্রক্রিয়া, পৃথক পৃথক প্রয়োজন এবং এআরএমএ কাঠামো। বস্তুনিষ্ঠতা ধরে রাখতে এবং মডেল স্পেসিফিকেশন বায়াস এড়ানোর জন্য ফিল্টারটি ধরে নেওয়া উচিত নয় বরং স্থায়ী এক্স সিরিজের স্বতঃসংশ্লিষ্ট প্রকৃতি ব্যবহার করে সেই ফিল্টারটি তৈরি করা উচিত। তারপরে একটি ওয়াই সিরিজ নেয় এবং এটি স্থিতিশীল করতে অপারেটরদের যা প্রয়োজন তা প্রয়োগ করে এবং তারপরে স্থিতিশীল ওয়াইতে পূর্বে বিকশিত ফিল্টারটি প্রয়োগ করুন। এই পদ্ধতির একটি এবং একমাত্র উদ্দেশ্য রয়েছে এবং তা হ'ল Y এবং X এর মধ্যে সম্পর্ক চিহ্নিত করা One প্রয়োজনীয় বিবিধ অপারেটরগুলি সম্পর্কে কখনও সিদ্ধান্তে উড়ে আসা উচিত নয়, এআরএমএ ফিল্টার এবং ভেরিয়েবলগুলির মধ্যে সম্পর্ক যদি না হয় কোনও একনোমেট্রিশিয়ান যিনি মডেলটি জানেন সেগুলি ডেটা পর্যবেক্ষণ করার আগে বা যদি আপনি সরাসরি সর্বশক্তিমানের সাথে কথা বলেন। ত্রুটিগুলির প্রয়োজনীয়তার স্বাভাবিকতার বিষয়ে সাবধানতার সাথে বিশ্লেষণ করা প্রয়োজন যে কোনও পরিসংখ্যানের পরীক্ষা গণনা করা উচিত। এফ টেস্ট / টি পরীক্ষার গণনা প্রয়োজনীয় তবে পর্যাপ্ত নয়। সংক্ষেপে আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি "একটি স্থানান্তর ফাংশন মডেল কীভাবে চিহ্নিত করবেন" বিষয় অনুসরণ করুন। অন্যরা এবং আমি এই বিষয়টিকে বেশ কয়েকবার সম্বোধন করেছি। আপনি যদি চান তবে আপনি কিছু প্রশ্নের উত্তর পেতে পারেন যার সাথে "টাইম সিরিজ" ট্যাগটি সংযুক্ত রয়েছে। যোগী যেমন বলেছিলেন, "আপনি কেবল পড়া / দেখার মাধ্যমে অনেক কিছু পর্যবেক্ষণ করতে পারেন"। কখনও কখনও সুন্দর এবং সহজ উত্তরগুলি আপনাকে বিপথগামী এবং সম্ভাব্যভাবে জড়িত / রক্ষণশীল উত্তরগুলিকে আমার মতো করে তুলতে পারে আপনার প্রয়োজন হতে পারে সময় সিরিজের ডেটা মডেলিংয়ের আরও ভাল বোঝার বিকাশ। যেমন একবার বলা হয়েছিল "টোটো, আমরা আর কানসাসে নেই (অর্থাত্ ক্রস-বিভাগীয় ডেটা)!"

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.