গড় উপাত্তের সাথে ফিটিং এবং ফিটিংয়ের পরে গড় গড়ের মধ্যে পার্থক্য


10

যদি কোনও হয়, একাধিক পৃথক "পরীক্ষাগুলি" -এর জন্য একটি লাইন ফিটিংয়ের মধ্যে থাকে তবে ফিটগুলির গড় গড়ে নেওয়া, বা পৃথক পরীক্ষাগুলি থেকে ডেটা গড় করার পরে গড় ডেটা ফিটিং করা। আমাকে বিস্তারিতভাবে বলতে দাও:

আমি কম্পিউটার সিমুলেশনগুলি সম্পাদন করি যা নীচে দেখানো একটি বক্র তৈরি করে। আমরা একটি পরিমাণ বের করি, প্লটের লিনিয়ার অঞ্চলটি (দীর্ঘ সময়) ফিট করে একে "এ" বলি। মানটি হ'ল লিনিয়ার অঞ্চলের opeাল। এই লিনিয়ার রিগ্রেশনটির সাথে অবশ্যই একটি ত্রুটি যুক্ত রয়েছে।

"এ" এর গড় মান গণনা করতে আমরা সাধারণত বিভিন্ন প্রাথমিক শর্তাবলী সহ এই জাতীয় সিমুলেশনগুলির 100 বা তার বেশি চালাই। আমাকে বলা হয়েছে যে কাঁচা তথ্য (নীচের চক্রান্তের) 10 টি বলে গ্রুপগুলিতে গড় করা ভাল, তারপরে "এ" এর জন্য উপযুক্ত এবং সেই 10 "এ" এর একসাথে গড়।

এটির যে কোনও যোগ্যতা আছে কিনা বা এটি যদি 100 টি পৃথক "এ" মানগুলিকে ফিট করে এবং সেগুলি গড়ে গড়ে তোলার চেয়ে ভাল হয় তবে সে সম্পর্কে আমার কোনও প্রজ্ঞা নেই।

উপাত্ত


আমি নিশ্চিত যে আমি বুঝতে পেরেছি না: আপনি সময়ের বিভিন্ন বিন্দুতে A পরিমাপ করেন এবং তারপরে আপনি অনুমান করেন ? তারপরে আপনি বেশ কয়েকবার এটি করেন এবং আপনি ? A=β0+β1tβ1

দুঃখিত, না। উপরের প্লটটি একটি একক সিমুলেশনের ফলাফল (আসুন একে একটি পরীক্ষা বলুন)। প্রাথমিক অ-রৈখিক অঞ্চলটি বাতিল করা হয়, তারপরে আমরা রৈখিক অংশের সাথে একটি লাইন ফিট করি এবং slাল "A" পাই। সুতরাং একটি সম্পূর্ণ সিমুলেশন "এ" এর একক অনুমান দেয়। অবশ্যই আমার প্রশ্নটি ঘুরে দেখা যায় যে অনেক প্লটের গড়পড়তার পরে A কে গণনা করা কেবল একগুচ্ছ প্লটের জন্য A গণনা করা এবং সেগুলি গড়ের চেয়ে আলাদা কি না। আশা করি তা স্পষ্ট হয়ে গেছে।
প্রাগমেটিস্ট 1

1
আমি দেখছি না কেন এটি একটি পার্থক্য করবে? (যদি রৈখিক প্রতিরোধের জন্য অনুমানগুলি সম্পন্ন হয়)

আমার ধারণা অনুমান করা হয় যে ফিটিংসটি কখনও ভুল হয় না / রূপান্তর করে না / পরীক্ষাগুলি ছোট হওয়ার কারণে হাস্যকরভাবে খাড়া অনুমান দেয়? এটি এমন কিছু হবে যা প্রথম (বা শ্রেণিবদ্ধ মডেলগুলি) একত্রিত করার সাথে সহায়তা করতে পারে।
Björn

1
আপনি সমস্ত ডেটা একসাথে ফিট করতেও পারেন তবে পরীক্ষাগুলির মধ্যে পার্থক্য করার জন্য কোনও একক উপাদানকে অন্তর্ভুক্ত করতে পারেন (প্রতিটি পরীক্ষার জন্য বিভিন্ন ইন্টারসেপ্ট বা এমনকি বিভিন্ন opালু এমনকি) লিনিয়ার মিশ্রিত মডেল পদ্ধতির মতো কিছু। আপনি সামগ্রিক
slাল

উত্তর:


2

কল্পনা করুন আমরা একটি প্যানেল ডেটা প্রসঙ্গ যেখানে সময় জুড়ে প্রকরণ আছে আছেন এবং সংস্থাগুলো জুড়ে । প্রতিটি সময়ের চিন্তা আলাদা পরীক্ষা হিসেবে। আমি আপনার প্রশ্নটি বুঝতে পারছি এটি ব্যবহার করে কোনও প্রভাব অনুমানের সমতুল্য:tit

  • সময় সিরিজের গড়ের ক্রস-বিভাগীয় প্রকরণ।
  • ক্রস-বিভাগীয় প্রকরণের সময় সিরিজের গড় verages

সাধারণভাবে উত্তর না হয়।

সেটআপ:

আমার তৈয়ার, আমরা প্রতিটি সময় সময়ের মনে করতে পারেন আলাদা পরীক্ষা হিসেবে।t

ধরা যাক আপনার সংস্থাগুলির চেয়ে দৈর্ঘ্যের এর ভারসাম্য প্যানেল রয়েছে । যদি আমরা প্রতিটি সময়কাল পৃথক করে ইত্যাদি ... আমরা সামগ্রিক ডেটা এইভাবে লিখতে পারি:Tn(Xt,yt)

Y=[y1y2yn]X=[X1X2Xn]

ফিটের গড়:

1Ttbt=1Tt(XtXt)1Xtyt=1TtSt1(1nixt,iyt,i)where St=1nixt,ixt,i

গড় ফিট:

সময় সিরিজের গড়ের ক্রস-বিভাগীয় পরিবর্তনের উপর ভিত্তি করে এটি প্রাক্কলনের সমান হয় না (যেমন অনুমানের মধ্যে)।

(1nix¯ix¯i)11nix¯iy¯i

যেখানে ইত্যাদি ...x¯i=1Ttxt,i

পুলের ওএলএস অনুমান:

ভাবতে দরকারী কিছু হ'ল পোল্ড ওএলএস অনুমান। এটা কি? তারপরে

b^=(XX)1XY=(1nTtXtXt)1(1nTtXtyi)
bt=(XtXt)1Xtyi
=(1nTtXtXt)1(1nTtXtXtbt)

আসুন এবং আমাদের অনুমান সম্পূর্ণ নমুনার উপর এবং যথাক্রমে পিরিয়ড in তারপর আমাদের আছে:S=1nTiXXSt=1nXtXtE[xx]t

b^=1Tt(S1St)bt

এটি বিভিন্ন সময়ের নির্দিষ্ট অনুমানের গড়ের মতো , তবে এটি কিছুটা আলাদা। কিছুটা আলগা অর্থে, আপনি ডান হাতের পার্শ্বের ভেরিয়েবলগুলির উচ্চতর বৈচিত্র সহ পিরিয়ডগুলিকে আরও বেশি ওজন দিচ্ছেন।bt

বিশেষ ক্ষেত্রে: ডান পাশের ভেরিয়েবলগুলি সময় অদমী এবং দৃt় নির্দিষ্ট

তাহলে প্রতিটি দৃঢ় জন্য ডান দিকে ভেরিয়েবল হয় সময় জুড়ে ধ্রুবক (অর্থাত কোন এবং ) তাহলে সবার জন্য এবং আমরা প্রয়োগ করা হবে:iXt1=Xt2t1t2S=Stt

b^=1Ttbt

মজার মন্তব্য:

এটি ফামা এবং ম্যাকবেথ যেখানে বাজারের (বা অন্যান্য ফ্যাক্টর লোডিং) সংস্থাগুলির সংস্থাগুলির সাথে প্রত্যাশিত রিটার্নগুলি কীভাবে পরিবর্তিত হয় তা অনুমান করার সময় তারা ধারাবাহিক স্ট্যান্ডার্ড ত্রুটিগুলি অর্জনের জন্য ক্রস-বিভাগীয় অনুমানের গড়ের এই কৌশলটি প্রয়োগ করেছিল।

ফামা-ম্যাকবেথ পদ্ধতিটি ত্রুটি শর্তগুলি ক্রস-বিভাগীয়ভাবে সম্পর্কিত হলেও সময়ের সাথে স্বতন্ত্র থাকলে প্যানেল প্রসঙ্গে নিয়মিত মানসম্পন্ন ত্রুটিগুলি পাওয়ার স্বজ্ঞাত উপায়। আরও একটি আধুনিক কৌশল যা একই ধরণের ফলাফল দেয় সময় মতো ক্লাস্টার হয়।


1

(দ্রষ্টব্য: মন্তব্য করার মতো যথেষ্ট খ্যাতি আমার নেই, তাই এটি উত্তর হিসাবে পোস্ট করছি))

উত্থাপিত বিশেষ প্রশ্নের জন্য, fcop দ্বারা উত্তরটি সঠিক: গড় ফিটগুলি ফিটগুলির গড় গড় (কমপক্ষে রৈখিক সর্বনিম্ন স্কোয়ারের জন্য)। তবে এটি উল্লেখ করার মতো যে এই সমস্ত ভ্রান্ত " অনলাইন " পদ্ধতির কোনওটিই একবারে সমস্ত ডেটা ফিট করার তুলনায় পক্ষপাতদুষ্ট ফলাফল দিতে পারে। যেহেতু দুটি সমান, আমি "ফিট ফিট গড়" পদ্ধতির দিকে মনোনিবেশ করব। মূলত, গড় বক্ররেখা বিভিন্ন পয়েন্টের মধ্যে মানগুলির মধ্যে আপেক্ষিক অনিশ্চয়তা উপেক্ষা করে । উদাহরণস্বরূপ যদি , , এবং , তবেYএক্সY1[X1]=Y2[X1]=2Y1[X2]=1Y1[X2]=3 ˉ Y [X1]= ˉ y [এক্স2]=2এক্সy¯[x]=y[x]yxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3y¯[x1]=y¯[x2]=2 , তবে যে কোনও বক্ররেখা ফিটের ক্ষেত্রে তুলনায় এ মিসফিট সম্পর্কে আরও বেশি যত্ন করা উচিত ।এক্স 2x1x2

নোট করুন যে বেশিরভাগ বৈজ্ঞানিক সফ্টওয়্যার প্ল্যাটফর্মে একটি সত্য "অনলাইন" ন্যূনতম স্কোয়াস ফিট করতে গণনা করা / আপডেট করার সরঞ্জাম থাকতে হবে ( পুনরাবৃত্ত ন্যূনতম স্কোয়ার হিসাবে পরিচিত )। সুতরাং সমস্ত ডেটা ব্যবহার করা যেতে পারে (যদি এটি আকাঙ্ক্ষিত হয়)।


1
Fcop পোস্ট করা উত্তর মুছে ফেলা হয়েছে। আপনি আপনার উত্তরটি কিছুটা সংশোধন করতে চাইতে পারেন
Glen_b -Rininstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.