প্যানেল / দ্রাঘিমাংশের ডেটা সহ কোনও রিগ্রেশনটিতে আপনার ডেটা মানক করা ভাল অনুশীলন?


16

সাধারণভাবে, সহগের সাথে সঠিকভাবে তুলনা করার জন্য আমি আমার স্বাধীন পরিবর্তনশীলগুলিকে প্রমিতগুলিতে মানক করি (এইভাবে তাদের একই ইউনিট রয়েছে: মানক বিচ্যুতি)। যাইহোক, প্যানেল / দ্রাঘিমাংশীয় ডেটা সহ, আমি নিশ্চিত না যে আমার ডেটা কীভাবে প্রমিত করা উচিত, বিশেষত যদি আমি শ্রেণিবদ্ধ মডেলটি অনুমান করি।

এটি কেন একটি সম্ভাব্য সমস্যা হতে পারে তা ধরে নিতে, ধরে নিন যে আপনার i=1,,n ব্যক্তিরা t=1,,T পিরিয়ড বরাবর পরিমাপ করেছে এবং আপনি একটি নির্ভরশীল ভেরিয়েবল, yi,t এবং একটি স্বতন্ত্র ভেরিয়েবল পরিমাপ করেছেনxi,t । যদি আপনি একটি সম্পূর্ণ পুলিং রিগ্রেশন চালনা করেন তবে আপনার ডেটা এইভাবে মানক করা ঠিক হবে: , যেহেতু এটি টি-স্ট্যাটিস্টিক পরিবর্তন করবে না। অন্যদিকে, যদি আপনি একটি অবৈতনিক রিগ্রেশন, অর্থাৎ প্রতিটি ব্যক্তির জন্য একটি রিগ্রেশন মাপসই করেন তবে আপনার সম্পূর্ণ ডেটাসেটটি (আর কোডে নয়) কেবল পৃথকভাবে আপনার ডেটা মানক করা উচিত:x.z=(xmean(x))/sd(x)

for (i in 1:n) {
  for ( t in 1:T) x.z[i] =  (x[i,t] - mean(x[i,]))/sd(x[i,]) 
}

তবে, যদি আপনি ব্যক্তি দ্বারা পৃথক পৃথক বাধা দিয়ে একটি সাধারণ শ্রেণিবিন্যাসের মডেল ফিট করেন তবে আপনি সংকোচনের প্রাক্কলনকারী ব্যবহার করছেন, অর্থাত্ আপনি পোলড এবং আনপুলড রিগ্রেশনের মধ্যে একটি মডেল নির্ধারণ করছেন। আমার ডেটা কীভাবে প্রমিত করা উচিত? একটি পোল্ড রিগ্রেশন মত পুরো ডেটা ব্যবহার করে? অবিকৃত ক্ষেত্রে যেমন কেবল ব্যক্তি ব্যবহার করছেন?

উত্তর:


10

xx2x2

এক্স


@ ফ্র্যাঙ্ক হ্যারেল - আপনি যে শর্তগুলি উল্লেখ করেছেন তার সাথে সম্পর্কিত সমস্যাগুলি সম্পর্কে ভাল পয়েন্টগুলি তবে যদি কারও কাছে বিভিন্ন স্কেলযুক্ত ক্রমাগত চলক থাকে তবে standardালু তুলনা করার একমাত্র উপায় মানককরণ নয়?
DQdlM

1
@ ফ্র্যাঙ্ক, আমি মনে করি এটি নির্ভর করে আপনি কী ধরণের মডেল চালাচ্ছেন তবে ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির মানিককরণ প্রায়শই দরকারী। তাদের কেন্দ্র করার অর্থ হ'ল মধ্যবর্তী পূর্বাভাসের ফলাফল হিসাবে বাধাটি ব্যাখ্যাযোগ্য হয়ে ওঠে এবং বিভিন্ন পূর্বাভাসকারীদের আপেক্ষিক গুরুত্ব আরও স্পষ্ট হয়ে ওঠে। আমি সাধারণত বাইনারি পূর্বাভাসকারীদের একা ফেলে রাখি তবে কখনও কখনও অন্যান্য স্কেলিং বিকল্পগুলি বিবেচনা করার মতো। অবশেষে, কিছু ক্ষেত্রে বন্যভাবে বিভিন্ন মানক বিচ্যুতি নিয়ে ভবিষ্যদ্বাণীকারীদের থাকার কারণে গণনামূলক / রূপান্তর সমস্যা দেখা দিতে পারে।
মাইকেল বিশপ

2
R2χ2

1
আপনার যদি বাইনারি ভেরিয়েবল থাকে তবে এগুলি মানক করবেন না, কেবল একটানা। গেলম্যানের এই নিবন্ধটি দেখুন (< স্ট্যাটিক্যালাম্বিয়া.ইডু / এগেলম্যান / রিসার্চ / প্রকাশিত / স্ট্যান্ডার্ডাইজিং ..পিডিএফ) , দুটি স্ট্যান্ডার্ড বিচ্যুতি দ্বারা বিভাজক ভেরিয়েবলের পরামর্শ দিচ্ছেন any কোনও ক্ষেত্রেই, আপনি যদি কোনও বায়সিয়ান মডেল ফিট করছেন তবে তা রূপান্তর অর্জনে সহায়তা করে।
মনোয়েল গ্যাল্ডিনো

এক্সএক্স2

0

বিভিন্ন স্কেল দিয়ে পরিমাপক ভেরিয়েবলগুলি একই মেট্রিকটিতে আনার জন্য মানককরণের বিকল্প রয়েছে। একে প্রোপোরেশন অফ ম্যাক্সিমামম স্কেলিং (পিওএমএস) বলা হয়, এবং জেড-ট্রান্সফর্মেশন করার ঝোঁক হিসাবে এটি মাল্টিভারিয়েট ডিস্ট্রিবিউশনগুলির সাথে জঞ্জাল না হয়ে মারা যায়।

টোড লিটল স্পষ্টভাবে তাঁর অনুদৈর্ঘ্য কাঠামোগত সমীকরণ মডেলিংয়ের উপর তাঁর বইতে z-মানককরণের ওপরে POMS এর সুপারিশ করেছেন। দ্রাঘিমাংশের তথ্য নিয়ে কাজ করার সময় জেড-ট্রান্সফর্মেশন অতিরিক্ত সমস্যার সাথে আসে, এখানে দেখুন: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4569815/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.