কোনও মডেল তৈরি করার আগে প্রায়শই ভেরিয়েবলগুলি অ্যাডজাস্ট করা হয় (যেমন মানসম্মত) - এটি কখন ভাল ধারণা এবং এটি কখন খারাপ?


56

কোন পরিস্থিতিতে আপনি মডেল ফিটিংয়ের আগে কোনও পরিবর্তনকে স্কেল বা মানক করতে চান না? এবং একটি পরিবর্তনশীল স্কেলিং এর সুবিধা / অসুবিধাগুলি কী কী?


খুব অনুরূপ প্রশ্ন এখানে: stats.stackexchange.com/q/7112/3748 আপনি খুঁজছেন কি আরও আছে?
মাইকেল বিশপ

হ্যাঁ - আমি কেবল রৈখিক মডেলের চেয়ে সাধারণভাবে মডেলগুলির জন্য জানতে চাই
অ্যান্ড্রু

1
অনেকগুলি সম্ভাব্য মডেল এবং সম্ভাব্য মডেলগুলির ব্যবহার রয়েছে। আপনি যদি নিজের প্রশ্নগুলিকে আরও নির্দিষ্ট করে তুলতে পারেন এবং অন্যান্য প্রশ্নের সাথে ওভারল্যাপ হ্রাস করতে পারেন যা আরও ভাল।
মাইকেল বিশপ

উত্তর:


37

মানককরণ মডেলটির জন্য বিভিন্ন ভেরিয়েবলের ওজন সম্পর্কে। যদি আপনি সংখ্যার স্থিতিশীলতার জন্য "কেবল" প্রমিতকরণ করেন তবে এমন রূপান্তর হতে পারে যেগুলি খুব অনুরূপ সংখ্যাসূচক বৈশিষ্ট্য প্রদান করে তবে বিভিন্ন শারীরিক অর্থ যা ব্যাখ্যার জন্য আরও উপযুক্ত হতে পারে। কেন্দ্রের ক্ষেত্রেও এটি একই সত্য, যা সাধারণত মানকতার অংশ।

যে পরিস্থিতিগুলি আপনি সম্ভবত মানক করতে চান:

  • ভেরিয়েবলগুলি বিভিন্ন শারীরিক পরিমাণ
  • এবং সংখ্যাসূচক মানগুলি দৈর্ঘ্যের খুব আলাদা স্কেলে থাকে
  • এবং কোনও "বাহ্যিক" জ্ঞান নেই যে উচ্চ (সংখ্যাগত) প্রকরণের ভেরিয়েবলগুলি আরও গুরুত্বপূর্ণ হিসাবে বিবেচনা করা উচিত।

যে পরিস্থিতিগুলি আপনি মানক করতে চান না:

  • যদি ভেরিয়েবলগুলি একই শারীরিক পরিমাণ হয় এবং একই পরিমাণের (মোটামুটি) হয়, যেমন
    • বিভিন্ন রাসায়নিক প্রজাতির আপেক্ষিক ঘনত্ব
    • বিভিন্ন তরঙ্গদৈর্ঘ্যে শোষণ
    • বিভিন্ন তরঙ্গদৈর্ঘ্যে নির্গমনের তীব্রতা (অন্যথায় একই পরিমাপের শর্ত)
  • নমুনার (বেসলাইন চ্যানেল) মধ্যে পরিবর্তন হয় না এমন পরিবর্তনগুলি আপনি অবশ্যই মানক করতে চান না - আপনি কেবল পরিমাপের শব্দটি ফুটিয়ে তুলবেন (পরিবর্তে আপনি এগুলি মডেল থেকে বাদ দিতে পারেন)
  • আপনার যদি শারীরিকভাবে সম্পর্কিত ভেরিয়েবলগুলি থাকে তবে আপনার পরিমাপের শব্দটি সমস্ত ভেরিয়েবলের জন্য প্রায় একই হতে পারে তবে সংকেতের তীব্রতা আরও অনেক বেশি পরিবর্তিত হয়। কম মান সহ ভেরিয়েবল উচ্চতর আপেক্ষিক শব্দ আছে। মানককরণে আওয়াজ উড়িয়ে দেবে। অন্য কথায়, আপনি সিদ্ধান্ত নিতে পারেন আপনি আপেক্ষিক বা নিখুঁত গোলমাল মানসম্মত করতে চান কিনা।
  • শারীরিকভাবে অর্থবহ মান থাকতে পারে যা আপনি আপনার পরিমাপ করা মানটির সাথে সম্পর্কিত করতে ব্যবহার করতে পারেন, উদাহরণস্বরূপ সংক্রমণ তীব্রতার পরিবর্তিত সংক্রমণের শতাংশের পরিবর্তে (ট্রান্সমিট্যান্স টি)।

আপনি "এর মধ্যে" কিছু করতে পারেন এবং ভেরিয়েবলগুলি রূপান্তর করতে পারেন বা ইউনিটটি বেছে নিতে পারেন যাতে নতুন ভেরিয়েবলগুলির শারীরিক অর্থ থাকতে পারে তবে সংখ্যাসূচক মানটির প্রকরণটি এর চেয়ে আলাদা নয়, যেমন

  • যদি আপনি ইঁদুরের সাথে কাজ করেন, বেস ইউনিট কেজি এবং মিটার পরিবর্তে দেহের ওজন ছাঁটার দৈর্ঘ্য এবং উভয় ক্ষেত্রে প্রায় 5 এর দৈর্ঘ্যের প্রত্যাশিত ব্যাপ্তি ব্যবহার করুন (পরিবর্তনের প্রত্যাশিত পরিসীমা 0.005 কেজি এবং 0.05 মিটার - প্রস্থের এক ক্রম আলাদা)।
  • উপরের ট্রান্সমিট্যান্স টির জন্য, আপনি ব্যবহার করতে পারেনA=log10T

কেন্দ্রীকরণের জন্য অনুরূপ:

  • (শারীরিক / রাসায়নিকভাবে / জৈবিকভাবে / ...) অর্থপূর্ণ বেসলাইন মান উপলব্ধ থাকতে পারে (যেমন নিয়ন্ত্রণ, খড়খড়ি ইত্যাদি)
  • গড়টি কি আসলে অর্থবহ? (গড় মানুষের একটি ডিম্বাশয় এবং একটি অণ্ডকোষ থাকে)

+1 এবং যখন কখন খুব বেশি মানক হয় না তার সহায়ক তালিকার জন্য গ্রহণ করা হয়, ধন্যবাদ
অ্যান্ড্রু

6
"গড় মানুষের একটি ডিম্বাশয় এবং একটি অণ্ডকোষ রয়েছে" (এবং উত্তরটির বাকি অংশগুলির জন্যও ;-)।
গুং - মনিকা পুনরায়

1
@ কেবেলাইটস এমন কোনও সুযোগ আছে যা আপনি কোনও উত্সের একটি লিঙ্ক সরবরাহ করতে পারেন যা আপনি আপনার উত্তরটিতে ব্যবহার করেছেন সেই প্রসঙ্গে বেসলাইন চ্যানেলগুলি ব্যাখ্যা করে? আমি এই শব্দটি আগে শুনিনি এবং আমি অনুসন্ধান ফলাফলগুলি পেয়ে যা যা এখানে আপনার এই শব্দটির ব্যবহার বুঝতে সহায়তা করে না। ধন্যবাদ!
mahonya

1
@ এসারিকান: ডুমুরটি দেখুন এই নিবন্ধে 1: americanlabotory.com/913- প্রযুক্তিগত- আর্টিকেলস / জৈবিক এবং পদার্থ-রাসায়নিক কারণে, 2000 থেকে 2700 সেমি মধ্যে কোনও সংকেত প্রত্যাশিত নয়। এই অঞ্চলটি বেসলাইনটি অনুমান করতে ব্যবহার করা যেতে পারে (রামন নয় এমন শারীরিক প্রভাবগুলি থেকে) যা পরে বিয়োগ করা হয়। এই পরিবর্তনগুলি তখন প্রায় শূন্য এবং আরও কিছু গোলমাল হবে। 1
cbeleites

9

মানক করার আগে আমি সর্বদা নিজেকে জিজ্ঞাসা করি, "আমি কীভাবে আউটপুটটি ব্যাখ্যা করব?" যদি রূপান্তর ছাড়াই ডেটা বিশ্লেষণের কোনও উপায় থাকে তবে এটি বিশ্লেষণের দিক থেকে নিখুঁতভাবে পছন্দনীয় হতে পারে।


7

সাধারণভাবে আমি স্কেলিং বা মানককরণের প্রস্তাব দিই না যদি না এটি একেবারে প্রয়োজনীয় হয়। এই জাতীয় প্রক্রিয়ার সুবিধা বা আবেদনটি হ'ল, যখন কোনও ব্যাখ্যামূলক ভেরিয়েবলটি প্রতিক্রিয়ার পরিবর্তনশীল থেকে সম্পূর্ণ আলাদা শারীরিক মাত্রা এবং প্রস্থতা রাখে, স্ট্যান্ডার্ড বিচ্যুতি দ্বারা বিভাগের মাধ্যমে স্কেলিং সংখ্যার স্থায়িত্বের ক্ষেত্রে সহায়তা করতে পারে এবং একাধিকের মধ্যে প্রভাবগুলির তুলনা করতে সক্ষম করে ব্যাখ্যামূলক ভেরিয়েবল. সর্বাধিক সাধারণ মানীকরণের সাথে, চলক প্রভাবটি প্রতিক্রিয়ার পরিবর্তনশীল পরিবর্তনের পরিমাণ হয় যখন ব্যাখ্যাযোগ্য ভেরিয়েবল একটি মান বিচ্যুতি দ্বারা বৃদ্ধি পায়; এটি এটিও ইঙ্গিত করে যে ভেরিয়েবল এফেক্টের অর্থ (প্রতিক্রিয়ার ভেরিয়েবলের পরিবর্তনের পরিমাণ যখন একক দ্বারা ব্যাখ্যামূলক ভেরিয়েবল বৃদ্ধি পায়) হারিয়ে যাবে যদিও বর্ণনামূলক ভেরিয়েবলের পরিসংখ্যানগত মান অপরিবর্তিত রয়েছে। যাহোক, কোনও মডেলতে যখন ইন্টারঅ্যাকশন বিবেচনা করা হয়, পরিসংখ্যান প্রভাবের স্ট্যান্ডার্ড ত্রুটি গণনায় স্টোকাস্টিক স্কেলিং সমন্বয় জড়িত একটি জটিলতার কারণে এমনকি পরিসংখ্যানগত পরীক্ষার জন্য স্কেলিং খুব সমস্যাযুক্ত হতে পারে (প্রচারক, 2003)। এই কারণে, আদর্শ বিচ্যুতির মাধ্যমে স্কেলিং (বা মানককরণ / নরমালাইজেশন) সাধারণত সুপারিশ করা হয় না, বিশেষত যখন মিথস্ক্রিয়া জড়িত থাকে।

প্রচারক, কেজে, কুরান, পিজে, এবং বাউয়ার, ডিজে, 2006. একাধিক রৈখিক রিগ্রেশন, মাল্টিলেভেল মডেলিং এবং সুপ্ত কার্ভ বিশ্লেষণে ইন্টারঅ্যাকশন প্রভাবগুলির তদন্তের জন্য গণনামূলক সরঞ্জাম। শিক্ষাগত ও আচরণগত পরিসংখ্যান জার্নাল, 31 (4), 437-448।


4
আমি আপনার দাবিটিকে প্রশ্ন করি যে ভবিষ্যদ্বাণীকারীদের মানক করা "সাধারণত সুপারিশ করা হয় না, বিশেষত যখন মিথস্ক্রিয়া জড়িত থাকে।" গেলম্যান এবং হিল, না রউদেনবুশ ও ব্রাইক উভয়েই তাদের গ্রন্থে এই উদ্বেগের কথা উল্লেখ করেছেন। তবে আমার যখন সুযোগ হবে তখন আমি আপনার উল্লেখ উল্লেখগুলি আগ্রহের সাথে দেখব।
মাইকেল বিশপ

যদি আমরা ক্রমাঙ্কন মহাবিশ্বকে স্কেলিং ভেরিয়েবল হিসাবে ব্যবহার করি তবে স্কেলিং স্টোকাস্টিক নয়।
আদম

মিথস্ক্রিয়া শর্তাদির ক্ষেত্রে স্কেলিং ক্ষতিকারক কিনা তা কেউ নিশ্চিত করতে পারেন? এটি উপরের আলোচনায় সমাধান হয়েছে বলে মনে হয় না।
তালিক 23233
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.