পারস্পরিক সম্পর্কযুক্ত রেজিস্টারদের সাথে ডিল করা


23

অত্যন্ত সংযুক্ত রেজিস্ট্রার সহ একাধিক লিনিয়ার রিগ্রেশন, ব্যবহারের জন্য সেরা কৌশলটি কী? সমস্ত সম্পর্কযুক্ত রেজিস্ট্রারদের পণ্য যুক্ত করা কি বৈধ পদ্ধতির?


1
আমি দুঃখিত @ সানকুলসুর উত্তর মুছে ফেলা হয়েছে তা দেখুন। এটি এবং এরপরে আসা মন্তব্যগুলি বহুবিধরেখা এবং অসুস্থ অবস্থার মধ্যে একটি পার্থক্য স্পষ্ট করে। এছাড়াও, একটি মন্তব্যে সানকুলসু উল্লেখ করেছিলেন যে প্রাথমিক মানীকরণ কীভাবে বহুপদী প্রতিরোধে সহায়তা করতে পারে। যদি এটি পুনরায় প্রদর্শিত হয় তবে আমি এটি প্রদান করব ;-)।
হোবার

@ Ηλίας: অনেক অ্যাপ্লিকেশনটিতে পণ্যটি অস্থির হতে পারে। স্বতন্ত্র রেজিস্ট্রারদের কিছু জিরো থাকলে এটি অনেকগুলি জিরো দ্বারা জর্জরিত হতে পারে; এর নিরঙ্কুশ মানটির শক্তিশালী ধনাত্মক স্কিউ থাকবে সম্ভবত কিছু উচ্চ-উত্তোলনের পয়েন্ট বাড়বে; এটি বহির্মুখী ডেটা বাড়িয়ে তুলতে পারে, বিশেষত একযোগে বহিরাগতদের, আরও তাদের লিভারেজকে যুক্ত করে। এটি ব্যাখ্যা করা বরং কঠিন হতে পারে, বিশেষত যদি রেজিস্ট্রাররা ইতিমধ্যে মূল ভেরিয়েবলগুলির পুনঃপ্রকাশ (যেমন লগ বা শিকড়) are
হোবার

উত্তর:


13

অধ্যক্ষ উপাদানগুলি গাণিতিকভাবে অনেক অর্থবোধ করে। তবে, আমি এই ক্ষেত্রে কিছু গাণিতিক কৌশল ব্যবহার করে এবং এই সমস্যাটি নিয়ে আশা করি যে আমার সমস্যা সম্পর্কে ভাবার দরকার নেই ।

আমার কী ধরণের ভবিষ্যদ্বাণী রয়েছে, স্বতন্ত্র পরিবর্তনশীল কী, আমার ভবিষ্যদ্বাণীকারীরা কেন পারস্পরিক সম্পর্কযুক্ত, আমার কিছু ভবিষ্যদ্বাণীকারী আসলে একই অন্তর্নিহিত বাস্তবতা পরিমাপ করছে কিনা তা নিয়ে আমি একটু চিন্তা করার পরামর্শ দিই (যদি তাই হয় তবে আমি কেবল একটি দিয়ে কাজ করতে পারি কিনা একক পরিমাপ এবং আমার ভবিষ্যদ্বাণীকারীদের মধ্যে এটির জন্য সর্বোত্তম হবে), আমি কীসের জন্য বিশ্লেষণ করছি - যদি আমি অনুমানের বিষয়ে আগ্রহী না হই, কেবলমাত্র পূর্বাভাসে, তবে আমি আসলে যতক্ষণ ভবিষ্যতে থাকি ঠিক তেমন জিনিসগুলি রেখে যেতে পারতাম ভবিষ্যদ্বাণীকারী মানগুলি অতীতের মতো।


4
সম্পূর্ণরূপে সম্মত, +1। কিন্তু আইএমএইচও, "গাণিতিক কৌশল" হিসাবে পিসিএর বৈশিষ্ট্যটিকে অন্যায়ভাবে অস্বীকার করে। শ্রীকান্তের পরামর্শ অনুসারে, আপনি যদি সম্মত হন (আমি নিশ্চিত নই যে আপনি করছেন) তবে রেজিস্ট্রারদের সংশ্লেষ বা গড় গ্রুপ, গ্রহণযোগ্য হবে, তবে পিসিএ ঠিক তেমন গ্রহণযোগ্য হবে এবং এটি সাধারণত ফিটকে উন্নত করে। তদুপরি, মূল উপাদানগুলি ভবিষ্যদ্বাণীকারীদের কোন গ্রুপের সাথে সম্পর্কিত এবং তারা কীভাবে সম্পর্কযুক্ত তা অন্তর্দৃষ্টি প্রদান করতে পারে: আপনি যে চিন্তাকে সমর্থন করছেন তার জন্য এটি একটি দুর্দান্ত সরঞ্জাম।
whuber

2
@ হুবুহু, আমি আপনার বক্তব্যটি দেখতে এবং এর সাথে একমত, এবং আমি পিসিএকে অস্বীকার করতে চাই না, তাই অবশ্যই +1 করুন। আমি কেবল ইঙ্গিত করতে চেয়েছিলাম যে অন্তর্নিহিত সমস্যাটি না দেখে এবং চিন্তা না করে অন্ধভাবে পিসিএ ব্যবহার করা (যা এখানে কেউ সমর্থন করছে না) আমাকে খারাপ অনুভূতি দিয়ে চলে যাবে ...
এস। কোলাসা - মনিকা পুনঃস্থাপন করুন

11

এই সমস্যাটি মোকাবেলা করতে আপনি প্রধান উপাদান বা রিজ রিগ্রেশন ব্যবহার করতে পারেন। অন্যদিকে, আপনার যদি দুটি ভেরিয়েবল থাকে যা প্যারামিটারের অনুমানের সাথে সমস্যা তৈরি করার জন্য যথেষ্ট পরিমাণে সংযুক্ত থাকে তবে আপনি অবশ্যই ভবিষ্যদ্বাণীটির দিক থেকে খুব বেশি ক্ষতি না করে দু'জনের একটিটিকে ফেলে দিতে পারেন - কারণ দুটি ভেরিয়েবল একই তথ্য বহন করে । অবশ্যই, এটি কেবল তখনই কার্যকর হয় যখন সমস্যাটি দুটি অত্যন্ত সংযুক্ত স্বতন্ত্র প্রার্থীর কারণে । যখন সমস্যাটিতে দুটিরও বেশি ভেরিয়েবল জড়িত থাকে যা একসাথে প্রায় কলিনারি থাকে (যার মধ্যে দুটির মধ্যে কেবলমাত্র মাঝারি সম্পর্ক রয়েছে), আপনার সম্ভবত অন্য পদ্ধতির একটি প্রয়োজন need


2
(+1) এখন, সমস্যাটি হল ওপি কতগুলি ভেরিয়েবলগুলি মডেলটিতে প্রবেশ করে তা নির্দেশ করে না, কারণ এগুলি সংখ্যার ক্ষেত্রে সংকোচন এবং পরিবর্তনশীল নির্বাচন উভয়ই করা ভাল, যেমন ইলাস্টিকনেট মাপদণ্ড (যা সংমিশ্রণ হয়) লাসো এবং রিজ পেনাল্টি)।
chl

3

এখানে আরও একটি চিন্তা যা স্টিফানের উত্তরে অনুপ্রাণিত :

যদি আপনার কিছু সম্পর্কযুক্ত রেজিস্ট্রারগুলি অর্থপূর্ণভাবে সম্পর্কিত হয় (যেমন, তারা বুদ্ধিমত্তার বিভিন্ন পদক্ষেপ, যেমন, মৌখিক, গণিত ইত্যাদি) তবে আপনি একটি একক ভেরিয়েবল তৈরি করতে পারেন যা নীচের একটি কৌশল ব্যবহার করে একই চলকটি পরিমাপ করে:

  • রেজিস্ট্রারদের যোগ করুন (যদি রেজিস্ট্রারগুলি সম্পূর্ণরূপে উপাদান হয় তবে উদাহরণস্বরূপ, মৌখিক আইকিউ + গণিত আইকিউ = সামগ্রিক আইকিউ)

  • রেজিস্ট্রারগুলির গড় গড় (যদি রেজিস্ট্রারগুলি একই অন্তর্নির্মিত নির্মাণ পরিমাপ করে থাকে যেমন, বাম জুতার আকার, পায়ের দৈর্ঘ্য পরিমাপ করতে ডান জুতোর আকার)

  • ফ্যাক্টর বিশ্লেষণ (পরিমাপের ত্রুটিগুলির জন্য অ্যাকাউন্টে এবং একটি সুপ্ত ফ্যাক্টরটি বের করার জন্য)

তারপরে আপনি সমস্ত সম্পর্কযুক্ত রেজিস্ট্রারগুলি ফেলে দিতে পারেন এবং উপরের বিশ্লেষণ থেকে উত্পন্ন এক পরিবর্তনশীল দ্বারা তাদের প্রতিস্থাপন করতে পারেন।


1
এটি যদি বোঝা যায় যে যদি রেজিস্ট্রাররা সমস্ত একই স্কেলে পরিমাপ করা হয়। মনোবিজ্ঞানে, বিভিন্ন সাবস্কেলগুলি প্রায়শই বিভিন্ন স্কেলের উপর পরিমাপ করা হয় (এবং এখনও পারস্পরিক সম্পর্কযুক্ত), সুতরাং একটি ওজনযুক্ত যোগফল বা গড় (যা এখানে সত্যই সমান হয়) উপযুক্ত হবে। এবং অবশ্যই, পিসিএ সর্বাধিক বৈকল্পিক অক্ষগুলি গণনা করে কেবল এই ধরণের ওজন সরবরাহ হিসাবে দেখতে পারে।
এস। কোলাসা - মনিকা পুনরায় ইনস্টল করুন

2

আমি উপরের স্টিফান কোলাছার মতো একই কথা বলতে যাচ্ছিলাম (সুতরাং তার উত্তরটিকে সমর্থন করে)। আমি কেবল যুক্ত করতাম যে কখনও কখনও বহুবিধ লাইনটি বিস্তৃত ভেরিয়েবলগুলি ব্যবহারের কারণে হতে পারে যা সমস্ত আকারের কিছু পরিমাপের সাথে সম্পর্কিত হয় এবং নিবিড় ভেরিয়েবলগুলি ব্যবহার করে জিনিসগুলি উন্নত করা যায়, অর্থাৎ আকারের কিছু পরিমাপের মাধ্যমে সবকিছুকে বিভাজন করে। উদাহরণস্বরূপ, যদি আপনার ইউনিটগুলি দেশ হয় তবে আপনি জনসংখ্যা, অঞ্চল বা জিএনপি অনুসারে ভাগ করতে পারেন, প্রসঙ্গে on

ওহ - এবং আসল প্রশ্নের দ্বিতীয় অংশের উত্তর দেওয়ার জন্য: সমস্ত সম্পর্কিত সম্পর্কযুক্ত রেজিস্ট্রারগুলির পণ্য যুক্ত করার সময় আমি কোনও পরিস্থিতির কথা ভাবতে পারি না এটি ভাল ধারণা হবে। এটা কিভাবে সাহায্য করবে? এর অর্থ কি?


আমার প্রাথমিক ধারণাটি ছিল
রেজিস্ট্রারদের যুগোপযোগী

অ্যাকাউন্টওয়ালা মিথস্ক্রিয়াটি অ্যাকাউন্টে নেওয়া প্রায়শই ভাল ধারণা। তবে সবগুলিই লোভ নয়: আপনার উচিত গর্তটি ভাবতে হবে যা বোঝা যায়!
কেজেটিল বি হালওয়ারসেন

1

আমি এতে কোনও বিশেষজ্ঞ নই, তবে আমার প্রথম চিন্তাটি ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির উপর একটি মূল উপাদান বিশ্লেষণ চালানো হবে, তারপরে আপনার নির্ভরশীল ভেরিয়েবলের পূর্বাভাস দেওয়ার জন্য ফলাফলের মূল উপাদানগুলি ব্যবহার করুন।



পি

@ সিএইচএল ভাল পয়েন্ট। তবে যেহেতু মূল উপাদানগুলি লিনিয়ার সংমিশ্রণ, তাই ব্যাখ্যামূলক রৈখিক মডেল পাওয়ার জন্য উপাদানগুলিতে প্রক্ষেপণ (= অন্য রৈখিক রূপান্তর) দ্বারা রঞ্জিত মডেল (= এক লিনিয়ার রূপান্তর) রচনা করা সোজা (যদিও মাঝে মাঝে কিছুটা ব্যথা হতে পারে) সমস্ত আসল ভেরিয়েবল জড়িত। এটি orthogonalization কৌশলগুলির মতো কিছুটা to নোট, এছাড়াও, যে শ্রীকান্তের সর্বশেষ প্রস্তাবগুলি (সমষ্টি বা গড় রেজিস্ট্রারগুলি গড়) মূলত মূল ইগেনভেেক্টরকে আনুমানিকভাবে প্রায় একই ধরণের ব্যাখ্যামূলক অসুবিধাগুলি প্ররোচিত করে।
হোবার

@ হ্যাঁ হ্যাঁ, আমি আপনার দুটি পয়েন্টের সাথে একমত আমি ব্যাপকভাবে পিএলএস রিগ্রেশন এবং সিসিএ ব্যবহার করেছি, সুতরাং এক্ষেত্রে আমাদের উভয় পক্ষের লিনিয়ার সংমিশ্রণগুলি মোকাবেলা করতে হবে (স্ট্যান্ড সর্বাধিক কোভেরিয়েন্স বা পারস্পরিক সম্পর্কের মানদণ্ড); প্রচুর সংখ্যক ভবিষ্যদ্বাণীকারীদের সাথে, ক্যানোনিকাল ভেক্টরগুলির ব্যাখ্যা ব্যথিতকর, সুতরাং আমরা কেবল সর্বাধিক অবদানকারী ভেরিয়েবলগুলি দেখি। এখন, আমি কল্পনা করতে পারি যে এত ভবিষ্যদ্বাণীকারী নেই যাতে আপনার সমস্ত যুক্তি (@ স্টিফেন, @ মাইক) বোঝা যায়।
chl

-1

এক্স

এক্সআমিগুলিটিএকটিএনএকটিRআমিz- র=এক্সআমি-এক্স¯গুলি

এটি কোনও প্রতিকার নয়, তবে অবশ্যই সঠিক দিকের একটি পদক্ষেপ।


8
লিনিয়ার ট্রান্সফর্মেশনগুলি (এগুলির মতো) কখনও কখনও সংযুক্তি সহগগুলি পরিবর্তন করে না। মানককরণের দিকটি হ'ল সাধারণ ম্যাট্রিক্সের কন্ডিশনার উন্নত করা।
হোবার

1
ভেরিয়েবলকে মানীকরণ করা স্বাধীন ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ককে প্রভাবিত করবে না এবং এই সমস্যার সাথে সম্মানের সাথে আমি যেভাবে ভাবতে পারি কোনওভাবেই "পারস্পরিক সম্পর্কের প্রভাব হ্রাস করবে না"।
ব্রেট 18

2
@ ব্রেট, একটি আদর্শ উদাহরণ যেখানে মানীকরণ হ'ল পলিনোমিয়াল রিগ্রেশন । এটি সর্বদা নিবন্ধনকারীদের মানক করার পরামর্শ দেওয়া হয়। স্ট্যান্ডার্ডাইজিং পারস্পরিক সম্পর্ক ম্যাট্রিক্স পরিবর্তন করে না, তবে ভার কোভ ম্যাট্রিক্সকে (যা এখন করাল ম্যাট্রিক্স হয়) ভাল আচরণ করে (মেট্রিক্সের শর্ত সংখ্যার দিকে ইঙ্গিত করে WHWer দ্বারা কন্ডিশনার বলা হয়, আইএমএইচও)।
সানকুলসু

একমত। বহুতল বা ইন্টারঅ্যাকশন শর্তগুলির মতো উচ্চতর অর্ডার শর্তাদি প্রবেশের সময় কেন্দ্রীকরণ দরকারী। এখানে বিষয়টি মনে হয় না এবং অন্যথায় পারস্পরিক সম্পর্কিত ভবিষ্যদ্বাণীকারীদের সমস্যাটিতে সহায়তা করবে না।
ব্রেট 18

আমি এটি মুছে ফেলেছি কারণ আমি ভুল উত্তর দিয়ে লোককে বিভ্রান্ত করতে চাইনি। সম্ভবত মডারেটররা এটি আবার সামনে এনেছিল।
সানকুলসু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.