কলিনারি ভেরিয়েবলের সাথে কী করবেন


11

দাবি অস্বীকার: এটি একটি হোম ওয়ার্ক প্রকল্পের জন্য।

আমি বেশ কয়েকটি ভেরিয়েবলের উপর নির্ভর করে হীরকের দামের জন্য সেরা মডেলটি নিয়ে আসার চেষ্টা করছি এবং আমার মনে হচ্ছে এ পর্যন্ত আমি বেশ ভাল মডেল পেয়েছি। তবে আমি দুটি ভেরিয়েবলের মধ্যে চলেছি যা স্পষ্টতই কলিনারি:

>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
                   Table       Depth Carat.Weight
Table         1.00000000 -0.41035485   0.05237998
Depth        -0.41035485  1.00000000   0.01779489
Carat.Weight  0.05237998  0.01779489   1.00000000

টেবিল এবং গভীরতা একে অপরের উপর নির্ভরশীল, তবে আমি তাদের এখনও আমার ভবিষ্যদ্বাণীমূলক মডেলটিতে অন্তর্ভুক্ত করতে চাই। আমি হীরা সম্পর্কে কিছু গবেষণা করে দেখেছি যে টেবিল এবং গভীরতা হ'ল শীর্ষের দৈর্ঘ্য এবং একটি হীরার শীর্ষ থেকে নীচে পর্যন্ত দূরত্ব। যেহেতু হীরার এই দামগুলি সৌন্দর্যের সাথে সম্পর্কিত বলে মনে হয় এবং সৌন্দর্যের সাথে এটি অনুপাত বলে মনে হয়, তাই আমি তাদের অনুপাতটি অন্তর্ভুক্ত করতে যাচ্ছি, বলুন , দাম ভবিষ্যদ্বাণী করা। কোলাইনারি ভেরিয়েবলগুলি মোকাবেলার জন্য এই আদর্শ পদ্ধতিটি কী? তা না হলে কী?TableDepth

সম্পাদনা করুন: এখানে গভীরতা ~ সারণির প্লট রয়েছে: এখানে চিত্র বর্ণনা লিখুন


1
একটি আকর্ষণীয় প্রশ্নের জন্য +1 তবে, না, সহ-রৈখিক ভেরিয়েবলগুলি মোকাবেলার জন্য এটি অবশ্যই কোনও প্রমিত পদ্ধতি নয়। আশা করি কেউ না কেন আপনাকে একটি ভাল উত্তর দেবে। আপনার ক্ষেত্রে এটি করা এখনও ভাল জিনিস হতে পারে ...
পিটার এলিস

3
এই সম্পর্কে বিজোড় জিনিসটি মনে হয় যে -0.4 এর পারস্পরিক সম্পর্কটি সূচিত করে যে শীর্ষগুলি জুড়ে দীর্ঘ হীরা শীর্ষ থেকে নীচে ছোট হয়। এটি পাল্টা স্বজ্ঞাত বলে মনে হচ্ছে - নিশ্চিত যে এটি সঠিক?
পিটার এলিস

corTableDepth

@ পিটারএলিস আমাকে জানানো হয়েছিল যে এটি হ'ল একটি বাস্তব ডেটা সেট। গভীরতা ~ টেবিলের একটি প্লটের দিকে তাকানো, এটি কারণ হতে পারে উচ্চ টেবিলের মানগুলির জন্য বৈকল্পিক অনুরাগীরা।
মাইক ফ্লাইন

উত্তর:


14

এই ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত।

এই পারস্পরিক সম্পর্ক ম্যাট্রিক্স দ্বারা সূচিত লিনিয়ার অ্যাসোসিয়েশনের ব্যাপ্তিটি কলিনারি হিসাবে বিবেচিত হওয়ার জন্য দূরবর্তীভাবে এত বেশি নয়।

এই ক্ষেত্রে, আমি সাধারণত রিগ্রেশন অ্যাপ্লিকেশনগুলির জন্য এই তিনটি ভেরিয়েবল ব্যবহার করে বেশ খুশি হব।

মাল্টিকোলাইনারিটি সনাক্ত করার একটি উপায় হ'ল পারস্পরিক সম্পর্ক ম্যাট্রিক্সের চোলসকি পঁচন পরীক্ষা করা - যদি মাল্টিকোল্লাইনারিটি থাকে তবে কিছু তির্যক উপাদান শূন্যের কাছাকাছি থাকবে। এখানে এটি আপনার নিজের সম্পর্ক ম্যাট্রিক্সে রয়েছে:

> chol(co)
     [,1]       [,2]       [,3]
[1,]    1 -0.4103548 0.05237998
[2,]    0  0.9119259 0.04308384
[3,]    0  0.0000000 0.99769741

(তির্যকটি সর্বদা ইতিবাচক হওয়া উচিত, যদিও কিছু বাস্তবায়ন সংশ্লেষিত কাণ্ডের ত্রুটির প্রভাবের সাথে কিছুটা নেতিবাচক যেতে পারে)

আপনি দেখতে পাচ্ছেন, সবচেয়ে ছোট তির্যকটি 0.91, যা এখনও শূন্য থেকে অনেক দূরে।

বিপরীতে এখানে প্রায় প্রায় কলিনের তথ্য রয়েছে:

> x<-data.frame(x1=rnorm(20),x2=rnorm(20),x3=rnorm(20))
> x$x4<-with(x,x1+x2+x3+rnorm(20,0,1e-4))
> chol(cor(x))
   x1         x2         x3           x4
x1  1 0.03243977 -0.3920567 3.295264e-01
x2  0 0.99947369  0.4056161 7.617940e-01
x3  0 0.00000000  0.8256919 5.577474e-01
x4  0 0.00000000  0.0000000 7.590116e-05   <------- close to 0.

ধন্যবাদ, আমি মনে করি আমি কেবল "সম্পর্কযুক্ত" এবং "কলিনারিয়ার" এর মধ্যে বিভ্রান্ত হয়ে পড়েছিলাম
মাইক ফ্লাইন

@kingledion ব্যক্তিদের আপনার প্রশ্নের উত্তর পেতে চেষ্টা করার জন্য মন্তব্য ব্যবহার করবেন না।
গ্লেন_বি

6

ভেবেছিল এই হীরা কাটা পরিকল্পনাগুলি প্রশ্নের মধ্যে অন্তর্দৃষ্টি যুক্ত করতে পারে। কোনও মন্তব্যে কোনও চিত্র যুক্ত করা যায় না তাই এটির উত্তর তৈরি করুন ....

এখানে চিত্র বর্ণনা লিখুন

পুনশ্চ. @ পিটারএলিসের মন্তব্য: "যে হীরাগুলি শীর্ষে দীর্ঘায়িত হয় উপরে থেকে নীচে পর্যন্ত সংক্ষিপ্ত হয়" এই সত্যটি বোধগম্য হতে পারে: ধরে নিন যে সমস্ত অবিরত হীরা মোটামুটি আয়তক্ষেত্রাকার (বলুন)। এখন কর্তনকারীকে অবশ্যই এই কাটা আবদ্ধের সাথে তার কাটাটি বেছে নিতে হবে। এটি ট্রেড অফের পরিচয় দেয়। প্রস্থ এবং দৈর্ঘ্য উভয় বৃদ্ধি পেলে আপনি আরও বড় হীরার জন্য যাচ্ছেন। সম্ভাব্য তবে বিরল এবং আরও ব্যয়বহুল। ধারণা তৈরী কর?


2

লিনিয়ার রিগ্রেশন এ অনুপাত ব্যবহার করা এড়ানো উচিত। মূলত, আপনি যা বলছেন তা হ'ল, যদি সেই দুটি ভেরিয়েবলের উপর লিনিয়ার রিগ্রেশন করা হয়, তবে তারা বিনা বাধা দিয়ে লিনিয়ার রিলেশন করতে হবে; এটা অবশ্যই ঘটনা নয়। দেখুন: http://cscu.cornell.edu/news/statnews/stnews03.pdf

এছাড়াও, তারা একটি সুপ্ত পরিবর্তনশীল - হীরার আকার (ভলিউম বা অঞ্চল) পরিমাপ করছে। আপনি কি উভয় ভেরিয়েবলকে অন্তর্ভুক্ত করার পরিবর্তে কোনও উপাত্তকে ক্ষেত্রের ক্ষেত্র / ভলিউম পরিমাপে রূপান্তরিত করার বিষয়টি বিবেচনা করেছেন?

আপনার সেই গভীরতা এবং সারণী ডেটার একটি অবশিষ্ট প্লট পোস্ট করা উচিত। উভয়ের মধ্যে আপনার সম্পর্কটি যাইহোক অবৈধ হতে পারে।


1

সারণী এবং প্রস্থ সত্যই পারস্পরিক সম্পর্কযুক্ত কিনা তা পারস্পরিক সম্পর্ক থেকে সিদ্ধান্ত নেওয়া কঠিন। +1 / -1 এর নিকটবর্তী একটি সহগ বলবে যে তারা কলিনারি। এটি নমুনার আকারের উপরও নির্ভর করে..আপনার কাছে আরও ডেটা থাকলে তা নিশ্চিত করতে ব্যবহার করুন।

কলিনারি ভেরিয়েবলগুলির সাথে ডিল করার স্ট্যান্ডার্ড পদ্ধতিটি হ'ল তাদের মধ্যে একটিকে নির্মূল করা ... কারণ জানাশুনা করে একজন অন্যটিকে নির্ধারণ করে।


1
আমি নিশ্চিত নই যে আমি ডাব্লু / এটিকে সম্মত করছি। পারস্পরিক সম্পর্ক হল r = -। 41, যা একটি পরস্পরের সম্পর্কের জন্য যুক্তিসঙ্গত মাত্রা, আমি ভাবব। সম্ভাব্য এন প্রদত্ত (প্লটের এক নজরে ভিত্তি করে) আমি আশা করব যে rটি অত্যন্ত 'তাত্পর্যপূর্ণ' হবে। টেবিল এবং গভীরতা "কলিনারি" বলা যথেষ্ট সংযুক্ত কিনা তা সংজ্ঞার বিষয় হতে চলেছে (যদিও আমি এটিকে সমস্যাযুক্ত কোলাইনারিটি বলব না)। অবশেষে, আমি r এর 1 এর 1 এর খুব কাছাকাছি না হলে আমি কেবল কোনও একটি ভেরিয়েবল মুছে ফেলার বিষয়ে সতর্ক থাকব (উদাহরণস্বরূপ,) .99) - আপনার অর্থ কি তা আমি বলতে পারি না।
গুং - মনিকা পুনরায়

1

আপনি কী ভাবেন যে সেই টেবিল এবং গভীরতা আপনার মডেলটিতে প্রান্তিকতার কারণ? সম্পর্কের ম্যাট্রিক্স থেকে একাই বলা মুশকিল যে এই দুটি ভেরিয়েবলের প্রান্তিক সমস্যার কারণ হবে। একটি যৌথ F পরীক্ষা আপনার মডেলটিতে উভয় ভেরিয়েবলের অবদান সম্পর্কে আপনাকে কী বলে? কৌতূহলী_ ক্যাট হিসাবে উল্লেখ করা হয়েছে যে সম্পর্কটি লিনিয়ার না হলে (সম্ভবত কোনও র‌্যাঙ্ক ভিত্তিক পরিমাপ?) পিয়ারসন পারস্পরিক সম্পর্কের সেরা মাপকাঠি নাও হতে পারে। ভিআইএফ এবং সহনশীলতা আপনার কাছে যে পরিমাণ কলিনারিটি থাকতে পারে তা পরিমাপ করতে সহায়তা করতে পারে।

আমি মনে করি যে তাদের অনুপাত ব্যবহার করার আপনার পদ্ধতিটি যথাযথ (যদিও কোলিনারিটির সমাধান হিসাবে নয়)। যখন আমি চিত্রটি দেখি, আমি তত্ক্ষণাত্ স্বাস্থ্য গবেষণায় একটি সাধারণ ব্যবস্থা সম্পর্কে চিন্তা করি যা কোমর অনুপাতের কোমর পর্যন্ত। যদিও, এক্ষেত্রে বিএমআইয়ের তুলনায় বেশি (ওজন / উচ্চতা more 2)। যদি অনুপাতটি আপনার দর্শকদের মধ্যে সহজেই ব্যাখ্যাযোগ্য এবং স্বজ্ঞাত হয় তবে আমি এটি ব্যবহার না করার কোনও কারণ দেখতে পাচ্ছি না। তবে, কোলিনারিটির সুস্পষ্ট প্রমাণ না থাকলে আপনি সম্ভবত আপনার মডেলটিতে দুটি পরিবর্তনশীল ব্যবহার করতে সক্ষম।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.