আনর্ডার্ডযুক্ত শ্রেণিবদ্ধ ভেরিয়েবলগুলির সাথে সম্পর্কিত


123

আমার কাছে অনেকগুলি পর্যবেক্ষণ এবং অনেক ভেরিয়েবল সহ একটি ডেটাফ্রেম রয়েছে। এর মধ্যে কয়েকটি শ্রেণিবদ্ধ (নিরক্ষিত) এবং অন্যগুলি সংখ্যাগত are

আমি এই ভেরিয়েবলগুলির মধ্যে সমিতিগুলির সন্ধান করছি for আমি সংখ্যার ভেরিয়েবলের জন্য পারস্পরিক সম্পর্ক গণনা করতে সক্ষম হয়েছি (স্পিয়ারম্যানের পারস্পরিক সম্পর্ক) তবে:

  • আমি জানি না কীভাবে অর্ডারযুক্ত শ্রেণিবদ্ধ ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ক পরিমাপ করতে হয়।
  • আমি জানি না কীভাবে আনর্ডার্ডযুক্ত শ্রেণীবদ্ধ ভেরিয়েবল এবং সংখ্যাসূচক ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক পরিমাপ করতে হয়।

এটি কীভাবে করা যেতে পারে তা কি কেউ জানেন? যদি তা হয় তবে এই পদ্ধতিগুলি বাস্তবায়ন করার জন্য কি আর ফাংশন রয়েছে?


উত্তর:


113

এটি নির্ভর করে আপনি কীসের সাথে সম্পর্ক স্থাপন করতে চান on আপনি যখন প্রোটোটাইপিকাল পিয়ারসনের পণ্যের মুহুর্তের সম্পর্কটি চালাবেন, আপনি সংস্থার শক্তির একটি পরিমাপ পান এবং আপনি সেই সংস্থার তাত্পর্যটির একটি পরীক্ষা পান। আরও সাধারণত, তাত্পর্য পরীক্ষা এবং প্রভাব আকারের পরিমাপ পৃথক।

তাৎপর্য পরীক্ষা:

প্রভাব আকার ( সংযুক্তির শক্তি):


5
অবিচ্ছিন্ন বনাম নামমাত্র মামলার একটি খুব বিশদ ব্যাখ্যা এখানে পাওয়া যাবে: নামমাত্র (চতুর্থ) এবং একটি অবিচ্ছিন্ন (ডিভি) ভেরিয়েবলের মধ্যে সম্পর্ক স্থাপন
গাং

3
বাইনারি বনাম অন্তর ক্ষেত্রে ক্ষেত্রে পয়েন্ট-বাইজারিয়াল পারস্পরিক সম্পর্ক রয়েছে
Glen_b

বড় নমুনাগুলির জন্য চি-স্কোয়ার পরীক্ষার জন্য এর চেয়ে ভাল বিকল্প আর কী হতে পারে?
ওয়াল্ডির লিওনসিও

2
@WaldirLeoncio, হ্যাঁ কিন্তু যদি নাল সত্য, হতে হবে শুধুমাত্র সময়। এভাবেই কাজ করার কথা রয়েছে। আপনি যদি প্রভাবটির তীব্রতা পাশাপাশি শূন্যতার পরীক্ষা জানতে চান তবে আপনি চি-স্কোয়ার পরীক্ষার পাশাপাশি ক্র্যামার এর ভি গণনা করতে চাইতে পারেন। পি<.055%
গাং

1
@ গং যেমন উল্লেখ করেছেন, নামমাত্র (চতুর্থ) এবং একটি অবিচ্ছিন্ন (ডিভি) ভেরিয়েবলের মধ্যে সম্পর্ক হ'ল মিশ্র ভেরিয়েবলগুলির জন্য কীভাবে সম্পর্ক স্থাপন করা যায় তার একটি দুর্দান্ত লিঙ্ক। Hmisc::rcorrএটি কি সুন্দরভাবে সম্পাদন করে এবং আমরা নীচে এটি (একটি মিশ্র ভেরিয়েবল ডেটাফ্রেমের জন্য) পরীক্ষা করতে পারি:as.data.frame(rcorr(as.matrix(data_frame),type = "pearson")$P) as.data.frame(rcorr(as.matrix(data_frame),type = "pearson")$r)
কার্তিক এস

15

আমি নিম্নলিখিত চিটশিটটি এর আগে সংযুক্ত দেখেছি:

https://stats.idre.ucla.edu/other/mult-pkg/whatstat/

এটি আপনার কাজে লাগতে পারে। এমনকি এটির নির্দিষ্ট আর লাইব্রেরিতে লিঙ্ক রয়েছে।


3
এই চিটশিটের সমস্যাটি কেবল শ্রেণিবদ্ধ / অর্ডিনাল / ইন্টারভাল ভেরিয়েবলের বিষয়। আমি যা খুঁজছি তা হল এমন একটি পদ্ধতি যা আমাকে সংখ্যাসূচক এবং বিভাগগত স্বতন্ত্র ভেরিয়েবল উভয়ই ব্যবহার করতে দেয়।
ক্লামেন্ট এফ

6

আপনি যদি শ্রেণিবদ্ধ ভেরিয়েবলগুলির একটি সম্পর্কিত ম্যাট্রিক্স চান, তবে আপনি নীচের মোড়ক ফাংশনটি ব্যবহার করতে পারেন ('ভিসিডি' প্যাকেজটির প্রয়োজন):

catcorrm <- function(vars, dat) sapply(vars, function(y) sapply(vars, function(x) assocstats(table(dat[,x], dat[,y]))$cramer))

কোথায়:

vars আপনি সম্পর্কিত করতে চান শ্রেণীবদ্ধ ভেরিয়েবলের একটি স্ট্রিং ভেক্টর

dat একটি ডেটা ফ্রেম যা ভেরিয়েবলগুলি ধারণ করে

ফলাফলটি ক্র্যামারের ভি এর একটি ম্যাট্রিক্স।


6

এক্সকেটিআমিকেআমি=1,...,পিএক্সটিআমিআর2

এই জাতীয় বিশ্লেষণকে একাধিক চিঠিপত্র বিশ্লেষণের সাধারণীকরণ হিসাবে দেখা যেতে পারে এবং এটি বহু নামে পরিচিত যেমন ক্যানোনিকাল পারস্পরিক সম্পর্ক বিশ্লেষণ, একজাতীয় বিশ্লেষণ এবং আরও অনেকগুলি হিসাবে। আর এর একটি বাস্তবায়ন homalsপ্যাকেজে রয়েছে (সিআরএএন-তে)। এই নামের কিছুটির জন্য গুগল করা তথ্যের একটি ধনী দেবে, একটি সম্পূর্ণ বই রয়েছে: অ্যালবার্ট গিফি, "ননলাইনার মাল্টিভারিয়েট বিশ্লেষণ"। শুভকামনা!


1
(+1) কেন লাগরঞ্জ মাল্টিপ্লায়ার ব্যবহার করবেন? শ্রেণীবদ্ধটিকে স্কোর করতে কেবল অবিচ্ছিন্ন ভেরিয়েবলের মানগুলি ব্যবহার করুন। এটিও প্রকাশ করে যে সর্বাধিক সম্পর্ক কীভাবে প্রয়োজনীয় হয় না , যা কেবল তখনই অর্জনযোগ্য যখন প্রতিটি বিভাগ অবিচ্ছিন্ন ভেরিয়েবলের মানগুলির একটি অনিচ্ছাকৃত সেট দিয়ে যুক্ত হয়। 1
হোবার

আমি এই মন্তব্যটি আমলে নিতে সম্পাদনা করব।
কেজেটিল বি হালওয়ারসেন

2

আমার অনুরূপ সমস্যা ছিল এবং আমি চি-স্কোয়ার্ড-টেস্টটি প্রস্তাবিত হিসাবে চেষ্টা করেছিলাম কিন্তু আমি নুল হাইপোথেসিসের বিরুদ্ধে পি-মানগুলি মূল্যায়নে খুব বিভ্রান্ত হয়ে পড়েছিলাম।

আমি ব্যাখ্যা করব কীভাবে আমি শ্রেণিবদ্ধ ভেরিয়েবলগুলি ব্যাখ্যা করি। আপনার ক্ষেত্রে এটি কতটা প্রাসঙ্গিক তা আমি নিশ্চিত নই। আমার রেসপন্স ভেরিয়েবল ওয়াই এবং দুটি প্রেডিক্টর ভেরিয়েবলস এক্স 1 এবং এক্স 2 ছিল যেখানে এক্স 2 স্পষ্টতাল ভেরিয়েবল হিসাবে দুটি স্তরের 1 এবং 2 বলে। আমি একটি লিনিয়ার মডেল ফিট করার চেষ্টা করছিলাম

ols = lm(Y ~ X1 + X2, data=mydata)

তবে আমি বুঝতে চেয়েছিলাম যে এক্স 2 এর বিভিন্ন স্তরের উপরের সমীকরণটি কীভাবে ফিট করে। আমি একটি আর ফাংশন জুড়ে এসেছি () দ্বারা

by(mydata,X2,function(x) summary(lm(Y~X1,data=x)))

এই কোডটি যা করে তা হ'ল এটি প্রতিটি স্তরের এক্স 2 এর জন্য লিনিয়ার মডেলটিতে ফিট করার চেষ্টা করছে। এটি আমাকে সমস্ত পি-মান এবং আর-বর্গক্ষেত্র দিয়েছে, রেসিডুয়াল স্ট্যান্ডার্ড ত্রুটি যা আমি বুঝতে পারি এবং ব্যাখ্যা করতে পারি।

আবার আমি নিশ্চিত নই যে আপনি যা চান এটি এটি কিনা। আমি Y এর পূর্বাভাস দেওয়ার ক্ষেত্রে এক্স 2 এর বিভিন্ন মানের তুলনা করি sort


1

দুটি শ্রেণিবদ্ধ ভেরিয়েবলের মধ্যে লিঙ্ক শক্তি পরিমাপ করতে আমি বরং চিস্কোয়ার স্ট্যাট সহ ক্রস ট্যাব ব্যবহারের পরামর্শ দেব

একটি সংখ্যাসূচক এবং শ্রেণিবদ্ধ ভেরিয়েবলের মধ্যে লিঙ্কের শক্তি পরিমাপ করতে আপনি কোনও গড় তুলনা ব্যবহার করে দেখতে পারেন যে এটি একটি বিভাগ থেকে অন্যে পরিবর্তিত হয়েছে কিনা?


2
সাইটটিতে আপনাকে স্বাগতম, @ ডাঃসিলভালিওনেল। আপনি লক্ষ্য করতে পারেন যে দুটি শ্রেণিবদ্ধ ভেরিয়েবলের সাথে চি-স্কোয়ার্ড পরীক্ষাটি ইতিমধ্যে উপরে প্রস্তাবিত হয়েছে।
গাং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.