গুডম্যান-কৃসকল গামা এবং কেন্ডাল তাউ বা স্পিয়ারম্যান রো পারস্পরিক সম্পর্ক কীভাবে তুলনা করে?


31

আমার কাজে, আমরা কিছু সেট ডেটার জন্য ভবিষ্যদ্বাণী করা র‌্যাঙ্কিং বনাম সত্য র‌্যাঙ্কিংয়ের সাথে তুলনা করছি। সম্প্রতি অবধি, আমরা একা কেন্ডাল-টাউ ব্যবহার করে আসছি। অনুরূপ প্রকল্পে কাজ করা একটি দল প্রস্তাব দিয়েছে যে আমরা তার পরিবর্তে গুডম্যান-কৃষ্কাল গামা ব্যবহার করার চেষ্টা করব এবং তারা এটি পছন্দ করেছে। আমি ভাবছিলাম যে বিভিন্ন র‌্যাঙ্কের পারস্পরিক সম্পর্ক অ্যালগরিদমের মধ্যে পার্থক্যগুলি কী।

আমি সবচেয়ে ভাল খুঁজে পেয়েছি এই উত্তরটি , যা দাবি করে যে স্পিয়ারম্যান স্বাভাবিক রৈখিক পারস্পরিক সম্পর্কের জায়গায় ব্যবহার করা হয়, এবং কেন্ডাল-টউ কম সরাসরি এবং আরও গুডম্যান-কৃসকল গামার সাথে সাদৃশ্যপূর্ণ। আমি যে ডেটা নিয়ে কাজ করছি তাতে কোনও সুস্পষ্ট রৈখিক সম্পর্ক আছে বলে মনে হয় না এবং ডেটাটি ভারীভাবে স্কিউড এবং অ-স্বাভাবিক normal

এছাড়াও, স্পিয়ারম্যান সাধারণত আমাদের ডেটাগুলির জন্য কেন্ডাল-টুর চেয়ে উচ্চতর সম্পর্কের খবর দেয় এবং আমি ভাবছিলাম যে এটি কীভাবে বিশেষত ডেটা সম্পর্কে বলে। আমি কোনও পরিসংখ্যানবিদ নই, সুতরাং এই বিষয়গুলিতে আমি যে কয়েকটি কাগজপত্র পড়ছি তা কেবল আমার কাছে কলহের মতো মনে হচ্ছে, দুঃখিত।


3
" স্পিয়ারম্যান সাধারণত আমাদের ডেটাগুলির জন্য কেন্ডাল-তাউয়ের চেয়ে ভাল সম্পর্ক সম্পর্কিত রিপোর্ট করে এবং আমি ভাবছিলাম যে এটি বিশেষত ডেটা সম্পর্কে কী বলেছে " ... সম্ভবত কিছুই নয়; কেন্ডাল হয় 0 নিকটতম প্রায়ই Spearman এর চেয়ে যখন সম্পর্কযুক্তরূপে সত্যিই আপনার নিকট নয় এমন বা - এটা ভিন্নভাবে সমিতি পরিমাপ; এটি পরিমিতিতে সাধারণত ছোট হওয়ার অর্থ এই নয় যে স্পিয়ারম্যান পারস্পরিক সম্পর্ক 'আরও ভাল'; তারা কেবল ডেটা সম্পর্কে বিভিন্ন জিনিস পরিমাপ করছে। 'আরও ভাল সম্পর্ক' বলতে আপনাকে কী নেতৃত্ব দেবে? τ0 ± 1ρ0±1
গ্লেন_বি -রাইনস্টেট মনিকা

1
এটি পরোক্ষভাবে আমার প্রশ্নের মতই ছিল, @ গ্লেন_ বি; বাদে, আমি জিজ্ঞাসা করছিলাম কেন অ্যালগরিদমগুলি উচ্চতর পারস্পরিক সম্পর্কের কথা জানিয়েছিল এবং এর কারণ কী হবে। আমার অর্থটিকে আরও পরিষ্কার করার জন্য আমি "আরও ভাল "টিকে" উচ্চতর "এ পরিবর্তন করব। আপনি ঠিক বলেছেন যে তারা বিভিন্ন জিনিস পরিমাপ করে, এবং সংখ্যাগুলির একে অপরের সাথে আসলেই খুব বেশি কিছু হয় না, তবে আমি জানতে চেয়েছিলাম সংখ্যাগুলি আসলে কী বোঝায়, যা নীচে বিস্তারিতভাবে উত্তর দেওয়া হয়েছে।
পোইক

উত্তর:


29

স্পিয়ারম্যান rho বনাম কেন্ডাল তাউ । এই দুটি এত বেশি গণনামূলকভাবে পৃথক যে আপনি সরাসরি তাদের দৈর্ঘ্যের তুলনা করতে পারবেন না । স্পিয়ারম্যান সাধারণত 1/4 থেকে 1/3 দ্বারা উচ্চতর হয় এবং এটি ভুলভাবে এই সিদ্ধান্তে পৌঁছে যে স্পিয়ারম্যান কোনও নির্দিষ্ট ডেটাসেটের জন্য "আরও ভাল"। আরএইচও এবং তউয়ের মধ্যে পার্থক্যটি তাদের আদর্শে, আরএইচওর জন্য অনুপাতের-বৈচিত্র্য এবং তাউর সম্ভাবনা । আরএইচ হ'ল একটি পিয়ারসন আর, যা র্যাঙ্কযুক্ত ডেটার জন্য প্রয়োগ করা হয় এবং আর এর মতো ছোট ছোট মুহুর্তগুলির সাথে পয়েন্টের চেয়ে বড় মুহুর্তের সাথে পয়েন্টগুলি (অর্থাৎ মেঘ কেন্দ্র থেকে বিচ্যুতি) আরও সংবেদনশীল। অতএব র‌্যাংকিংয়ের পরে মেঘের আকারের জন্য rho বেশ সংবেদনশীলসম্পন্ন: একটি বিভাজক রম্বিক মেঘের জন্য গুণাগুণটি একটি আয়তাকার ডম্ববেল্ড ক্লাউডের সহগের চেয়ে বেশি হবে (কারণ প্রথমটির ধারালো প্রান্তগুলি বড় মুহুর্তের হয়)। তাও গামার একটি এক্সটেনশান এবং সমস্ত ডেটা পয়েন্টের জন্য সমান সংবেদনশীল , তাই এটি স্থানযুক্ত মেঘের আকারে অদ্ভুততা সম্পর্কে কম সংবেদনশীল। তৌ আরহোর চেয়ে বেশি "সাধারণ", কারণ আপনি যখন ভেরিয়েবলের মধ্যে অন্তর্নিহিত (মডেল, বা জনসংখ্যায় কার্যকরী) সম্পর্ক কঠোরভাবে একঘেয়েমি বিশ্বাস করেন তখনই আরএইওর চাওয়া হয়। যদিও তাউ নমনোটোনিক অন্তর্নিহিত বক্ররেখা এবং এমন ব্যবস্থাগুলির জন্য অনুমতি দেয় যা মানোটোনিক "প্রবণতা", ধনাত্মক বা নেতিবাচক, সেখানে সামগ্রিকভাবে বিরাজ করে। Rh মাত্রার সাথে আর এর সাথে তুলনীয়; তাও হয় না।

গ্যামার চরিত্রে কেন্ডাল তাউ । তাউ গামা র একটি মানক রূপ। বেশ কয়েকটি সম্পর্কিত পদক্ষেপের সকলের মধ্যে তবে ডিনোমিনেটরকে স্বাভাবিক করার চেয়ে পৃথক :PQ

  • গামা: P+Q
  • সামার্স ডি ("এক্স নির্ভর"): P+Q+Tx
  • সোমার্স ডি ("y নির্ভরশীল"): P+Q+Ty
  • সামার্স ডি ("প্রতিসম"): উপরের দুটিটির গাণিতিক গড়
  • কেন্ডালের টাউ-বি করর। (বর্গ সারণীর জন্য সবচেয়ে উপযুক্ত): এই দুটিয়ের জ্যামিতিক গড়
  • কেন্ডালের টাউ-সি করর। (আয়তক্ষেত্রাকার টেবিলগুলির জন্য সবচেয়ে উপযুক্ত): N2(k1)/(2k)
  • কেন্ডালের টাউ-এ করর (সম্পর্কের জন্য nо সামঞ্জস্য করে): N(N1)/2=P+Q+Tx+Ty+Txy

যেখানে - "সংমিশ্রণ", প্রশ্ন - "বিপর্যয়" সহ পর্যবেক্ষণগুলির সংখ্যার সংখ্যা ; টি এক্স - ভেরিয়েবল দ্বারা এক্সের সংখ্যার সংখ্যা, টি ওয়াই - ভেরিয়েবল দ্বারা, টি এক্স ওয়াই - উভয় ভেরিয়েবল দ্বারা; এন - পর্যবেক্ষণের সংখ্যা, কে - সেই পরিবর্তনশীল যেখানে স্বতন্ত্র সংখ্যাটি কম সেখানে স্বতন্ত্র মানের সংখ্যা।PQTxTyTxyNk

সুতরাং, তাউ সরাসরি গামার সাথে তত্ত্ব এবং মাত্রায় তুলনীয়। Rho তত্ত্ব ও পিয়ারসন সঙ্গে মাত্রার সরাসরি তুলনা করা যায় । এখানে নিক স্টাওনারের দুর্দান্ত উত্তরটি জানায় যে কীভাবে পরোক্ষভাবে রাই এবং তাউয়ের তুলনা করা সম্ভব।r

তাও এবং রহ সম্পর্কেও দেখুন


14

এখানে অ্যান্ড্রু গিলপিন থেকে উদ্ধৃতি (1993) মরিস কেন্ডাল এর সমর্থনে এর Spearman এর উপর ρ তাত্ত্বিক কারণে:τρ

[কেন্ডাল এর ] একটি সাধারন বন্টনের আরো দ্রুত তুলনায় পন্থা ρ , যেমন এন , নমুনা আকার, বৃদ্ধি; এবং mathe আরও গাণিতিকভাবে ট্র্যাকটেবল, বিশেষত যখন বন্ধন উপস্থিত থাকে। τρNτ

আমি অনেক গুডম্যান-Kruskal সম্পর্কে জুড়তে পারবেন না , এটা কেন্ডাল এর চেয়ে সদা এত সামান্য বড় অনুমান উত্পাদন করতে মনে হচ্ছে যে ছাড়া অন্য τ জরিপ তথ্য একটি নমুনা আমি ইদানীং কাজ করছি করুন ... এবং অবশ্যই, লক্ষণীয়ভাবে Spearman এর চেয়ে অনুমান কম ρ । যাইহোক, আমি একটি দম্পতি আংশিক গণক চেষ্টা γ অনুমান (Foraita & Sobotka,, 2012), এবং যারা আংশিক কাছাকাছি বেরিয়ে আসেন ρ আংশিক চেয়ে τ ... এটা প্রক্রিয়াকরণের সময় যদিও ন্যায্য পরিমাণ গ্রহণ তাই আমি ছেড়ে দেব সিমুলেশন পরীক্ষা বা গাণিতিক তুলনা অন্য কারও সাথে ... (কে কীভাবে এটি করতে হবে জানতে পারে ...)γτργρτ

হিসাবে ttnphns বোঝা যায়, আপনি এই উপসংহারে দিতে পারে না যে আপনার অনুমান আপনার চেয়ে ভাল τ একা মাত্রার দ্বারা অনুমান, কারণ তাদের দাঁড়িপাল্লা ভিন্ন (যদিও সীমা হবে না)। গিলপিন অনুপাত বর্ণনা যেমন কেন্ডাল (1962) উল্লেখ ρ করার τ মোটামুটিভাবে 1.5 ওভার মূল্যবোধের পরিসীমা সবচেয়ে যাবে। তাদের দৈর্ঘ্য বাড়ার সাথে সাথে তারা ধীরে ধীরে আরও কাছাকাছি চলে আসে, তাই উভয়ই 1 (বা -1) এ পৌঁছানোর সাথে সাথে পার্থক্যটি অনন্য হয়ে যায়। গিলপিন সমতুল্য মূল্যবোধের একটা চমৎকার বড় টেবিল দেয় ρ , , 2 , , এবং জেড তৃতীয় অঙ্ক আউট τρτρτρrr2Zrτএর পরিসীমা জুড়ে .01 এর প্রতিটি বর্ধনে, ঠিক যেমন আপনি কোনও অন্ত্রের পরিসংখ্যান পাঠ্যপুস্তকের প্রচ্ছদটি দেখতে চেয়েছিলেন। তিনি এই মানগুলি কেন্দালের নির্দিষ্ট সূত্রের ভিত্তিতে তৈরি করেছিলেন, যা নিম্নরূপ: (আমি এই সূত্র সরলীকৃতρরূপ, যার মাধ্যমে গিলপিন লিখেছিলেন, যা পিয়ারসন এর পরিপ্রেক্ষিতে ছিল থেকে।)

r=sin(τπ2)ρ=6π(τarcsin(sin(τπ2)2))
ρr

হতে পারে আপনার কে একটি ρ রূপান্তরτρ করা এবং গণনা পরিবর্তন আপনার প্রভাবের আকারের প্রাক্কলনকে কীভাবে প্রভাবিত করবে তা দেখুন sense মনে হচ্ছে যে তুলনা যা ব্যাপ্তি সমস্যা Spearman এর কিছু ইঙ্গিত দিতে হবে আরো অনুভূতিশীল হয়, আপনার ডেটা উপস্থিত এ যদি সব। প্রতিটি নির্দিষ্ট সমস্যা স্বতন্ত্রভাবে চিহ্নিত করার জন্য আরও সরাসরি পদ্ধতি অবশ্যই বিদ্যমান; আমার পরামর্শটি এই সমস্যাগুলির জন্য আরও দ্রুত এবং মলিন বহুমুখী প্রভাব আকারের উত্পাদন করতে পারে। যদি কোনও পার্থক্য না থাকে (স্কেলের পার্থক্যটি সংশোধন করার পরে), তবে কেউ মনে করতে পারে যে কেবলমাত্র problemsρρ। যদি যথেষ্ট পার্থক্য থাকে, তবে সম্ভবত দায়বদ্ধতা নির্ধারণের জন্য ম্যাগনিফাইং লেন্সগুলি ছড়িয়ে দেওয়ার সম্ভবত সময় এসেছে।

আমি নিশ্চিত নই যে কেন্ডাল ব্যবহার করার সময় লোকেরা সাধারণত কীভাবে আকারের মাপের প্রতিবেদন করে (দুর্ভাগ্যবশত সীমাবদ্ধ পরিমাণে যে লোকেরা সাধারণভাবে প্রভাবের আকারগুলির প্রতিবেদন করার বিষয়ে উদ্বেগ প্রকাশ করে), তবে যেহেতু এটি সম্ভবত অপরিচিত পাঠকরা পিয়ারসনের স্কেলে এটি ব্যাখ্যা করার চেষ্টা করবেন বলে মনে হয় , এটা জ্ঞানী উভয় প্রতিবেদন করতে হতে পারে আপনার τ পরিসংখ্যাত এবং স্কেলে তার প্রভাব আকার স্কেল মধ্যে পার্থক্য আউট উপরে রূপান্তর সূত্র ব্যবহার করে ... বা অন্তত সময়ে এবং একটি পেজে তার কুশলী রূপান্তর টেবিল জন্য গিলপিন আউট দিতে ।τrτr

রেফারেন্স

ফোরাইটা, আর।, এবং সোবোটকা, এফ (2012)। গ্রাফিকাল মডেলগুলির বৈধতা। জিএমএলডিয়াল প্যাকেজ, v1.23। বিস্তৃত আর আর্কাইভ নেটওয়ার্ক। ইউআরএল: http://cran.r-project.org/web/packages/gmomot/gmomot.pdf

গিল্পিন, এআর (1993)। মেটা-বিশ্লেষণের জন্য প্রভাবের পরিমাপের পরিপ্রেক্ষিত ব্যবস্থার মধ্যে স্পেনম্যানের রোতে কেন্ডাল তাউ রূপান্তর করার সারণী Table শিক্ষাগত এবং মানসিক পরিমাপ, 53 (1), 87-92।

কেন্ডল, এমজি (1962)। রেঙ্ক পারস্পরিক সম্পর্ক পদ্ধতি (তৃতীয় সংস্করণ)। লন্ডন: গ্রিফিন।


9

ρτγγτXYγX1X2YXXXγ


2
ফ্র্যাঙ্ক, আপনি কি Spearman's ρ is related to the probability of majority concordance among random triplets of observationsআরও বিশদে এটি ব্যাখ্যা করতে পারবেন , যদি সম্ভব হয় তবে খুব বেশি গাণিতিকভাবে কঠিন নয়? ধন্যবাদ।
ttnphns

1
আমি এটি বহু বছর আগে পড়েছি, সম্ভবত একটি ননপ্যারমেট্রিক সংখ্যার পাঠ্যে text আমি রেফারেন্সটি খুঁজে পাইনি।
ফ্র্যাঙ্ক হ্যারেল

1
দুর্ভাগ্য ...
...-
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.