কেন পিয়ারসন প্যারামেট্রিক এবং স্পিয়ারম্যান নন-প্যারাম্যাট্রিক


19

স্পষ্টতই পিয়ারসনের পারস্পরিক সম্পর্ক সহগ প্যারামিমেট্রিক এবং স্পিয়ারম্যানের rho অ-প্যারাম্যাট্রিক।

এটি বুঝতে আমার সমস্যা হচ্ছে। আমি যেমন বুঝতে পেরেছি পিয়ারসনকে হিসাবে গণনা করা হয়েছে এবং একইভাবে গণনা করা হয়, যদি না আমরা তাদের মানগুলির সাথে সমস্ত মানকে প্রতিস্থাপন করি।

rxy=cov(X,Y)σxσy

উইকিপিডিয়া বলেছেন

প্যারামেট্রিক মডেল এবং নন-প্যারাম্যাট্রিক মডেলের মধ্যে পার্থক্যটি হ'ল প্রাক্তনটির একটি নির্দিষ্ট সংখ্যক পরামিতি থাকে, তবে পরবর্তীকালে প্রশিক্ষণের ডেটার পরিমাণের সাথে পরামিতিগুলির সংখ্যা বৃদ্ধি পায়।

তবে আমি নিজেই নমুনাগুলি ছাড়া কোনও প্যারামিটার দেখতে পাচ্ছি না। কেউ কেউ বলে যে প্যারামেট্রিক পরীক্ষাগুলি সাধারণ বিতরণগুলি ধরে নেয় এবং বলে যায় যে পিয়ারসন সাধারণ বিতরণকৃত ডেটা ধরে নেন তবে পিয়ারসনকে কেন এটির প্রয়োজন হবে তা দেখতে আমি ব্যর্থ।

সুতরাং আমার প্রশ্নটি পরিসংখ্যানের প্রসঙ্গে প্যারামেট্রিক এবং নন-প্যারামেট্রিক বলতে কী বোঝায়? এবং সেখানে পিয়ারসন এবং স্পিয়ারম্যান কীভাবে খাপ খায়?


6
এটি একটি ভাল প্রশ্ন এবং সেখানে একটি ভয়াবহ ভুল তথ্য রয়েছে। উদাহরণস্বরূপ, প্যারাম্যাট্রিক পরীক্ষাগুলির সমীকরণ এবং সাধারণ বিতরণগুলি ধরে নেওয়া দুর্ভাগ্যক্রমে একটি ঘন ঘন বিভ্রান্তি, যার মাধ্যমে অনেক পাঠ্যপুস্তক লেখক, অবশ্যই শিক্ষক এবং ইন্টারনেট পোস্টার কেবল অন্যদের থেকে অনুলিপি করে যারা আরও বিভ্রান্ত হন।
নিক কক্স

5
সম্ভবত প্রশ্নের সহজতম ইতিবাচক সমাধানটি হ'ল: হ্যাঁ, স্পিয়ারম্যানের পারস্পরিক সম্পর্ক একটি সম্পর্কের পরিমাণ নির্ধারণের শক্তি হিসাবে অনুমান করা যেতে পারে এবং এটি পিয়ারসনের সাথে সাদৃশ্যপূর্ণ (মূলত, এটি একই ধারণা, যেমন আপনি উল্লেখ করেছেন); তবে না, স্পিয়ারম্যানের পারস্পরিক সম্পর্ক কোনও বিতরণের বৈশিষ্ট্যযুক্ত প্যারামিটার নয়, অন্যদিকে পিয়ারসন হ'ল বিভাজনীয় সাধারণ বিতরণের একটি প্যারামিটার (যখন আপনি সম্পর্ক স্থাপন করেন তখন আপনি কী করছেন তার একটি historicতিহাসিক কিন্তু এখন ডাউনপ্লেড ব্যাখ্যা)। "পরামিতি" শব্দটির একাধিক সংবেদন রয়েছে তা দেখে বোঝা যায় এটি একটি দুর্দান্ত পার্থক্য।
নিক কক্স

@ নিককক্স, আপনি উত্তর হিসাবে পোস্ট করেন না কেন?
রিচার্ড হার্ডি

5
বিতরণের স্বাভাবিকতা সম্পর্কিত বিষয়টি কেবল তখনই কামড় দেয় যখন আপনি পারস্পরিক সম্পর্কের সাথে তাত্পর্যপূর্ণ পরীক্ষা করতে চান। আপনি যদি সম্পর্কিতগুলি কেবল বর্ণনামূলক পদক্ষেপ হিসাবে ব্যবহার করেন তবে অ-স্বাভাবিকতা সম্পর্কিত সম্পর্কগুলি ব্যবহারে বাধা হওয়ার দরকার নেই। দুটো বাইনারি ভেরিয়েবলের সাথে সম্পর্কের ক্ষেত্রেও এতটা কার্যকর হতে পারে যেহেতু উভয়ই আলাদা হয়। আপনার এখনও আউটলিয়ার ইত্যাদির প্রভাবগুলির জন্য নজর রাখা দরকার
নিক কক্স

1
যেহেতু এটি এখনও পরিষ্কারভাবে বলা হয়নি বলে মনে হয় না, তাই আমি জোর দিয়ে বলতে চাই যে কোনও পরিসংখ্যান "প্যারাম্যাট্রিক" নয়। এটি বলার মতো সংখ্যাগুলি সুস্বাদু: বিশেষণটি বিশেষ্যটি বিশেষ্যটির জন্য প্রযোজ্য নয়। পরিসংখ্যানের মডেলগুলি প্যারামিট্রিক (উইকিপিডিয়া উদ্ধৃতি দ্বারা নির্দেশিত), পাশাপাশি তাদের উপর ভিত্তি করে পরীক্ষা এবং পদ্ধতিও হতে পারে। স্পিয়ারম্যান এবং পিয়ারসন পরিসংখ্যানগুলি প্যারামেট্রিক এবং নন-প্যারামেট্রিক উভয় সেটিংসে ব্যবহার করা যেতে পারে। এই সম্পর্কে আরও stats.stackexchange.com/questions/67204 এ । কোনও মডেলকে প্যারামিমেট্রিক করে তোলে তা হল তার রাষ্ট্রীয় স্থান
শুক্র

উত্তর:


17

সমস্যাটি হ'ল "ননপ্যারামেট্রিক" এর এই দিনগুলিতে সত্যিই দুটি স্বতন্ত্র অর্থ রয়েছে। উইকিপিডিয়ায় সংজ্ঞাটি ননপ্যারমেট্রিক কার্ভ ফিটিংয়ের মতো জিনিসগুলিতে প্রযোজ্য যেমন স্প্লাইলেস বা স্থানীয় প্রতিরোধের মাধ্যমে। অন্য অর্থ, যা পুরানো, এটি "বিতরণ-মুক্ত" এর ধারায় আরও বেশি - অর্থাৎ, এমন প্রযুক্তিগুলি যা ডেটা ধরে নেওয়া বন্টন নির্বিশেষে প্রয়োগ করা যেতে পারে। পরেরটি হ'ল স্পিয়ারম্যানের রো-র ক্ষেত্রে প্রযোজ্য, যেহেতু র‌্যাঙ্ক-ট্রান্সফর্মেশন থেকেই বোঝা যাচ্ছে এটি আপনার মূল বিতরণ কী তা বিবেচনা না করে একই ফলাফল দেবে।


2
ননপ্যারমেট্রিকের দুটি অর্থ রয়েছে তবে উইকিপিডিয়ায় মন্তব্যটি সত্যই উভয়ের ক্ষেত্রে প্রযোজ্য। ননপ্যারামেট্রিক রিগ্রেশনে এটি সম্পর্কের সীমাবদ্ধ-প্যারামেট্রিক না হওয়ার বিষয়টি বোঝায়। জিনিসের 'ডিস্ট্রিবিউশন-মুক্ত' সাইডে এটি বিতরণকারী মডেলগুলিকে সসীম-প্যারাম্যাট্রিক না করে বোঝায়।
গ্লেন_বি -রিনস্টেট মনিকা

1
এইচএম, উইকিপিডিয়া থেকে উদ্ধৃতিটি আমি নই। অন্য কেউ এটি যুক্ত করেছেন।
হংক ওওই

2
মূল সম্পাদনা - যা আমি বিশ্বাস করি যে একটি বিবরণে ভুল এবং বিশেষত দরকারী কিছু যুক্ত করে না - পর্যালোচনার জন্য হাজির হয়েছিল যেহেতু এটি একটি কম = প্রতিনিধি ব্যবহারকারী দ্বারা তৈরি করা হয়েছিল, এবং একটি ব্যক্তি দ্বারা প্রত্যাখ্যান করা হয়েছিল, তবে তখন স্বয়ংক্রিয়ভাবে গ্রহণ করা হয়েছিল তৃতীয় ব্যক্তি এটিকে উন্নত করার জন্য সম্পাদনা করার চেষ্টা করেছিলেন (তারা বুঝতে পারে না যে এটি পরিণতি হবে)। আমি সম্পাদনাটি আপনার মূলটিতে ফিরে যাব। আপনি যে পছন্দটি পছন্দ করেন না এমন যে কোনও সময় আপনি এটি করতে পারেন।
গ্লেন_বি -রিনস্টেট মনিকা

এখন আপনার মূল পোস্টে ফিরে গেছে, যেহেতু আমি মনে করি এটি আপনার চুক্তি না চাইতেই আপনার পোস্টটি খুব বেশি পরিবর্তিত হয়েছে এবং আপনি এটির সাথে সম্মত হচ্ছেন বলে মনে হচ্ছে না। কোন কিছু যদি এটি সম্পর্কে পছন্দ ছিল, আমার নাম উপরের "সম্পাদিত ... আগে" লিঙ্কটি ক্লিক করুন এবং কপি কি কি ছিল সেখানে আগে, তারপর সম্পাদনা করতে এবং এটি আটকে দিন থেকে মত অংশগুলি।
Glen_b -Reinstate মনিকা

স্পিয়ারম্যান ব্যবহার করা কখন যুক্তিযুক্ত? আপনি যখন স্পিয়ারম্যান ব্যবহার করেন তখন পিয়ারসন কীভাবে সহায়তা করতে পারেন?
লিও লোপল্ড হার্টজ 준영

3

আমি মনে করি যে পিয়ারসনের পারস্পরিক সম্পর্কের সহগকে প্যারামেট্রিক বলা হবে তার একমাত্র কারণ আপনি এটি মাল্টিভারিয়েট স্বাভাবিক বিতরণের পরামিতিগুলি অনুমান করতে ব্যবহার করতে পারেন। উদাহরণস্বরূপ, দ্বিখণ্ডিত স্বাভাবিক বিতরণে 5 টি প্যারামিটার থাকে: দুটি উপায়, দুটি বৈকল্পিক এবং পারস্পরিক সম্পর্ক সহগ। দ্বিতীয়টি পিয়ারসন পারস্পরিক সম্পর্কের সহগের সাথে অনুমান করা যায়।

ρ


পিয়ারসনের পারস্পরিক সম্পর্কের সহগ পরামিতিটি এই অর্থে নয় যে আপনি এর তাত্পর্য পরীক্ষা করার জন্য আপনাকে স্বাভাবিকতা ধরে নিতে হবে? অর্থাৎ এটি কোনও পরিসংখ্যান হিসাবে স্বাভাবিকতা ধরে নেয় না, তবে আপনি অনুমান করেন যে নমুনা পারস্পরিক সম্পর্ক সহগের বিতরণ গণনা করার সময় ডেটা স্বাভাবিক হয় এবং এটি পরীক্ষা করে? এটি সত্যই প্রশ্ন, আমি 100% ভুল হতে পারি।
মিগেন

আপনি যদি স্পার্ম এবং কেন্ডলে কোনও বিতরণ অনুমান করেন তবে দয়া করে ব্যাখ্যা করতে পারেন?
লিও লোপোল্ড হার্টজ 준영

@ মিজেন আপনাকে পিয়ারসন পারস্পরিক সম্পর্কের তাৎপর্য পরীক্ষা করতে স্বাভাবিকতা ধরে নিতে হবে না; পিয়ারসন পারস্পরিক সম্পর্কের একটি সাধারণ পরীক্ষা এটি করে। আপনি একটি ভিন্ন প্যারাম্যাট্রিক অনুমান করতে পারেন এবং একটি ভিন্ন পরীক্ষা নিয়ে আসতে পারেন ... বা প্রকৃতপক্ষে, কেউ শূন্যের একটি ক্রমশক্তি পরীক্ষা করতে পারে যে জনসংখ্যা পিয়ারসন পারস্পরিক সম্পর্ক শূন্য, ফলস্বরূপ একটি ননপ্যারমেট্রিক পরীক্ষায়।
গ্লেেন_বি -রিনস্টেট মনিকা

0

সহজ উত্তর আমার মনে হয় স্পিয়ারম্যানের rho পরীক্ষায় অর্ডিনাল ডেটা ব্যবহার করা হয় (যে সংখ্যাগুলি র‌্যাঙ্ক করা যেতে পারে তবে সংখ্যার মধ্যবর্তী ব্যবধান সম্পর্কে আপনাকে কিছু বলবেন না যেমন 3 আইসক্রিমের স্বাদ 1, 2 এবং 3 স্থান করে তবে এটি কেবল আপনাকে জানায় যা কোনটি গন্ধটি কতটা পছন্দ নয়)। প্যারামেট্রিক টেস্টে সাধারণ তথ্য ব্যবহার করা যায় না।

পিয়ারসনের আর টেস্টে বিরতি বা অনুপাতের ডেটা ব্যবহার করা হয় (সংখ্যার স্থির বিরতি যেমন সেকেন্ড, কেজি, মিমি)। 1 মিমি কেবল 5 মিমি থেকেও ছোট নয় তবে আপনি কতটা ঠিক তা জানেন। এই ধরণের ডেটা প্যারামেট্রিক পরীক্ষায় ব্যবহার করা যেতে পারে।


1
অবশ্যই প্যারামেট্রিক মডেলগুলি ব্যবহার করা সম্ভব - এবং সেইজন্য প্যারামেট্রিক টেস্টগুলি - অর্ডিনাল ডেটা সহ। এই পরিবর্তনশীলটির জন্য কেবলমাত্র একটি সীমাবদ্ধ - এবং নির্দিষ্ট - পরামিতিগুলির সংখ্যা এবং সেইগুলি পরামিতি এবং ভয়েলা সম্পর্কিত কিছু উপযুক্ত অনুমানের সাথে একটি বিতরণ প্রস্তাব করা দরকার , একটি প্যারাম্যাট্রিক পরীক্ষা বিদ্যমান। পিয়ারসন পারস্পরিক সম্পর্ককে এমন পরিস্থিতিতে গণনা করা হয় যেখানে এক বা উভয় ভেরিয়েবলের দুটি বিভাগ থাকে (দুটি পৃথক সংখ্যার লেবেলযুক্ত, সাধারণত 0/1) এর ফলে সাধারণত সেই পরিস্থিতিতে সংস্থার ব্যবস্থা ব্যবহৃত হয়।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.