আমি প্রত্যাশা করতাম পারস্পরিক সম্পর্ক সহগটি একটি রিগ্রেশন opeাল (বিটা) এর মতোই হবে, তবে কেবল দুটিটির তুলনা করলে তারা আলাদা। তারা কীভাবে আলাদা হয় - তারা কী আলাদা তথ্য দেয়?
আমি প্রত্যাশা করতাম পারস্পরিক সম্পর্ক সহগটি একটি রিগ্রেশন opeাল (বিটা) এর মতোই হবে, তবে কেবল দুটিটির তুলনা করলে তারা আলাদা। তারা কীভাবে আলাদা হয় - তারা কী আলাদা তথ্য দেয়?
উত্তর:
ধরে নেওয়া যাক আপনি কমপক্ষে স্কোয়ার দ্বারা অনুমান করা হয়েছে, আমরা উইকিপিডিয়া থেকে জানি যে সুতরাং only এ দুটি তখনই মিলে যায় । অর্থাত্ যখন দুটি ভেরিয়েবল একই স্কেল হয় তখন কোনও অর্থে এগুলি মিলিত হয়। এটি অর্জনের সর্বাধিক সাধারণ উপায় হ'ল মানদকরণের মাধ্যমে, যেমনটি @ গুং দ্বারা নির্দেশিত।
দুই, কিছু অর্থে আপনি একই তথ্য দিতে - তারা একে আপনি শক্তি বলতে রৈখিক মধ্যে সম্পর্ক এবং । তবে, তারা প্রত্যেকটি আপনাকে পৃথক তথ্য দেয় (অবশ্যই, যখন তারা ঠিক একই হয়):
পারস্পরিক সম্পর্ক আপনাকে একটি সীমাবদ্ধ পরিমাপ দেয় যা দুটি ভেরিয়েবলের স্কেলের স্বতন্ত্রভাবে ব্যাখ্যা করা যায়। কাছাকাছি অনুমান পারস্পরিক সম্পর্ক হয় , কাছাকাছি দুই একটি নিখুঁত রৈখিক সম্পর্ক হয় । রিগ্রেশন regালু, বিচ্ছিন্নভাবে, আপনাকে সেই তথ্যটির টুকরোটি বলে না।
রিগ্রেশন ঢাল প্রত্যাশিত মান আনুমানিক পরিবর্তন হিসেবে ব্যাখ্যা একটি দরকারী পরিমাণ দেয় প্রদত্ত মান । বিশেষ করে, তোমাদের প্রত্যাশিত মান পরিবর্তন বলে একটি 1-ইউনিট বৃদ্ধি সংশ্লিষ্ট । এই তথ্যটি কেবলমাত্র পারস্পরিক সম্পর্ক সহগ থেকে হ্রাস করা যায় না।
সাধারণ লিনিয়ার রিগ্রেশন (অর্থাত্, কেবল 1 কোভারিয়েট) সহ, পিয়ারসনের এর সমান, যদি উভয় ভেরিয়েবলগুলি প্রথমে মানক করা হয় । (আরও তথ্যের জন্য, আপনি আমার উত্তরটি এখানে সহায়ক হিসাবে খুঁজে পেতে পারেন )) আপনি যখন একাধিক রিগ্রেশন করছেন, মাল্টিকোলাইনারিটি ইত্যাদির কারণে এটি আরও জটিল হতে পারে etc.
পারস্পরিক সম্পর্কের সহগের পরিমাপ "নিবিড়তা" দুটি ভেরিয়েবল মধ্যে রৈখিক সম্পর্ক এবং -1 এবং 1-এর মধ্যে আবদ্ধ। শূন্যের কাছাকাছি সম্পর্কগুলি ভেরিয়েবলগুলির মধ্যে কোনও রৈখিক সংস্থার প্রতিনিধিত্ব করে না, তবে -1 বা +1 এর নিকটবর্তী সম্পর্কগুলি দৃ strong় রৈখিক সম্পর্ককে নির্দেশ করে। স্বজ্ঞাতভাবে, কোনও স্ক্র্যাটারপ্লোটের মাধ্যমে আপনার পক্ষে সবচেয়ে উপযুক্ত লাইনের অঙ্কন করা তত বেশি সহজতর তারা তত বেশি সংযুক্ত থাকে।
রিগ্রেশন ঢাল পরিমাপ করে "steepness" দুটি ভেরিয়েবল মধ্যে রৈখিক সম্পর্ক থেকে কোনো মান গ্রহণ করতে পারেন থেকে । শূন্যের কাছাকাছি opালু বলতে বোঝায় যে ভবিষ্যদ্বাণীকারী (এক্স) ভেরিয়েবল পরিবর্তন হওয়ার সাথে সাথে প্রতিক্রিয়া (Y) পরিবর্তনশীল ধীরে ধীরে পরিবর্তিত হয়। শূন্যের থেকে আরও Slালু (নেতিবাচক বা ধনাত্মক দিকের) এর অর্থ ভবিষ্যদ্বানীকারী পরিবর্তনের সাথে সাথে প্রতিক্রিয়া আরও দ্রুত পরিবর্তিত হয়। স্বজ্ঞাতভাবে, যদি আপনি কোনও স্ক্র্যাটারপ্লোটের মাধ্যমে সেরা ফিটের একটি লাইন আঁকেন তবে এটি যে স্টিপার, এটি আরও আপনার yourাল শূন্য থেকে from+ ∞
সুতরাং পারস্পরিক সম্পর্ক সহগ এবং রিগ্রেশন opeাল একই সাইন (+ বা -) থাকতে হবে, তবে প্রায় একই মান হবে না।
সরলতার জন্য, এই উত্তরটি সাধারণ রৈখিক প্রতিরোধকে ধরে নেয়।
ইনপুট ভেরিয়েবলের মাত্রা এবং স্কেল নির্বিশেষে পিয়ারসনের পারস্পরিক সম্পর্ক সহগ মাত্রাবিহীন এবং -1 এবং 1 এর মধ্যে মাপা হয়।
যদি (উদাহরণস্বরূপ) আপনি কোনও পরিমাণে গ্রাম বা কিলোগুলিতে ইনপুট করে থাকেন তবে এটি এর মানের সাথে কোনও তাত্পর্য রাখে না, যদিও এটি গ্রেডিয়েন্ট / opeালের (যাটির মাত্রা রয়েছে এবং তদনুসারে স্কেল করা হয়েছে ... এর সাথে একটি দুর্দান্ত পার্থক্য আনবে ... একইভাবে, এটিও কোন পার্থক্য করতে হবে যদি স্কেল কোন ভাবেই স্থায়ী হয় পরিবর্তে পাউন্ড বা টন ব্যবহার সহ)।
একটি সাধারণ বিক্ষোভ (পাইথন ব্যবহারের জন্য ক্ষমা প্রার্থনা!):
import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]
10 এর গুণক দ্বারা বৃদ্ধি করা সত্ত্বেও দেখায় ।
আমি এটি একটি ঝরঝরে কৌতুক যে কবুল হবে -1 এবং 1 (যাদের ক্ষেত্রে যেখানে লব হর তার চেয়ে অনেক বেশী পরম মান না থাকতে পারে এক) মধ্যে ছোটো করা আসে।
যেমন @ ম্যাক্রো উপরে বিশদ বিবরণ দিয়েছেন, াল , তাই আপনি অনুধাবন করতে সঠিক যে পিয়ারসনের theালের সাথে সম্পর্কিত, তবে কেবল তখনই সামঞ্জস্য হলে মানক বিচ্যুতির দিকে (যা কার্যকরভাবে মাত্রা এবং স্কেলগুলি পুনরুদ্ধার করে!)।
প্রথমে আমি এটি অদ্ভুত ভেবেছিলাম যে সূত্রটি মনে হয় একটি স্বচ্ছভাবে লাগানো রেখা (নিম্ন ) এর ফলে নিম্ন গ্রেডিয়েন্টের ফলাফল হয়; তারপর আমি একটি উদাহরণ অঙ্কিত এবং উপলব্ধি করেন যে একটি গ্রেডিয়েন্ট দেওয়া মধ্যে "চরিত্রহীনতা" ফলাফল নানারকম কমছে কিন্তু এই একটি আনুপাতিক বৃদ্ধি দ্বারা অফসেট হয় ।
নীচের চার্টে চারটি ডেটাসেট প্লট করা হয়েছে:
এতে দেখা যায় যে ভ্যারিয়েন্স প্রভাবিত অগত্যা প্রভাবিত না করেই , এবং মাপার একক স্কেল প্রভাবিত এবং এইভাবে করতে প্রভাবিত না করেই