যতদূর আমি বুঝতে পেরেছি, দূরত্বের পারস্পরিক সম্পর্ক দুটি সংখ্যক ভেরিয়েবলের মধ্যে কোনও সম্পর্ক আছে কিনা তা যাচাই করার একটি মজবুত এবং সর্বজনীন উপায়। উদাহরণস্বরূপ, যদি আমাদের সংখ্যার জোড়া থাকে:
(x1, y1)
(x2, y2)
...
(xn, yn)
দুটি ভেরিয়েবল ( x
এবং y
) এর মধ্যে কোনও (অগত্যা রৈখিক নয়) সম্পর্ক আছে কিনা তা পরীক্ষা করতে আমরা দূরত্বের সম্পর্কটি ব্যবহার করতে পারি । তদতিরিক্ত, x
এবং y
বিভিন্ন মাত্রার ভেক্টর হতে পারে।
দূরত্ব পারস্পরিক সম্পর্ক গণনা করা তুলনামূলকভাবে সহজ। প্রথমে আমরা দূরত্বের ম্যাট্রিক্স গণনা করতে ব্যবহার করি । তারপরে আমরা ব্যবহার করে দূরত্বের ম্যাট্রিক্স গণনা করি । দুটি দূরত্বের ম্যাট্রিকের একই মাত্রা থাকবে কারণ এবংএকই (কারণ তারা জোড়ায় আসে)।
এখন আমাদের অনেকগুলি দূরত্ব রয়েছে যা যুক্ত করা যায়। উদাহরণস্বরূপ (2,3)
, প্রথম দূরত্বের ম্যাট্রিক্সের উপাদানটি (2,3)
দ্বিতীয় দূরত্বের ম্যাট্রিক্সের সাথে উপাদানটির সাথে যুক্ত হয় । সুতরাং, আমাদের কাছে দূরত্বের জোড়া রয়েছে এবং আমরা এটি ব্যবহার করতে পারি পারস্পরিক সম্পর্ক (দূরত্বগুলির মধ্যে পারস্পরিক সম্পর্ক) গণনা করতে।
দুই ধরণের দূরত্ব যদি পারস্পরিক সম্পর্কযুক্ত হয় তবে এর চেয়ে কাছে ক্লোজ এক্স এর অর্থ সাধারণত ঘনিষ্ঠ ইয়াস হয়। উদাহরণস্বরূপ, যদি পাসে হবে এক্স 13 তুলনায় এটি তার মানে Y 7 পাসে হতে পারে Y 13 । সুতরাং, আমরা সিদ্ধান্ত নিতে পারি যে এক্স এবং ওয়াই নির্ভরশীল।
যুক্তিসঙ্গত শোনায়, তবে দুটি দিক রয়েছে যা আমি বুঝতে পারি না ।
প্রথমত , দূরত্বের পারস্পরিক সম্পর্ক গণনা করতে আমরা সরাসরি দুটি দূরত্বের ম্যাট্রিক ব্যবহার করি না। আমরা তাদের জন্য ডাবল কেন্দ্রীকরণ পদ্ধতি প্রয়োগ করি (যাতে কোনও সারিতে (বা কলাম) সমস্ত উপাদানের যোগফল শূন্যের সমান হয়)। আমাদের কেন এটি করা দরকার তা আমি বুঝতে পারি না। এই পদক্ষেপের পিছনে যুক্তি (বা অন্তর্দৃষ্টি) কী?
দ্বিতীয়ত , মূল দূরত্বের ম্যাট্রিকগুলিতে আমাদের তির্যকের উপর জিরো থাকে। সুতরাং, আমরা যদি দূরত্বগুলির মধ্যে পারস্পরিক সম্পর্কগুলি গণনা করি তবে আমাদের কাছে একটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ সম্পর্ক থাকবে কারণ প্রথম ম্যাট্রিক্সের অনেকগুলি শূন্যের সাথে দ্বিতীয় ম্যাট্রিক্সের সংশ্লিষ্ট শূন্যগুলির সাথে জুটিবদ্ধ। কীভাবে এই সমস্যার সমাধান হয়?