কোভেরিয়েন্স ম্যাট্রিক্স তৈরি করে চলকগুলির মধ্যে দূরত্বগুলি কী কী?


11

আমার একটি কোভারিয়েন্স ম্যাট্রিক্স রয়েছে এবং শ্রেণিবদ্ধ ক্লাস্টারিং ব্যবহার করে ক্লাস্টারে বিভাজনগুলি ভাগ করতে চাই (উদাহরণস্বরূপ, কোভরিয়েন্স ম্যাট্রিক্সকে বাছাই করতে)।এন×এন

ভেরিয়েবলগুলির মধ্যে (যেমন বর্গাকার কোভারিয়েন্স ম্যাট্রিক্সের কলাম / সারিগুলির মধ্যে) এর মধ্যে একটি সাধারণ দূরত্বের কার্য রয়েছে?

বা যদি আরও কিছু থাকে তবে বিষয়টিতে কোনও ভাল রেফারেন্স আছে?


আপনি কেন ভেরিয়েবলগুলিতে শ্রেণিবদ্ধ ক্লাস্টারিং ব্যবহার করতে চান? সাধারণত, আমরা একটি ডাটা ম্যাট্রিক্স , কলামে ডাব্লু / ভেরিয়েবল এবং সারিগুলিতে পর্যবেক্ষণের কথা ভাবি । আপনি যদি সুপ্ত গোষ্ঠীগুলির সন্ধান করতে চান, আপনি উদাহরণস্বরূপ, সারি / পর্যবেক্ষণগুলিতে শ্রেণিবদ্ধ ক্লাস্টারিং বা কলাম / ভেরিয়েবলগুলির ফ্যাক্টর বিশ্লেষণ করতে পারেন । এক্স
গুং - মনিকা পুনরায়

@ পাইওটার, হ্যাঁ, কোভেরিয়েন্স (বা পারস্পরিক সম্পর্ক বা কোসাইন) সহজেই এবং প্রাকৃতিকভাবে ইউক্যালিডীয় দূরত্বে রূপান্তরিত হতে পারে, কারণ এটি একটি স্কেলার পণ্য (= কৌণিক ধরণের মিল)। দুটি ভেরিয়েবলের মধ্যে কোভারিয়েন্স জানার পাশাপাশি তাদের বৈকল্পিকগুলি স্বয়ংক্রিয়ভাবে ভেরিয়েবলগুলির মধ্যে ডি জেনে বোঝায় : । 2=σ12+ +σ22-2বনাম
ttnphns

নোট করুন এই সূত্রটির অর্থ একটি ধনাত্মক covariance তুলনায় একটি নেতিবাচক সমবায়ু বৃহত্তর দূরত্ব (এবং এটি আসলে জ্যামিতিক দৃষ্টিকোণ থেকে ঘটনাটি)) আপনি যদি না চান যে স্বীকৃতির চিহ্নটি ভূমিকা পালন করতে পারে তবে নেতিবাচক চিহ্নটি বাতিল করুন।
ttnphns

@ গং এটি একটি প্রতিসম ম্যাট্রিক্স, তাই সারি ~ কলাম। আমার পক্ষে এটিকে ভেরিয়েবলের সেটে বিভক্ত করা গুরুত্বপূর্ণ, তাদেরকে ফ্যাক্টর অ্যানালাইসিস দিয়ে 'আবর্তিত' না করা (আসলে, আমি একটি স্ট্যান্ডার্ড কোভের সাথে কাজ করছি না। ম্যাট্রিক্স, তবে একটি জটিল একটি (কোয়ান্টাম মেকানিক্সে ঘনত্বের ম্যাট্রিক্স))।
পাইওটর মিগডাল

ধন্যবাদ যে বিষয়টি আমাকে বিরক্ত করে তা হ'ল আমি অসংরক্ষিত ভেরিয়েবলগুলি পৃথক করতে চাই - নেতিবাচক পারস্পরিক সম্পর্ক আমার পক্ষে (প্রায়) ইতিবাচক হিসাবে যতটা ভাল।
পাইওটর মিগডাল

উত্তর:


13

কোভেরিয়েন্স (বা পারস্পরিক সম্পর্ক বা কোসাইন) সহজেই এবং প্রাকৃতিকভাবে কোসাইনের আইন দ্বারা ইউক্যালিডিয়ান দূরত্বে রূপান্তরিত হতে পারে , কারণ এটি ইউক্যালিডীয় স্থানের একটি স্কেলার পণ্য (= কৌণিক-ভিত্তিক মিল)। আই এবং জে এবং দুটি ভেরিয়েবলের মধ্যে কোয়াররিয়েন্স জানার সাথে সাথে ভেরিয়েবলের মধ্যে d জেনে রাখা স্বয়ংক্রিয়ভাবে বোঝায় : । (যে ডি 2 আমি জেআমি2=σআমি2+ +σ2-2বনামআমিআমি2সাধারণ স্কোয়ারড ইউক্লিডিয়ান দূরত্বের সাথে সরাসরি আনুপাতিক : আপনি যদি বৈকল্পিক এবং কোভারিয়েন্সের জায়গায় বর্গাকার পরিমাণ এবং সম-অফ ক্রস প্রোডাক্ট ব্যবহার করেন তবে আপনি পরবর্তীটি পাবেন। উভয় ভেরিয়েবল অবশ্যই প্রাথমিকভাবে কেন্দ্রিক হওয়া উচিত: "কোভেরিয়েনস" এর কথা বলা হ'ল সরানো উপায় সহ ডেটা সম্পর্কে চিন্তাভাবনা করা।)

দ্রষ্টব্য, এই সূত্রটির অর্থ হল যে .ণাত্মক covariance ইতিবাচক covariance তুলনায় বৃহত্তর দূরত্ব (এবং প্রকৃতপক্ষে এটি জ্যামিতিক দৃষ্টিকোণ থেকে ক্ষেত্রে হয়, অর্থাত্ যখন স্থানটিতে ভেরিয়েবল হিসাবে দেখা হয় )। আপনি যদি না চান যে স্বীকৃতির চিহ্নটি ভূমিকা পালন করতে পারে তবে নেতিবাচক চিহ্নটি বাতিল করুন। নেতিবাচক চিহ্নটিকে উপেক্ষা করা "হাত দ্বারা প্যাচিং" অপারেশন নয় এবং প্রয়োজন অনুসারে সতর্কতাযুক্ত : যদি কোভ ম্যাট্রিক্স ইতিবাচক নির্দিষ্ট হয় তবে অ্যাবস (কোভ) ম্যাট্রিক্সও ইতিবাচক সুনির্দিষ্ট হবে; এবং সুতরাং উপরোক্ত সূত্র দ্বারা প্রাপ্ত দূরত্বগুলি সত্য ইউক্লিডিয়ান দূরত্ব হবে (ইউক্লিডিয়ান দূরত্বটি নির্দিষ্ট ধরণের মেট্রিক দূরত্ব)।

শ্রেণিবিন্যাস সংক্রান্ত ক্লাস্টারিংয়ের ক্ষেত্রে ইউক্লিডিয়ান দূরত্ব সর্বজনীন : এই জাতীয় ক্লাস্টারিংয়ের যে কোনও পদ্ধতি ইউক্যালিডিয়ান বা স্কোয়ার্ড ইউক্যালিডিয়ান ডি সহ বৈধ । তবে কিছু পদ্ধতি, যেমন গড় লিঙ্কেজ বা সম্পূর্ণ লিঙ্কেজ, কোনও ভিন্নতা বা মিলের সাথে ব্যবহার করা যেতে পারে (কেবল মেট্রিক দূরত্ব নয়)। সুতরাং আপনি যেমন cov বা অ্যাবস (কোভ) ম্যাট্রিক্স বা - উদাহরণস্বরূপ - সর্বোচ্চ (অ্যাবস (কোভ)) - অ্যাবস (কোভ) দূরত্বের ম্যাট্রিক্সের সাহায্যে এই জাতীয় পদ্ধতি ব্যবহার করতে পারেন । অবশ্যই, ক্লাস্টারিং ফলাফলগুলি সম্ভবত ব্যবহার করা (ডিস) মিলের সঠিক প্রকৃতির উপর নির্ভর করে।


আমি2আমি2

@ হেলো গুডবি, হ্যাঁ আমি প্রথম উদাহরণে দুটি ভেরিয়েবল (ভেক্টর) বোঝাতে চাইছি - আসলে, প্রথম উপায়ে, সরানো উপায় সহ।
ttnphns

3

ক্লাস্টারিং করতে পারস্পরিক সম্পর্ক ম্যাট্রিক্স ব্যবহার করবেন না কেন? ধরে নিচ্ছি আপনার র্যান্ডম ভেরিয়েবলগুলি কেন্দ্রিক, ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক গণনা করে আপনি কোজিনের মিলের দূরত্ব গণনা করছেন । এই দূরত্বটি আপনার লিঙ্কেও উল্লেখ করা হয়েছে। এই দূরত্বটি শ্রেণিবদ্ধ ক্লাস্টারিংয়ের জন্য ব্যবহার করা যেতে পারে। 1 - | কোসাইন অনুরূপ | আরও ছোট, আপনার ভেরিয়েবলগুলি সমান।


(আমি,)=1-একজনআমি2/(একজনআমিআমিএকজন)

3
আহ, ভুল বোঝার জন্য দুঃখিত। আমার জানা সবচেয়ে ভাল উত্স এটি । তারা শ্রেণিবদ্ধ ক্লাস্টারিং সহ বেশ কয়েকটি মেট্রিকের মান (যা পারস্পরিক সম্পর্ক ব্যবহার করে) অধ্যয়ন করে। শ্রেণিবদ্ধ ক্লাস্টারিংয়ের জন্য আমি সাধারণত অনেকগুলি মেট্রিক চেষ্টা করি এবং দেখি যা আমার নির্দিষ্ট লক্ষ্য এবং ডেটার জন্য সবচেয়ে ভাল কাজ করে।
জোর্জে বানুওলোস

লিঙ্কটি আর কাজ করবে বলে মনে হচ্ছে না?
মাফতিউ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.