একটি অ ইতিবাচক নির্দিষ্ট কোভেরিয়েন্স ম্যাট্রিক্স আমার ডেটা সম্পর্কে আমাকে কী বলে?


21

আমার বেশ কয়েকটি মাল্টিভিয়ারেট পর্যবেক্ষণ রয়েছে এবং সমস্ত ভেরিয়েবলের মধ্যে সম্ভাবনার ঘনত্ব মূল্যায়ন করতে চাই। ধারণা করা হয় যে তথ্যগুলি সাধারণত বিতরণ করা হয়। ভেরিয়েবলের স্বল্প সংখ্যায় সবকিছু যেমনটি আমি আশা করি তেমন কাজ করে তবে বৃহত্তর সংখ্যায় চলে যাওয়ার ফলে সমবায় ম্যাট্রিক্স অ ইতিবাচক নিশ্চিত হয়ে যায়।

আমি মতলব-এ সমস্যা কমিয়েছি:

load raw_data.mat; % matrix number-of-values x number of variables
Sigma = cov(data);
[R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf.

যদি ভুল হয়> 0 তবে সিগমা ধনাত্মক সুনির্দিষ্ট নয়।

উচ্চতর মাত্রায় আমার পরীক্ষামূলক ডেটা মূল্যায়নের জন্য আমি কি কিছু করতে পারি? এটি কি আমার ডেটা সম্পর্কে দরকারী কিছু বলবে?

আমি এই অঞ্চলে কিছুটা শিক্ষানবিস তাই ক্ষমা চাইছি যদি আমি স্পষ্ট কিছু মিস করে থাকি।


দেখে মনে হচ্ছে আপনার ডেটা উচ্চ মাত্রার উপস্থাপনাগুলির পক্ষে খুব কম। আপনি কি এই ডেটা দিয়ে রিগ্রেশন মডেলগুলি চালানোর পরিকল্পনা করছেন?
জোনাথন থিয়েলে

উত্তর:


30

কোভেরিয়েন্স ম্যাট্রিক্স ইতিবাচক নির্দিষ্ট নয় কারণ এটি একবচন। এর অর্থ হল আপনার কমপক্ষে একটি পরিবর্তনশীল অন্যের রৈখিক সংমিশ্রণ হিসাবে প্রকাশ করা যেতে পারে। আপনার সমস্ত ভেরিয়েবলের দরকার নেই কারণ অন্যের উপসেট থেকে কমপক্ষে একটির মান নির্ধারণ করা যায়। আমি ক্রমক্রমে ভেরিয়েবল যুক্ত করার এবং প্রতিটি পদক্ষেপে কোভেরিয়েন্স ম্যাট্রিক্স পরীক্ষা করার পরামর্শ দেব। যদি কোনও নতুন ভেরিয়েবল একটি এককত্ব তৈরি করে তবে এটিকে ফেলে দিন এবং পরবর্তীটিতে যান। অবশেষে আপনার একটি ইতিবাচক নির্দিষ্ট কোভারিয়েন্স ম্যাট্রিক্স সহ ভেরিয়েবলগুলির একটি উপসেট থাকা উচিত।


19
+1 টি। এটিও লক্ষণীয় যে সমস্ত সমবায় ম্যাট্রিকগুলি ইতিবাচক সুনির্দিষ্ট এবং সমস্ত ধনাত্মক সুনির্দিষ্ট ম্যাট্রিকগুলি হ'ল কিছু মাল্টিভারিয়েট বিতরণের covariance ম্যাট্রিক্স। সুতরাং, "অ-পজিটিভ সুনির্দিষ্ট কোভারিয়েন্স ম্যাট্রিক্স" বলা কিছুটা অক্সিমোরন। মনে হচ্ছে ওপি সত্যিই শুধু বলছিলেন যে নমুনা সহভেদাংক ম্যাট্রিক্স একবচন যা ঠিক সমরৈখিকতা থেকে ঘটতে পারে ছিল (আপনি বলেন করেছি) অথবা যখন পর্যবেক্ষণ সংখ্যা ভেরিয়েবল সংখ্যার চেয়ে কম হয়
ম্যাক্রো

3
কিছু পরিসংখ্যান সফ্টওয়্যার স্বয়ংক্রিয়ভাবে এই সমস্যাটি সংশোধন করতে প্ররোচিত হতে পারে। উদাহরণস্বরূপ, স্টাটের regressকমান্ড স্বয়ংক্রিয়ভাবে অতিরিক্ত ভেরিয়েবলগুলি নামিয়ে দেবে যখন কিছু কলিনারি হয় (এবং এর আউটপুটটি এমন আকারে সংরক্ষণ করা যায় যা এই ভেরিয়েবলগুলি সনাক্ত করে এবং ভবিষ্যতে ব্যবহারের জন্য একটি নন-কল্লিনিয়ার সাবসেট চিহ্নিত করে)। সম্ভবত একটি জটিলতা হ'ল ভেরিয়েবলগুলি অগত্যা কলিনারি নাও হতে পারে তবে এগুলি পর্যাপ্ত পর্যায়ে থাকতে পারে যে কোলেস্কি পচনতে ভাসমান বিন্দু ত্রুটির প্রচারগুলি নেতিবাচক এগারুভ্যালু অনুমান তৈরি করে, যা সমস্ত ব্যবহারিক উদ্দেশ্যে ভেরিয়েবলগুলিকে কলরেখা তৈরি করে।
হোবার

1
@ হুবুহু, একই সাথে একই কার্যকারিতা রয়েছে R- রিগ্রেশন মডেলগুলি স্বয়ংক্রিয়ভাবে লিনিয়ার প্রেডিক্টর থেকে ভেরিয়েবলগুলি ড্রপ করে থাকে যদি সঠিক কোলাইনারিটি থাকে।
ম্যাক্রো

2
@ হুবুহু, এটি কিছুটা হ্যাকি তবে আপনিও একই কৌশল করতে পারেন। যদি gআপনার লিনিয়ার মডেল হয়, তবে colnames(model.matrix(g))[-which(is.na(coef(g))==TRUE)][-1]সেই মডেলটিতে প্রবেশ করা ভবিষ্যদ্বাণীদের নামগুলি অবশ্যই পাঠানো উচিত যা সঠিকভাবে প্রান্তিক নয়। কোনটি গুণফল ছিল তা যাচাই করে NA(এটি কীভাবে Rকোনও ভেরিয়েবল বাদ ছিল তা নির্দেশ করে) কাজ করে এবং মডেল ম্যাট্রিক্সের সংশ্লিষ্ট কলামের নামগুলি সন্ধান করে (ইন্টারসেপ্ট কলাম মুছে ফেলা) কাজ করে works যাইহোক, কোনও কোলাইনারি শর্ত না থাকলে এটি কাজ করবে না তাই which(is.na(coef(g))==TRUE)খালি নয় তা যাচাই করার জন্য যদি একটি বিবৃতি প্রয়োজন হয় :)
ম্যাক্রো

8
@ ম্যাক্রো সমস্ত কোভেরিয়েন্স ম্যাট্রিক্স ইতিবাচক আধা-নির্দিষ্ট। যখন তারা একবাক্য হয় তারা ইতিবাচক সুনির্দিষ্ট হয় না কারণ ম্যাট্রিক্স এ এর ​​জন্য সমস্ত ভেক্টর x এর জন্য x'Ax> 0 থাকে positive একক ক্ষেত্রে x'Ax = 0 কিছু এক্স এর জন্য ঘটে।
মাইকেল আর চেরনিক

0

এটি একটি বৈধ ফলাফল। কোভেরিয়েন্স ম্যাট্রিক্সের সেই উপাদানটির অনুমান শূন্য যা খুব ভাল সত্য হতে পারে! এটি গণনা সংক্রান্ত অসুবিধা দেখা দিতে পারে, তবে আর এর কিছু অ্যালগরিদম (আমি মাতালাব সম্পর্কে জানি না) এটি পরিচালনা করতে পারে। আমি বুঝতে পারছি না কেন লোকেরা এই সম্পর্কে বিরক্ত হয় এবং আরও পার্সোনমিয়াস মডেল ফিট করার জন্য জোর দেয়।


-1

আমি মনে করি না যে উপরের দিকে সম্বোধন করা হয়েছে তা হ'ল আপনার ভেরিয়েবলগুলি সম্পূর্ণরূপে রৈখিকভাবে সম্পর্কিত না হলেও ইমিরিকাল ডেটা থেকে একটি ইতিবাচক নির্দিষ্ট কোভারিয়েন্স ম্যাট্রিক্স গণনা করা সম্ভব। আপনার যদি পর্যাপ্ত ডেটা না থাকে (বিশেষত যদি আপনি জোড়ের তুলনায় একগুচ্ছ থেকে উচ্চ-মাত্রিক কোভেরিয়েন্স ম্যাট্রিক্স তৈরির চেষ্টা করছেন) বা যদি আপনার ডেটা একটি বহুবিধ সাধারণ বিতরণ অনুসরণ করে না, তবে আপনি বিপরীত সম্পর্কের সাথে শেষ করতে পারেন ভেরিয়েবলগুলির মধ্যে যেমন কোভ (এ, বি)> 0; cov (একটি, সি)> 0; cov (বি, সি) <0।

এই জাতীয় ক্ষেত্রে, কেউ একটি বহুবিধ সাধারণ পিডিএফ ফিট করতে পারে না, কারণ এই মানদণ্ডগুলি পূরণ করে এমন কোনও মাল্টিভারিয়েট সাধারণ বিতরণ নেই - কোভ (এ, বি)> 0 এবং কোভ (এ, সি)> 0 অবশ্যই বোঝায় যে কোভ (বি, সি) )> 0।

এই সমস্ত বলতে গেলে, একটি ইতিবাচক নির্দিষ্ট ম্যাট্রিক্সের অর্থ এই নয় যে আপনি কলিনারি ভেরিয়েবলগুলি অন্তর্ভুক্ত করছেন। এটি এমনটিও প্রস্তাব দিতে পারে যে আপনি এমন একটি প্যাডামেট্রিক কাঠামো বেছে নিয়েছেন যা অসম্ভব এমন একটি সম্পর্কের মডেল করার চেষ্টা করছেন।


1
আপনার উত্তর এতগুলি স্তরে ভুল। যাইহোক, তির্যকটিতে 1 এর সহ একটি কোভারিয়েন্স ম্যাট্রিক্স এবং কোভের 1/2 (1 ম এবং 2 য় উপাদান), কোভের জন্য 1/2 (1 ম এবং 3 য় উপাদান), এবং কোভের জন্য -1/2 (2 য় এবং 3 ডি উপাদান) বিবেচনা করুন । কোভেরিয়েন্স ম্যাট্রিক্সের প্রায় ২.০৫, ১.৩৫, ১.৫০ রয়েছে এবং এটি আপনার ২ য় অনুচ্ছেদে দৃ .় প্রতিবেদনের প্রতিদান সরবরাহ করে।
মার্ক এল। স্টোন

@ মার্কএল.স্টোন, আপনি ২ য় অনুচ্ছেদে ঠিক বলেছেন, তবে আমি ভাবছি যে এর কিছুটা অস্পষ্ট এবং উদার ব্যাখ্যার অধীনে বাঁচানো যেতে পারে। উদাহরণস্বরূপ, আমি আশ্চর্য হই যে, অনুচ্ছেদে ১-এ, "যথেষ্ট পরিমাণে ডেটা নেই ... একটি জোড়ের জোড় থেকে তুলনামূলক উচ্চতর মাত্রার কোভারিয়েন্স ম্যাট্রিক্স তৈরির চেষ্টা করা" প্রচুর পরিমাণে অনুপস্থিত তথ্য থাকা এবং যুগলভাবে সম্পূর্ণ পর্যবেক্ষণ ব্যবহারকে বোঝায় কোভেরিয়েন্স ম্যাট্রিক্সের প্রতিটি উপাদান গণনা করা।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.