যখন নমুনা কোভেরিয়েন্স ম্যাট্রিক্সটি অবিচ্ছিন্ন না হয় তখন কী করবেন?


12

আমি কয়েকটি ক্লাস্টারিং কৌশল নিয়ে কাজ করছি, যেখানে ডি-ডাইমেনশন ভেক্টরগুলির প্রদত্ত ক্লাস্টারের জন্য আমি একটি মাল্টিভারিয়েট স্বাভাবিক বিতরণ অনুমান করি এবং নমুনা ডি-ডাইমেনশনাল গড় ভেক্টর এবং নমুনা কোভারিয়েন্স ম্যাট্রিক্স গণনা করি।

তারপরে যখন সিদ্ধান্ত নেওয়ার চেষ্টা করা হচ্ছে যে কোনও নতুন, অদৃশ্য, ডি-ডাইমেনশনাল ভেক্টর এই ক্লাস্টারের অন্তর্ভুক্ত তবে আমি এই পরিমাপের মাধ্যমে এর দূরত্বটি যাচাই করছি:

(এক্সআমি-μ^এক্স)'σ^এক্স-1(এক্সআমি-μ^এক্স)>বি0.95(পি2,-পি2)

যার জন্য আমাকে কোভারিয়েন্স ম্যাট্রিক্স এর বিপরীত গণনা করা প্রয়োজন । তবে কিছু নমুনা দেওয়াতে আমি গ্যারান্টি দিতে পারি না যে সমবায়ু ম্যাট্রিক্সটি অবিচ্ছিন্ন হবে, এমন ক্ষেত্রে আমি কী করব?σ^এক্স

ধন্যবাদ


এটি ম্যাট্রিক্সকে কী অবিচ্ছেদ্য হতে না পারে তার উপর নির্ভর করে। সম্ভাব্য কারণগুলি হ'ল (ক) আপনি কোভারিয়েন্স ম্যাট্রিক্স গণনা করতে যে নমুনাটি ব্যবহার করেছিলেন তা খুব ছোট (খ) আপনার নমুনা পর্যাপ্ত আকারের তবে এটির সদস্য একটি অবিচ্ছিন্ন বিতরণ থেকে আঁকেন না যাতে আপনার নমুনার কিছু কলাম / সারি পুনরাবৃত্তি করে ।
ব্যবহারকারী 60

আমি মনে করি যে নমুনার আকারটি ছোট হয়ে যায়
এলি

@ অ্যানি-মৌসে আমি নিশ্চিত হয়েছি যে আমি এখন মাত্রা হিসাবে কমপক্ষে অনেকগুলি নমুনা ব্যবহার করছি, অন্যথায় ম্যাট্রিক্সের র‌্যাঙ্কের ঘাটতি হবে। এখনও অবধি কোনও সমস্যা নেই, তবে আমি মনে করি নমুনা covariance দিয়ে এটি অ-পরিবর্তনীয় হতে পারে?
আলি

1
এমএমটি

1
@ করোন এটি কঠোর করে তোলে>
ব্যবহারকারী 603

উত্তর:


14

+ +1+ +1

এ কারণেই আক্ষরিক পিসিএ ব্যবহার না করা সাধারণ , তবে পরিবর্তে একক মান ভলন সঞ্চালন করে , যা ম্যাট্রিক্সের সিউডোয়েন্টার গণনা করতে ব্যবহার করা যেতে পারে । ম্যাট্রিক্স যদি অবিচ্ছিন্ন হয় তবে সিউডোইনভার্সটি বিপরীত হবে।

যাইহোক, আপনি যদি অ-পরিবর্তনীয় ম্যাট্রিক্সগুলি দেখছেন, সম্ভাবনা হ'ল গোষ্ঠী থেকে আপনার দূরত্ব অর্থহীন হয়ে উঠবে যদি ভেক্টর হাইপারপ্লেনের ক্লাস্টারের পুনরায় সংস্থাগুলির বাইরে থাকে, কারণ আপনি অরথোগোনাল স্পেসের বিভিন্নতা জানেন না (আপনি ভাবতে পারেন) এই রূপটি 0 হিসাবে!) এসভিডি সিউডোইনভার্স গণনা করতে পারে, তবে "রূপগুলি" এখনও আপনার ডেটা দ্বারা নির্ধারিত হবে না।

Y=এক্সএক্স-Y

তদুপরি, আপনি কীভাবে সমবায় ম্যাট্রিক্স গণনা করছেন তার উপর নির্ভর করে বিপর্যয়কর বাতিল হওয়ার কারণে আপনি সংখ্যাসূচক সমস্যায় পড়তে পারেন। সবচেয়ে সহজ কাজটি হ'ল শূন্য গড় পেতে সর্বদা ডেটাটিকে কেন্দ্র করে নেওয়া।


এখানে উত্তর দেওয়ার জন্য দুঃখিত তবে আমি একই ইস্যুতে কাজ করছি। আমি মহালানবিস দূরত্বের মাধ্যমে ক্লাস্টারিং দূরত্বগুলির সাথে তুলনা করছি যার জন্য বিপরীত কোভেরিয়েন্স ম্যাট্রিক্স প্রয়োজন। তবে আমার ক্ষেত্রে আমি একই ত্রুটি পাচ্ছি। সুতরাং আমি সিঙ্গুলারভ্যালু ডিকম্পোজিশনের চেষ্টা করেছি তবে এবার সমস্ত দূরত্ব সমান 1.4: ডি আমি এটি বের করতে পারি না
মনস্টার এমএমআরপিজি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.