দ্বিমাত্রিক বিমানে উচ্চ মাত্রিক স্থানটি কীভাবে প্রজেক্ট করবেন?


11

আমার কাছে এন-ডাইমেনশনাল স্পেসে ডেটা পয়েন্টের একটি সেট রয়েছে। তদতিরিক্ত, এই একই এন-ডাইমেনশনাল স্পেসে আমারও সেন্ট্রয়েড রয়েছে। এমন কোনও পন্থা রয়েছে যা আমাকে মূল স্থানটিতে তাদের আপেক্ষিক দূরত্বের তথ্য রাখার সময় এই ডেটা পয়েন্টগুলিকে দ্বি-মাত্রিক স্থানে প্রজেক্ট করার অনুমতি দিতে পারে। পিসিএ কি সঠিক?


1
আপনি যদি দূরত্ব রক্ষার চেষ্টা করতে চান তবে আমার প্রথম চিন্তাটি দূরত্বগুলি (যা পিসিএ সম্পর্কিত) এর উপর বহুমাত্রিক স্কেলিং হত, তবে যেহেতু আপনার অবস্থানগুলি রয়েছে এবং কেবল দূরত্ব নয়, আমার বোঝার দ্বারা, পিসিএ তার পক্ষে কাজ করা উচিত ।
গ্লেন_বি -রিনস্টেট মনিকা

1
@Glen_b, কী পয়েন্ট যে MDS দূরত্বের ইনপুট জন্য এবং পিসিএ স্থানাঙ্ক ইনপুট জন্য, কিন্তু নয় যে পুনরাবৃত্ত তড়কা কয়েক মাত্রা MDS পিসিএ কয়েক মাত্রা বজায় ছিল। সুতরাং এমডিএস দূরত্ব সংরক্ষণ করে ক্লাসিক পিসিএর চেয়ে কিছুটা ভাল। প্রশ্নের উত্তর হ্যাঁ, পিসিএ উপযুক্ত তবে এমডিএস আরও উপযুক্ত।
ttnphns

1
এটি মূলত মেট্রিক স্পেস এম্বেডিংয়ের ক্ষেত্রে অধ্যয়ন করা হয় , অর্থাৎ দূরত্বের বিকৃতি হ্রাস করার সময় আপনি কীভাবে আপনার ডেটার মাত্রিকতা হ্রাস করতে পারেন।
বিটওয়াইজ

উত্তর:


6

আপনার সমস্যার সমাধান করে এমন একটি সাধারণ কাঠামোকে ডাইমেনশিলিটি হ্রাস বলা হয়। আপনার ডেটাতে "প্রয়োজনীয় তথ্য" সংরক্ষণের সময় আপনি N মাত্রা থেকে 2 মাত্রা পর্যন্ত ডেটা প্রজেক্ট করতে চান। সর্বাধিক উপযুক্ত পদ্ধতি আপনার ডেটা বিতরণের উপর নির্ভর করে, যেমন এন-ডাইমেনশনাল বহুগুণ। পিসিএ সর্বনিম্ন স্কোয়ার মাপদণ্ড ব্যবহার করে একটি বিমান ফিট করবে। এটি সম্ভবত "সুইস রোল" উদাহরণের জন্য খারাপভাবে কাজ করবে: সুইস রোল

আরও আধুনিক পদ্ধতিগুলির মধ্যে কার্নেল পিসিএ, এলএলই, প্রসারণ মানচিত্র এবং স্পার্স অভিধানের উপস্থাপনা অন্তর্ভুক্ত রয়েছে। দূরত্ব সংরক্ষণ সম্পর্কিত, কিছু পদ্ধতি নন-ইউক্লিডিয়ান দূরত্ব সংরক্ষণ করতে পারে।


2
এটি লক্ষ্য করা গুরুত্বপূর্ণ যে "মাত্রিকতা হ্রাস" পদ্ধতিগুলি সাধারণত "আপেক্ষিক দূরত্বের তথ্য" বজায় রাখে না । তারা করুক বা না করুক আংশিকভাবে পদ্ধতির উপর এবং আংশিকভাবে "দূরত্ব" নির্ভর করে।
whuber

2

পূর্ববর্তী উত্তরে বর্ণিত হিসাবে, মাত্রিকতা হ্রাসের বিভিন্ন পদ্ধতি রয়েছে এবং বিবেচনা করার জন্য একটি গুরুত্বপূর্ণ বিষয়টি আপনি কী উপস্থাপনের চেষ্টা করছেন - আপনি কি ইউক্যালিডিয়ান দূরত্ব ব্যবস্থা গ্রহণে আগ্রহী? অথবা নমুনা জুড়ে একটি মেট্রিক?

প্রাক্তনদের জন্য পিসিএ উপযুক্ত হতে পারে। এটি সাধারণত ধ্রুবক ব্যবস্থাগুলির সাথে ব্যবহৃত হয় যেমন নমুনাগুলির পরিমাপ (প্রাণী, গাছপালা ইত্যাদি ...)। যদিও আমি পূর্বের উত্তরে আরও আধুনিক উল্লেখগুলি সন্ধান করব।

পরবর্তীকালের জন্য, যেখানে আপনি নন-ইউক্লিডিয়ান দূরত্বের মেট্রিক ব্যবহার করে সাদৃশ্যটির তুলনা করার চেষ্টা করছেন সেখানে কয়েকটি ভাল পদ্ধতির উপস্থিতি রয়েছে যেমন প্রিন্সিপাল কম্পোনেন্টস অর্ডিনেশন (পিসিওএ) এবং নন-মেট্রিক বহুমাত্রিক স্কেলিং (এনএমডিএস)। আপনি যখন এগুলি ব্যবহার করতে পারেন তার একটি উদাহরণ হ'ল যখন আপনি বিভিন্ন অঞ্চলের মধ্যে বাস্তুসংস্থান সম্প্রদায়ের তুলনা করছেন, এবং আপনার কাছে বিভিন্ন ধরণের জীবের সন্ধান পাওয়া গেছে। সুতরাং, আপনার ডেটা হ'ল "গণনা" ডেটা। জ্যাকার্ড, সোরেনসেন, ব্রা-কার্টিসের মতো বেশ কয়েকটি মিলের মেট্রিক রয়েছে যা কার্যকরভাবে অনুমান করতে দেয় যে জীবগুলির গঠনে সাইটগুলি কতটা অনুরূপ। পিসিওএ এবং এনএমডিএস মূলত আপনাকে পরিবেশগত দূরত্ব (সাদৃশ্য) উপস্থাপনের জন্য নমুনাগুলি (সাইটগুলি) প্লট করতে দেয় এবং প্রতিটি অক্ষতে আপনার সাইটের জন্য স্কোর থাকে।

মাল্টিভাইয়ারেট বিশ্লেষণের জন্য প্রচুর ভাল বই এবং অন্যান্য সংস্থান রয়েছে। গুগলে "অর্ডিনেশন" অনুসন্ধান করুন। এছাড়াও, 'Vegan' নামক একটি আর প্যাকেজ রয়েছে যা আসলে এই কাজটি প্রচুরভাবে সম্পাদন করার জন্য সত্য good


0

আপনার সমস্যাটি বহুমাত্রিক স্কেলিংয়ের জন্য পাঠ্য-পুস্তক অ্যাপ্লিকেশনটির মতো মনে হচ্ছে । একটি ভাল ভূমিকা এখানে পাওয়া যাবে: http://www.mathpsyc.uni-bonn.de/doc/delbeke/delbeke.htm

অবশ্যই আপনি পিসিএ চেষ্টা করতে পারেন। তবে পিসিএর মূল স্থানটিতে আপেক্ষিক দূরত্বের তথ্য রাখার কোনও উদ্দেশ্য নেই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.