পিসিএ এবং ক্লাসিকাল এমডিএস কীভাবে আলাদা? এমডিএস বনাম ননমেট্রিক এমডিএস সম্পর্কে কীভাবে? এমন সময় কি আছে যখন আপনি একে অপরের চেয়ে পছন্দ করবেন? ব্যাখ্যাগুলি কীভাবে পৃথক হবে?
পিসিএ এবং ক্লাসিকাল এমডিএস কীভাবে আলাদা? এমডিএস বনাম ননমেট্রিক এমডিএস সম্পর্কে কীভাবে? এমন সময় কি আছে যখন আপনি একে অপরের চেয়ে পছন্দ করবেন? ব্যাখ্যাগুলি কীভাবে পৃথক হবে?
উত্তর:
ক্লাসিক টর্জারসনের মেট্রিক এমডিএস আসলে দূরত্বকে সাদৃশ্যগুলিতে রূপান্তর করে এবং সেগুলির জন্য পিসিএ (আইজেন-পচন বা একক-মান-পচন) সম্পাদন করে সম্পন্ন হয়। [ এই পদ্ধতির অপর নাম ( distances between objects -> similarities between them -> PCA
যার মাধ্যমে লোডিংগুলি স্থানাঙ্কের জন্য সন্ধানী ) হ'ল প্রিন্সিপাল কোঅর্ডিনেট অ্যানালাইসিস বা পিসিওএ ]
নন-মেট্রিক এমডিএস পুনরাবৃত্ত ALSCAL বা PROXSCAL অ্যালগোরিদম (বা তাদের মতো অ্যালগোরিদম) এর উপর ভিত্তি করে তৈরি হয় যা পিসিএর তুলনায় আরও বহুমুখী ম্যাপিং কৌশল এবং মেট্রিক এমডিএসেও প্রয়োগ করা যেতে পারে। পিসিএ যদিও বজায় মি আপনার জন্য গুরুত্বপূর্ণ মাত্রা, ALSCAL / PROXSCAL ফিট কনফিগারেশন মি মাত্রা (আপনি প্রাক সংজ্ঞায়িত মি ) এবং এটি আরো সরাসরি এবং সঠিকভাবে পিসিএ চেয়ে সাধারণত (নীচের চিত্রে অধ্যায় দেখুন) করতে মানচিত্রে অমিল প্রজনন করে থাকে।
সুতরাং, এমডিএস এবং পিসিএ সম্ভবত একে অপরের বিপরীতে হতে পারে একই স্তরে নয়। পিসিএ কেবল একটি পদ্ধতি যখন এমডিএস বিশ্লেষণের শ্রেণি class ম্যাপিং হিসাবে, পিসিএ হ'ল এমডিএসের একটি বিশেষ ঘটনা। অন্যদিকে, পিসিএ হ'ল ফ্যাক্টর বিশ্লেষণের একটি বিশেষ কেস যা ডেটা হ্রাস হ'ল কেবল ম্যাপিংয়ের চেয়ে বেশি, অন্যদিকে এমডিএস কেবল ম্যাপিং।
মেট্রিক এমডিএস বনাম নন-মেট্রিক এমডিএস সম্পর্কে আপনার প্রশ্নের বিষয়ে মন্তব্য করার মতো খুব কম কারণ উত্তরটি সোজা। আমি যদি বিশ্বাস করি যে আমার ইনপুট বৈষম্যগুলি ইউক্লিডিয়ান দূরত্বের এত কাছাকাছি যে একটি লিনিয়ার ট্রান্সফর্ম তাদের এম-ডাইমেনশনাল স্পেসে ম্যাপ করার জন্য যথেষ্ট হবে তবে আমি মেট্রিক এমডিএস পছন্দ করব। যদি আমি বিশ্বাস না করি তবে নন-মেট্রিক এমডিএস ব্যবহার করে একঘেয়ে রূপান্তর প্রয়োজন necessary
পাঠকের জন্য পরিভাষা সম্পর্কিত একটি নোট । টার্ম ক্লাসিক (আল) এমডিএস (সিএমডিএস) এর এমডিএসের বিস্তৃত সাহিত্যের দুটি পৃথক অর্থ থাকতে পারে, তাই এটি অস্পষ্ট এবং এড়ানো উচিত। একটি সংজ্ঞা হ'ল সিএমডিএস হ'ল টর্জারসনের মেট্রিক এমডিএসের প্রতিশব্দ । অন্য সংজ্ঞাটি হ'ল সিএমডিএস হ'ল একক ম্যাট্রিক্স ইনপুট সহ যে কোনও এমডিএস (যে কোনও অ্যালগোরিদম; মেট্রিক বা ননমেট্রিক বিশ্লেষণ) ( একসাথে অনেকগুলি ম্যাট্রিক বিশ্লেষণকারী মডেল উপস্থিত রয়েছে - স্বতন্ত্র "INDSCAL" মডেল এবং প্রতিলিপিযুক্ত মডেল)।
উত্তরের উদাহরণ । পয়েন্টগুলির কিছু মেঘ (উপবৃত্তাকার) এক-মাত্রিক এমডিএস-মানচিত্রে ম্যাপ করা হচ্ছে। এক জোড়া পয়েন্ট লাল বিন্দুতে দেখানো হয়েছে।
আইট্রেটিভ বা "সত্য" এমডিএস লক্ষ্য করে অবজেক্টগুলির মধ্যে জোড়া লাগানোর দূরত্বগুলি পুনর্গঠন করা। এটি কোনও এমডিএসের কাজ । বিভিন্ন মানসিক চাপ বা বেমানান বস্তু মানদণ্ড মধ্যে কমিয়ে আনা যেতে পারে ণ উপর riginal দূরত্ব এবং দূরত্বের মি পি: , , । একটি অ্যালগরিদম হতে পারে (নন-মেট্রিক এমডিএস) বা না (মেট্রিক এমডিএস) এই পথে একঘেয়ে রূপান্তর অন্তর্ভুক্ত। ‖ ডি 2 ও - ডি 2 মি ‖ 1 ‖ ডি ও - ডি এম ‖ 1
পিসিএ ভিত্তিক এমডিএস (টর্গারসন, বা পিসিওএ) সোজা নয়। এটি মূল স্থানের বস্তু এবং মানচিত্রে তাদের চিত্রগুলির মধ্যে বর্গক্ষেত্রের দূরত্বগুলি হ্রাস করে। এটি পুরোপুরি জেনুইন এমডিএসের কাজ নয়; এটি সাফল্যজনক, এমডিএস হিসাবে, কেবলমাত্র ততই ফেলে দেওয়া জুনিয়র অধ্যক্ষের অক্ষগুলি দুর্বল। যদি এর চেয়ে অনেক বেশি বৈচিত্র্য ব্যাখ্যা করে তবে প্রাক্তন একা মেঘের মধ্যে জোড়া লাগা দূরত্বগুলি যথেষ্ট পরিমাণে প্রতিফলিত করতে পারে, বিশেষত উপবৃত্তের সাথে অনেক দূরে থাকা পয়েন্টগুলির জন্য। Iterative এমডিএস সর্বদা জিততে হবে এবং বিশেষত যখন মানচিত্রটি খুব নিম্ন-মাত্রিক চায়। মেঘের উপবৃত্তটি পাতলা হলে Iterative এমডিএসও আরও সফল হবে, তবে পিসিওএর তুলনায় এমডিএস-টাস্কটি পুরো ফিল করবে। দ্বিগুণ কেন্দ্রিক ম্যাট্রিক্সের সম্পত্তি দ্বারা ( এখানে বর্ণিত)পি 2 ‖ ডি ণ ‖ 2 2 - ‖ ডি মিটার ‖ 2 2) এটি উপস্থিত হয় যে পিসিওএ im হ্রাস করে, যা উপরের যে কোনও সংকেত থেকে পৃথক।
আবার, পিসিএ সবচেয়ে সুবিধাজনক সমস্ত-কর্পোরাল সেভিং সাবস্পেসে ক্লাউডের পয়েন্টগুলি প্রজেক্ট করে । এটি পুনরুক্তিযুক্ত এমডিএস হিসাবে যেহেতু জোড়ায় দূরত্বে , সাবসপেসে পয়েন্টগুলির আপেক্ষিক অবস্থানগুলি সর্বাধিক সেই সম্মানের সাথে প্রজেক্ট করে না । তবুও, historতিহাসিকভাবে পিসিওএ / পিসিএ মেট্রিক এমডিএসের পদ্ধতিগুলির মধ্যে বিবেচনা করা হয়।
আহ ... বেশ আলাদা পিসিএ-তে আপনাকে মাল্টিভারিয়েট অবিচ্ছিন্ন ডেটা (প্রতিটি বিষয়ের জন্য মাল্টিভারিয়েট ভেক্টর) দেওয়া হয় এবং সেগুলি ধারণাগত করার জন্য আপনার যদি এতগুলি মাত্রা প্রয়োজন না হয় তবে আপনি নির্ধারণের চেষ্টা করছেন। (মেট্রিক) এমডিএসে আপনাকে অবজেক্টগুলির মধ্যে দূরত্বের ম্যাট্রিক্স দেওয়া হবে এবং স্থানটির এই বস্তুর অবস্থানগুলি কী (এবং আপনার যদি 1 ডি, 2 ডি, 3 ডি, ইত্যাদি স্থান প্রয়োজন কিনা) তা বের করার চেষ্টা করছেন। নন-মেট্রিক এমডিএসে আপনি কেবল এটিই জানেন যে 1 এবং 2 অবজেক্ট 2 এবং 3 অবজেক্টের চেয়ে বেশি দূরবর্তী, তাই আপনি মাত্রা এবং অবস্থানগুলি সন্ধানের শীর্ষে এটি পরিমাণের প্রমাণ দেওয়ার চেষ্টা করেন।
কল্পনাশক্তির একটি উল্লেখযোগ্য অংশ সহ, আপনি বলতে পারেন যে পিসিএ এবং এমডিএসের একটি সাধারণ লক্ষ্য হ'ল 2D বা 3 ডি তে অবজেক্টগুলিকে দৃশ্যায়ন করা। তবে ইনপুটগুলি কতটা পৃথক, এই পদ্ধতিগুলি কোনও মাল্টিভারিয়েট পাঠ্যপুস্তকে এমনকি দূর থেকে সম্পর্কিত হিসাবে আলোচনা করা হবে না। আমি অনুমান করব যে আপনি পিসিএর জন্য ব্যবহারযোগ্য উপাত্তগুলিকে এমডিএসের জন্য ব্যবহারযোগ্য উপাত্তে রূপান্তর করতে পারবেন (বলুন, নমুনা কোভরিয়েন্স ম্যাট্রিক্স ব্যবহার করে বস্তুর মধ্যে মহালানোবিস দূরত্বগুলি গণনা করে) তবে এর ফলে তাত্ক্ষণিকভাবে তথ্য ক্ষতির সৃষ্টি হবে: এমডিএস কেবলমাত্র সংজ্ঞায়িত করা হয়েছে অবস্থান এবং রোটেশন, এবং দ্বিতীয় দুটি পিসিএ দিয়ে আরও তথ্যপূর্ণভাবে করা যেতে পারে।
আমি যদি সংক্ষেপে কাউকে কাউকে নন-মেট্রিক এমডিএসের ফলাফলগুলি দেখানো এবং বিশদভাবে না গিয়ে এটি কী করে সে সম্পর্কে মোটামুটি ধারণা দিতে চাই, তবে আমি বলতে পারি:
আমাদের যে সাদৃশ্য বা বৈসাদৃশ্য রয়েছে তার ব্যবস্থা গ্রহণের ফলে আমরা আমাদের অবজেক্ট / বিষয়গুলিকে এমনভাবে মানচিত্রের চেষ্টা করছি যাতে তারা তৈরি করা 'শহরগুলি' তাদের মধ্যে দূরত্ব থাকতে পারে যা আমরা তাদের তুলনায় যতটা মিল রাখতে পারি ততই সামঞ্জস্যতা ব্যবস্থার কাছাকাছি। আমরা কেবল মাত্রিক স্থানগুলিতে কেবল তাদের নিখুঁতভাবে ম্যাপ করতে পারি , যদিও আমি এখানে দুটি সর্বাধিক তথ্যযুক্ত মাত্রার প্রতিনিধিত্ব করছি - আপনি যদি প্রধান দুই প্রধান উপাদানগুলির সাথে একটি ছবি দেখান তবে আপনি পিসিএতে কী করবেন তা পছন্দ করুন।
মেট্রিক বহুমাত্রিক স্কেলিং (এমডিএস) এর কাজটি নীচের মতো করে বিমূর্তভাবে তৈরি করা যেতে পারে: পয়েন্টগুলির মধ্যে জোড়াযুক্ত দূরত্বের একটি ম্যাট্রিক্স , ডাটা পয়েন্টগুলির একটি নিম্ন-মাত্রিক এম্বেডিং পাওয়া যায় যে তাদের মধ্যে ইউক্লিডিয়ান দূরত্বগুলি প্রদত্ত দূরত্বগুলির আনুমানিক:ডি এন আর ট ‖ এক্স আমি - এক্স ঞ ‖ ≈ ডি আমি ঞ ।
যদি "আনুমানিক" এখানে পুনর্গঠন ত্রুটির স্বাভাবিক অর্থে বোঝা যায়, অর্থাত্ যদি "স্ট্রেস" নামক ব্যয়টি কম করা হয়: তারপরে সমাধানটি PCA এর সমতুল্য নয় । সমাধানটি কোনও বদ্ধ সূত্র দ্বারা দেওয়া হয় না, এবং একটি ডেডিকেটেড পুনরাবৃত্তি অ্যালগরিদম দ্বারা গণনা করা আবশ্যক।
"ক্লাসিকাল এমডিএস", "টর্জারসন এমডিএস" নামেও পরিচিত, এই ব্যয়টির ক্রিয়াকলাপটি সম্পর্কিত তবে সমতুল্য নয় , একে "স্ট্রেন" নামে প্রতিস্থাপন করে : যা দূরত্বের পরিবর্তে কেন্দ্রিক স্কেলারের পণ্যগুলির পুনর্গঠন ত্রুটি হ্রাস করতে চায়। দেখা যাচ্ছে যে কে থেকে গণনা করা যায় (যদি if হয় ইউক্লিডিয়ান দূরত্ব) এবং এর পুনর্গঠন ত্রুটি হ্রাস করা ঠিক করে, যেমন পরবর্তী বিভাগে দেখানো হয়েছে।কে গ ডি ডি কে গ
সারিগুলির পর্যবেক্ষণ এবং কলামগুলিতে বৈশিষ্ট্য সহ ডেটা ম্যাট্রিক্স এর আকারে সংগ্রহ করা যাক । আসুন বিয়োগকৃত কলামের সাথে কেন্দ্রিক ম্যাট্রিক্স হয়।
তারপরে পিসিএ একক মান পরিমাণ সহ, of এর কলামগুলির সাথে প্রধান উপাদান principal এগুলি প্রাপ্ত করার একটি সাধারণ উপায় হ'ল কোভরিয়েন্স ম্যাট্রিক্স সি এর একটি egendecomposition মাধ্যমে, তবে অন্য সম্ভাব্য উপায় হল একটি e Endndecomposition সম্পাদন করা গ্রাম ম্যাট্রিক্স : মূল উপাদানগুলি এর বর্গক্ষেত্রগুলি দ্বারা স্কেল করা হয়েছে সংশ্লিষ্ট ইগন্যালভ্যুর।
এটি সহজেই দেখতে পাওয়া যায় যে , যেখানে একটি ম্যাট্রিক্স। এখান থেকে আমরা অবিলম্বে যেখানে নিরীক্ষিত ডেটার একটি গ্রাম ম্যাট্রিক্স। এটি দরকারী: যদি আমাদের কাছে বিনাঘাটিত ডেটাগুলির গ্রাম ম্যাট্রিক্স থাকে তবে আমরা নিজেই ফিরে না গিয়ে সরাসরি এটিকে কেন্দ্র করতে পারি । কখনও কখনও এই অপারেশন বলা হয়
এখন সাথে ইউক্লিডিয়ান দূরত্বের একটি ম্যাট্রিক্স বিবেচনা করুন। পিসিএ করার জন্য এই ম্যাট্রিক্সকে তে রূপান্তর করা যেতে পারে ? দেখা যাচ্ছে যে উত্তরটি হ্যাঁ।
প্রকৃতপক্ষে, মহাসাগরীয় আইন অনুসারে আমরা দেখতে পাই যে সুতরাং কেবল কিছু সারি এবং কলাম ধ্রুবক দ্বারা পৃথক হয় (এখানে অর্থ উপাদান অনুসারে বর্গক্ষেত্র!)। এর অর্থ আমরা যদি এটি দ্বিগুণ করে রাখি তবে আমরা :
যার অর্থ হ'ল জোড়াযুক্ত ইউক্লিডিয়ান দূরত্বের ম্যাট্রিক্স থেকে শুরু করে আমরা পিসিএ করতে পারি এবং মূল উপাদানগুলি পেতে পারি। এটি ক্লাসিকাল (টর্জারসন) এমডিএস ঠিক ঠিক তাই করে: , সুতরাং এর ফলাফলটি PCA এর সমতুল্য।
অবশ্যই, যদি পরিবর্তে অন্য কোনও দূরত্ব পরিমাপ বেছে নেওয়া হয় , তাহলে ধ্রুপদী এমডিএসের ফলাফল অন্য কিছু হবে।
তথ্যসূত্র: পরিসংখ্যান শিক্ষার উপাদানসমূহ , বিভাগ 18.5.2।
ইউক্লিডিয়ান দূরত্ব ব্যবহার করা হলে পিসিএ ক্লাসিকাল এমডিএসের মতো একই ফলাফল দেয় ।
আমি কক্স অ্যান্ড কক্স (2001) এর উদ্ধৃতি দিচ্ছি, পৃষ্ঠা 43-44:
একটি প্রিন্সিপাল উপাদান উপাদান বিশ্লেষণ এবং পিসিও [প্রধান স্থানাঙ্ক বিশ্লেষণ, ওরফে ক্লাসিকাল এমডিএস] এর মধ্যে দ্বৈততা রয়েছে যেখানে ইউক্লিডিয়ান দূরত্বের দ্বারা ভিন্নতা দেওয়া হয়।
কক্স অ্যান্ড কক্স বিভাগটি এটি পরিষ্কারভাবে ব্যাখ্যা করেছে:
same results as classical MDS
। "ক্লাসিকাল এমডিএস" দ্বারা আপনার অবশ্যই এখানে টার্গারসনের এমডিএস হওয়া উচিত। তারপর বিবৃতি প্রকৃতপক্ষে সত্য জন্য Torgerson এর MDS হয় (শুধুমাত্র দূরত্ব ম্যাট্রিক্স থেকে শুরু) প্রকৃতপক্ষে পিসিএ। যদি "ক্লাসিকাল এমডিএস" আলাদাভাবে সংজ্ঞায়িত করেন (আমার উত্তর দেখুন) তবে বিবৃতিটি সত্য নয়।
তুলনা: "মেট্রিক এমডিএস একই ফলাফলকে পিসিএ হিসাবে দেয়" - প্রক্রিয়াগতভাবে- যখন আমরা এসভিডিটি সর্বোত্তম অর্জনের জন্য ব্যবহার করা হয় সেদিকে লক্ষ্য করি। তবে, সংরক্ষিত উচ্চ-মাত্রিক মানদণ্ডটি আলাদা। পিসিএ একটি কেন্দ্রিক কোভেরিয়েন্স ম্যাট্রিক্স ব্যবহার করে যখন এমডিএস ডাবল-কেন্দ্রিক দূরত্বের ম্যাট্রিক্স দ্বারা প্রাপ্ত একটি গ্রাম ম্যাট্রিক্স ব্যবহার করে।
পার্থক্য করা গাণিতিকভাবে হবে: পিসিএ পূর্ণবিস্তার হিসাবে দেখা যাবে উপর সীমাবদ্ধতার যে অধীনে লম্ব হয়, যার ফলে অক্ষ / অধ্যক্ষ উপাদান দেয়। বহুমাত্রিক স্কেলিংয়ে একটি গ্রাম ম্যাট্রিক্স (একটি পিএসডি ম্যাট্রিক্স যা হিসাবে উপস্থাপিত হতে পারে ) মধ্যে সারিগুলির মধ্যে ইউক্যালিডিয়ান দূরত্ব থেকে গণনা করা হয় এবং নীচে উপর দিয়ে হ্রাস করা হয় । ছোট করুন: ।এক্সএক্সটু Zটিজেডএক্সওয়াই| | জি-ওয়াইটিওয়াই| | 2 এফ