একটি পিসিএ বাইপ্লটে তীর স্থাপন করা osition


18

আমি জাভাস্ক্রিপ্টে মূল উপাদান বিশ্লেষণ (পিসিএ) এর জন্য বাইপ্লট বাস্তবায়ন করতে চাই। আমার প্রশ্ন হ'ল আমি কীভাবে ডেটা ম্যাট্রিক্সের একক ভেক্টর পচন (এসভিডি) এর আউটপুট থেকে তীরগুলির স্থানাঙ্ক নির্ধারণ করব ?U,V,D

এখানে আর দ্বারা উত্পাদিত একটি উদাহরণ বাইপ্লট:

biplot(prcomp(iris[,1:4]))

আইরিস ডেটাসেটের বিপ্লট

আমি বিপ্লট সম্পর্কিত উইকিপিডিয়া নিবন্ধে এটি সন্ধান করার চেষ্টা করেছি তবে এটি খুব কার্যকর নয়। বা সঠিক। নিশ্চিত যা না।


3
বিপ্লট হ'ল ওভারলে স্ক্রেটারপ্লট যা ইউ মান এবং ভি উভয় মানকে দেখায়। অথবা ইউডি এবং ভি। বা ইউ এবং ভিডি '। অথবা ইউডি এবং ভিডি '। পিসিএ এর শর্তাবলী, ইউডি কে কাঁচা মূল উপাদান স্কোর এবং ভিডি বলা হয় ভেরিয়েবল-উপাদান লোডিং।
ttnphns

2
আরও উল্লেখ করুন যে স্থানাঙ্কগুলির স্কেল আপনি প্রাথমিকভাবে কীভাবে ডেটা স্বাভাবিক করেন তার উপর নির্ভর করে। পিসিএ-তে, উদাহরণস্বরূপ, একজন সাধারণভাবে ডেটা স্কোয়ার্ট (আর) বা স্ক্রিট (আর -1) দ্বারা ভাগ করে দেয় [r হ'ল সারি সংখ্যা]। তবে সত্য "বিপ্লব" শব্দের সংকীর্ণ অর্থে একটি সাধারণত স্কয়ার্ট (আরসি) দ্বারা ডেটা ভাগ করে দেয় [সি কলামের সংখ্যা] এবং তারপরে প্রাপ্ত ইউ এবং ভি-কে ডি-নরমালাইজ করে
ttnphns

কেন ডেটা 1 দ্বারা স্কেল করতে হবে ? 1n1
ktdrv

1
@ এনটিএনএফএনএস: উপরে আপনার মন্তব্য অনুসরণ করে, আমি এই প্রশ্নের উত্তর লিখেছি, পিসিএ বাইপ্লট সাধারণকরণের ওভারভিউয়ের মতো কিছু সরবরাহ করার লক্ষ্য নিয়ে। তবে, এই বিষয় সম্পর্কে আমার জ্ঞানটি সম্পূর্ণ তাত্ত্বিক এবং আমি বিশ্বাস করি যে আমার চেয়ে বাইপলটগুলির সাথে আপনার অনেক বেশি অভিজ্ঞতা রয়েছে experience সুতরাং আমি কোন মন্তব্য জন্য কৃতজ্ঞ হবে।
অ্যামিবা

1
@ আলেকসান্ডার, জিনিসগুলি বাস্তবায়নের একটি কারণ হ'ল কী করা হচ্ছে তা জেনে রাখা। আপনি দেখতে পাচ্ছেন, কোনও রান করলে ঠিক কী ঘটে তা নির্ধারণ করা এত সহজ নয় biplot()। এছাড়াও, কেন এমন কিছুর জন্য আর-জেএস সংহতকরণের জন্য কেন বিরক্ত হন যার জন্য কোডের কয়েকটি লাইন প্রয়োজন।
অ্যামিবা বলেছেন মনিকা

উত্তর:


40

পিসিএ বিপ্লট উত্পাদন করার বিভিন্ন উপায় রয়েছে এবং তাই আপনার প্রশ্নের কোনও অনন্য উত্তর নেই। এখানে একটি সংক্ষিপ্ত বিবরণ।

আমরা ধরে নিই যে ডাটা ম্যাট্রিক্স এর সারিগুলিতে এন ডাটা পয়েন্ট রয়েছে এবং এটি কেন্দ্রিক (যেমন কলামের অর্থ সমস্ত শূন্য)। আপাতত, আমরা ধরে নিই না যে এটি প্রমিত হয়েছে, অর্থাৎ আমরা পিসিএকে কোভারিয়েন্স ম্যাট্রিক্স (পারস্পরিক সম্পর্ক ম্যাট্রিক্সের উপর নয়) বিবেচনা করি। পিসিএর পরিমাণ একক মান পচন X = U S V ⊤ এর সমান , আপনি বিশদের জন্য আমার উত্তরটি এখানে দেখতে পাবেন: এসভিডি এবং পিসিএর মধ্যে সম্পর্ক। কীভাবে পিসিএ করতে এসভিডি ব্যবহার করবেন?Xn

X=USV,

একটি পিসিএ বাইপ্লটে, দুটি প্রথম প্রধান উপাদান একটি স্ক্রেটার প্লট হিসাবে প্লট করা হয়, অর্থাৎ প্রথম কলামটি এর দ্বিতীয় কলামের বিরুদ্ধে প্লট করা হয়েছে। তবে সাধারণীকরণ আলাদা হতে পারে; যেমন একটি ব্যবহার করতে পারেন:U

  1. কলাম : এগুলি মূল উপাদানগুলি বর্গাকার এককের যোগফলকে স্কেল করা হয়;U
  2. এর কলাম : এগুলি মানকীয় মূল উপাদান (ইউনিটের বৈচিত্র);n1U
  3. কলাম : এগুলি "কাঁচা" মূল উপাদান (মূল নির্দেশাবলীর উপর অনুমান)।Uএস

তদতিরিক্ত, মূল পরিবর্তনশীলগুলি তীর হিসাবে প্লট করা হয়; অর্থাত্ আই- তীর সমাপ্তি বিন্দুর স্থানাঙ্কগুলি ভি এর প্রথম এবং দ্বিতীয় কলামে i -th মান দ্বারা দেওয়া হয় । তবে আবারও কেউ বিভিন্ন সাধারণীকরণ বেছে নিতে পারেন, যেমন:(x,y)iiV

  1. কলাম : আমি জানি না যে এখানে একটি ব্যাখ্যা কী হতে পারে;VS
  2. ভি এস / of এর কলাম : এই লোডিং হয়;VS/n1
  3. কলাম : এগুলি প্রধান অক্ষ (ওরফে প্রধান নির্দেশাবলী, ওরফে আইজেনভেেক্টর)।V

ফিশার আইরিস ডেটাসেটের জন্য এটির সমস্ত দেখতে কেমন তা এখানে রয়েছে:

ফিশার আইরিস বাইপলট, covariance উপর পিসিএ

উপর থেকে যে কোনও সাবপ্লটকে নীচে থেকে যে কোনও সাবপ্লোটের সাথে সংমিশ্রণ করা সম্ভাব্য নরমালাইজেশন তৈরি করবে। তবে একাত্তরের গ্যাব্রিয়েল-এ প্রবর্তিত বাইপল্টের মূল সংজ্ঞা অনুসারে, মূল উপাদান বিশ্লেষণের ক্ষেত্রে ম্যাট্রিকের বিপ্লব গ্রাফিক প্রদর্শন (এই কাগজটিতে 2k উদ্ধৃতি দেওয়া আছে, উপায় হিসাবে), বিপ্লটের জন্য ব্যবহৃত ম্যাট্রিকগুলি যখন প্রায় একসাথে গুণিত করা উচিত, এক্স (এটি পুরো বিষয়টি)। সুতরাং একটি "যথাযথ বাইপ্লট" উদাহরণস্বরূপ ইউ এস α β এবং ভি এস ব্যবহার করতে পারে (9XUSαβVS(1α)/β9 হ'ল "যথাযথ বাইপলটস": যথা উপরোক্ত যেকোন সাবপ্ল্লটের সংমিশ্রণ সরাসরি নীচের সাথে below

[যে কোনও সংমিশ্রণটি যেটিই ব্যবহার করুন না কেন, কিছু স্বেচ্ছাচারী ধ্রুবক ফ্যাক্টর দ্বারা তীর স্কেল করা প্রয়োজন হতে পারে যাতে তীর এবং ডেটা উভয়ই একই স্কেলে মোটামুটি প্রদর্শিত হয়]]

VS/n1Un1

এই [বিশেষ পছন্দ] পর্যবেক্ষণের মাল্টিভিয়ারেট ম্যাট্রিক্সের ব্যাখ্যায় সবচেয়ে দরকারী গ্রাফিক্যাল সহায়তা সরবরাহ করার সম্ভাবনা রয়েছে, অবশ্যই সরবরাহিত যে এগুলি যথাযথভাবে দুটি র‌্যাঙ্কে পৌঁছানো যায়।

USV

US

biplotUVSbiplot0.8biplotn/(n1)1আরসি তে পিসিএ বিপ্লবতে অন্তর্নিহিত ভেরিয়েবলগুলির তীরগুলি )

পারস্পরিক সম্পর্ক মেট্রিক্স উপর পিসিএ

X1

Fisher Iris biplots, PCA on correlations

1R=1


আরও পড়া:


1
+6, এটি 3 টিরও বেশি upvotes এর প্রাপ্য।
গুং - মনিকা পুনরায়

3
কেবলমাত্র লক্ষ্য করেছেন যে? সিএ :: প্লটকাএর বিভিন্ন সম্ভাব্য নরমালাইজেশনের একটি সুন্দর সংক্ষিপ্তসার রয়েছে: তারা সারি অধ্যক্ষকে পৃথক করে (প্রিন্সিপাল কর্ডগুলিতে বিপ্লট = সারি গঠন করে, মানক স্থানে কোলস), কর্নাল অধ্যক্ষ (মূল কাঠামোর মধ্যে কোভারিয়েন্স বিপ্লট = কোলস) স্ট্যান্ডার্ড কর্ডগুলিতে), প্রতিসম বাইপ্লট (সারি এবং কলামগুলি একক মানগুলির (ইগেনভ্যালুগুলির বর্গমূল) এর সমান রূপগুলি আকারে), রাউগাব এবং কলগ্যাব (মূল কর্ডগুলিতে সারি এবং মানক সমষ্টিগুলিতে সারিগুলি সংশ্লিষ্ট পয়েন্টের ভর দ্বারা গুণিত বা তদ্বিপরীত) এবং রাউগ্রিন এবং কোলাগ্রিন (রোউগাব এবং কোলগাব হিসাবে তবে স্কয়ার্ট (জনসাধারণ))
টম ওয়েনসিলার্স

2
এই শেষগুলিগুলিকে "অবদানের বাইপলট "ও বলা হয়; এম। গ্রিনাক্রে বই "অনুশীলনে বিপ্লটস" এছাড়াও এই সমস্ত একটি সুন্দর ওভারভিউ দেয়; স্কেলিংয়ের এই উপায়গুলি এসভিডি (যেমন সিএ বাইপলটস, পিসিএ বাইপলটস, এলডিএ বাইপলটস ইত্যাদি) ভিত্তিক সমস্ত পদ্ধতির ক্ষেত্রে প্রযোজ্য; এটি কীভাবে কাজ করে তার উদাহরণের জন্য উত্স কোড সিএ ::: প্লট.সিএ এবং "মানচিত্র" যুক্তি দেখুন
টম ভেনসিলিয়র

1
n1

1
@ আঁটোনিপরেল্লদা আমি সম্পাদনা করেছি এবং কয়েকটি লিঙ্ক sertedুকিয়েছি।
অ্যামিবা বলছেন মনিকাকে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.