প্রশ্ন ট্যাগ «pca»

প্রধান উপাদান বিশ্লেষণ (পিসিএ) একটি লিনিয়ার মাত্রিকতা হ্রাস কৌশল। এটি যতটা সম্ভব তথ্য (তত বেশি বৈকল্পিক) সংরক্ষণ করে নির্মিত ভেরিয়েবলগুলির একটি ছোট সেটটিতে একটি মাল্টিভিয়ারেট ডেটাসেট হ্রাস করে। এই ভেরিয়েবলগুলি, প্রধান উপাদান হিসাবে পরিচিত, ইনপুট ভেরিয়েবলের লিনিয়ার সংমিশ্রণ।

1
একটি গবেষণাপত্রে “মূল উপাদানগুলির সংখ্যা নির্ধারণের জন্য মন্টে কার্লো সিমুলেশন” উল্লেখ করা হয়েছে; এটা কিভাবে কাজ করে?
আমি এমআরআই তথ্য নিয়ে একটি ম্যাটল্যাব বিশ্লেষণ করছি যেখানে আমি 10304x236 আকারের ম্যাট্রিক্সে পিসিএ করেছি যেখানে 10304 ভক্সেলের সংখ্যা (তাদেরকে পিক্সেল হিসাবে মনে করি) এবং 236 সময়পয়েন্টের সংখ্যা। পিসিএ আমাকে 236 ইগেনভ্যালু এবং তাদের সম্পর্কিত সহগ প্রদান করে। এই সব ঠিক আছে। তবে কয়টি উপাদান ধরে রাখতে হবে তা ঠিক …

1
মূল উপাদানগুলির স্কোরগুলি কেন সম্পর্কহীন?
Supose একজনএকজন\mathbf Aগড় কেন্দ্রিক ডেটার একটি ম্যাট্রিক্স। জরায়ুএস =কোভ( এ )এস=cov(একজন)\mathbf S=\text{cov}(\mathbf A) হয় মি × মিমি×মিm\times m, আছে মিমিm স্বতন্ত্র এগেনভ্যালু এবং ইগেনভেেক্টর গুলি1গুলি1\mathbf s_1, গুলি2গুলি2\mathbf s_2 ... গুলিমিগুলিমি\mathbf s_mযা অরথোগোনাল। দ্য আমিআমিi-তম মূল উপাদান (কিছু লোক তাদের "স্কোর" বলে ডাকে) ভেক্টর z- রআমি= কগুলিআমিz- রআমি=একজনগুলিআমি\mathbf z_i = \mathbf …

2
বুলিয়ান বৈশিষ্ট্যগুলির একটি ছোট নমুনা সেটের জন্য পিসিএ এবং বর্ণালী ক্লাস্টারিংয়ের মধ্যে পার্থক্য
আমার কাছে 50 টি নমুনার ডেটাসেট রয়েছে। প্রতিটি নমুনা 11 (সম্ভবত সম্পর্কিত) বুলিয়ান বৈশিষ্ট্য নিয়ে গঠিত। আমি কিছু 2D প্লটের উপর এই নমুনাগুলি কীভাবে দৃশ্যমান করব এবং 50 টি নমুনার মধ্যে ক্লাস্টার / গ্রুপিং রয়েছে কিনা তা পরীক্ষা করতে চাই some আমি নিম্নলিখিত দুটি পদ্ধতির চেষ্টা করেছি: (ক) 50x11 ম্যাট্রিক্সে …

4
পৃথক সময়ের ইভেন্ট ইতিহাস (বেঁচে থাকা) মডেল আর
আমি আর-তে একটি পৃথক-সময়ের মডেল ফিট করার চেষ্টা করছি তবে কীভাবে এটি করব তা নিশ্চিত নই। আমি পড়েছি যে আপনি বিভিন্ন সারিতে নির্ভরশীল পরিবর্তনশীল, প্রতিটি সময়-পর্যবেক্ষণের জন্য glmএকটি এবং লজিট বা ক্লোগলগ লিঙ্কের সাহায্যে ফাংশনটি ব্যবহার করতে পারেন । এই অর্থে, আমি তিনটি কলাম আছে: ID, Event(1 বা 0, প্রতিটি …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

3
যখন পিসিএ হয়ে মহালানোবিসের দূরত্ব
আমার একটি ম্যাট্রিক্স রয়েছে, যেখানে হল জিনের সংখ্যা এবং রোগীর সংখ্যা। এই জাতীয় ডেটা নিয়ে যার সাথে কাজ করেছেন যে কেউ জানেন যে সর্বদা চেয়ে বড় । বৈশিষ্ট্য নির্বাচন ব্যবহার করে আমি আরও বেশি যুক্তিসঙ্গত সংখ্যায় নামিয়েছি, তবে এখনও চেয়ে বেশি ।n × পিএন×পিn\times pপিপিpএনএনnপিপিpএনএনnপিপিpপিপিpএনএনn আমি রোগীদের জেনেটিক প্রোফাইলের উপর …

2
বহুভুজটির কোভারিয়েন্স ম্যাট্রিক্সটি কীভাবে খুঁজে পাবেন?
স্থানাঙ্কের একটি সেট দ্বারা সংজ্ঞায়িত আপনার বহুভুজ রয়েছে তা কল্পনা করুন (x1,y1)...(xn,yn)(x1,y1)...(xn,yn)(x_1,y_1)...(x_n,y_n) এবং এর ভর কেন্দ্র হয় (0,0)(0,0)(0,0)। বহুভুজ সীমানা সহ আপনি বহুভুজকে অভিন্ন বন্টন হিসাবে বিবেচনা করতে পারেন । আমি এমন একটি পদ্ধতির পরে আছি যা বহুভুজের কোভারিয়েন্স ম্যাট্রিক্সটি খুঁজে পাবে । আমি সন্দেহ করি যে বহুভুজের কোভরিয়েন্স ম্যাট্রিক্স …

1
বাচ্চারা কীভাবে একটি জিডাব্লুএএস ডেটা সেটের পিসিএ অভিক্ষেপে তাদের পিতামাতাকে একসাথে টানতে পারে?
প্রতিটি সমন্বিত আইডির সাথে 10,000 টি-মাত্রিক জায়গাতে 20 এলোমেলো পয়েন্ট নিন N(0,1)N(0,1)\mathcal N(0,1)। এগুলিকে 10 জোড়া ("দম্পতিরা") বিভক্ত করুন এবং প্রতিটি জোড়ের গড় ("একটি শিশু") ডেটাসেটে যুক্ত করুন। তারপরে 30 টি পয়েন্ট এবং প্লট PC1 বনাম PC2 তে পিসিএ করুন। একটি লক্ষণীয় জিনিস ঘটে: প্রতিটি "পরিবার" পয়েন্টগুলির একটি ট্রিপলেট তৈরি …

3
এন, পি উভয়ই বড় হলে পিসিএ খুব ধীর: বিকল্প?
সমস্যা সেটআপ আমার কাছে উচ্চ মাত্রার (4096) ডেটা পয়েন্ট (চিত্রগুলি) রয়েছে, যা আমি 2D তে ভিজ্যুয়ালাইজ করার চেষ্টা করছি। এই লক্ষ্যে, আমি কার্পাথির দ্বারা নিম্নলিখিত উদাহরণ কোডের অনুরূপ টি-স্নে ব্যবহার করছি । Scikit-শিখতে ডকুমেন্টেশন প্রথম ডেটার মাত্রা কম পিসিএ ব্যবহার বিশেষ পরামর্শ দেওয়া হচ্ছে: বৈশিষ্ট্যের সংখ্যাটি খুব বেশি হলে মাত্রার …

2
আইসক্রিম বিক্রয় বনাম তাপমাত্রার এই পিসিএ প্লটটি বোঝা
আমি তাপমাত্রা বনাম আইসক্রিম বিক্রয়ের একটি ডামি ডেটা নিচ্ছি এবং কে মিন্স (এন ক্লাস্টারস = 2) ব্যবহার করে 2 বিভাগ (সম্পূর্ণ ডামি) পার্থক্য করতে এটি শ্রেণীবদ্ধ করেছি। এখন আমি এই ডেটাতে একটি প্রধান উপাদান বিশ্লেষণ করছি এবং আমার লক্ষ্য আমি কী দেখছি তা বোঝা। আমি জানি যে পিসিএ উদ্দেশ্যটি মাত্রিকতা …

2
স্কেলেবল মাত্রা হ্রাস
স্থির বৈশিষ্ট্যগুলির সংখ্যা বিবেচনা করে, বার্নস-হট টি-এসএনই- তে একটি জটিলতা রয়েছে , এলোমেলো প্রক্ষেপণ এবং পিসিএ-তে একটি জটিলতা রয়েছে এগুলিকে খুব বড় ডেটা সেটগুলির জন্য "সাশ্রয়ী" করে তোলে।O(nlogn)O(nlog⁡n)O(n\log n)O(n)O(n)O(n) অন্যদিকে, বহুমাত্রিক স্কেলিংয়ের উপর নির্ভরশীল পদ্ধতিগুলির একটি জটিলতা রয়েছে।O(n2)O(n2)O(n^2) অন্যান্য মাত্রা হ্রাস কৌশলগুলি (তুচ্ছ বিষয়গুলি বাদ দিয়ে, যেমন প্রথম কলামগুলি দেখার …

1
পিসিএ প্লটের একটি কদলের মতো আকারটি কী নির্দেশ করে?
পাঠ্য শ্রেণিবিন্যাসের জন্য অটোনকোডারদের উপর তাদের গবেষণাপত্রে দ্বি-মাত্রিক এলএসএ (যা পিসিএর সাথে নিবিড়ভাবে সম্পর্কিত) উত্পাদিত প্লটটি প্রদর্শন করেছে: হিন্টন এবং সালখুদ্দিনভ । একেবারে ভিন্ন কিছু উচ্চ মাত্রিক ডেটাতে পিসিএ প্রয়োগ করা আমি একই ধরণের ত্রুটিযুক্ত প্লট পেয়েছি: (এই ক্ষেত্রে বাদে আমি সত্যিই জানতে চেয়েছিলাম কোনও অভ্যন্তরীণ কাঠামো আছে কিনা)। আমরা …

3
প্রতিটি উপাদানগুলির বৈকল্পিক সমান করতে পিসিএ উপাদানগুলি ঘোরান
আমি ডেটাসেটে পিসিএ করে শেষ কয়েকটি পিসি ফেলে দিয়ে কোনও ডেটাসেটের মাত্রিকতা এবং গোলমাল হ্রাস করার চেষ্টা করছি। এর পরে, আমি বাকী পিসিগুলিতে কিছু মেশিন লার্নিং অ্যালগরিদম ব্যবহার করতে চাই এবং তাই আমি অ্যালগরিদমগুলি আরও ভালভাবে কাজ করতে পিসিগুলির বৈচিত্রকে সমান করে ডেটাটিকে স্বাভাবিক করতে চাই। একটি সহজ উপায় হ'ল …

3
আমি কীভাবে বলতে পারি যে পিসিএ ফলাফলগুলিতে কোনও প্যাটার্ন নেই?
আমার কাছে 19 টি ভেরিয়েবলের 1000+ স্যাম্পল ডেটাসেট রয়েছে। আমার উদ্দেশ্যটি অন্যান্য 18 ভেরিয়েবল (বাইনারি এবং অবিচ্ছিন্ন) এর উপর ভিত্তি করে বাইনারি ভেরিয়েবলের পূর্বাভাস দেওয়া। আমি যথেষ্ট আত্মবিশ্বাসী যে ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির মধ্যে 6 বাইনারি প্রতিক্রিয়ার সাথে যুক্ত, তবে, আমি ডেটাসেটটি আরও বিশ্লেষণ করতে চাই এবং অন্যান্য সমিতি বা কাঠামো যা …
9 pca 

1
আউটপুট ভেরিয়েবলের পূর্বাভাস দেওয়ার জন্য মূল উপাদানগুলিতে রিগ্রেশন কীভাবে প্রয়োগ করবেন?
আমি টিউটোরিয়াল 1 , লিঙ্ক 1 এবং লিংক 2 থেকে মূল উপাদান বিশ্লেষণের মূল বিষয়গুলি সম্পর্কে পড়েছি । আমার কাছে 100 ভেরিয়েবলের ডেটা সেট রয়েছে (আউটপুট ভেরিয়েবল ওয়াই সহ), আমি পিসিএ দ্বারা ভেরিয়েবলগুলি 40 এ হ্রাস করতে চাই এবং তারপরে 40 টি ভেরিয়েবল ব্যবহার করে ভেরিয়েবল ওয় এর পূর্বাভাস দিতে …
9 regression  pca 

2
মূল উপাদান বিশ্লেষণের ফলাফল থেকে প্রাপ্ত সিদ্ধান্ত
আমি নিম্নলিখিত হিসাবে সম্পাদিত মূল উপাদান বিশ্লেষণের আউটপুট বুঝতে চেষ্টা করছি: > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 …
9 r  pca  interpretation 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.