আইসক্রিম বিক্রয় বনাম তাপমাত্রার এই পিসিএ প্লটটি বোঝা


9

আমি তাপমাত্রা বনাম আইসক্রিম বিক্রয়ের একটি ডামি ডেটা নিচ্ছি এবং কে মিন্স (এন ক্লাস্টারস = 2) ব্যবহার করে 2 বিভাগ (সম্পূর্ণ ডামি) পার্থক্য করতে এটি শ্রেণীবদ্ধ করেছি।

এখন আমি এই ডেটাতে একটি প্রধান উপাদান বিশ্লেষণ করছি এবং আমার লক্ষ্য আমি কী দেখছি তা বোঝা। আমি জানি যে পিসিএ উদ্দেশ্যটি মাত্রিকতা হ্রাস করা (স্পষ্টতই এই ক্ষেত্রে নয়) এবং উপাদানগুলির বৈচিত্র্য দেখানো। তবে আপনি কীভাবে নীচের পিসিএ প্লটটি পড়বেন, অর্থাৎ পিসিএ প্লটে তাপমাত্রা বনাম আইসক্রিম সম্পর্কে আপনি কী গল্প বলতে পারবেন ? 1 ম (এক্স) এবং 2 য় (ওয়াই) পিসি বলতে কী বোঝায়?

এখানে চিত্র বর্ণনা লিখুন


1
এটি একটি মন্তব্য হওয়া উচিত, তবে আমার যথেষ্ট অপ্রতুলতা রয়েছে। নীচের লিঙ্কটি পিসিএ-তে একটি দুর্দান্ত টিউটোরিয়াল। বিশেষত, খেলনা উদাহরণটি "একটি ছবি দিয়ে বোঝার পক্ষে যথেষ্ট সহজ" এবং "যথেষ্ট জটিল যে এটি ভবিষ্যতের সমস্যার ক্ষেত্রে সাদৃশ্য হিসাবে ব্যবহার করা যেতে পারে" এর মধ্যে একটি ভাল ভারসাম্য রোধ করে। আমি মনে করি এটি পড়তে পিসিএ আপনার জন্য কি করতে পারে এবং কী করতে পারে তা পরিষ্কার করতে সহায়তা করতে পারে। সিএস.প্রিন্সটন.ইডু
জেসন

উত্তর:


18

আমি জানি যে পিসিএ উদ্দেশ্যটি মাত্রা হ্রাস করা

লোকেদের ধারণা প্রায়শই এটি হয় তবে পিসিএ হ'ল অর্থগোনাল ভিত্তিতে আপনার ডেটার উপস্থাপনা। এই ভিত্তিতে এখনও আপনার মূল তথ্য হিসাবে একই মাত্রা আছে। কিছুই হারিয়ে যায়নি ... এখনও। মাত্রিকতা হ্রাস অংশ সম্পূর্ণ আপনার উপর নির্ভর করে। পিসিএ যা নিশ্চিত করে তা হ'ল শীর্ষআপনার নতুন প্রক্ষেপণের মাত্রা সেরা are আপনার ডেটা সম্ভবত হিসাবে প্রতিনিধিত্ব করা যেতে পারে যে মাত্রা। সবচেয়ে ভাল মানে কি? সেখানে বর্ণিত রূপটি আসবে।

অবশ্যই এই ক্ষেত্রে না

আমি এটা সম্পর্কে নিশ্চিত হতে হবে না! আপনার দ্বিতীয় চক্রান্ত থেকে, দৃশ্যত দেখে মনে হচ্ছে আপনার ডেটা থেকে প্রচুর তথ্য একটি অনুভূমিক রেখায় প্রক্ষেপণ করা যেতে পারে। এটি মূল মাত্রার পরিবর্তে 1 টি মাত্রা যা 2 মাত্রায় ছিল! স্পষ্টতই আপনি কিছু তথ্য হারাবেন কারণ আপনি ওয়াই-অক্ষগুলি সরিয়ে দিচ্ছেন, তবে এই তথ্য ক্ষতি আপনার কাছে গ্রহণযোগ্য কিনা, তা কি আপনার কল।

সাইটে পিসিএ কী সম্পর্কিত একাধিক প্রশ্ন রয়েছে তাই আমি আপনাকে এখানে , এখানে , এখানে বা এখানে এগুলি পরীক্ষা করতে উত্সাহিত করি । এর পরে যদি আপনার আরও প্রশ্ন থাকে তবে দয়া করে সেগুলি পোস্ট করুন এবং আমি সাহায্য করে খুশি হব।

আপনার আসল প্রশ্ন হিসাবে:

পিসিএ প্লটে তাপমাত্রা বনাম আইসক্রিম সম্পর্কে আপনি যে গল্পটি বলতে পারেন?

যেহেতু নতুন স্থানাঙ্ক অক্ষগুলি মূল স্থানাঙ্কগুলির একটি রৈখিক সংমিশ্রণ, তারপর ... মূলত কিছুই নয়! পিসিএ আপনাকে উত্তর দেবে যেমন (সংখ্যাগুলি তৈরি):

পিসি1=2.5×আইসক্রিম-3.6×তাপমাত্রাপিসি2=-1.5×আইসক্রিম+ +0.6×তাপমাত্রা

এটা কি আপনার কাজে লাগে? হতে পারে. তবে আমি অনুমান করব না :)

সম্পাদিত

আমি এই উত্সটি যুক্ত করব যা আমি মনে করি সহায়ক বলে মনে করি কারণ ইন্টারেক্টিভ চার্টগুলি দুর্দান্ত।

আবার সম্পাদিত

কোনটি সেরা তা স্পষ্ট করা মাধ্যম:

পিসিএ যখন সেগুলির উপরে ডেটা প্রজেক্ট করা হয় তখন সর্বোচ্চ মাত্রাগুলি সরবরাহকারী মাত্রাগুলি সন্ধান করার চেষ্টা করে। ধরে নিচ্ছি আপনার ডেটা আছেএন> মাত্রা, প্রথম পিসি অন্য কোনও তুলনায় আপনার ডেটাতে আরও বৈচিত্র্য ব্যাখ্যা করে মাত্রা পারে। আমি সেরা বলতে চাই । এটি আপনার পক্ষে দরকারী কি না অন্য জিনিস।


6
এছাড়াও, ভেরিয়েবল স্কেল করতে ভুলবেন না। অন্যথায় বিক্রয় (অনেক বেশি সংখ্যক সংখ্যা) বেশিরভাগ বৈকল্পিকতা ব্যাখ্যা করবে। সম্ভবত আপনার পিসিগুলির ইউনিটগুলি কেন এত আলাদা।
ফিলিপ

ভাল উত্তর, তবে আপনার বিবৃতি "... আপনার ডেটা সম্ভবত হিসাবে উপস্থাপিত হতে পারে যে সেরা কে কে মাত্রা ..." সম্ভবত অতিরিক্ত-সাধারণীকরণ করা হয়েছে। সর্বাধিক প্রকরণের দিকনির্দেশটি দুটি শ্রেণি আলাদা করার জন্য প্রয়োজনীয় নয়। একরকম, এটি প্রায়শই ভালভাবে কাজ করে তবে এটি কোনও কারণে নয় যে পিসিএ নির্দিষ্ট উদ্দেশ্যে সেরা পছন্দগুলি করার জন্য কিছু করে।
ওয়েইন

"আসলে পিসিএ একটি অরথোগোনাল ভিত্তিতে আপনার ডেটার একটি প্রতিনিধিত্ব মাত্র।" আমি ক্রমাগত অবাক হয়েছি যে অনেক লোক এই বিষয়টি বুঝতে পারে না ...
3x89g2

5

ইলান লোকের উত্তরের উত্তরে আমি যুক্ত করব যে আপনার মূল উপাদানগুলির একটি সুস্পষ্ট ব্যাখ্যা রয়েছে, যদিও এই সাধারণ 2 ডি ক্ষেত্রে এটি কেবলমাত্র স্ক্যাটারপ্লোটের দিকে তাকিয়ে আমরা যে ব্যাখ্যা করতে পারতাম তাতে তেমন কিছু যোগ হয় না।

প্রথম পিসি হ'ল ভারযুক্ত যোগফল (এটি, একটি লিনিয়ার সংমিশ্রণ যেখানে উভয় সহগ ধনাত্মক হয়) তাপমাত্রা এবং আইসক্রিম ব্যবহারের জন্য। ডানদিকে আপনার গরমের দিনগুলি রয়েছে যেখানে প্রচুর আইসক্রিম বিক্রি হয় এবং বাম দিকে আপনার শীতল দিনগুলি রয়েছে যেখানে কম আইসক্রিম বিক্রি হয়। সেই পিসি আপনার বেশিরভাগ বৈকল্পিকতা এবং যে দুটি গ্রুপের সাথে মিল পেয়েছে সেগুলি ব্যাখ্যা করে।

দ্বিতীয় পিসি পরিমাপ করে যে কীভাবে তাপমাত্রা এবং আইসক্রিম ব্যবহারের ফলে প্রথম পিসির আন্ডারলাইন করা লিনিয়ার সম্পর্ক থেকে দূরে সরে যায়। গ্রাফের উপরের অংশে একই তাপমাত্রার অন্যান্য দিনের তুলনায় আমাদের বেশি আইসক্রিম বিক্রি হয় এবং নিম্ন অংশে তাপমাত্রা অনুযায়ী প্রত্যাশার চেয়ে কম আইসক্রিম বিক্রি হয়। এই পিসি বৈকল্পিকের সামান্য অংশ ব্যাখ্যা করে।

এটি হ'ল আমরা মূল উপাদানগুলির একটি গল্প বলতে পারি, যদিও মাত্র দুটি ভেরিয়েবলের সাথে এটি একই গল্পটি আমরা পিসিএ ছাড়াই লক্ষ্য করতে পারতাম। আরও ভেরিয়েবলের সাথে পিসিএ আরও দরকারী হয়ে ওঠে কারণ এটি এমন গল্প বলে যা অন্যথায় লক্ষ্য করা শক্ত হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.