শ্রেণিবদ্ধ ক্লাস্টার বিশ্লেষণের ডেনড্রগ্রাম কীভাবে ব্যাখ্যা করবেন to


25

নীচের আর উদাহরণটি বিবেচনা করুন:

plot( hclust(dist(USArrests), "ave") )
  1. "উচ্চতা" অর্থ হ'ল y- অক্ষ কী?

  2. উত্তর ক্যারোলিনা এবং ক্যালিফোর্নিয়ার দিকে তাকিয়ে (বরং বাম দিকে)। ক্যালিফোর্নিয়া কি অ্যারিজোনার চেয়ে উত্তর ক্যারোলিনার কাছাকাছি? আমি কি এই ব্যাখ্যা করতে পারি?

  3. হাওয়াই (ডান) এর চেয়ে বেশি দেরিতে ক্লাস্টারে যোগ দেয়। অন্যান্য রাজ্যের তুলনায় এটি "উচ্চতর" হওয়ায় আমি এটি দেখতে পাচ্ছি। সাধারণভাবে আমি কীভাবে এই বিবরণটি ব্যাখ্যা করতে পারি যে ডেনড্রোগ্রামে লেবেলগুলি "উচ্চতর" বা "নিম্ন" সঠিকভাবে রয়েছে?

এখানে চিত্র বর্ণনা লিখুন



3
লেবেলের অবস্থানগুলির কোনও অর্থ নেই। আপনি যদি y- অক্ষগুলি বুঝতে না পারেন তবে এটি আশ্চর্যজনক যে আপনি হায়ারারিকিকাল ক্লাস্টারিংটি ভালভাবে বুঝতে অনুভূতির অধীনে রয়েছেন।
স্টাফেন লরেন্ট

1
দয়া করে সচেতন হন যে শ্রেণিবদ্ধ ক্লাস্টারিং সাধারণত আপনাকে শ্রেণিবদ্ধ (বৃক্ষ) শ্রেণিবিন্যাস দেয় না । গড় পদ্ধতি (যা আপনি ব্যবহার করেছেন) বিশেষত তা করে না। এখানে শেষ পয়েন্ট দেখুন ।
ttnphns

1
যদিও একটি লেবেলের অবস্থানটির কিছুটা অর্থ রয়েছে। পরের বিষয়টি অন্যদের সাথে সংযুক্ত হওয়ার পরে যে অবস্থানটি তত বেশি থাকে, এবং তাই এটি আরও বেশি পছন্দ করে একজন বহিরাগত বা বিপথগামী।
ttnphns

3
@ স্টাফেনলরেন্ট আপনি ঠিক বলেছেন যে এই শব্দটি একটি দ্বন্দ্বের মতো। সেখানে আমি এখনও মনে করি যে আমি ভালভাবে জানি ডেটা একটি ডেন্ডোগ্রামের সাথে আমি আটকে রাখতে সক্ষম। Ttnphns এবং পিটার ফ্লুম পয়েন্ট হিসাবে লেবেলগুলির অবস্থানটির কিছুটা অর্থ রয়েছে। শেষ পর্যন্ত আপনার মন্তব্য আমার কাছে গঠনমূলক ছিল না।
রিক

উত্তর:


17

1) y- অক্ষ হ'ল পৃথক ডেটা পয়েন্ট বা ক্লাস্টারগুলির ঘনিষ্ঠতার একটি পরিমাপ।

2) ক্যালিফোর্নিয়া এবং অ্যারিজোনা ফ্লোরিডা থেকে সমানভাবে দূরে কারণ সিএ এবং এজেড উভয়ই এফএল-এ যোগদানের আগে একটি ক্লাস্টারে রয়েছে।

3) হাওয়াই বরং দেরীতে যোগদান করে; প্রায় 50. এর অর্থ হ'ল এইচআই-তে যোগদানের আগে এটি যে ক্লাস্টারটিতে যোগ দেয় এটি একত্রে আরও কাছাকাছি চলে আসে। তবে খুব বেশি কাছাকাছি নয়। নোট করুন যে এটির সাথে যোগ দেয় এমন ক্লাস্টারটি (প্রায় সমস্ত অংশে ডানদিকে) কেবল প্রায় 45 এ গঠন করে H এইচআইআই অন্য কোনও রাজ্যের তুলনায় পরবর্তীকালে একটি ক্লাস্টারে যোগদান করে তার অর্থ সহজভাবে বোঝায় যে (আপনি যে মেট্রিকটি নির্বাচন করেছেন) এইচআইয়ের খুব কাছাকাছি নয় is যে কোনও নির্দিষ্ট রাজ্য।


সুতরাং "উচ্চতা" আমাকে লিঙ্ক মাপদণ্ডের মান সম্পর্কে ধারণা দেয় ( এখানে যেমন ) - আমার ক্ষেত্রে একে অপরের কাছে ক্লাস্টারের গড় দূরত্ব। এটা কী ঠিক? ধন্যবাদ!
রিক

Y- অক্ষগুলি কি ক্লাস্টার এবং পয়েন্টগুলির মধ্যে ডিসের মিলের পরিমাপ নয় ? অর্থাত্ ঘনিষ্ঠতাটিকে ঘৃণিত করুন, কারণ বিষয়গুলি সবচেয়ে বেশি ভিন্ন যখন @ পিটারফ্লুমের চারপাশে অন্যভাবে নয়
ফিলিপ আলমেডা

21

আমি হায়ারারিকিকাল ক্লাস্টারিং শেখার চেষ্টা করার সময় আমার একই প্রশ্ন ছিল এবং আমি নিম্নলিখিত পিডিএফটিকে খুব দরকারী বলে খুঁজে পেয়েছি।

http://www.econ.upf.edu/~michael/stanford/maeb7.pdf

এমনকি যদি রিচার্ড পদ্ধতিটি সম্পর্কে ইতিমধ্যে পরিষ্কার, অন্যরা যারা প্রশ্নটির মাধ্যমে ব্রাউজ করেন তারা সম্ভবত পিডিএফ ব্যবহার করতে পারেন, যাদের পক্ষে গণিতের ব্যাকগ্রাউন্ড পর্যাপ্ত নেই তাদের পক্ষে এটি খুব সহজ এবং স্পষ্ট sp


3
কেবল পুনরাবৃত্তি করতে চাই যে লিঙ্কযুক্ত পিডিএফ খুব ভাল।
হাইজেনবার্গ

তথ্যসূত্র: ক্লেমবার্গ, রোনাল্ড কে এবং বিডি ম্যাককুলাও। 2013. জেএমপির সাথে ভবিষ্যদ্বাণীমূলক বিশ্লেষণের ফান্ডামেন্টালগুলিতে "অধ্যায় 7: শ্রেণিবদ্ধ ক্লাস্টার বিশ্লেষণ।" কেরি, এনসি: এসএএস ইনস্টিটিউট।
jay.sf

1

অনুভূমিক অক্ষগুলি ক্লাস্টারগুলিকে উপস্থাপন করে। ডেনড্রোগ্রামের উল্লম্ব স্কেল দূরত্ব বা ভিন্নতা উপস্থাপন করে। দুটি ক্লাস্টারের প্রতিটি যোগদান (ফিউশন) চিত্রের উপর একটি উল্লম্ব রেখাকে দুটি উল্লম্ব রেখায় বিভক্ত করে উপস্থাপিত হয়। একটি ছোট দণ্ড দ্বারা প্রদর্শিত বিভাজনের উল্লম্ব অবস্থান দুটি ক্লাস্টারের মধ্যে দূরত্ব (ভিন্নতা) দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.