ডেনড্রগ্রাম ক্লাস্টারিংয়ের জন্য কফেনেটিক পারস্পরিক সম্পর্ক রয়েছে


10

একটি ডেনড্রগ্রাম ক্লাস্টারিংয়ের প্রসঙ্গটি বিবেচনা করুন। আসুন আমরা ব্যক্তিদের মধ্যে দূরত্বকে মূল অসামঞ্জস্যতা বলি । ডেনড্রোগ্রাম তৈরির পরে আমরা দুটি ব্যক্তির মধ্যে কফেনেটিক বৈষম্যকে সংজ্ঞায়িত করি যেগুলি এই ব্যক্তিগুলির মধ্যে থাকা ক্লাস্টারের মধ্যে দূরত্ব হিসাবে রয়েছে as

কিছু লোক বিবেচনা করে যে আসল অসামঞ্জস্য এবং কোফেনেটিক অসম্পূর্ণতার (যা কোফেনেটিক পারস্পরিক সম্পর্ক বলা হয় ) মধ্যে পারস্পরিক সম্পর্ককে শ্রেণিবিন্যাসের একটি "উপযুক্ততা সূচক"। এটি আমার কাছে পুরোপুরি বিস্মিত মনে হচ্ছে। আমার আপত্তিটি পিয়ারসন পারস্পরিক সম্পর্কের নির্দিষ্ট পছন্দের উপর নির্ভর করে না, তবে সাধারণ ধারণার ভিত্তিতে যে মূল অসম্পূর্ণতা এবং কোফেনেটিক অসামতার মধ্যে যে কোনও যোগসূত্র শ্রেণিবিন্যাসের উপযুক্ততার সাথে সম্পর্কিত হতে পারে।

আপনি কি আমার সাথে একমত হন, বা আপনি ডেনড্রগ্রাম শ্রেণিবিন্যাসের জন্য উপযুক্ততা সূচক হিসাবে কোফেনেটিক পারস্পরিক সম্পর্ককে সমর্থন করে কিছু যুক্তি উপস্থাপন করতে পারেন?


আপনি নিজের আপত্তিটি ব্যাখ্যা করবেন না (বেশ স্বজ্ঞাত) general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification। শ্রেণিবিন্যাসে মূল অসম্পূর্ণতা প্রতিফলিত করা উচিত। এটি করার জন্য ডেনড্রোগ্রামিক শ্রেণিবিন্যাসের প্রাথমিক বৈশিষ্ট্যটি হ'ল কোফেনেটিক ভিন্নতা। সেখানে স্মেথ আছে ভুল?
ttnphns

1
যাইহোক, স্তরের শ্রেণিবিন্যাস (ডেনড্রোগ্রামিক) শ্রেণিবিন্যাসের সাথে শ্রেণিবিন্যাসের ( এগ্রোগোমেটিভেটিভ) গুচ্ছ ধারণাটি মিশ্রিত করা উচিত নয় । ক্লাস্টারিং একটি প্রক্রিয়া রিপোর্ট হিসাবে তার ডেনড্রোগ্রাম উত্পাদন করে ; এটি এটিকে শ্রেণিবিন্যাসিক শ্রেণিবিন্যাসের ফলাফল বলে দাবি করে না ।
ttnphns

1
যেখানে শ্রেণীবিন্যাস - Cophenetic পারস্পরিক সম্পর্ক "মতবাদ" শুধুমাত্র শ্রেণীবিভাগেরও জন্য প্রস্তাবিত হয় উচিত সেখান এর (cophenetic) পারস্পরিক সম্পর্ক উপযোগিতা ধারণা immideately অনুসরণ pairwise অমিল প্রতিফলিত।
ttnphns

2
আপনি এই পেপারটি কফেনেটিক পারস্পরিক সম্পর্কের উপরে পড়তে চাইতে পারেন
ttnphns

3
@ স্টাফেনলাউরেন্ট আপনার প্রশ্নের উত্তর হিসাবে আমার অবদানের কিছুই নেই তবে আমি ডায়লগটি পড়ছি। আপনি যা বলেছেন তা কিছুই আমার কাছে আপত্তিজনক মনে হয়নি। এছাড়াও আপনি বলেছিলেন যে আপনি শ্রেণিবদ্ধকরণ এবং গুচ্ছকরণের মধ্যে পার্থক্য জানেন না এবং আমি সেই সহজ প্রশ্নের উত্তর দেখিনি। এটি মেশিন লার্নিং লোককে তদারকি করা এবং নিরীক্ষণযোগ্য শেখার মধ্যে পার্থক্য। শ্রেণিবিন্যাসে আপনি আপনার ডেটার জন্য সমস্ত বর্গ লেবেল জানেন এবং লেবেল নেই এমন ভবিষ্যতের ক্ষেত্রে শ্রেণিবিন্যাসের নিয়ম তৈরি করতে সেই তথ্যটি ব্যবহার করুন। ক্লাস্টারে আপনার কোনও লেবেল নেই।
মাইকেল আর চেরনিক

উত্তর:


2

... শ্রেণিবিন্যাসের একটি "উপযুক্ততা সূচক"

আমার কাছে এটি বোঝানো ঠিক নয় যে এর অর্থ কী। আমি যেভাবে পেলাম, সেটাই

মূল অসম্পূর্ণতা এবং কোফেনেটিক অসম্পূর্ণতার (যা কোফেনেটিক পারস্পরিক সম্পর্ক বলা হয়) মধ্যে পারস্পরিক সম্পর্ক

পর্যবেক্ষণগুলির মধ্যে শ্রেণিবদ্ধ কাঠামোর একটি পরিমাপ , অর্থাৎ তাদের দূরত্ব। এর অর্থ এটি বলা যায় যে কোনও ভিন্ন ক্লাস্টারে পর্যবেক্ষণের সাথে অসমতাগুলি সাধারণত সমান। ইউক্লিডিয়ান দূরত্ব এবং সম্পূর্ণ সংযোগ ব্যবহার করে ডেটাসেটগুলি এ এবং বি ক্লাস্টারকে বিবেচনা করে ... এখানে চিত্র বর্ণনা লিখুন ... এমনকি কফেনিটিক দূরত্বের মানচিত্র বা কম্পিউটারের কোফেনেটিক পারস্পরিক সংযোগ না দেখেও কেউ দেখতে পাবে যে, এ এর ​​কপেনেটিক পারস্পরিক সম্পর্ক বি এর চেয়ে বেশি হায়ারার্কিতে স্তর রয়েছে। সুতরাং সিসি একই স্তরের পর্যবেক্ষণের দূরত্বগুলি (ক্লাস্টার) একই রকম কিনা তা জানায়।

সম্পূর্ণতার জন্য: কপেনেটিক পারস্পরিক সম্পর্কগুলি হ'ল সিসি (এ) = 0.936 এবং সিসি (বি) = 0.691


1
আমি আশা করি আমি এই বিষয়ে আরও বিশেষজ্ঞ হয়ে থাকি। আমি আপনার উদাহরণটি ডাব্লু / হিটম্যাপগুলি পুরোপুরি অনুসরণ করি না। আপনি কী দেখেন যে এটি সিসি (এ)> সিসি (বি) কে সুস্পষ্ট করে তোলে? উদাহরণস্বরূপ, যদি উপরের ত্রিভুজগুলি কফিনেটিক দূরত্ব হয় এবং নীচের ত্রিভুজগুলি মূল দূরত্ব হয় এবং উভয়ই একই ধরণের প্রদর্শিত হয়, তবে আমি বুঝতে পারি যে সিসি বেশি হবে ইত্যাদি W । এটা কি ঠিক যে এ স্বাভাবিকভাবেই আরও ভাল ক্লাস্টারিংয়ের জন্ম দেবে এবং ফলস্বরূপ সিসি কেবল ভাল মিলিয়ে শেষ করতে হবে?
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.