আমি অনুমান করি যে আমি আমার উত্তরটি কুমিয়ান ক্লাস্টারিংয়ের জন্য পেয়েছি:
গিট সোর্স কোডটি দেখে আমি দেখতে পেলাম যে সাইকিট শিখার জন্য, জড়তাটি প্রতিটি বিন্দুর নিকটতম সেন্ট্রয়েড অর্থাৎ তার নির্ধারিত ক্লাস্টারের জন্য স্কোয়ার দূরত্বের যোগফল হিসাবে গণনা করা হয়। সুতরাং যেখানে নির্ধারিত ক্লাস্টারের সেন্ট্রয়েড এবং বর্গক্ষেত্রের দূরত্ব। I=∑i(d(i,cr))crd
এখন ফাঁক পরিসংখ্যানের সূত্রে
যেখানে ক্লাস্টার সমস্ত পয়েন্টের মধ্যে স্কোয়ার দূরত্বের যোগফল ।
Wk=∑r=1k1(2∗nr)Dr
Drr
প্রবর্তনের দ্বারা , স্কোয়ারড দূরত্ব সূত্রে ( ক্লাস্টার centroid হচ্ছে স্থানাঙ্ক), আমি একটি শব্দ আছে নিষ্ক্রিয়তা সাথে সঙ্গতিপূর্ণ (scikit হিসেবে) + একটি শব্দ যে যদি প্রতিটি disappears প্রতিটি ক্লাস্টার barycentre হয় (যা এটি কামিয়ানদের মধ্যে থাকার কথা)। সুতরাং আমি অনুমান করি যে আসলে জড়তা k+c−ccrcWk
আমার এখনও দুটি প্রশ্ন আছে:
- আপনি কি মনে করেন আমার ক্যালকুলাসটি সঠিক? (উদাহরণস্বরূপ, আমি জানি না এটি হায়ারারিকিকাল ক্লাস্টারিংয়ের জন্য রয়েছে কিনা))
- আমি যদি উপরে সঠিক হয়ে থাকি তবে আমি ফাঁক পরিসংখ্যানকে কোড করেছি (অনুমান এবং ক্লাস্টারিংয়ের মধ্যে লগ জড়তার পার্থক্য হিসাবে) এবং এটি বিশেষত আইরিস ডেটাসেটটিতে খারাপভাবে সম্পাদন করে, কেউ কি এটি চেষ্টা করেছে?