এটি আমার মনের ভিতরে অন্তত কয়েক ঘন্টা ছিল। আমি কে-মানে অ্যালগরিদম (একটি কোসাইন সাদৃশ্য মেট্রিক সহ ) থেকে আউটপুটটির জন্য একটি অনুকূল কে অনুসন্ধান করার চেষ্টা করছিলাম তাই ক্লাস্টারের সংখ্যার ফাংশন হিসাবে বিকৃতিটি প্লট করে শেষ করেছি। আমার ডেটাসেটটি 600-মাত্রিক জায়গায় 800 টি নথির সংগ্রহ।
আমি যা বুঝি সেগুলি থেকে, এই বক্ররেখার হাঁটু বিন্দু বা কনুই পয়েন্টটি সন্ধান করার জন্য আমার ডেটা putোকাতে আমার কমপক্ষে কতটা ক্লাস্টার প্রয়োজন তা বলতে হবে। আমি গ্রাফটি নীচে রেখেছি। যে বিন্দুতে লাল উল্লম্ব রেখাটি অঙ্কিত হয়েছিল সেটি সেকেন্ড দ্বিতীয় ডেরিভেটিভ টেস্ট ব্যবহার করে প্রাপ্ত হয়েছিল । এত কিছুর পরে, আমি অনেক সহজ কিছুতে আটকে গিয়েছিলাম: এই গ্রাফটি আমাকে ডেটাসেট সম্পর্কে কী বলে?
এটি কি আমাকে বলবে যে এটি গুচ্ছবৃত্তি করার মতো নয় এবং আমার নথির কাঠামোর অভাব রয়েছে বা আমার খুব উচ্চ কে সেট করা দরকার? তবে একটি আশ্চর্যের বিষয় হ'ল কম কে দিয়েও আমি একই ধরণের দলিলগুলি একসাথে ক্লাস্টার করা দেখছি তাই আমি কেন এই বক্রতা পাচ্ছি তা নিশ্চিত নই। কোন চিন্তা?
terms x document
একক ভেক্টর সম্পাদনের পরে প্রাপ্ত হয়েছিল পচানি। যদি আমার ভুল হয় তবে দয়া করে আমাকে সংশোধন করুন।