3
আর এ ক্লাস্টার বিগ ডেটা কি নমুনা প্রাসঙ্গিক?
আমি ডেটা সায়েন্সে নতুন এবং 200,000 সারি এবং আর-এ 50 টি কলাম সহ একটি ডেটা সেটটিতে ক্লাস্টারগুলি খুঁজে পেতে সমস্যা হচ্ছে যেহেতু ডেটাতে উভয় সংখ্যাসূচক এবং নামমাত্র ভেরিয়েবল রয়েছে, তাই কে-ইনের মতো পদ্ধতিগুলি যা ইউক্লিডিয়ান দূরত্ব পরিমাপ ব্যবহার করে তা উপযুক্ত পছন্দ বলে মনে হয় না। সুতরাং আমি পিএএম, অ্যাগনেস …