আমি ক্লাস্টারিংয়ের জন্য যে আমার ভিন্নতা মাপতে ব্যবহার করতে পারি তার জন্য বিশদ ওজন শিখতে (অনুদান) শিখতে চাই।
আমার কাছে কয়েকটি উদাহরণ যা "একই" (একই ক্লাস্টারের মধ্যে হওয়া উচিত) এবং একই সাথে কয়েকটি জিনিস যা "অনুরূপ নয়" হওয়া উচিত নয়) একই ক্লাস্টারে থাকা)। প্রতিটি বস্তুর বিভিন্ন বৈশিষ্ট্য রয়েছে: আপনি যদি পছন্দ করেন তবে আমরা প্রতিটি বস্তুর বৈশিষ্ট্যগুলির একটি ডাইমেনশনাল ভেক্টর হিসাবে ভাবতে পারি , যেখানে প্রতিটি বৈশিষ্ট্য একটি অ-নেতিবাচক পূর্ণসংখ্যার হয়। বৈসাদৃশ্য পরিমাপের জন্য অনুকূল বৈশিষ্ট্য ওজনগুলি অনুমান করার জন্য কি অনুরূপ / বিচ্ছিন্ন বস্তুর উদাহরণ ব্যবহার করার কৌশল রয়েছে?
এটির সাহায্যে যদি, আমার প্রয়োগে, সম্ভবত একটি ভারী এল 2 আদর্শ যা একটি ভিন্নতা পরিমাপ শেখার উপর ফোকাস করা যুক্তিসঙ্গত হবে:
যেখানে ওজন জানা যায় না এবং শিখতে হবে। (বা, কিছু ধরণের ওয়েটেড কোসিনের মিলের পরিমাপটিও যুক্তিসঙ্গত হতে পারে)) , এই জাতীয় পরিমাপের জন্য ওজন জন্য কি কোনও ভাল অ্যালগরিদম রয়েছে ? বা আমার সাথে বিবেচনা করা উচিত এমন একটি মিল পরিমাপ / ভিন্নতা পরিমাপ শেখার জন্য অন্য কোনও পদ্ধতি আছে?
মাত্রার সংখ্যা দুর্ভাগ্যক্রমে খুব বড় (হাজার বা ততোধিক; এটি শব্দ-ব্যাগের বৈশিষ্ট্য থেকে উদ্ভূত) from তবে, আমার কাছে কয়েক হাজার উদাহরণ রয়েছে। আমার তখন কয়েক হাজার বস্তু রয়েছে যা আমি ক্লাস্টার করতে চাই, সুতরাং একটি ভাল ভিন্নতা মেট্রিক শেখার জন্য উদাহরণগুলি থেকে সাধারণকরণ করা গুরুত্বপূর্ণ।
আমি একত্রিত হয়েছি যে এটি আধা-তত্ত্বাবধানে থাকা ক্লাস্টারিংয়ের রুব্রিকের মধ্যে পড়ে এবং এটি মনে হয় এটি "মিল-অভিযোজক" শিরা হতে পারে তবে আমি এই উদ্দেশ্যে ব্যবহার করার জন্য অ্যালগরিদমের স্পষ্ট বিবরণ খুঁজে পাইনি।