আমি একটি ছোট, ব্যক্তিগত প্রকল্পে কাজ করছি যা ব্যবহারকারীর কাজের দক্ষতা গ্রহণ করে এবং সেই দক্ষতার উপর ভিত্তি করে তাদের জন্য সবচেয়ে আদর্শ ক্যারিয়ারের পরামর্শ দেয়। আমি এটি অর্জনের জন্য কাজের তালিকার একটি ডাটাবেস ব্যবহার করি। এই মুহুর্তে কোডটি নিম্নলিখিতভাবে কাজ করে:
1) তালিকায় উল্লেখ করা দক্ষতাগুলি নিষ্ক্রিয় করতে প্রতিটি কাজের তালিকার পাঠ্য প্রক্রিয়া করুন
২) প্রতিটি কেরিয়ারের জন্য (যেমন "ডেটা অ্যানালিস্ট"), সেই কেরিয়ারের জন্য কাজের তালিকার প্রসেসড টেক্সটকে একটি ডকুমেন্টে একত্রিত করুন
৩) ক্যারিয়ারের নথির মধ্যে প্রতিটি দক্ষতার টিএফ-আইডিএফ গণনা করুন
এর পরে, আমি নিশ্চিত নই যে ব্যবহারকারীর দক্ষতার তালিকার ভিত্তিতে কেরিয়ারকে র্যাঙ্ক করতে আমার কোন পদ্ধতিটি ব্যবহার করা উচিত। আমি যে সর্বাধিক জনপ্রিয় পদ্ধতিটি দেখেছি তা হ'ল ব্যবহারকারীর দক্ষতাগুলিকে একটি নথি হিসাবেও গণ্য করা, তারপরে দক্ষতার নথির জন্য টিএফ-আইডিএফ গণনা করা এবং দক্ষতা নথির এবং প্রতিটিটির মধ্যে মিলের জন্য গণমাধ্যমে কোসাইন মিলের মতো কিছু ব্যবহার করা to কেরিয়ারের নথি
এটি আমার কাছে আদর্শ সমাধানের মতো বলে মনে হচ্ছে না, কারণ একই ফর্ম্যাটের দুটি ডকুমেন্টের সাথে তুলনা করার সময় কোসাইন মিলটি সবচেয়ে ভাল ব্যবহৃত হয়। এই বিষয়টির জন্য, টিএফ-আইডিএফ মোটামুটি ব্যবহারকারীর দক্ষতার তালিকায় প্রয়োগ করার জন্য উপযুক্ত মেট্রিকের মতো বলে মনে হচ্ছে না। উদাহরণস্বরূপ, যদি কোনও ব্যবহারকারী তাদের তালিকায় অতিরিক্ত দক্ষতা যুক্ত করে, তবে প্রতিটি দক্ষতার জন্য টিএফ নামবে। বাস্তবে, ব্যবহারকারীর দক্ষতার তালিকায় দক্ষতার ফ্রিকোয়েন্সিটি কী তা আমি পাত্তা দিই না - আমি কেবল যত্ন নিই যে তাদের those দক্ষতা রয়েছে (এবং তারা সম্ভবত এই দক্ষতাগুলি কতটা ভাল জানেন)।
দেখে মনে হচ্ছে আরও ভাল মেট্রিক নিম্নলিখিত কাজগুলি করা:
1) ব্যবহারকারীর প্রতিটি দক্ষতার জন্য, ক্যারিয়ারের নথিতে সেই দক্ষতার টিএফ-আইডিএফ গণনা করুন
2) প্রতিটি কেরিয়ারের জন্য, ব্যবহারকারীর সমস্ত দক্ষতার জন্য টিএফ-আইডিএফ ফলাফলগুলি যোগ করুন
3) উপরের যোগফলের ভিত্তিতে র্যাঙ্ক ক্যারিয়ার
আমি কি এখানে সঠিক লাইন বরাবর চিন্তা করছি? যদি তা হয় তবে এই লাইনগুলি ধরে কাজ করে এমন কোনও অ্যালগোরিদম রয়েছে তবে সাধারণ অঙ্কের চেয়ে আরও পরিশীলিত? সাহায্যের জন্য ধন্যবাদ!