আমি বর্তমানে অ্যাপাচি লুসিনের উপর ভিত্তি করে একটি ছোট ইন-হাউস সার্চ ইঞ্জিন তৈরি করছি। এর উদ্দেশ্যটি সহজ - কিছু কীওয়ার্ডের ভিত্তিতে, এটি আমাদের সংস্থার অভ্যন্তরে অভ্যন্তরীণভাবে লেখা কিছু নিবন্ধের পরামর্শ দেবে। আমি বেস মেট্রিক হিসাবে মোটামুটি স্ট্যান্ডার্ড টিএফ-আইডিএফ স্কোরিংটি ব্যবহার করছি এবং এর উপরে আমার নিজস্ব স্কোরিং ব্যবস্থা তৈরি করেছি। এগুলি সমস্ত কোণার ক্ষেত্রে ব্যতীত র্যাঙ্কিংয়ে বিশৃঙ্খলা বিহ্বলিত মনে হয়েছে excellent
সুতরাং আমি যা করার পরিকল্পনা করছি তা হল অনুসন্ধান ফলাফল পৃষ্ঠায় একটি ছোট সম্পর্কিত / প্রাসঙ্গিক লিঙ্ক যুক্ত করা যাতে ব্যবহারকারীরা ফলাফলটি প্রথম স্থানে অন্তর্ভুক্ত করা উচিত ছিল কিনা তাদের ধারণার উপর নির্ভর করে তাদের মধ্যে একটিতে ক্লিক করতে পারেন।
আমার ধারণা
- এই সম্পর্কিত / প্রাসঙ্গিক নয় লেবেল হিসাবে বিবেচনা করুন এবং একটি প্রশিক্ষণ ডেটা তৈরি করুন।
- শ্রেণিবদ্ধকারীকে প্রশিক্ষণের জন্য এই ডেটা ব্যবহার করুন (যেমন এসভিএম)
- এই মডেলটিকে অনুসন্ধান ইঞ্জিনে অন্তর্ভুক্ত করুন অর্থাৎ প্রতিটি নতুন ফলাফল শ্রেণিবদ্ধের মধ্য দিয়ে যাবে এবং এটি প্রাসঙ্গিক কিনা তা নিয়ে একটি লেবেল অর্পণ করা হবে।
এই পদ্ধতির বিষয়টি আমার কাছে স্বজ্ঞাত মনে হলেও এটি অনুশীলনে কার্যকর হবে কিনা তা সম্পর্কে নিশ্চিত নই। আমার দুটি নির্দিষ্ট প্রশ্ন রয়েছে:
- আমার সমস্ত বৈশিষ্ট্যগুলি কী এক্সট্রাক্ট করা উচিত?
- সার্চ ইঞ্জিনে মেশিন লার্নিং উপাদানটি সংহত করার জন্য আরও ভাল উপায় আছে কি? আমার চূড়ান্ত লক্ষ্য হ'ল ব্যবসায়ের যুক্তি পাশাপাশি ব্যবহারকারীর প্রতিক্রিয়া উভয়ের উপর ভিত্তি করে র্যাঙ্কিং ফাংশন "শিখুন"।