সুপারিশে অন্তর্নিহিত ডেটাগুলির সাথে কীভাবে ডিল করা উচিত


9

একটি সুপারিশ সিস্টেম কোনও নির্দিষ্ট ব্যবহারকারীর কাছে কী সুপারিশ করা হয়েছিল এবং সেই ব্যবহারকারী সেই প্রস্তাবটি গ্রহণ করে কিনা তার একটি লগ রাখে। এটা দেখতে

user_id item_id result
1       4       1
1       7       -1
5       19      1
5       80      1

যেখানে 1 এর অর্থ ব্যবহারকারী সুপারিশটি গ্রহণ করেছেন যখন -1 এর অর্থ ব্যবহারকারী তার সুপারিশটির প্রতিক্রিয়া জানায় নি।

প্রশ্ন: আমি যদি উপরে বর্ণিত লগের উপর ভিত্তি করে একগুচ্ছ ব্যবহারকারীদের কাছে সুপারিশ করতে যাচ্ছি, এবং আমি এমএপি @ 3 স্কোরকে সর্বোচ্চ করতে চাই, তবে আমি কীভাবে অন্তর্নিহিত ডেটা (1 বা -1) নিয়ে কাজ করব?

আমার ধারণাটি 1 এবং -1 কে রেটিং হিসাবে বিবেচনা করা এবং ফ্যাক্টরিজেশন মেশিন-টাইপ অ্যালগরিদম ব্যবহার করে রেটিংটির পূর্বাভাস। তবে এটি সঠিক বলে মনে হচ্ছে না, অন্তর্নিহিত ডেটার অসমমিতি দেওয়া (-1 এর অর্থ এটি ব্যবহারকারীর প্রস্তাবটি পছন্দ করে না)।

সম্পাদনা 1 আসুন আমরা ম্যাট্রিক্স ফ্যাক্টেরাইজেশন পদ্ধতির প্রসঙ্গে এটি সম্পর্কে চিন্তা করি। আমরা যদি -1 এবং 1 কে রেটিং হিসাবে বিবেচনা করি তবে কিছু সমস্যা হবে। উদাহরণস্বরূপ, ব্যবহারকারী 1 মুভি এ পছন্দ করে যা একটি ফ্যাক্টরে (যেমন গৌরবময় পটভূমি সংগীত রয়েছে) সুপ্ত ফ্যাক্টর স্পেসে বেশি। সিস্টেমটি মুভি বিয়ের প্রস্তাব দেয় যা "গৌরবময় পটভূমি সংগীত" এও উচ্চতর স্কোর করে তবে কিছু কারণে ব্যবহারকারী 1 সুপারিশটি দেখতে খুব ব্যস্ত, এবং আমাদের কাছে বি -1 রেটিং মুভি রয়েছে যদি আমরা কেবল 1 বা -1 সমান আচরণ করি এরপরে, সিস্টেমটি গৌরবান্বিত বিজিএম সহ 1 ব্যবহারকারীর সিনেমার সুপারিশ করতে নিরুৎসাহিত হতে পারে যখন ব্যবহারকারী 1 এখনও গৌরবময় বিজিএম সহ সিনেমা পছন্দ করে। আমি মনে করি এই পরিস্থিতি এড়ানো উচিত।


কোনও সমস্যা নেই যা -1 এর অর্থ অপছন্দ নয়। এটি পৃথক করার সহজ উপায় যে কেউ আইটেমটি দেখেছিল। সেই অর্থে এটি কোনও অনুপস্থিত মানের চেয়ে বেশি তথ্য বহন করে। এটি আসলে আপনার প্রস্তাবনার যথার্থতা বাড়াতে পারে। আপনার দূরত্বের মেট্রিকের উপর নির্ভর করে সুপারিশ করার ক্ষেত্রে আপনি এটিকে -1 থেকে সামান্য মেট্রিক মানকে পরিবর্তন করতে বিবেচনা করতে পারেন তাই এটি দূরত্বকে ততটা প্রভাবিত করে না।
cwharland

1
অন্তর্নিহিত প্রতিক্রিয়ার জন্য প্রৌ paper় কাগজ হু, কোরেেন এবং ভলিনস্কি । এতে আপনার আত্মবিশ্বাসের অনুমান করা সহ অনেকগুলি ভাল সুপারিশ রয়েছে যার মধ্যে -1 অপছন্দ বা কেবল "দেখেনি" indicates
ট্রে

উত্তর:


5

আপনার সিস্টেমটি কেবলমাত্র প্রস্তাবিত আইটেমগুলিতে প্রশিক্ষিত নয়? যদি তাই হয় তবে আপনার এখানে একটি বড় প্রতিক্রিয়া লুপ রয়েছে। আপনি সব ক্লিক / দর্শন থেকে শিখতে চান, আমি আশা করি।

আপনি পরামর্শ দিচ্ছেন যে কোনও আইটেমটি না দেখার বিষয়টি একটি নেতিবাচক সংকেত। আমি দৃ strongly়ভাবে পরামর্শ দিচ্ছি যে আপনি এ জাতীয় আচরণ করবেন না। কোনও কিছুর সাথে আলাপচারিতা না করা কোনও তথ্য হিসাবে প্রায় সর্বদা সেরা হিসাবে বিবেচিত হয়। যদি আপনার কাছে একটি স্পষ্ট সংকেত থাকে যা নীচের ভোটের মতো একটি অপছন্দকে নির্দেশ করে (বা, সম্ভবত 10 সেকেন্ডের ভিডিও দেখে এবং থামিয়ে দেওয়া হয়েছে), সম্ভবত এটি বৈধ।

আমি এই ইনপুটটিকে রেটিং-জাতীয় ডেটা হিসাবে তৈরি করব না। (যদিও আপনার ক্ষেত্রে, আপনি এটি থেকে দূরে সরে যেতে পারেন।) পরিবর্তে এগুলিকে ওজন হিসাবে বিবেচনা করুন, এটি হ'ল হু কোরেন ভলিনস্কি পেইজে ALS তে ঠিক চিকিত্সা যা @ ট্রে একটি মন্তব্যে উল্লেখ করেছেন। এটি আপনাকে ইতিবাচক / নেতিবাচক মিথস্ক্রিয়া সম্পর্কিত আপেক্ষিক শক্তি রেকর্ড করতে দেয়।

পরিশেষে আমি লক্ষ করব যে এই কাগজটি আপনি যা খুঁজছেন তা সম্ভবত হওয়ার সম্ভাবনা থাকলেও নেতিবাচক ওজন সরবরাহ করে না। এইভাবে প্রসারিত করা সহজ। আপনি যদি এ পর্যন্ত পৌঁছে যান তবে আমি আপনাকে সহজ বর্ধনের দিকে ইঙ্গিত করতে পারি, যা স্পার্ক এবং অরিক্সে আমার জানা দুটি বাস্তবায়নের মধ্যে ইতিমধ্যে বিদ্যমান ।


2
আমি মনে করি যে আইটেমগুলির জন্য সামান্য নেতিবাচক মানগুলি গণনা করা হয়েছে যা অনেকবার দেখা গেছে তবে কখনও বেছে নেওয়া হয়নি তা যুক্তিসঙ্গত। ওপি নির্দেশ করে না যে তাদের ডেটাতে অ্যাক্সেস রয়েছে যা এই নেতিবাচক অনুপ্রবেশকে যোগ্য করে তোলে তবে আমি সেই কৌশলটি পুরোপুরি কার্যকর করব না। নেতিবাচক মানের অনুকূল মাত্রা ডেটা থেকে নির্ধারণ করা যেতে পারে। Recsys দৃশ্যে এটি করা থেকে আমার কিছুটা লাভ হয়েছে। যে কোনও ক্ষেত্রে ... আপনি একবার দেখা আইটেম এবং বনাম দেখা এন পছন্দ করেন নি এবং কখনও নেতিবাচক অভিব্যক্তি ছাড়া বেছে নেওয়া হয়েছে না মধ্যে পার্থক্য অন্যান্য উপায় পরামর্শ?
cwharland
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.