সম্ভাবনা যে কেউ চিত্র পছন্দ করবে will


11

আমি নিম্নলিখিত সমস্যা পেয়েছি:
- আমরা এন ব্যক্তিদের
সেট করেছি - আমরা কে ইমেজ সেট করেছি
- প্রতিটি ব্যক্তি কিছু সংখ্যক চিত্রকে রেট করে। কোনও ব্যক্তি কোনও চিত্র পছন্দ করতে বা পছন্দ করতে পারে না (এগুলি কেবলমাত্র দুটি সম্ভাব্য)) - সমস্যাটি হ'ল সম্ভাবনাটি গণনা করা যায় যে কোনও ব্যক্তি কোনও নির্দিষ্ট চিত্র পছন্দ করে।

আমি আমার অন্তর্দৃষ্টি উপস্থাপনা উদাহরণ দিতে হবে।
এন = 4
কে = 5
+ এর অর্থ হল যে ব্যক্তি চিত্র পছন্দ করে
- এর অর্থ সেই ব্যক্তি চিত্রটি পছন্দ করে না
0 এর অর্থ সেই ব্যক্তিকে চিত্র সম্পর্কে জিজ্ঞাসা করা হয়নি, এবং সেই মানটির পূর্বাভাস দেওয়া উচিত

x 1 2 3 4 5    
1 + - 0 0 +   
2 + - + 0 +  
3 - - + + 0  
4 - 0 - - -

ব্যক্তি 1 সম্ভবত 3 টি চিত্র পছন্দ করবে কারণ, ব্যক্তির 2 টির পছন্দ একই রকম এবং ব্যক্তি 2 টি চিত্র পছন্দ করে 3..
ব্যক্তি 4 সম্ভবত চিত্র 2 পছন্দ করবে না কারণ অন্য কেউ এটি পছন্দ করে না এবং অতিরিক্ত ব্যক্তি 4 বেশিরভাগ চিত্র পছন্দ করে না।

এমন কোনও সম্ভাব্য পদ্ধতি গণনা করার জন্য কোন সুপরিচিত পদ্ধতি আছে কি?


আমার সীমিত অভিজ্ঞতা দেওয়া, আমি একটি সঠিক উত্তর দিতে পারে না। তবে আমি বিশ্বাস করি যে আপনি প্যানেল ডেটা ব্যবহার করতে পারেন (কারণ আপনি ব্যক্তি এবং ব্যক্তিদের মধ্যে আপনার উদাহরণের বিভিন্নতা বিবেচনা করেন) লগইটের সাথে যোগাযোগ করুন। হতে পারে অন্যরাও এ সম্পর্কে বিস্তারিত বলতে পারে ...
পাঠক

আপনার ছোট উদাহরণটি খুব দরকারী, তবে আমি ধরে নিই যে আপনার আসল ডেটাসেটটি আরও বড়। কত বড়, অর্থাত্ (মোটামুটি) আপনার আসল এন এবং কে কত বড় ?
onestop

এন এবং কে বিশাল হতে পারে তবে গণনা শক্তি কোনও সমস্যা নয়।
টোমেক তার্কিজেনস্কি

উত্তর:



6

এটি মেশিন লার্নিংয়ের জন্য একটি ভাল সমস্যার মতো দেখায়, তাই আমি এই গ্রুপগুলির পদ্ধতিতে মনোনিবেশ করব।

প্রথম এবং সর্বাধিক সুস্পষ্ট ধারণা হ'ল কেএনএন অ্যালগরিদম। সেখানে আপনি প্রথমে দর্শকদের মধ্যে সাদৃশ্য গণনা করুন এবং তারপরে অনুরূপ ব্যবহারকারীর দ্বারা উত্পন্ন এই ছবিতে গড় ভোটের সাথে অনুপস্থিত ভোটের পূর্বাভাস দিন। বিস্তারিত জানার জন্য উইকিপিডিয়া দেখুন

আরেকটি ধারণা হ'ল এই ডেটাতে নিরীক্ষণযুক্ত এলোমেলো বন বৃদ্ধি করা (যে কোনও উপায়ে চিত্র বা লোকের বৈশিষ্ট্যযুক্ত, যা কিছু ভাল) এবং বন কাঠামোর ভিত্তিতে নিখোঁজ ডেটা গণ্য করা; পুরো পদ্ধতিটি আর randomForestপ্যাকেজে কার্যকর এবং বর্ণিত হয়েছে , rfImputeফাংশনটির সন্ধান করুন ।

পরিশেষে, আপনি সমস্যাটিকে একটি সাধারণ শ্রেণিবদ্ধকরণ কার্যে পুনর্গঠন করতে পারেন, ম্যাট্রিক্সে প্রতিটি শূন্যের একটি বস্তু তৈরি করুন এবং কিছু যুক্তিসঙ্গত বর্ণনাকারী (যেমন গড় দর্শকের ভোট, গড় চিত্রের ভোট, সর্বাধিক, দ্বিতীয় সর্বাধিক ভোটের ভোট), চিন্তা করার চেষ্টা করুন একই চিত্র, একই চিত্রের সাথে একই, সম্ভবত কিছু বাহ্যিক ডেটা (চিত্রের গড় বর্ণ, ভোটার বয়স, ইত্যাদি) এবং তারপরে এই ডেটাতে বিভিন্ন শ্রেণিবদ্ধকরণ চেষ্টা করুন (এসভিএম, আরএফ, এনবি, ...)।

আরও কিছু জটিল সম্ভাবনা রয়েছে; ওভারভিউয়ের জন্য আপনি নেটফ্লিক্স প্রাইজ চ্যালেঞ্জ (যা একই রকম সমস্যা ছিল) সমাধানগুলি সন্ধান করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.