এটি আসলে মেশিন লার্নিংয়ের ক্ষেত্রে তুলনামূলকভাবে বিখ্যাত সমস্যা। 2006-এ নেটফ্লিক্স অ্যালগরিদমকে 1 মিলিয়ন ডলার অফার করেছিল যা তাদের সুপারিশকারী সিস্টেমে সর্বোত্তম যুক্তিসঙ্গত উন্নতি সরবরাহ করে। বিজয়ী সমাধানের তত্ত্বটি সংক্ষেপে এই ক্যালটেক পাঠ্যপুস্তকে প্রবর্তনীয় মেশিন লার্নিংয়ে আলোচনা করা হয়েছে ।
মূলত একটি জড়ো শেখার পদ্ধতি ব্যবহৃত হত used বিশেষত, এক ধরণের মিশ্রণ বা স্ট্যাকিংয়ের কাজ ছিল। এটি অনানুষ্ঠানিক, তবে এক ধরণের স্বজ্ঞাত। সুসংগতভাবে বিভিন্ন পরিসংখ্যানগত পদ্ধতির ব্যবহারের অনুধাবন বুঝতে, বিভিন্ন লোক একই সিনেমাগুলির মতো বিভিন্ন কারণগুলি বিবেচনা করুন: অর্থ্যাৎ জো টপগান পছন্দ করতে পারে কারণ তিনি ৮০ এর দশকের অ্যাকশন চলচ্চিত্র পছন্দ করেন এবং জেন টপগান পছন্দ করেন কারণ কেনি লগগিনস সাউন্ডট্র্যাকগুলির সাথে তিনি মুভি পছন্দ করেন। সুতরাং উভয় দর্শকের (এবং মুভিটিকে উচ্চ রেট দেওয়া) সত্যই বোঝানো হয়নি যে তারা উচ্চ সম্ভাবনা সহ অন্যান্য সিনেমা পছন্দ করবেন। পূর্বাভাস অ্যালগরিদম আদর্শভাবে এই পার্থক্যগুলি সামঞ্জস্য করতে সক্ষম হবেন, কমপক্ষে কিছুটা ক্ষমতার ক্ষেত্রে।
এটি সমাধানটিকে বেশ সহজ করে তুলতে পারে তবে প্রতিযোগী অ্যালগরিদমগুলিতে ভারসাম্য বজায় রাখা এবং প্রতিটি ক্ষেত্রে সেরা অনুমানটিকে অগ্রাধিকার দেওয়া অবশ্যই সহজ নয়। নেটফ্লিক্স যে এত বড় অনুদানের প্রস্তাব দিয়েছিল তা চ্যালেঞ্জের পরিমাণকে বরং স্পষ্ট করে তুলবে।
আপনি যদি কেবল মেশিন লার্নিংয়েই শুরু করছেন, আপনার আগ্রহের স্তর এবং আপনার গণিতের পটভূমির উপর নির্ভর করে উপরের সংস্থানগুলি পরীক্ষা করে নেওয়া সহায়ক হতে পারে। সুতরাং রিগ্রেশন সম্ভবত ভাল-থেকে-ভাল কাজ করবে, তবে উল্লেখযোগ্যভাবে আরও ভাল পারফরম্যান্স সম্ভব।