অনুশীলনে, লোকেরা সুপারিশ ম্যাট্রিক্স থেকে অনুপস্থিত মানগুলি কী করে, যা গণনা করার পুরো বিষয়টি? সাইমনের ব্লগ পোস্টটি পড়ে আমার অনুমান, তিনি কেবল মডেল তৈরি করতে অনুপস্থিত শর্তাদি ব্যবহার করেন।
এটি ঠিক - এটি তার এবং আপনার মডেলের মূল বিষয়, অনুপস্থিত পদগুলির পূর্বাভাস দেওয়ার জন্য, তাই না? এটি একটি গুরুত্বপূর্ণ বিষয় যা অনেকে আসলে ভুলে যায়। তারা মনে করে যে তারা বিশ্বে কোনও যত্ন ছাড়াই নিখরচায় থাকা ডেটাগুলির জন্য একটি ধ্রুবককে পূর্ব-নির্ধারিত করতে "অনুমান" করতে পারে এবং এসভিডি থেকে জিনিসগুলি যাদুতে যথেষ্ট ভাল কাজ করবে। ময়লা আবর্জনা, আবর্জনা বাইরে: এটি আসল এবং আপনি এটি আরও ভাল করে দেখেছিলেন। আপনি যদি কোনও ফলাফলের জন্য দরকারী কিছু চান তবে আপনি কোনও মডেলকে জাঙ্ক ডেটা না খাওয়ানো ভাল।
সংখ্যাগরিষ্ঠ স্পার্স ডেটাসেটে অবশ্যই "কোনও অনুপস্থিত মান নির্ধারণ করা" সেরা নয় এবং তারপরে এসভিডি চালানো আপনার জন্য কিছু মূল্যবান প্রত্যাশার আশা নিয়ে (যা আপনি এসভিডি চালানোর আগে ইতিমধ্যে দোষী সাব্যস্ত করেছেন, তাই না?)। আপনি কি মনে করেন, একটি মডেল যাদু? সংখ্যাগরিষ্ঠ জঞ্জাল ডেটা কাটিয়ে ওঠার জন্য কোনও জাদু বা প্রযুক্তি নয়। আপনি এমন কোনও মডেলের সাথে মিথ্যা বলতে পারবেন না যে ডেটা বাস্তব তথ্য যখন এটি একেবারে বাস্তব হয় না, তবে সত্যিকারের মাত্র কিছু আবর্জনা যা আপনি কেবল সরু বায়ু থেকে তৈরি করেছেন।
এসভিডি অন্যান্য দরকারী জিনিসগুলি করে তাই আমি অবশ্যই বলছি না যে এসভিডি কমপক্ষে মূল্যহীন। এগিয়ে যান এবং কেবল সম্পূর্ণ ডেটাসেটে এসভিডি ব্যবহার করুন, সম্ভবত আপনি বুদ্ধিমানভাবে এর বিকাশের সময় পক্ষপাত ত্রুটি এবং বৈকল্পিক ত্রুটির প্রতি সমস্ত প্রাসঙ্গিক মনোযোগ সহ একটি মেশিন লার্নিং মডেল ব্যবহার করার জন্য বুদ্ধিমানভাবে অনুপস্থিত মানগুলি চাপিয়েছেন।
মেশিন লার্নিংয়ের উপায়। সুতরাং আপনি যদি এখনও জানতে চান যে ম্যাট্রিক্স ফ্যাক্টেরাইজেশন ডিজাইন ব্যবহার করে মানগুলি কীভাবে কার্যকর করা যায় তবে মেশিন লার্নিং ব্যবহার করে ঠিক এটি করার ভাল উপায় রয়েছে এবং গুরুত্বপূর্ণভাবে তারা কোনও মডেলকে কোনও জঞ্জাল ডেটা ফিড করে না অর্থহীনভাবে শেখার চেষ্টা করার জন্য।
ঠিক এই জাতীয় মেশিন লার্নিং ম্যাট্রিক্স ফ্যাক্টেরাইজেশন মডেলটি স্ট্যানফোর্ড অনলাইন কোর্স মাইনিং ম্যাসিভ ডেটা সেটগুলির প্রশিক্ষকগণ মডিউল 5 তে বেশ ভালভাবে উপস্থাপন করেছেন। তারা আপনাকে গণিত দেখায় এবং মডেলটি ব্যাখ্যা করে। যদিও তারা আপনার জন্য এটি কোড করে না।
এটি ঠিক আছে কারণ আপনি যদি বেসিক মেশিন লার্নিং বুঝতে পারেন তবে আপনি নিজেরাই এটি কোড আপ করতে পারেন। আপনি কি জানেন যে ক্ষতির ফাংশন এবং ব্যয় কার্য কী? নিয়মিতকরণ? গ্রেডিয়েন্ট বংশোদ্ভূত? ম্যাট্রিক্সের গুণ এবং সংযোজন দিয়ে ঠিক আছে? বায়াস ত্রুটি এবং বৈকল্পিক ত্রুটি? যদি তাই হয় তবে আপনি ভাল। যদি তা না হয় তবে আপনার অ্যান্ড্রু এনগের অনলাইন কোর্স মেশিন লার্নিং এ কোর্সেরা নেওয়া উচিত , যা অনেক ভাল শুরু করার জায়গা। তারপরে মাইনিং ম্যাসিভ ডেটা সেটগুলি অনলাইন কোর্সেও যান যা মেট্রিক্স ফ্যাক্টেরাইজেশন এবং সুপারিশকারী মডেলগুলি তৈরির জন্য মেশিন লার্নিং সম্পর্কে ঠিক কথা বলে।
বলা বাহুল্য, আপনি পুরোপুরি ডিজাইন করার পাশাপাশি আপনার নিজস্ব ফ্যাক্টরিজেশন মডেলটিও কোডিং করতে পারেন যা নিখোঁজ ডেটাগুলি খুব ভালভাবে পরিচালনা করে, ঠিক যেমন সাইমন ফানক করেছিলেন এবং আপনি এটি স্ক্র্যাচ থেকে করতে পারেন তবে এটি আর আগের মতো শক্ত ছিল না back তার দিনে, কারণ এখন আপনি টেনসরফ্লো বা মাইক্রোসফ্ট সিএনটিকে মতো একটি সরঞ্জাম ব্যবহার করতে পারেন যা আপনার জন্য অনেক কিছু করে। একটি ক্ষতির ফাংশন এবং একটি ব্যয় ফাংশন সংজ্ঞায়িত করুন, একটি অপ্টিমাইজার চয়ন করুন, আপনার ডেটাসেটকে প্রশিক্ষণে ভাগ করুন, ডেভ, প্রকৃত উপলভ্য ডেটা (লেবেলযুক্ত ডেটা) থেকে পরীক্ষা করুন এবং এটি চালিত হতে দিন। সিরিয়াসলি, এটি কাজ করে। এটি সহজে ডিবাগিং টিএফ এবং এর গ্রাফ বিল্ডিংয়ের ত্রুটিগুলি নয় তবে শেষ পর্যন্ত এটি দুর্দান্ত কাজ করতে পারে এবং কোডের এক পৃষ্ঠারও কম লাগে।
বিশেষত, ম্যাট্রিক্স ফ্যাক্টরাইজেশন মেশিন লার্নিং মডেলটিতে জাল ডেটা না খাওয়ানোর একটি উপায় হ'ল আপনার ক্ষতি এবং ব্যয় কার্যকারিতাগুলিতে হারিয়ে যাওয়া ডেটার ম্যাট্রিক্স উপাদানগুলি এড়িয়ে যাওয়া ।