প্রশ্নপত্রটি কি-লার্নিংয়ের নামে কেন বেছে নেওয়া হয়েছিল?
সর্বাধিক অক্ষর যেমন একটি সমাহার হিসেবে নির্বাচিত করা হয় নীতি এবং জন্য স্থায়ী বনাম মান জন্য দাঁড়িয়েছে। তবে আমি মনে করি না যে প্রশ্নটি কোনও শব্দের সংক্ষেপণ।
প্রশ্নপত্রটি কি-লার্নিংয়ের নামে কেন বেছে নেওয়া হয়েছিল?
সর্বাধিক অক্ষর যেমন একটি সমাহার হিসেবে নির্বাচিত করা হয় নীতি এবং জন্য স্থায়ী বনাম মান জন্য দাঁড়িয়েছে। তবে আমি মনে করি না যে প্রশ্নটি কোনও শব্দের সংক্ষেপণ।
উত্তর:
আমি সবাইকে হতাশ করার জন্য দুঃখিত, তবে কি কিছুতেই দাঁড়ায় না :)
১৯৯৯ সালে ওয়াটকিন্স তাঁর পিএইচডি থিসিসে কি-লার্নিংয়ের প্রস্তাব করেছিলেন , দেখুন p.96। সেই পৃষ্ঠায় সমীকরণের Q টি প্রতিটি ধাপে নির্দিষ্ট উপায়ে আপডেট করা হয়। প্রশ্নটি প্রদত্ত অবস্থায় ক্রিয়া থেকে প্রত্যাশিত প্রত্যাশা , p.46-তে Q এর সংজ্ঞা দেখুন see রিটার্নটি একটি অর্থনৈতিক বা গেমের তত্ত্বের অর্থে, অর্থাত্ ছাড়যুক্ত সম্ভাব্যতা ওজনিত পুরষ্কারগুলি, কোনও কম্পিউটার বিজ্ঞানের শর্ত নয় যা কোনও ফাংশন থেকে ফেরতের মতো।
লক্ষ্য করুন, তিনি ইতিমধ্যে কীভাবে সম্ভাব্যতার জন্য পি এবং পুরস্কারের জন্য আর ব্যবহার করেছেন, তাই তিনি ফেরতের জন্য কিউকে ধরলেন। এটাই. প্রশ্ন বাছাইয়ের জন্য কোন গভীর অর্থ নেই Q
প্রশ্ন-লার্নিং এর কারণটি বলা হয় কারণ এটি অনুমানগুলি তৈরি করতে Q মান ব্যবহার করে। সাধারন শেখার নিয়ম হল, এবং এটিকে কেন-লার্নিং বলা হয় তা পরিষ্কার হওয়া উচিত।
তবে আমার মতে আসল প্রশ্নটি কেন-লার্নিংকে বলা হয়। যদিও সন্তোষজনক উত্তর বলে মনে হচ্ছে না, এই লিঙ্কটিতে উল্লেখ করা হয়েছে যে মডার্ন রিইনফোর্সমেন্ট লার্নিংয়ের অন্যতম প্রতিষ্ঠাতা অ্যান্ড্রু বার্তো মনে করেন যে কোয়ালিটির পক্ষে দাঁড়িয়েছে, কারণ এটি একটি বাহু টানার ফলাফলের পক্ষে কতটা ভাল ফলাফলের বৈশিষ্ট্যযুক্ত থাকা.