কিছু ডেটা সেটে স্টোকাস্টিক গ্রেডিয়েন্ট বংশদ্ভুতের মাধ্যমে একটি প্যারামিটারাইজড মডেলকে (উদাহরণস্বরূপ সর্বাধিকীকরণের জন্য) প্রশিক্ষণ দেওয়ার সময়, এটি সাধারণত অনুমান করা হয় যে প্রশিক্ষণের ডেটা বিতরণ থেকে প্রশিক্ষণের নমুনাগুলি আঁকা হয়। সুতরাং যদি লক্ষ্যটি একটি যৌথ বিতরণ মডেল করা হয় , তবে প্রতিটি প্রশিক্ষণের নমুনা সেই বিতরণটি থেকে আঁকতে হবে।
যদি লক্ষ্যটি পরিবর্তে শর্তসাপেক্ষ ডিস্ট্রিবিউশন মডেল করা হয়, তবে আইডির প্রয়োজনীয়তাটি কীভাবে পরিবর্তিত হবে, যদি না?
- আমরা কি এখনও যৌথ বন্টন থেকে প্রতিটি নমুনা আঁকতে পারি ?
- আমরা আঁকা উচিত থেকে IID , তারপর আঁকা থেকে IID ?
- আমরা কি (যেমন সময়ের সাথে সংযুক্ত) থেকে নয় আঁকতে পারি , তারপরে থেকে iid আঁকতে পারি?
আপনি স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত জন্য এই তিনটি পদ্ধতির বৈধতা সম্পর্কে মন্তব্য করতে পারেন? (বা যদি প্রয়োজন হয় তবে আমাকে পুনরায় প্রশ্নে উত্তর দিতে সহায়তা করুন))
সম্ভব হলে আমি # 3 করতে চাই। আমার অ্যাপ্লিকেশনটি পুনর্বহালকরণ শিক্ষায় রয়েছে, যেখানে আমি নিয়ন্ত্রণ নীতি হিসাবে প্যারামিটারাইজড শর্তযুক্ত মডেলটি ব্যবহার করি। রাজ্যগুলির ক্রম অত্যন্ত পরস্পর সম্পর্কিত, তবে ক্রিয়াকলাপগুলি রাজ্য সম্পর্কিত শর্তাধীন একটি স্টকাস্টিক নীতিমালা থেকে নমুনাযুক্ত। ফলাফলের নমুনা (বা সেগুলির একটি উপসেট) নীতিটি প্রশিক্ষণের জন্য ব্যবহৃত হয়। (অন্য কথায়, কিছু পরিবেশে দীর্ঘ সময়ের জন্য একটি নিয়ন্ত্রণ নীতি পরিচালনার কল্পনা করুন, রাষ্ট্র / ক্রিয়াকলাপের নমুনাগুলির একটি ডেটা সেট সংগ্রহ করুন Then তারপরেও রাজ্যগুলি সময়ের সাথে সম্পর্কযুক্ত হলেও, ক্রিয়াগুলি স্বাধীনভাবে জেনারেট হয়, রাষ্ট্রকে শর্তাধীন)) এই কিছুটা পরিস্থিতি অনুরূপ এই কাগজ ।
আমি একটি কাগজ পেয়েছিলাম, রিয়াবকো, ২০০,, " প্যাটার্ন রিকগনিশন ফর শর্তসাপেক্ষে স্বতন্ত্র ডেটা ", যা প্রথমে প্রাসঙ্গিক বলে মনে হয়েছিল; তবে, পরিস্থিতি আমার যা প্রয়োজন তা থেকে বিপরীত হয়েছে, যেখানে (লেবেল / বিভাগ / ক্রিয়া) থেকে আইআইডি আঁকতে পারে না , এবং (অবজেক্ট / প্যাটার্ন / অবস্থা) থেকে আইডিয়া আঁকতে হবে)।
আপডেট: রিয়াবকো কাগজে উল্লিখিত দুটি কাগজপত্র ( এখানে এবং এখানে ) এখানে প্রাসঙ্গিক বলে মনে হচ্ছে। তারা ধরে নেয় একটি স্বেচ্ছাসেবী প্রক্রিয়া থেকে এসেছে (উদাঃ আইড নয়, সম্ভবত অস্থিরতা)। তারা দেখায় যে নিকটতম-প্রতিবেশী এবং কার্নেলের অনুমানকারীরা এই ক্ষেত্রে সামঞ্জস্যপূর্ণ। তবে স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভুতের উপর ভিত্তি করে অনুমান এই পরিস্থিতিতে কার্যকর কিনা তা নিয়ে আমি আরও আগ্রহী।