পি (ওয়াই | এক্স) এর কোনও মডেলকে পি (এক্স) এর নন-আইআইডি নমুনা এবং পি (ওয়াই। এক্স) এর আইআইডি নমুনাগুলি থেকে স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত হওয়ার মাধ্যমে প্রশিক্ষণ দেওয়া যেতে পারে?


10

কিছু ডেটা সেটে স্টোকাস্টিক গ্রেডিয়েন্ট বংশদ্ভুতের মাধ্যমে একটি প্যারামিটারাইজড মডেলকে (উদাহরণস্বরূপ সর্বাধিকীকরণের জন্য) প্রশিক্ষণ দেওয়ার সময়, এটি সাধারণত অনুমান করা হয় যে প্রশিক্ষণের ডেটা বিতরণ থেকে প্রশিক্ষণের নমুনাগুলি আঁকা হয়। সুতরাং যদি লক্ষ্যটি একটি যৌথ বিতরণ মডেল করা হয় , তবে প্রতিটি প্রশিক্ষণের নমুনা সেই বিতরণটি থেকে আঁকতে হবে।P(X,Y)(xi,yi)

যদি লক্ষ্যটি পরিবর্তে শর্তসাপেক্ষ ডিস্ট্রিবিউশন মডেল করা হয়, তবে আইডির প্রয়োজনীয়তাটি কীভাবে পরিবর্তিত হবে, যদি না?P(Y|X)

  1. আমরা কি এখনও যৌথ বন্টন থেকে প্রতিটি নমুনা আঁকতে পারি ?(xi,yi)
  2. আমরা আঁকা উচিত থেকে IID , তারপর আঁকা থেকে IID ?xiP(X)yiP(Y|X)
  3. আমরা কি (যেমন সময়ের সাথে সংযুক্ত) থেকে নয় আঁকতে পারি , তারপরে থেকে iid আঁকতে পারি?xiP(X)yiP(Y|X)

আপনি স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত জন্য এই তিনটি পদ্ধতির বৈধতা সম্পর্কে মন্তব্য করতে পারেন? (বা যদি প্রয়োজন হয় তবে আমাকে পুনরায় প্রশ্নে উত্তর দিতে সহায়তা করুন))

সম্ভব হলে আমি # 3 করতে চাই। আমার অ্যাপ্লিকেশনটি পুনর্বহালকরণ শিক্ষায় রয়েছে, যেখানে আমি নিয়ন্ত্রণ নীতি হিসাবে প্যারামিটারাইজড শর্তযুক্ত মডেলটি ব্যবহার করি। রাজ্যগুলির ক্রম অত্যন্ত পরস্পর সম্পর্কিত, তবে ক্রিয়াকলাপগুলি রাজ্য সম্পর্কিত শর্তাধীন একটি স্টকাস্টিক নীতিমালা থেকে নমুনাযুক্ত। ফলাফলের নমুনা (বা সেগুলির একটি উপসেট) নীতিটি প্রশিক্ষণের জন্য ব্যবহৃত হয়। (অন্য কথায়, কিছু পরিবেশে দীর্ঘ সময়ের জন্য একটি নিয়ন্ত্রণ নীতি পরিচালনার কল্পনা করুন, রাষ্ট্র / ক্রিয়াকলাপের নমুনাগুলির একটি ডেটা সেট সংগ্রহ করুন Then তারপরেও রাজ্যগুলি সময়ের সাথে সম্পর্কযুক্ত হলেও, ক্রিয়াগুলি স্বাধীনভাবে জেনারেট হয়, রাষ্ট্রকে শর্তাধীন)) এই কিছুটা পরিস্থিতি অনুরূপ এই কাগজxiyi(xi,yi)

আমি একটি কাগজ পেয়েছিলাম, রিয়াবকো, ২০০,, " প্যাটার্ন রিকগনিশন ফর শর্তসাপেক্ষে স্বতন্ত্র ডেটা ", যা প্রথমে প্রাসঙ্গিক বলে মনে হয়েছিল; তবে, পরিস্থিতি আমার যা প্রয়োজন তা থেকে বিপরীত হয়েছে, যেখানে (লেবেল / বিভাগ / ক্রিয়া) থেকে আইআইডি আঁকতে পারে না , এবং (অবজেক্ট / প্যাটার্ন / অবস্থা) থেকে আইডিয়া আঁকতে হবে)।yiP(Y)xiP(X|Y)

আপডেট: রিয়াবকো কাগজে উল্লিখিত দুটি কাগজপত্র ( এখানে এবং এখানে ) এখানে প্রাসঙ্গিক বলে মনে হচ্ছে। তারা ধরে নেয় একটি স্বেচ্ছাসেবী প্রক্রিয়া থেকে এসেছে (উদাঃ আইড নয়, সম্ভবত অস্থিরতা)। তারা দেখায় যে নিকটতম-প্রতিবেশী এবং কার্নেলের অনুমানকারীরা এই ক্ষেত্রে সামঞ্জস্যপূর্ণ। তবে স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভুতের উপর ভিত্তি করে অনুমান এই পরিস্থিতিতে কার্যকর কিনা তা নিয়ে আমি আরও আগ্রহী।xi


1
সম্ভবত আমি কিছু মিস করছি, এবং আমি কাগজটি পড়িনি, তবে: আপনি থেকে নন-আইডির অঙ্কন করছেন এবং তারপরে থেকে আইআইডি স্যাম্পল করছেন । রিয়াবকো (২০০)) থেকে নন- আইডির অঙ্কন করছে এবং তারপরে - মিডওয়াই থেকে আইডির নমুনা । এগুলি পুনরায় নামকরণের ক্ষেত্রেও একই রকম। এবং অবজেক্ট সম্পর্কে মৌলিকভাবে আলাদা কিছু রয়েছে যা এটি একই পরিস্থিতি তৈরি করে না? xiP(X)yiP(YX)yiP(Y)xiP(XY)xy
দুগল

@ ডাওগাল: পার্থক্যটি হ'ল শর্তসাপেক্ষ বিতরণ মডেলগুলি, শর্তসাপেক্ষ র্যান্ডম ক্ষেত্রগুলির মতো এবং ("ইনপুট" এবং "আউটপুট") আলাদাভাবে চিকিত্সা করে ... তারা কেবলমাত্র একটি দিকের মডেল ( তবে নয় মডেল )। XYP(Y|X)P(X|Y)
টাইলার স্ট্রিটার 14

2
আমি এই ক্ষেত্রে নিম্নলিখিত উপমা বিবেচনা করব। ধরুন এবং দুই সম্পর্কিত সময় সিরিজ (সময় পারস্পরিক সম্পর্ক) হয়। আমরা একটি ফাংশন বের করতে চাই , যা সমতুল্য । যদি , যা অবশিষ্ট, IID হয় (তাই স্থির এবং নিরবিচ্ছিন্ন) তবে অনুমান পদ্ধতি পক্ষপাত ছাড়াই রূপান্তরিত হয়। শর্তসাপেক্ষ সম্ভাবনা সঠিকভাবে নির্দিষ্ট করা হয় এবং অবশিষ্টগুলি আইআইডি হওয়া পর্যন্ত মূলত সময় ক্রম বা যেকোন র্যান্ডমাইজড অর্ডারে টাইম সিরিজ প্রক্রিয়াজাতকরণ কোনও এমএলই পদ্ধতিতে গুরুত্বপূর্ণ নয়। X i Y i = f ( X i ; θ ) P ( Y i | X i ; θ ) P ( Y i | X i ; θ )YiXiYi=f(Xi;θ)P(Yi|Xi;θ)P(Yi|Xi;θ)
ক্যাগডাস ওজজেঙ্ক

উত্তর:


1

আমি মনে করি আপনি 2 বা 3 করতে পারেন তবে 3 এর সাথে সমস্যাটি হ'ল এক্স এর জন্য নির্বিচারে বিতরণকে অনুমতি দেওয়ার ক্ষেত্রে আপনি এমন বিতরণগুলি অন্তর্ভুক্ত করেন যাগুলির সম্ভাব্যতার সমস্ত বা প্রায় সমস্ত ঘনত্ব হবে এক্স-স্পেসের মধ্যে একটি ছোট ব্যবধান। এটি পি (ওয়াই | এক্স) এর সামগ্রিক অনুমানকে আঘাত করবে কারণ আপনার এক্স এর নির্দিষ্ট মানগুলির জন্য খুব কম বা কোনও ডেটা থাকবে না


সুতরাং আপনি কি বলছেন যে # 3 পদ্ধতির সাথে, আমি সম্ভাব্য উচ্চ বৈচিত্র সহ একটি পক্ষপাতহীন ফলাফল পেতে পারি?
টাইলার স্ট্রিটার

যদি বিন্দু x কাছে বা কাছে কোনও তথ্য না থাকে তবে আপনি পি (ওয়াই | এক্স = এক্স ) এমনকি করতে পারবেন না এবং যদি কয়েকটি পয়েন্ট থাকে তবে অনুমানের বৈচিত্রটি বড় হবে। 111
মাইকেল আর চেরনিক

হ্যাঁ, এটি বোঝা যায় যে বৈকল্পিকতা বড় হতে পারে। আমার অনুমান যে আমার মূল উদ্বেগ হ'ল অনুমান করা হয় যে পি (ওয়াই। এক্স) পক্ষপাতদুষ্ট হবে।
টাইলার স্ট্রিটার

আমরা একটি বিন্দু অনুমান নিয়ে আলোচনা করিনি। আপনার যদি পি (এক্স), পি (ওয়াই) এবং পি (এক্স | ওয়াই) এর পক্ষপাতহীন অনুমান থাকে এবং সেগুলিকে P (Y | X) = P (X | Y) P (Y) / P (X) এ প্লাগ করে আপনি একটি পক্ষপাতদুষ্ট অনুমান পাবেন।
মাইকেল আর চেরনিক

আমার জোর দেওয়া উচিত যে আমি স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত মাধ্যমে পি (ওয়াই | এক্স) অনুমানের বিষয়ে কথা বলছি, সেক্ষেত্রে প্রশিক্ষণের নমুনাগুলির ক্রমটি কতটা দ্রুত বা এটি সঠিক মডেলে রূপান্তরিত করে কিনা তা প্রভাবিত করতে পারে। আমি কেবল নমুনা গড় ব্যবহার করছি না, যেখানে নমুনার ক্রম কোনও বিবেচনা করে না।
টাইলার স্ট্রিটার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.