এই প্রশ্নের ফোকাস
"কীভাবে ... আমরা একই বিতরণে প্রকৃত বিতরণ এবং জেনারেটাল মডেল থেকে ডেটা প্রক্রিয়া করতে পারি?
ফাউন্ডেশনাল পাবলিকেশন বিশ্লেষণ
উল্লেখযোগ্য পৃষ্ঠায়, জেনারেটাল অ্যাডভারসিয়াল নেটওয়ার্কগুলি ( ২০১ () বোঝা , ডক্টরাল প্রার্থী ড্যানিয়েল সিটি সঠিকভাবে জেনারেটাল অ্যাডভারসিয়াল নেটওয়ার্কগুলি, গুডফেলো, পাউজেট -আবাদি, মির্জা, জু, ওয়ার্ডে-ফারলে, ওজায়ার, করভিল এবং বেঞ্জিও, জুন ২০১৪ উল্লেখ করেছেন । এটি বিমূর্তে বলা হয়েছে, "আমরা একটি বিবর্তনমূলক প্রক্রিয়ার মাধ্যমে জেনেরেটরি মডেলগুলি অনুমান করার জন্য একটি নতুন কাঠামো প্রস্তাব করি, যেখানে আমরা একই সাথে দুটি মডেলকে প্রশিক্ষণ দিই ..." এই মূল কাগজটি দুটি মডেলকে এমএলপি (মাল্টিলেয়ার পারসেপ্ট্রন) হিসাবে সংজ্ঞায়িত করে।
- জেনারেটরি মডেল, জি
- বৈষম্যমূলক মডেল, ডি
এই দুটি মডেল এমনভাবে নিয়ন্ত্রণ করা হয় যেখানে একজন অন্যের দিকে এক ধরণের নেতিবাচক প্রতিক্রিয়া সরবরাহ করে, তাই শব্দটি বিবর্তনবাদী।
- ডি ডি বোকা হিসাবে যথেষ্ট উদাহরণের একটি সেট ডেটা বিতরণ ক্যাপচার প্রশিক্ষণপ্রাপ্ত।
- ডি এর ইনপুটটি জি এর মক বা জ্যান সিস্টেমের জন্য উদাহরণগুলির সেট কিনা তা আবিষ্কার করতে প্রশিক্ষিত হয়।
(জিএন সিস্টেমের জন্য উদাহরণগুলির সেটকে কখনও কখনও আসল নমুনা হিসাবে উল্লেখ করা হয় তবে উত্পন্ন উত্সগুলির তুলনায় এগুলি আর বাস্তব হতে পারে না Both উভয়ই কম্পিউটারে সংখ্যাসূচক অ্যারে, একটি অভ্যন্তরীণ উত্স সহ একটি সেট এবং অন্যটি বাহ্যিক সহ উত্স। কিছু শারীরিক দৃশ্যে নির্দেশিত ক্যামেরা থেকে বাহ্যিকগুলি কিনা তা GAN অপারেশনের সাথে প্রাসঙ্গিক নয়))
সম্ভাবনাময়ভাবে, ডি বোকা বানাতে সম্ভাবনা সর্বাধিক প্রতিশব্দ হয় যে ডি যতগুলি মিথ্যা ধনাত্মক এবং মিথ্যা নেতিবাচকতা উত্পন্ন করবে যতই এটি সঠিক শ্রেণিবদ্ধকরণগুলি করে, প্রতিটি 50%। তথ্য বিজ্ঞানের ক্ষেত্রে, এটি বলা যায় যে জি ডি এর তথ্যের সীমাটি 0 এর কাছাকাছি পৌঁছেছে কেননা অসীমের কাছে যায়। এটি ডি এর দৃষ্টিকোণ থেকে জি এর এনট্রাপি সর্বাধিক করার প্রক্রিয়া, এইভাবে ক্রস-এনট্রপি শব্দটি।
কনভারজেন্স কীভাবে সম্পন্ন হয়
কারণ প্রশ্নে সিয়েটার 2017 লিখন থেকে পুনরুত্পাদন করা ক্ষতির ফাংশনটি ডি প্রদত্ত, কোনও নির্দিষ্ট প্রশিক্ষণ রাষ্ট্রের জন্য সম্পূর্ণ বিন্দুতে পুরো পয়েন্ট প্রয়োগ করার সময় দুটি বিতরণের মধ্যে ক্রস এনট্রপি (বা পারস্পরিক সম্পর্ক) হ্রাস করার জন্য নকশাকৃত।
এইচ( ( এক্স1, y1) , ডি ) = 1ডি ( এক্স1)
ক্রসের এনট্রাপি সর্বাধিক করার জন্য ডিজাইন করা জি এর জন্য একটি পৃথক লোকসানের কার্যকারিতা রয়েছে। লক্ষ করুন যে সিস্টেমে TWO স্তর প্রশিক্ষণের গ্রানুলারিলিটি রয়েছে।
- গেমটি দুই খেলোয়াড়ের খেলায় চলে moves
- প্রশিক্ষণ নমুনা যে
এগুলি নীচে বাইরের পুনরাবৃত্তির সাথে নেস্টেড পুনরাবৃত্তি উত্পাদন করে।
- জি এর ক্ষতির কার্যকারিতা ব্যবহার করে জি প্রশিক্ষণ নেওয়া ce
- মকের ইনপুট প্যাটার্নগুলি তার বর্তমান প্রশিক্ষণের অবস্থায় জি থেকে উত্পন্ন হয়।
- ডি এর ক্ষতির কার্যকারিতা ব্যবহার করে ডি প্রশিক্ষণ ce
- যদি ক্রস এনট্রপি এখনও পর্যাপ্ত পরিমাণে বাড়ানো না হয় তবে পুনরাবৃত্তি করুন, ডি এখনও বৈষম্য করতে পারে।
ডি অবশেষে খেলাটি হেরে গেলে, আমরা আমাদের লক্ষ্য অর্জন করেছি।
- জি প্রশিক্ষণ তথ্য বিতরণ পুনরুদ্ধার
- ডিটিকে অকার্যকর করে তোলা হয়েছে ("সর্বত্র 1/2 সম্ভাবনা")
সমকালীন প্রশিক্ষণ কেন প্রয়োজনীয়
যদি দু'টি মডেলকে সামনের নকল করার জন্য পিছনে পিছনে প্রশিক্ষণ না দেওয়া হয়, তবে অ্যাডভারসিয়াল প্লেনে (বাহ্যিক পুনরাবৃত্তি) 2014 সালের কাগজে দাবি করা অনন্য সমাধানের ক্ষেত্রে রূপান্তর ঘটবে না।
অধিক তথ্য
প্রশ্নের বাইরে, সিয়েটার কাগজে আগ্রহের পরবর্তী আইটেমটি হ'ল, "জেনারেটরের ক্ষতির কার্যকারিতাটির খারাপ নকশা," বংশদ্ভুত দিকনির্দেশের জন্য পর্যাপ্ত গ্রেডিয়েন্ট মানগুলিতে নেতৃত্ব দিতে পারে এবং যা কখনও কখনও স্যাচুরেশন নামে পরিচিত তাকে উত্পাদন করতে পারে। স্যাচুরেশন হ'ল ফিডব্যাক সিগন্যালের হ্রাস যা পিছনে বংশবৃদ্ধিতে বংশোদ্ভূত ভাসমান পয়েন্ট গোলাকর্ষণ থেকে উদ্ভূত বিশৃঙ্খলা শব্দে নেতৃত্ব দেয়। শব্দটি সংকেত তত্ত্ব থেকে এসেছে।
আমি গুডফেলো এট আলিয়া (পাকা গবেষকরা) এর 2014 সালের কাগজটি 2017 পৃষ্ঠার চেয়ে জিএন প্রযুক্তি সম্পর্কে জানতে অধ্যয়ন করার পরামর্শ দিচ্ছি ।