আমি এখনও এই বিষয়ে গতিতে এগিয়ে আসছি এই জন্য আমি আগাম ক্ষমা চেয়ে নিচ্ছি। আমি আমার নিউরন অ্যাক্টিভেশন ফাংশনের জন্য তানহ (মানচিত্র -1 থেকে 1) বনাম সিগময়েড (মানচিত্র 0 থেকে 1) ব্যবহার করার পক্ষে এবং কৌশলগুলি বোঝার চেষ্টা করছি। আমার পড়া থেকে এটি প্রান্তিক পার্থক্য সহ একটি গৌণ জিনিস মত শোনাচ্ছে। আমার সমস্যার জন্য অনুশীলনে আমি দেখতে পেলাম যে সিগময়েড প্রশিক্ষণ করা সহজ এবং আশ্চর্যের সাথে, সিগময়েড সাধারণ সমাধান আরও ভালভাবে খুঁজে পেতে পারে। এর মাধ্যমে আমার অর্থ এই যে সিগময়েড সংস্করণটি প্রশিক্ষণ করা হলে এটি রেফারেন্সের (প্রশিক্ষণবিহীন) ডেটা সেটটিতে ভাল করে, যেখানে টানহ সংস্করণটি রেফারেন্সটিতে খারাপভাবে করার সময় প্রশিক্ষণের ডেটাতে সঠিক উত্তর পেতে সক্ষম হবে বলে মনে হয়। এটি একই নেটওয়ার্ক আর্কিটেকচারের জন্য।
আমার একটি অন্তর্নিহিততা হ'ল সিগময়েডের সাথে, নিউরনের পক্ষে প্রায় পুরোপুরি বন্ধ করা সহজ হয়, ফলে পরবর্তী স্তরগুলিকে কোনও ইনপুট সরবরাহ করা হয় না। তানহলের এখানে আরও কঠিন সময় রয়েছে কারণ এটির ইনপুটগুলি পুরোপুরি বাতিল করতে হবে, অন্যথায় এটি সর্বদা পরবর্তী স্তরটিকে একটি মান দেয়। যদিও এই স্বজ্ঞাত যদিও ভুল।
দীর্ঘ পোস্ট। নীচের লাইনটি, বাণিজ্যটি কী এবং এটির একটি বড় পার্থক্য করা উচিত?