এই প্রশ্নটি "কীভাবে কনভলিউশন স্তরগুলি ঠিক কাজ করে তা উত্সাহিত করে ।
ধরুন আমার কাছে একটি গ্রেস্কেল চিত্র রয়েছে। সুতরাং চিত্রটির একটি চ্যানেল রয়েছে। প্রথম স্তরে, আমি ফিল্টার এবং প্যাডিংয়ের সাথে কনভলিউশন প্রয়োগ করি । তারপর আমি সাথে অন্য সংবর্তন স্তর রয়েছে convolutions এবং ফিল্টার। আমার কাছে কতগুলি বৈশিষ্ট্যের মানচিত্র রয়েছে?কে 1 5 × 5 কে 2
1 সমঝোতা টাইপ করুন
প্রথম স্তরটি কার্যকর হয়। এর পরে, আমার কাছে বৈশিষ্ট্য মানচিত্র রয়েছে (প্রতিটি ফিল্টারের জন্য একটি)। এগুলির প্রত্যেকেরই আকার । প্রতিটি একক পিক্সেল প্যাডযুক্ত ইনপুট চিত্র থেকে পিক্সেল নিয়ে তৈরি হয়েছিল। এন × এম 3 ⋅ 3 = 9
তারপরে দ্বিতীয় স্তরটি প্রয়োগ করা হয়। প্রতিটি একক ফিল্টার বৈশিষ্ট্য মানচিত্রের প্রতিটি পৃথকভাবে প্রয়োগ করা হয় । এর ফলে কে বৈশিষ্ট্য মানচিত্রের প্রত্যেকটির জন্য কে বৈশিষ্ট্য মানচিত্র রয়েছে। সুতরাং দ্বিতীয় স্তরের পরে বৈশিষ্ট্য মানচিত্র রয়েছে। নতুন বৈশিষ্ট্য মানচিত্রগুলির প্রত্যেকটির একক পিক্সেল আগে থেকে প্যাডযুক্ত বৈশিষ্ট্য মানচিত্রের "পিক্সেল" নিয়ে তৈরি হয়েছিল।কে 1 কে 1 × কে 2 5 ⋅ 5 = 25
সিস্টেমটি পরামিতি শিখতে হবে ।
2.1 কনভোলজেশন টাইপ করুন
আগের মত: প্রথম স্তরটি কার্যকর হয়। এর পরে, আমার কাছে বৈশিষ্ট্য মানচিত্র রয়েছে (প্রতিটি ফিল্টারের জন্য একটি)। এগুলির প্রত্যেকেরই আকার । প্রতিটি একক পিক্সেল প্যাডযুক্ত ইনপুট চিত্র থেকে পিক্সেল নিয়ে তৈরি হয়েছিল। এন × এম 3 ⋅ 3 = 9
আগের মত নয়: তারপরে দ্বিতীয় স্তরটি প্রয়োগ করা হবে। প্রতিটি একক ফিল্টার একই অঞ্চলে প্রয়োগ করা হবে তবে সমস্ত বৈশিষ্ট্য আগে থেকেই রয়েছে। দ্বিতীয় স্তরটি কার্যকর হওয়ার পরে বৈশিষ্ট্য মানচিত্রের ফলাফল in নতুন বৈশিষ্ট্য মানচিত্রগুলির প্রত্যেকটির একক পিক্সেল আগে থেকে প্যাডযুক্ত বৈশিষ্ট্য মানচিত্রের কে "পিক্সেল" নিয়ে তৈরি হয়েছিল।কে 2 ⋅ 5 ⋅ 5 = 25 ⋅ কে 2
সিস্টেমটি পরামিতি শিখতে হবে ।
2.2 কনভোলজেশন টাইপ করুন
উপরের মত, তবে ফিল্টার প্রতি পরামিতি থাকার পরিবর্তে শিখতে হবে এবং অন্য ইনপুট বৈশিষ্ট্যের মানচিত্রের জন্য অনুলিপি করা উচিত, আপনার কাছে পরামিতি যা শিখতে হবে।কে 1 ⋅ 3 ⋅ 3 + কে 2 ⋅ কে 1 ⋅ 5 ⋅ 5
প্রশ্ন
- টাইপ 1 বা টাইপ 2 সাধারণত ব্যবহৃত হয়?
- অ্যালেক্সনেটে কোন ধরণের ব্যবহার হয় ?
- গুগলনেটে কোন ধরণের ব্যবহার হয় ?
- আপনি যদি টাইপ 1 বলে থাকেন: কেন সমাবর্তন কোনও অর্থ দেয়? তারা কি কেবল একটি ধ্রুবক দিয়ে ডেটা গুণ করে না?
- আপনি যদি টাইপ 2 বলে থাকেন: দয়া করে চতুর্ভুজ ব্যয়ের ব্যাখ্যা করুন ("উদাহরণস্বরূপ, গভীর দৃষ্টি নেটওয়ার্কে, যদি দুটি সমঝোতা স্তরগুলি বেঁধে রাখা হয়, তবে তাদের ফিল্টারগুলির সংখ্যায় কোনও অভিন্ন বৃদ্ধি গণনাটির চতুর্ভুজ বৃদ্ধি পেয়েছে")
সমস্ত উত্তরের জন্য, দয়া করে কিছু প্রমাণ দিন (কাগজপত্র, পাঠ্যপুস্তক, ফ্রেমওয়ার্কের ডকুমেন্টেশন) যে আপনার উত্তরটি সঠিক।
বোনাস প্রশ্ন 1
পুলিংটি কেবল সর্বদা বৈশিষ্ট্য মানচিত্রের জন্য প্রয়োগ করা হয় বা এটি একাধিক বৈশিষ্ট্যের মানচিত্রের মাধ্যমেও করা হয়?
বোনাস প্রশ্ন 2
আমি তুলনামূলকভাবে নিশ্চিত যে টাইপ 1 সঠিক এবং আমি গুগলি পেপারে কিছু ভুল পেয়েছি। তবে একটি থ্রিডি কনভলিউশনও রয়েছে। আপনাকে বলুন যে আপনার কাছে সাইজের মাপের 1337 টি বৈশিষ্ট্যযুক্ত মানচিত্র রয়েছে এবং আপনি ফিল্টার প্রয়োগ করেন । আপনি কীভাবে বৈশিষ্ট্য মানচিত্রের উপর ফিল্টার স্লাইড করবেন? (বাম থেকে ডানদিকে, উপরে থেকে নীচে, সর্বশেষ বৈশিষ্ট্যের মানচিত্রের সর্বশেষ বৈশিষ্ট্য মানচিত্র?) আপনি যতক্ষণ না এটি ধারাবাহিকভাবে কাজ করেন ততক্ষণ কি বিষয়টি বিবেচনা করে?3 × 4 × 5
আমার গবেষণা
- আমি উপরের দুটি কাগজ পড়েছি, তবে এখনও কী ব্যবহার করা হচ্ছে তা সম্পর্কে নিশ্চিত নই।
- আমি লাসাগন ডকুমেন্টেশন পড়েছি
- আমি থিয়ানো ডকুমেন্টেশন পড়েছি
- আমি কনভোলশনাল নিউরাল নেটওয়ার্কগুলি বোঝার উপর উত্তরগুলি পড়েছি (সমস্ত লিঙ্ক অনুসরণ না করে)
- আমি কনভলিউশনাল নিউরাল নেটওয়ার্ক (লেনেট) পড়েছি । বিশেষত চিত্র 1 আমাকে তুলনামূলকভাবে নিশ্চিত করে তোলে যে টাইপ 2.1 সঠিক। এটি গুগলি নেট-এর "চতুষ্কোণ ব্যয়" মন্তব্য এবং ক্যাফির সাথে আমার কিছু ব্যবহারিক অভিজ্ঞতার সাথে খাপ খায়।