ডিপ লার্নিংয়ে 1D কনভোলিউশনাল স্তর কী?


13

আমার 2 ডি বা 3 ডি বাস্তবায়নের ক্ষেত্রে ইমেজ প্রসেসিংয়ের জন্য ডিপ লার্নিংয়ে কনভোলশনাল স্তরগুলির ভূমিকা এবং প্রক্রিয়া সম্পর্কে ভাল ধারণা রয়েছে - তারা "সহজভাবে" চিত্রগুলিতে 2 ডি প্যাটার্ন ধরার চেষ্টা করে (3 ডি ক্ষেত্রে ক্ষেত্রে 3 চ্যানেলে)।

তবে সম্প্রতি আমি প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের প্রসঙ্গে 1D কনভ্যুশনাল স্তরগুলিতে ঝাঁপিয়েছি, যা আমার জন্য একপ্রকার অবাক করা কারণ আমার বোঝার মধ্যে 2D সমঝোতা বিশেষত 2D প্যাটার্নগুলি ধরার জন্য ব্যবহৃত হয় যা 1D (ভেক্টর) আকারে প্রকাশ করা অসম্ভব চিত্র পিক্সেল এর। 1 ডি সমঝোতার পিছনে যুক্তি কি?

উত্তর:


16

সংক্ষেপে, বোঝার জন্য কয়েকটি মাত্রার সংখ্যা সম্পর্কে বিশেষ কিছু নেই। কোনও সমস্যার সাথে মানিয়ে নিলে সমঝোতার যে কোনও মাত্রিকতা বিবেচনা করা যেতে পারে।

মাত্রার সংখ্যা হ'ল সমস্যাটির একটি সম্পত্তি। উদাহরণস্বরূপ, অডিও সংকেতের জন্য 1 ডি, চিত্রগুলির জন্য 2 ডি, চলচ্চিত্রের জন্য 3 ডি। । ।

সংক্ষিপ্তভাবে সংখ্যার মাত্রা উপেক্ষা করে, নির্দিষ্ট ধরণের ডেটা নিয়ে কাজ করার সময়, সম্পূর্ণ-সংযুক্ত মডেলের তুলনায় নিম্নলিখিতটিকে একটি কনভোলশিয়াল নিউরাল নেটওয়ার্ক (সিএনএন) এর শক্তি হিসাবে বিবেচনা করা যেতে পারে :

  1. সম্পূর্ণরূপে সংযুক্ত নেটওয়ার্কের মাধ্যমে প্রক্রিয়াকৃত একই ডেটার তুলনায় কনভলিউশন প্রক্রিয়াগুলি যে পরামিতিগুলি শিখতে হবে তা উল্লেখযোগ্যভাবে হ্রাস করে প্রতিটি অবস্থানের জন্য ভাগ করা ওজনের ব্যবহার।

  2. ভাগ করা ওজন নিয়ন্ত্রণের একধরণের।

  3. কনভোলশনাল মডেলের কাঠামো ডেটাতে স্থানীয় সম্পর্ক সম্পর্কে দৃ strong় ধারণা অনুমান করে, যা সত্য হয়ে গেলে এটি সমস্যার উপযুক্ত হয়ে ওঠে।

    ৩.১ স্থানীয় নিদর্শনগুলি ভাল ভবিষ্যদ্বাণীপূর্ণ ডেটা সরবরাহ করে (এবং / অথবা উচ্চতর স্তরগুলিতে আরও জটিল ভবিষ্যদ্বাণীপূর্ণ নিদর্শনগুলিতে কার্যকরভাবে সংযুক্ত করা যেতে পারে)

    ৩.২ তথ্যগুলিতে যে ধরণের প্যাটার্ন পাওয়া যায় সেগুলি একাধিক জায়গায় পাওয়া যায়। ডেটা পয়েন্টের আলাদা আলাদা সেটটিতে একই প্যাটার্নটি সন্ধান করা অর্থবহ।

সিএনএনগুলির এই বৈশিষ্ট্যগুলি মাত্রা সংখ্যার তুলনায় স্বতন্ত্র। এক-মাত্রিক সিএনএন একটি মাত্রায় নিদর্শনগুলির সাথে কাজ করে এবং নির্দিষ্ট দৈর্ঘ্যের সংকেতগুলির তুলনায় সিগন্যাল বিশ্লেষণে কার্যকর হতে থাকে। উদাহরণস্বরূপ, তারা অডিও সংকেত বিশ্লেষণের জন্য ভাল কাজ করে। কিছু প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের জন্য - যদিও পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলি, যা বিভিন্ন সিকোয়েন্স দৈর্ঘ্যের জন্য মঞ্জুরি দেয়, বিশেষত এলএসটিএম বা জিআরইউয়ের মতো মেমরি গেটের ব্যবস্থা সহ এমনগুলি আরও ভাল ফিট হতে পারে। তবুও সিএনএন পরিচালনা করা সহজ হতে পারে এবং আপনি দৈর্ঘ্য নির্ধারণের জন্য সহজভাবে প্যাড করতে পারেন।


2 ডি কি কেবল গ্রেস্কেল চিত্রের জন্য? আরজিবি চালু করলে কী হয়?
মোহাম্মদ আটার

1
@ মোহাম্মদআথার: আরজিবি পৃথক 2D তথ্যের চ্যানেল (বা বৈশিষ্ট্য মানচিত্র ) হিসাবে উপস্থাপিত হয় এবং সিএনএন স্তরগুলি বর্ণনা করার সময় সাধারণত 2D হিসাবেও বিবেচিত হয়। আপনি যদি টেনসরফ্লো বা কেরাস ব্যবহার করছিলেন তবে আপনি অবশ্যই রঙিন চিত্রগুলি পরিচালনা করার জন্য একটি কনভ 2 ডি স্তর সংজ্ঞাটি ব্যবহার করবেন। তবে, প্রয়োগগুলি প্রায়শই ওজন সংরক্ষণের জন্য অভ্যন্তরীণভাবে 3 ডি এবং 4 ডি কাঠামো ধারণ করে। । । এবং একাধিক চ্যানেল জুড়ে একটি 2 ডি কনভোলিউশন কার্যকরভাবে 3 ডি কনভোলিউশনের গাণিতিকভাবে একটি বিশেষ ক্ষেত্রে (যেখানে ইনপুট এবং কার্নেলের মাত্রাগুলি শেষ স্তরের সাথে মেলানো উচিত)। সুতরাং এটি যতটা কিছুই নামকরণের সম্মেলন।
নিল স্লেটার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.