গভীর সমঝোতা সংক্রান্ত নিউরাল নেটওয়ার্কগুলির জন্য কিছু দরকারী ডেটা বর্ধনের কৌশলগুলি কী কী?


13

পটভূমি: জেফ্রি হিন্টনের এই দুর্দান্ত কথাবার্তা দেখার পরে কনভোলশনাল নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়ার সময় আমি সম্প্রতি গভীর মাত্রায় ডেটা বর্ধনের গুরুত্ব বুঝতে পেরেছি ।

তিনি ব্যাখ্যা করেছেন যে বর্তমান প্রজন্মের কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলি পরীক্ষার অধীনে অবজেক্টের রেফারেন্সের ফ্রেমটিকে সাধারণীকরণ করতে সক্ষম হয় না, কোনও নেটওয়ার্কের পক্ষে সত্যিকার অর্থে যে কোনও বস্তুর মিররযুক্ত চিত্রগুলি একই তা বোঝা শক্ত করে তোলে।

কিছু গবেষণা এর প্রতিকার করার চেষ্টা করেছে। এখানে অনেকগুলি উদাহরণের মধ্যে একটি । আমি মনে করি এটি আজ সমালোচনামূলক নিউরাল নেটওয়ার্কগুলির প্রশিক্ষণের সময় ডেটা বর্ধনের সমালোচনা কতটা তা প্রতিষ্ঠিত করতে সহায়তা করে।

ডেটা বৃদ্ধির কৌশলগুলি একে অপরের বিরুদ্ধে খুব কমই বেঞ্চমার্কযুক্ত। অত: পর:

প্রশ্নাবলী:

  • অনুশীলনকারীরা ব্যতিক্রমী আরও ভাল পারফরম্যান্সের রিপোর্ট করেছেন এমন কয়েকটি কাগজপত্র কী কী?

  • আপনি দরকারী বলে মনে করেন এমন কিছু ডেটা বৃদ্ধির কৌশল কী কী?


হাই @ রাহদার, আপনার কি কোনও খবর আছে? ধন্যবাদ :)
নাল্গেপেটো

উত্তর:


1

সেকেন্ড। 1: ডেটা অগমেন্টেশন যেহেতু গভীর নেটওয়ার্কগুলিকে সন্তোষজনক কর্মক্ষমতা অর্জনের জন্য বিশাল সংখ্যক প্রশিক্ষণ চিত্রের উপর প্রশিক্ষণ দেওয়া দরকার, যদি মূল চিত্রের ডেটা সেটটিতে সীমিত প্রশিক্ষণের চিত্র থাকে তবে কার্যকারিতা বাড়ানোর জন্য ডেটা বর্ধন করা আরও ভাল। এছাড়াও, একটি গভীর নেটওয়ার্ক প্রশিক্ষণের সময় ডেটা বর্ধন করা জিনিসটি হয়ে ওঠে।

  • ডেটা বর্ধন করার অনেকগুলি উপায় রয়েছে যেমন জনপ্রিয় অনুভূমিকভাবে উল্টানো, এলোমেলো ফসল এবং রঙের জ্বলজ্বল। তদতিরিক্ত,
    আপনি একাধিক বিভিন্ন প্রসেসিংয়ের সংমিশ্রণগুলি চেষ্টা করতে পারেন, উদাহরণস্বরূপ,
    একই সময়ে আবর্তন এবং এলোমেলো স্কেলিং করা। এছাড়াও,
    আপনি
    সমস্ত পিক্সেলের পরিপূর্ণতা এবং মান ( এইচএসভি রঙ স্পেসের এস এবং ভি উপাদান ) বাড়াতে চেষ্টা করতে পারেন 0.25 থেকে 4 এর মধ্যে (
    প্যাচের মধ্যে থাকা সমস্ত পিক্সেলের জন্য একই ), এই মানগুলিকে
    0.7 এর মধ্যে একটি গুণক দ্বারা গুণ করুন এবং 1.4, এবং তাদের -0.1 এবং 0.1 এর মধ্যে একটি মান যুক্ত করুন।
    এছাড়াও, আপনি
    চিত্র / প্যাচের সমস্ত পিক্সেলের হিউ ( এইচএসভির এইচ উপাদান) এর সাথে [-0.1, 0.1] এর মধ্যে একটি মান যুক্ত করতে পারেন ।

  • ক্রিজেভস্কি এট আল। ২০১২ সালে বিখ্যাত অ্যালেক্স-নেটকে প্রশিক্ষণ দেওয়ার সময় 1 প্রস্তাবিত অভিনব পিসিএ F
    প্রশিক্ষণ চিত্রগুলিতে অভিনব পিসিএ আরজিবি চ্যানেলগুলির তীব্রতাকে পরিবর্তন করে । অনুশীলনে, আপনি প্রথমে আপনার প্রশিক্ষণ চিত্র জুড়ে আরজিবি পিক্সেল মান সেট করে পিসিএ করতে পারেন। এবং
    তারপরে, প্রতিটি প্রশিক্ষণ চিত্রের জন্য
    প্রতিটি আরজিবি চিত্র পিক্সেলের সাথে নিম্নলিখিত পরিমাণটি যুক্ত করুন (যেমন, I_ {xy} = [I_ {xy} ^ R, I_ {xy} ^ G, I_ {xy} ^ B] ^ T ):
    [প্রেমিক {P} _1, প্রেমিক {P} _2, প্রেমিক {P} _3] [alpha_1 lambda_1, alpha_2 lambda_2, alpha_3
    lambda_3] ^ টি যেখানে, প্রেমিক {P} _i এবং lambda_i I- তম eigenvector এবং হয়
    eigenvalue
    যথাক্রমে আরজিবি পিক্সেল মানগুলির 3 টাইম 3 কোভারিয়েন্স ম্যাট্রিক্স এবং আলফা_আই একটি গাউসিয়ান থেকে আঁকা একটি এলোমেলো পরিবর্তনশীল is
    গড় শূন্য এবং মান বিচ্যুতি 0.1। দয়া করে মনে রাখবেন যে, প্রতিটি
    আলফা_আই নির্দিষ্ট
    প্রশিক্ষণ চিত্রের সমস্ত পিক্সেলের জন্য একবারে অঙ্কিত হবে যতক্ষণ না সেই চিত্রটি আবার প্রশিক্ষণের জন্য ব্যবহার না করা হয়। এর অর্থ
    এটি, যখন মডেলটি আবার একই প্রশিক্ষণ চিত্রটির সাথে দেখা করে, এটি
    এলোমেলোভাবে ডেটা বৃদ্ধির জন্য অন্য একটি আলফা_আই উত্পাদন করবে । ইন 1 , তারা
    দাবি করেন যে, "অভিনব পিসিএ প্রায় একটি গুরুত্বপূর্ণ ক্যাপচার পারে
    প্রাকৃতিক ইমেজ সম্পত্তি, যথা, যে বস্তুর পরিচয় তীব্রতা এবং আলোকসজ্জা রঙ পরিবর্তনের পরিবর্তিত হয়"। করতে
    শ্রেণীবিন্যাস কর্মক্ষমতা, এই স্কিম টপ 1 টি ত্রুটি হার হ্রাস
    ImageNet 2012 এর প্রতিযোগিতায়% 1 বেশি।

(উত্স: ডিপ নিউরাল নেটওয়ার্কগুলির টিপস / কৌশলগুলি অবশ্যই জানতে হবে (শিও-শেন ওয়ে দ্বারা))

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.