নিউরাল নেটওয়ার্কগুলির বৈশিষ্ট্য নির্বাচন / ইঞ্জিনিয়ারিংয়ের প্রয়োজন কেন?


14

বিশেষত কাগল প্রতিযোগিতার প্রসঙ্গে আমি লক্ষ্য করেছি যে মডেলটির পারফরম্যান্স সমস্ত বৈশিষ্ট্য নির্বাচন / ইঞ্জিনিয়ারিং সম্পর্কে। যদিও আমি আরও বুঝতে পারি যে আরও প্রচলিত / পুরাতন-স্কুল এমএল অ্যালগরিদমগুলির সাথে কাজ করার ক্ষেত্রে কেন এমনটি হয় তবে গভীর স্নায়বিক নেটওয়ার্কগুলি ব্যবহার করার সময় কেন এমনটি হবে তা আমি দেখতে পাচ্ছি না।

ডিপ লার্নিং বইয়ের উদ্ধৃতি:

ডিপ লার্নিং অন্যান্য, সরল উপস্থাপনার ক্ষেত্রে প্রকাশিত প্রতিনিধিত্বগুলি প্রবর্তন করে প্রতিনিধিত্ব শিক্ষার এই কেন্দ্রীয় সমস্যাটি সমাধান করে। গভীর শেখা কম্পিউটারকে সহজ ধারণার বাইরে জটিল ধারণা তৈরি করতে সক্ষম করে।

তাই আমি সর্বদা ভেবেছিলাম যে "তথ্য ডেটাতে থাকে", যথেষ্ট গভীর, ভাল-প্যারামিটারাইজড নিউরাল নেটওয়ার্ক পর্যাপ্ত প্রশিক্ষণের সময় প্রদত্ত সঠিক বৈশিষ্ট্যগুলি গ্রহণ করবে।


4
আপনার মস্তিষ্ক একটি মেশিনের তুলনায় এখনও আরও শক্তিশালী, তাই কোনও মানুষের কাছ থেকে সামান্য সাহায্য অনেকদূর এগিয়ে যায়
আকসাকাল

কে বলে যে তাদের বৈশিষ্ট্য নির্বাচন / ইঞ্জিনিয়ারিং প্রয়োজন? আপনি কোন রেফারেন্স দিতে পারেন? আপনি যখন ছবিগুলির সাথে কাজ করেন, তারা শেষ পর্যন্ত শেষ পর্যন্ত অনেক বেশি কাজ করে ...

@ ইউজার 2137591 এটাই কথা। আমি একটি ধারণা পেয়েছি যে সাহিত্যে স্নায়বিক জালগুলি প্রচলিত মেশিন লার্নিং থেকে প্রায়শই এক ধাপ হিসাবে চিহ্নিত করা হয় কারণ তারা সম্ভবত ইঞ্জিনিয়ারিং এবং নির্বাচন স্বয়ংক্রিয়ভাবে করেন (ডিপ লার্নিং বইয়ের গুডফেলো, বেনজিও, করভিলির দ্বারা বর্ণিত)। এটি সিভি বা এনএলপিতে অনেকগুলি কার্যক্রমে সত্য যেখানে আমি বিশ্বাস করি যে তথ্য এখনও অভাবযুক্ত। অন্যদিকে, প্রতিযোগিতামূলক ডেটা সায়েন্সে (ক্যাগল) যেখানে প্রচুর গোলমাল তথ্য পাওয়া যায়, একটি সাধারণ বিশ্বাস হ'ল প্রতিযোগিতামূলক সমাধান তৈরির সবচেয়ে গুরুত্বপূর্ণ বিষয়টি "ম্যাজিক বৈশিষ্ট্য" সন্ধান করা।
সিফাসডাব্লু

আমি কমপভিসের পক্ষে কথা বলতে পারি, যেখানে নেটওয়ার্কগুলিতে ফিড দেওয়ার জন্য ফিচার ইঞ্জিনিয়ারিংয়ের কোনও প্রকল্প আমি স্মরণ করতে পারি না ... এটি মেডিকেল চিত্রের ডেটাও ধারণ করে, যেখানে চিত্রের মানটি সাধারণত কম থাকে। হতে পারে এটি অন্যান্য ক্ষেত্রেও ভিন্ন ... আপনার কোনও কাগজপত্র বা কোনও প্রকাশিত উত্স আছে যা আপনি এই বিষয়ে উল্লেখ করতে পারেন? আমি এটি প্রশংসা করব, ধন্যবাদ।

উত্তর:


18
  • যদি "পর্যাপ্ত গভীর" নেটওয়ার্কটি অবিচ্ছিন্নভাবে বিশাল হয়, হয় মডেল প্রশিক্ষণকে খুব ব্যয়বহুল করে তোলে (এডাব্লুএস ফি যোগ করে!) বা আপনার কোনও সংস্থান-সীমাবদ্ধ পরিবেশে নেটওয়ার্ক স্থাপন করতে হবে বলে?

  • নেটওয়ার্কটি ভালভাবে প্যারামিটারাইজড হয়েছে এমন একটি অগ্রাধিকার আপনি কীভাবে জানতে পারবেন ? এটি ভাল কাজ করে এমন একটি নেটওয়ার্ক খুঁজে পেতে প্রচুর পরীক্ষা নিতে পারে।

  • আপনি যে ডেটা নিয়ে কাজ করছেন তা মান বিশ্লেষণ পদ্ধতিগুলির যেমন "বায়ানারি" নয় যেমন কয়েক হাজার বা মিলিয়ন বিট সমন্বিত বাইনারি স্ট্রিং যেখানে প্রতিটি অনুক্রমের আলাদা দৈর্ঘ্য রয়েছে?

  • আপনি যদি ব্যবহারকারী-স্তরের ডেটাতে আগ্রহী হন তবে আপনি কেবল এমন লেনদেন-স্তরের ডেটা সংগ্রহ করে এমন একটি ডাটাবেস নিয়ে কাজ করতে বাধ্য হন?

  • 12,32,486,73,5,18,7

আমরা এমন এক বিশ্বে বাস করতে চাই যেখানে ডেটা বিশ্লেষণটি "টার্নকি" হয় তবে এই ধরণের সমাধান সাধারণত বিশেষ পরিস্থিতিতে উপস্থিত থাকে। চিত্রের শ্রেণিবিন্যাসের জন্য প্রচুর কাজ গভীর সিএনএন বিকাশে চলে গেছে - পূর্ববর্তী কাজের একটি পদক্ষেপ ছিল যা প্রতিটি চিত্রকে একটি নির্দিষ্ট দৈর্ঘ্যের ভেক্টর হিসাবে রূপান্তরিত করে।

ফিচার ইঞ্জিনিয়ারিং অনুশীলনকারীকে সরাসরি ফিড-ফরোয়ার্ড নেটওয়ার্কগুলিতে উপযুক্ত স্থির দৈর্ঘ্যের ভেক্টর হিসাবে সমস্যা সম্পর্কে জ্ঞান রূপান্তর করতে দেয়। বৈশিষ্ট্য নির্বাচন এতগুলি অপ্রাসঙ্গিক বৈশিষ্ট্যগুলি যে কোনও সিগন্যাল হারিয়েছে, সেইসাথে মডেলটিতে পরামিতির সংখ্যা নাটকীয়ভাবে হ্রাস করার সমস্যা সমাধান করতে পারে।


6

এখানে মূল শব্দগুলি প্রিয়ার এবং স্কেল । একটি সাধারণ উদাহরণ হিসাবে, কল্পনা করুন আপনি কোনও ছবি থেকে কোনও ব্যক্তির বয়স সম্পর্কে ভবিষ্যদ্বাণী করার চেষ্টা করছেন। চিত্র এবং যুগের ডেটাসেটের সাহায্যে, আপনি ভবিষ্যদ্বাণীগুলি করতে গভীর-লার্নিং মডেলকে প্রশিক্ষণ দিতে পারেন। এটি বস্তুনিষ্ঠভাবে সত্যই অদক্ষ কারণ চিত্রটির 90% ব্যর্থহীন, এবং কেবলমাত্র ব্যক্তির সাথে অঞ্চলটি দরকারী। বিশেষত, ব্যক্তির মুখ, তাদের শরীর এবং সম্ভবত তাদের পোশাক।

অন্যদিকে, আপনি পরিবর্তে কোনও ব্যক্তির জন্য বাউন্ডিং বাক্সগুলি বের করতে, চিত্রটি ক্রপ করুন এবং তারপরে এটি নেটওয়ার্কের মাধ্যমে পাস করার জন্য প্রাক-প্রশিক্ষিত অবজেক্ট সনাক্তকরণ নেটওয়ার্ক ব্যবহার করতে পারেন। এই প্রক্রিয়াটি বিভিন্ন কারণে আপনার মডেলের যথার্থতা উল্লেখযোগ্যভাবে উন্নত করবে:

1) সমস্ত নেটওয়ার্ক সংস্থান (যেমন ওজন) প্রথমে ব্যক্তিকে প্রথম সন্ধান করার বিপরীতে, বয়সের পূর্বাভাসের আসল কাজটিতে মনোনিবেশ করতে পারে। এটি বিশেষত গুরুত্বপূর্ণ কারণ ব্যক্তির মুখে দরকারী বৈশিষ্ট্য রয়েছে। অন্যথায়, আপনার প্রয়োজন সূক্ষ্ম বৈশিষ্ট্যগুলি প্রথম কয়েকটি স্তরগুলিতে হারিয়ে যেতে পারে। তাত্ত্বিকভাবে একটি বড়-পর্যাপ্ত নেটওয়ার্ক এটি সমাধান করতে পারে, তবে এটি হ'ল অদক্ষ। ক্রপযুক্ত চিত্রটি মূল চিত্রের চেয়েও যথেষ্ট নিয়মিত। মূল চিত্রটিতে প্রচুর শব্দ রয়েছে, তবে ক্রপযুক্ত চিত্রের মধ্যে তার তর্কযোগ্য তাত্পর্যগুলি লক্ষ্যটির সাথে অনেক বেশি সংযুক্ত রয়েছে corre

2) ক্রপ করা চিত্র একই আছে স্বাভাবিক করা যায় স্কেল । এটি স্কেলিং সম্পর্কিত সমস্যাগুলির সাথে দ্বিতীয় নেটওয়ার্ককে সহায়তা করে, কারণ মূল চিত্রটিতে লোকেরা কাছাকাছি বা খুব দূরে ঘটতে পারে। প্রাক্কালনের স্কেলটি আগেই এটি তৈরি করে যাতে শস্যযুক্ত চিত্রটি এমন কোনও ব্যক্তির গ্যারান্টিযুক্ত যাতে পূর্ণ ফসলযুক্ত চিত্রটি পূর্ণ হয় (তারা যদি খুব দূরে থাকত তবে পিক্সিলটেড থাকা সত্ত্বেও)। এটি কীভাবে স্কেলকে সহায়তা করতে পারে তা দেখার জন্য, মূল চিত্রের অর্ধেক প্রস্থ এবং উচ্চতার অর্ধবৃত্তাকার একটি শরীরে প্রক্রিয়া করতে 4x কম পিক্সেল রয়েছে এবং তাই এই চিত্রটিতে প্রয়োগ করা একই নেটওয়ার্কের প্রতিটি স্তরে 4x মূল নেটওয়ার্কের গ্রহণযোগ্য ক্ষেত্র থাকবে।

উদাহরণস্বরূপ, kaggle ফুসফুস প্রতিযোগিতায়, একটি সাধারণ থিম শীর্ষ সমাধান ফুসফুস চিত্র যে তাদের যতটা সম্ভব মুণ্ডিত এবং প্রতিটি ফুসফুস উপাদান বিচ্ছিন্ন উপর preprocessing কিছু ছিল না। প্রভাবটি ঘনক হওয়ায় এটি 3D চিত্রগুলিতে বিশেষভাবে গুরুত্বপূর্ণ: প্রতিটি মাত্রার 20% সরিয়ে আপনি প্রায় অর্ধেক পিক্সেল থেকে মুক্তি পাবেন!


4

এই ঘটনাটি সম্পর্কে আমার স্বীকৃতি মডেলটি শিখার জটিলতার সাথে সংযুক্ত। একটি গভীর নিউরাল নেটওয়ার্ক প্রকৃতপক্ষে তত্ত্বের যে কোনও ক্রিয়াকলাপটিকে আনুমানিকভাবে অনুমান করতে পারে তবে পরামিতি জায়গার মাত্রাটি লক্ষ লক্ষের মতো সত্যই বড় হতে পারে। সুতরাং, আসলে খোঁজার একটি ভাল স্নায়ুর নেটওয়ার্ক সত্যিই কঠিন। আমি অ্যালগরিদমকে একটি শুরুর দিকে ফিচার ইঞ্জিনিয়ারিং সম্পর্কে ভাবতে চাই, এটি ডেটা উপস্থাপন সম্পর্কিত কিছু অতিরিক্ত তথ্য সরবরাহ করে যা কিছুটা অর্থে যথেষ্ট ভাল। অবশ্যই এটি কোনও আনুষ্ঠানিক ব্যাখ্যা নয়, বৈজ্ঞানিক কঠোরতার সাথে এই প্রশ্নের উত্তর দেওয়া সত্যিই কঠিন হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.