নিউরাল নেটওয়ার্কগুলিতে কেন উদ্ভূত বৈশিষ্ট্য ব্যবহার করা হয়?


13

উদাহরণস্বরূপ, কেউ বাড়ির দামের পূর্বাভাস দিতে চায় এবং বাড়ির দৈর্ঘ্য এবং প্রস্থের দুটি ইনপুট রয়েছে। কখনও কখনও, একটির মধ্যে 'উত্পন্ন' বহুপদী ইনপুট বৈশিষ্ট্যও অন্তর্ভুক্ত থাকে, যেমন ক্ষেত্রফল, দৈর্ঘ্য * প্রস্থ।

1) উদ্ভূত বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করার বিষয়টি কী? একটি নিউরাল নেটওয়ার্ক প্রশিক্ষণের সময় দৈর্ঘ্য, প্রস্থ এবং দামের মধ্যে সংযোগ শিখতে হবে না? তৃতীয় বৈশিষ্ট্য, অঞ্চল, অপ্রয়োজনীয় নয় কেন?

এছাড়াও, কখনও কখনও আমি এটিও দেখতে পাই যে লোকেরা তাদের সংখ্যা হ্রাস করার জন্য ইনপুট বৈশিষ্ট্যগুলিতে জেনেটিক নির্বাচন অ্যালগরিদমগুলি চালায়।

2) ইনপুট বৈশিষ্ট্যগুলি যদি দরকারী তথ্য থাকে তবে তা হ্রাস করার কী আছে? নিউরাল নেটওয়ার্কের প্রতিটি ইনপুট বৈশিষ্ট্যটির গুরুত্ব অনুসারে উপযুক্ত ওজন নির্ধারণ করা উচিত নয়? জেনেটিক সিলেকশন অ্যালগরিদমগুলি চালানোর বিন্দুটি কী?

উত্তর:


8

1): উত্সাহিত বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করা প্রশিক্ষণ প্রক্রিয়াতে বিশেষজ্ঞের জ্ঞানকে ইনজেক্ট করার একটি উপায় এবং তাই এটির গতি বাড়ানোর জন্য। উদাহরণস্বরূপ, আমি আমার গবেষণায় পদার্থবিদদের সাথে অনেক কাজ করি। যখন আমি একটি অপ্টিমাইজেশন মডেল তৈরি করছি, তারা আমাকে 3 বা 4 পরামিতি দেবে, তবে তারা সাধারণত কিছু নির্দিষ্ট ফর্মগুলিও জানেন যা সমীকরণে উপস্থিত হওয়ার কথা। উদাহরণস্বরূপ, আমি ভেরিয়েবলগুলি এবং পেতে পারি , তবে বিশেষজ্ঞ জানে যে গুরুত্বপূর্ণ। এটিকে একটি বৈশিষ্ট্য হিসাবে অন্তর্ভুক্ত করে, আমি মডেলটিকে সংরক্ষণ করি যে গুরুত্বপূর্ণ finding মঞ্জুর, কখনও কখনও ডোমেন বিশেষজ্ঞরা ভুল হয় তবে আমার অভিজ্ঞতায় তারা সাধারণত জানেন যে তারা কী সম্পর্কে কথা বলছেন।nlnlnl

2): আমি এটির জন্য দুটি কারণ জানি। প্রথমত, যদি আপনার হাজার হাজার বৈশিষ্ট্য সরবরাহ করা হয় (যেমন প্রায়শই রিয়েল ওয়ার্ল্ডের ডেটাতে ঘটে থাকে), এবং প্রশিক্ষণের জন্য সিপিইউয়ের সময় খুব কম থাকে (এটিও একটি সাধারণ ঘটনা), আপনি বৈশিষ্ট্যটির স্থানটি আলাদা করতে বিভিন্ন বৈশিষ্ট্য নির্বাচন অ্যালগরিদম ব্যবহার করতে পারেন অগ্রিম. এর জন্য মূলত পদ্ধতিগুলি প্রায়শই তথ্য-তাত্ত্বিক পদক্ষেপগুলি সর্বাধিক ভবিষ্যদ্বাণীমূলক শক্তি সহ বৈশিষ্ট্যগুলি নির্বাচন করতে ব্যবহার করে। দ্বিতীয়ত, আপনি সমস্ত ডেটা এবং আপনার কাছে থাকা সমস্ত বৈশিষ্ট্যগুলি প্রশিক্ষণের পক্ষে সামর্থ্য থাকলেও, নিউরাল নেটওয়ার্কগুলি প্রায়শই 'ব্ল্যাক বক্স' মডেল বলে সমালোচিত হয়। আগে থেকে বৈশিষ্ট্যটির স্থান হ্রাস করা এই সমস্যাটি প্রশমিত করতে সহায়তা করতে পারে। উদাহরণস্বরূপ, এনএন-এর দিকে নজর দেওয়া কোনও ব্যবহারকারী 0.01 ওজনের অর্থ "0" তবে সহজেই বলতে পারবেন না তবে অনুকূলকরণ প্রক্রিয়াটি সেখানে যথেষ্টভাবে পায়নি "বা"


0

1) বেশিরভাগ নিউরাল নেটওয়ার্কগুলি গুণ করতে পারে না; তারা কেবলমাত্র অঙ্কগুলি গণনা করতে পারে (যা পরে কোনও অ্যাক্টিভেশন ফাংশনের মাধ্যমে স্বতন্ত্রভাবে খাওয়ানো হয় )। তাদের যদি গুরুত্বপূর্ণ হয় তবে তাদের সেই গুণাগুলির পরিবর্তে অনুমান করতে হবে, যার জন্য অনেকগুলি নিউরন প্রয়োজন, বিশেষত যদি কারণগুলি বড় পরিসীমা বিস্তৃত করতে পারে।

যদি এটি ঘুরে দেখা যায় যে প্রকৃতপক্ষে বাড়ির অঞ্চলটি একটি গুরুত্বপূর্ণ বৈশিষ্ট্য, আপনি যদি অঞ্চলটি এটি সরবরাহ করেন তবে আপনি নেটওয়ার্কটিকে সহায়তা করবেন কারণ এটি তখন প্রস্থ এবং দৈর্ঘ্যের গুণনের অনুমান করার জন্য প্রয়োজনীয় নিউরনগুলি ব্যবহার করতে পারে অন্যান্য জিনিস করতে।

সুতরাং, বহু-বৈশিষ্ট্যযুক্ত বৈশিষ্ট্যগুলি সহ কিছু ক্ষেত্রে নেটওয়ার্কের পক্ষে উপকারী হতে পারে তবে অন্যান্য ক্ষেত্রে এর উল্লেখযোগ্য প্রভাব নেই। তদুপরি, বহুপদী বৈশিষ্ট্যগুলি হ'ল এক ধরণের উত্পন্ন বৈশিষ্ট্য যা নেটওয়ার্কের পক্ষে সহায়ক হতে পারে। আর কোনও ধরণের উত্সযুক্ত বৈশিষ্ট্য যা সহায়ক হতে পারে তা উদাহরণস্বরূপ ইনপুট ভেরিয়েবলের লগারিদমগুলি (তারা ইতিবাচক বলে বিবেচিত) যা প্রাপ্ত করার জন্য নেটওয়ার্কটিকেও অনুমান করতে হবে।

একটি ধারণাটি হ'ল কেবল সংযোজনের চেয়ে নেটওয়ার্কের সংখ্যার মধ্যে আরও বেশি ক্রিয়াকলাপ চালানোর অনুমতি দেওয়া, এটি বহুবর্ষীয় বৈশিষ্ট্যগুলির মতো জিনিসগুলি দক্ষতার সাথে গণনা করতে সক্ষম করার জন্য, তবে এটি কীভাবে কাজ করবে তা পরিষ্কার নয়। এমন একটি আর্কিটেকচার যা দেখে মনে হয় এটি একই রকম কিছু করে তা হল যোগফল পণ্য নেটওয়ার্ক

২) জন উল্লিখিত গণনা ব্যয় ব্যতীত মডেলটিতে প্যারামিটারের সংখ্যা বৃদ্ধি করে, যখন আপনি আরও ইনপুটগুলি প্রবর্তন করেন তখন অনিবার্য ঘটনা ঘটে , বিশেষত আপনার যদি প্রশিক্ষণের জন্য অল্প ডেটা থাকে, বিশেষত যদি নেটওয়ার্কের পক্ষে অতিরিক্ত পোশাকের ঝুঁকিও বাড়ায় ।

তবে, যদি একটি ভাল নিয়মিতকরণ পদ্ধতি ব্যবহার করা হয় তবে এটিকে সমস্যার অনেক কম করা যায়। (ড্রপআউট তার পক্ষে চূড়ান্তভাবে কাজ করে বলে মনে হচ্ছে) তাত্ত্বিকভাবে, যথেষ্ট পরিমাণে নিয়মিতকরণ পদ্ধতি সহ, ওভারফিটিং কোনও সমস্যা হওয়া উচিত নয়। হিন্টন যেমন উল্লেখ করেছেন, একজন মানুষের মস্তিষ্কে 10 ^ 14 সিনপেসের ক্রম রয়েছে (নিউরাল নেটওয়ার্কের সংযোগগুলির সাথে সম্পর্কিত), তবে কেবল 10 ^ 9 সেকেন্ডের ক্রমে বেঁচে থাকে, তবে আমরা এখনও সক্ষম হতে পারি বলে মনে হয় বেশ ভাল জেনারালাইজ করুন। স্পষ্টতই, অনেক পরামিতি থাকা যা টিউন করা যায় ডান অ্যালগরিদমের সাথে কেবল একটি সুবিধা হওয়া উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.