নিউরাল নেটওয়ার্ক - ওজনের অর্থ


11

আমি ফিড-ফরোয়ার্ড এনএন ব্যবহার করছি। আমি ধারণাটি বুঝতে পারি, তবে আমার প্রশ্ন ওজন সম্পর্কে। আপনি কীভাবে তাদের ব্যাখ্যা করতে পারেন, অর্থাত্ তারা কী উপস্থাপন করবেন বা কীভাবে তারা আনস্ট্রোড হতে পারে (কেবলমাত্র ক্রিয়াকলাপের সহগ)? আমি "স্পেস অফ ওজন" নামে কিছু পেয়েছি, তবে এর অর্থ কী তা আমি যথেষ্ট নিশ্চিত নই।


উত্তর:


6

পৃথক ওজন ইউনিটগুলির মধ্যে সংযোগের শক্তি উপস্থাপন করে। ইউনিট এ থেকে ইউনিট বি-তে ওজনটির পরিমাণ আরও বেশি হলে (সমস্ত কিছুই সমান হচ্ছে), এর মানে হল যে বি এর উপর এ এর ​​বেশি প্রভাব রয়েছে (অর্থাত্ বি এর সক্রিয়করণের স্তর বৃদ্ধি বা হ্রাস করতে)।

আপনি যে ইউনিটটি 'কীভাবে যত্নশীল' তা পরিমাপ হিসাবে একটি ইউনিটে আগত ওজনের সেট সম্পর্কেও ভাবতে পারেন। এটি প্রথম স্তরে দেখতে সবচেয়ে সহজ। বলুন আমাদের একটি ইমেজ প্রসেসিং নেটওয়ার্ক রয়েছে। প্রাথমিক ইউনিটগুলি ইনপুট পিক্সেল থেকে ওজনযুক্ত সংযোগ গ্রহণ করে। প্রতিটি ইউনিটের সক্রিয়করণ হ'ল পিক্সেল তীব্রতার মানগুলির একটি ওজনযুক্ত যোগফল, যা একটি অ্যাক্টিভেশন ফাংশনটির মধ্য দিয়ে যায়। অ্যাক্টিভেশন ফাংশন একঘেয়েমি হওয়ায়, যখন ইনপুট পিক্সেলগুলি unit ইউনিটের আগত ওজনের সাথে মিলিত হয় (একটি বড় ডট পণ্য থাকার অর্থে) একটি নির্দিষ্ট ইউনিটের সক্রিয়করণ বেশি হয়। সুতরাং, আপনি চিত্রের বৈশিষ্ট্যটি নির্ধারণ করে ফিল্টার সহগের সেট হিসাবে ওজন সম্পর্কে ভাবতে পারেন। উচ্চ স্তরের ইউনিটগুলির জন্য (একটি ফিডফোরওয়ার্ড নেটওয়ার্কে) ইনপুটগুলি পিক্সেল থেকে আর নয়, নিম্ন স্তরগুলির ইউনিটগুলি থেকে। সুতরাং, আগত ওজনগুলি আরও বেশি '

আপনার আসল উত্স সম্পর্কে নিশ্চিত নন, তবে আমি যদি 'ওজন স্পেস' সম্পর্কে কথা বলি, তবে আমি নেটওয়ার্কের সমস্ত ওজনের সমস্ত সম্ভাব্য মানগুলির সেটটি উল্লেখ করব।


উপরে আপনার উত্তরের রেফারেন্স সহ, 'যখন ইনপুট পিক্সেলগুলি unit ইউনিটের আগত ওজনের সাথে মিলিত হয় (একটি বড় ডট পণ্য রাখার অর্থে)', আপনি কি দয়া করে এই বিষয়ে বিস্তারিত বলতে পারেন, প্রদত্ত ইউনিটের সক্রিয়করণ বেশি হবে। এর অর্থ কি যদি ইনপুটগুলি ইনপুট এবং লুকানো ইউনিটের মধ্যে ওজনের সমান হয়, তবে লুকানো ইউনিটের অ্যাক্টিভেশন বেশি হবে?
আয়রনলুকা

1
এর অর্থ হ'ল লুকানো ইউনিটের সক্রিয়করণ যখন ইনপুট এবং লুকানো ইউনিটের ওজনের মধ্যে ডট পণ্য বেশি হয়। কেউ ডট পণ্যটিকে মিলের আপেক্ষিক পরিমাপ হিসাবে ভাবতে পারে। আমরা দুটি ভেক্টর তুলনা করতে চান বলুন এবং তৃতীয় ভেক্টরকে (একই আদর্শ সঙ্গে) । আরো অনুরূপ চেয়ে যদি অর্থে যে মধ্যবর্তী কোণ এবং যে মধ্যবর্তী চেয়ে ছোট এবং । আমি আপেক্ষিক বলি কারণ এটি আদর্শের উপর নির্ভর করে। En.wikedia.org/wiki/Cosine_distance দেখুন ।x 2 y x 1 y x 2 x 1y > x 2y x 1 y x 2 yx1x2yx1yx2x1y>x2yx1yx2y
ব্যবহারকারী20160

6

ঠিক আছে, এটি কোনও নেটওয়ার্ক আর্কিটেকচার এবং নির্দিষ্ট স্তরের উপর নির্ভর করে। সাধারণভাবে এনএনগুলি ব্যাখ্যাযোগ্য নয়, বাণিজ্যিক ডেটা বিশ্লেষণে এটি তাদের প্রধান ব্যর্থতা (যেখানে আপনার লক্ষ্যটি আপনার মডেল থেকে ক্রিয়াযোগ্য অন্তর্দৃষ্টি উন্মোচন করা)।

তবে আমি কনসিওশনাল নেটওয়ার্কগুলি পছন্দ করি কারণ তারা আলাদা! যদিও তাদের উপরের স্তরগুলি খুব বিমূর্ত ধারণাগুলি শিখেছে, স্থানান্তর শিখন এবং শ্রেণিবিন্যাসের জন্য ব্যবহারযোগ্য, যা সহজে বোঝা যায় না, তাদের নীচের স্তরগুলি কাঁচা ডেটা থেকে সরাসরি গ্যাবার ফিল্টারগুলি শেখে (এবং এই জাতীয় ফিল্টার হিসাবে ব্যাখ্যাযোগ্য)। লে কুন লেকচার থেকে উদাহরণটি দেখুন:

এখানে চিত্র বর্ণনা লিখুন

এছাড়াও, এম জেইলার ( পিডিএফ ) এবং আরও অনেক গবেষক কনফ্যান্টকে "বোঝার" জন্য এবং এটি ডেকনভোলিউশনাল নেটওয়ার্কগুলির ডাবডভলিউশনাল নেটওয়ার্কগুলির দরকারী কিছু শিখেছে তা নিশ্চিত করার জন্য খুব সৃজনশীল পদ্ধতি আবিষ্কার করেছিলেন , যাতে তারা ইনপুট ছবিগুলিকে ফরোয়ার্ড পাস করে কিছু কনফেন্টকে 'ট্রেস' করে এবং কোনটি মনে করে নিউরনের সবচেয়ে অ্যাক্টিভেশন ছিল যার জন্য ছবিগুলি। এটি এটির মতো অত্যাশ্চর্য অন্তর্দৃষ্টি দেয় (কয়েকটি স্তর নীচে দেখানো হয়েছিল):

এম.জিলার দ্বারা কনভোলিউশনাল নেটওয়ার্ক অন্তঃকরণ

বামদিকে ধূসর চিত্রগুলি হ'ল ডানদিকে রঙিন ছবি দ্বারা নিউরন অ্যাক্টিভেশনগুলি (আরও তীব্রতা - বৃহত্তর অ্যাক্টিভেশন)। আমরা দেখতে পাচ্ছি যে এই সক্রিয়করণগুলি বাস্তব চিত্রগুলির কঙ্কালের উপস্থাপনা, যেমন, সক্রিয়করণগুলি এলোমেলো নয়। সুতরাং, আমাদের একটি দৃ hope় আশা, আমাদের প্রত্যয়টি সত্যিকার অর্থে দরকারী কিছু শিখেছে এবং অদেখা ছবিগুলিতে শালীন জেনারেলাইজেশন পাবে।


1

আমি মনে করি আপনি যে মডেলটির খুব বেশি ব্যাখ্যাযোগ্যতা রাখেন না তার জন্য খুব চেষ্টা করছেন। নিউরাল নেটওয়ার্ক (এনএন) একটি ব্ল্যাক বক্স মডেল যা আপনাকে আরও ভাল পারফরম্যান্স দেবে, তবে ভিতরে কী চলছে তা বোঝা শক্ত। এছাড়াও, এনএন এর ভিতরে হাজার হাজার এমনকি কয়েক মিলিয়ন ওজন থাকা খুব সম্ভব very

এনএন একটি খুব বড় অ-লিনিয়ার নন-উত্তল ফাংশন যার মধ্যে স্থানীয় মিনিমা প্রচুর পরিমাণে থাকতে পারে। আপনি যদি বিভিন্ন স্টার্ট পয়েন্ট সহ একাধিকবার প্রশিক্ষণ দেন তবে ওজন আলাদা হবে। অভ্যন্তরীণ ওজনগুলি কল্পনা করার জন্য আপনি কয়েকটি উপায় নিয়ে আসতে পারেন তবে এটি আপনাকে খুব বেশি অন্তর্দৃষ্টি দেয় না।

এমএনআইএসটি ডেটার জন্য এনএন ভিজ্যুয়ালাইজেশনের একটি উদাহরণ এখানে । উপরের ডান চিত্রটি (নীচে পুনরুত্পাদন করা) ওজন প্রয়োগের পরে রুপান্তরিত বৈশিষ্ট্যগুলি দেখায়।

এখানে চিত্র বর্ণনা লিখুন


-1

সাধারণ ওজন সম্ভাবনা।

কোনও সংযোগ কীভাবে সঠিক বা ভুল উত্তর দেবে সম্ভবত। এমনকি মাল্টিলেয়ার নেটগুলিতেও ভুল ফলাফল কার্যকর হতে পারে। এমন কিছু বলার অপেক্ষা রাখে না যে ..


কৌতূহলী যারা আমাকে নীচে নামিয়েছিলেন, নিউরাল জালের পরিসংখ্যানের উত্স আছে। আপনার ইতিহাসটি শিখুন ..
ব্যবহারকারী 3800527

2
আমি ডাউনওয়েট করিনি, তবে সততার সাথে উত্তরটি খুব কার্যকর বলে মনে হচ্ছে না। হ্যাঁ, কিছু নেটওয়ার্ক আর্কিটেকচার (যেমন বল্টজম্যান মেশিন বা হপফিল্ড নেটওয়ার্কগুলি) পরিসংখ্যানিক যান্ত্রিকগুলি দ্বারা অনুপ্রাণিত হয়, তবে "কিছু ইভেন্টের আপেক্ষিক ফ্রিকোয়েন্সি সীমিত করার" অর্থেও ওজন সম্ভাবনা থাকে না। ওজনও একের চেয়ে নেতিবাচক বা বড় হতে পারে, সম্ভাবনাগুলিও পারে না।
নিকি

চিহ্নটি উত্তরটি প্রতিবিম্বিত করে, এটির সম্ভাবনা সংখ্যাটি।
ব্যবহারকারী 3800527

এটি কেবল সীমিত আর্কিটেকচার এবং প্রশিক্ষণের জন্য লেবেল প্রকারের জন্য সঠিক।
এমিল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.