কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে কী ঘটছে তা বিজ্ঞানীরা জানেন?


69

বিজ্ঞানীরা বা গবেষণা বিশেষজ্ঞরা কি রান্নাঘর থেকে জানেন যে জটিল "গভীর" নিউরাল নেটওয়ার্কের ভিতরে কী ঘটছে, তাত্ক্ষণিকভাবে কমপক্ষে কয়েক মিলিয়ন সংযোগ স্থাপন করছে? তারা কি এর পেছনের প্রক্রিয়াটি বুঝতে পারে (উদাহরণস্বরূপ ভিতরে কী ঘটছে এবং এটি ঠিক কীভাবে কাজ করে), বা এটি বিতর্কের বিষয়?

উদাহরণস্বরূপ এই গবেষণা বলছে:

তবে তারা কেন এত ভালো পারফর্ম করে, বা কীভাবে তাদের উন্নতি হতে পারে সে সম্পর্কে এখনও স্পষ্ট কোন ধারণা নেই ।

সুতরাং এর অর্থ কি বিজ্ঞানীরা আসলে জানে না জটিল জটিল মডেলগুলি কীভাবে কাজ করে?


" কেন তারা এত ভালো পারফর্ম করে " - তারা সত্যই এসও খুব ভাল করে না। বেশিরভাগ নতুন প্রযুক্তির মতোই, ব্যর্থতাও নকল করা হয়।
টমে জাটো

উত্তর:


51

এমন অনেকগুলি পন্থা রয়েছে যা একটি প্রশিক্ষিত নিউরাল নেটওয়ার্ককে "ব্ল্যাক বাক্স" এর মতো আরও ব্যাখ্যাযোগ্য এবং কম করে গড়ে তোলার লক্ষ্যে বিশেষভাবে সংবিধানমূলক নিউরাল নেটওয়ার্কগুলির উল্লেখ করেছেন যা আপনি উল্লেখ করেছেন।

অ্যাক্টিভেশন এবং স্তর ওজন দৃশ্যমান

ক্রিয়াকলাপের দৃশ্যায়ন প্রথম সুস্পষ্ট এবং সরাসরি-এগিয়ে forward রিলু নেটওয়ার্কগুলির জন্য, অ্যাক্টিভেশনগুলি সাধারণত তুলনামূলকভাবে কুঁচকানো এবং ঘন সন্ধান শুরু করে, তবে প্রশিক্ষণটি অগ্রগতির সাথে সাথে ক্রিয়াকলাপগুলি সাধারণত আরও বিরল হয়ে যায় (বেশিরভাগ মান শূন্য হয়) এবং স্থানীয়করণ হয়। এটি কখনও কখনও দেখায় যে কোনও নির্দিষ্ট স্তর যখন কোনও চিত্র দেখায় তখন ঠিক কীটির দিকে দৃষ্টি নিবদ্ধ করা হয়।

অ্যাক্টিভেশনগুলির জন্য আরেকটি দুর্দান্ত কাজ যা আমি উল্লেখ করতে চাই তা হল ডিভিভিস যা পুলিং এবং নরমালাইজেশন স্তর সহ প্রতিটি স্তরের প্রতিটি নিউরনের প্রতিক্রিয়া দেখায়। তারা এটিকে কীভাবে বর্ণনা করে তা এখানে :

সংক্ষেপে, আমরা কয়েকটি পৃথক পদ্ধতি সংগ্রহ করেছি যা আপনাকে নিউরন কী কী বৈশিষ্ট্য শিখিয়েছে "ত্রিভঙ্গীকরণ" করতে দেয় যা ডিএনএন কীভাবে কাজ করে তা আপনাকে আরও ভালভাবে বুঝতে সহায়তা করতে পারে।

দ্বিতীয় সাধারণ কৌশল ওজন (ফিল্টার) কল্পনা করা। এগুলি সাধারণত প্রথম সিওএনভি স্তরে সর্বাধিক ব্যাখ্যামূলক যা সরাসরি কাঁচা পিক্সেল ডেটার দিকে তাকিয়ে থাকে তবে নেটওয়ার্কে আরও ভাল ফিল্টার ওজন প্রদর্শন করা সম্ভব। উদাহরণস্বরূপ, প্রথম স্তরটি সাধারণত গাবরের মতো ফিল্টারগুলি শেখে যা মূলত প্রান্তগুলি এবং ব্লবগুলি সনাক্ত করে।

প্রথম স্তর ফিল্টার

অন্তর্ভুক্তি পরীক্ষা

এখানে ধারণা। মনে করুন যে কোনও কনভনেট কোনও চিত্রকে কুকুরের মতো শ্রেণিবদ্ধ করেছে। কীভাবে আমরা নিশ্চিত হতে পারি যে এটি ব্যাকগ্রাউন্ড থেকে কিছু প্রাসঙ্গিক ইঙ্গিত বা অন্য কোনও বিবিধ বস্তুর বিপরীতে চিত্রের কুকুরটির উপরে উঠছে?

কিছু শ্রেণিবিন্যাসের পূর্বাভাসটি চিত্রটির কোন অংশটি এসেছে তা তদন্তের একটি উপায় হ'ল অবক্ষেপক বস্তুর অবস্থানের ফাংশন হিসাবে আগ্রহের শ্রেণীর সম্ভাব্যতা (যেমন কুকুর শ্রেণি) প্লট করা। আমরা যদি চিত্রটির বিভিন্ন অঞ্চলগুলিতে পুনরাবৃত্তি করি, এটি সমস্ত শূন্যের সাথে প্রতিস্থাপন করব এবং শ্রেণিবিন্যাসের ফলাফলটি যাচাই করি, আমরা কোনও নির্দিষ্ট চিত্রের নেটওয়ার্কের জন্য সবচেয়ে গুরুত্বপূর্ণ কোনটির দ্বিমাত্রিক তাপের মানচিত্র তৈরি করতে পারি। এই পদ্ধতির ব্যবহার ম্যাথু জেইলারের ভিজ্যুয়ালাইজিং এবং বোঝার কনভোলিউশনাল নেটওয়ার্কগুলিতে ব্যবহৃত হয়েছে (যে আপনি আপনার প্রশ্নের উল্লেখ করেছেন):

অন্তর্ভুক্তি পরীক্ষা

Deconvolution

আরেকটি পদ্ধতির মধ্যে এমন একটি চিত্র সংশ্লেষ করা যা একটি নির্দিষ্ট নিউরনকে আগুন লাগায়, মূলত যা নিউরন সন্ধান করছে। ধারণাটি হ'ল ওজনের ক্ষেত্রে স্বাভাবিক গ্রেডিয়েন্টের পরিবর্তে চিত্রের সাথে সম্মানের সাথে গ্রেডিয়েন্টটি গণনা করা। সুতরাং আপনি একটি স্তর বাছাই করুন, গ্রেডিয়েন্টটি সেখানে একটি নিউরনের জন্য ব্যতীত সমস্ত শূন্য হিসাবে সেট করুন এবং চিত্রটিতে ব্যাকপ্রপ করুন।

ডেকনভ বাস্তবে সুন্দর দেখায় এমন চিত্র তৈরি করতে গাইডড ব্যাকপ্রোপেশন নামক কিছু করে , তবে এটি কেবল একটি বিশদ।

অন্যান্য নিউরাল নেটওয়ার্কগুলির সাথে একই রকম পন্থা

আন্দ্রেজ কার্পাথির এই পোস্টটির সর্বাধিক সুপারিশ করুন , যাতে তিনি পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (আরএনএন) এর সাথে অনেক বেশি অভিনয় করেন। শেষ পর্যন্ত, তিনি নিউরনরা আসলে কী শিখেন তা দেখার জন্য তিনি অনুরূপ কৌশল প্রয়োগ করেন:

এই চিত্রটিতে হাইলাইট করা নিউরন ইউআরএলগুলি সম্পর্কে খুব উত্তেজিত বলে মনে হচ্ছে এবং ইউআরএল এর বাইরে বন্ধ হয়ে গেছে। এলএসটিএম সম্ভবত এই নিউরনটি ইউআরএল এর ভিতরে আছে কিনা তা মনে রাখার জন্য এটি ব্যবহার করছে।

উপসংহার

আমি গবেষণার এই ক্ষেত্রে ফলাফলের একটি ক্ষুদ্র ভগ্নাংশের উল্লেখ করেছি। এটি বেশ সক্রিয় এবং নতুন পদ্ধতিগুলি যা প্রতি বছর নিউরাল নেটওয়ার্কের অভ্যন্তরীণ কাজগুলিতে আলোকপাত করে।

আপনার প্রশ্নের উত্তর দেওয়ার জন্য, বিজ্ঞানীরা এখনও সবসময়ই জানেন না এমন কিছু আছে তবে অনেক ক্ষেত্রে তাদের ভিতরে কী চলছে তার একটি ভাল চিত্র (সাহিত্যিক) রয়েছে এবং অনেকগুলি নির্দিষ্ট প্রশ্নের উত্তর দিতে পারে।

আমার কাছে আপনার প্রশ্নের উদ্ধৃতিটি কেবল নির্ভুলতার উন্নতি নয়, তবে নেটওয়ার্কের অভ্যন্তরীণ কাঠামোর গবেষণার গুরুত্বকেও হাইলাইট করে। ম্যাট জিলার যেমন এই আলোচনায় বলেছেন , কখনও কখনও একটি ভাল দৃশ্যায়ন আরও ভাল নির্ভুলতার দিকে যেতে পারে।


ভিজ্যুয়ালাইজিং জেনে যাচ্ছেন? নাকি এটাই কি অজ্ঞতার ট্রেন্ডি সমাধান? সম্ভবত গাণিতিক বিকাশ হ'ল ক্ষেত্রটি সবচেয়ে বেশি কঠোরতা এবং পর্যাপ্ততা।
ফৌরিস্টিয়ান

1
@ ফৌক্রিশিয়ান আপনি এখানে পয়েন্টটি মিস করছেন। নিউরাল নেটওয়ার্কের মধ্যে ওজন এবং সমস্ত গণিতের অপসেসগুলি ঠিক সমাবেশ নামে পরিচিত । এটি প্রশ্নের বাইরে। ভিজ্যুয়ালাইজিং কিছু নির্দিষ্ট অপস কেন হচ্ছে তা বুঝতে সহায়তা করে এবং ভাল পারফরম্যান্সের দিকে পরিচালিত করে। আবারও ক্লাসিক কম্পিউটার সায়েন্স অ্যালগরিদমের মতো। এছাড়াও, আমি আপনাকে জিলার আল-এ উত্তরটি উল্লিখিত কাগজটি পড়তে উত্সাহিত করি।
ম্যাক্সিম

1
আমি এই পয়েন্টগুলি মিস করি না, সেগুলি আন্ডারগ্রাড হিসাবে অধ্যয়ন করেছি। যদিও আমি আমার মন্তব্যে অলস ছিলাম। কার্নেলগুলির প্রতিনিধিত্বকারী বি & ডাব্লু গ্রিডটি কেবল আকর্ষণীয় কারণ এটি avyেউয়ের প্রান্ত সনাক্তকরণ কার্নেল রাজ্যের কিছুটা বিশৃঙ্খলাযুক্ত ম্যাট্রিক্স দেখায়, এটি বোঝার জন্য বিশৃঙ্খলা চিহ্নিত করার প্রয়োজনীয়তা নির্দেশ করে। তাদের আকার বিতরণ, কৌণিক বিতরণ এবং স্কু বিতরণ কী কী? এই বিতরণগুলি কি ইঙ্গিত করে (ক) নির্দিষ্ট ডেটা সেটগুলির জন্য নির্দিষ্ট একটি ওভার-ফিট বা (খ) একটি সাধারণ প্যাটার্ন যা আরও বেশি গণ্য দক্ষতার সাথে একটি কার্যকরী ব্লক দ্বারা প্রতিস্থাপিত হতে পারে। ~~ একবার ভিজ্যুয়াল থেকে বলতে পারবেন না।
ফক্রিস্টিয়ান

1
ঠিক আছে, এই সমস্ত বিতরণগুলি (এবং আরও অনেকগুলি) এখানে গণনা করা হয়নি। এর অর্থ এই নয় যে তারা গণনা করতে পারে না বা করা উচিত নয় । এর অর্থ এই নয় যে মডেল ব্যাখ্যার সাথে ভিজ্যুয়ালাইজেশনের কোনও সম্পর্ক নেই। আমি আবারও আপনাকে জিলার আল -এর "ভিজ্যুয়ালাইজিং এবং কনভার্ভেশনাল নেটওয়ার্কগুলি বোঝার" পড়তে উত্সাহিত করছি, যেখানে লেখকরা এ সম্পর্কে বিস্তারিত আলোচনা করেছেন।
ম্যাক্সিম

আমাদের এটি ল্যাবটিতে রয়েছে। আমার সহযোগী কিছু কোড উদাহরণ দিয়ে দৌড়েছিল। আমি এটি স্ট্যাটাস দিক থেকে একবার দেখে নেব। ধন্যবাদ.
ফৌচ্রিস্টিয়ান

27

এটি "কী ঘটছে তা জানেন" দ্বারা আপনি কী বোঝাতে চান তার উপর নির্ভর করে।

ধারণামূলকভাবে, হ্যাঁ: এএনএন ননলাইনার রিগ্রেশন সম্পাদন করে। কোনও এএনএন এর ওজন ম্যাট্রিক্স / অ্যাক্টিভেশন ফাংশন (গুলি) দ্বারা উপস্থাপিত প্রকৃত প্রকাশটি স্পষ্টভাবে প্রতীকী আকারে প্রসারিত হতে পারে (যেমন উপ-এক্সপ্রেশন যেমন )।1/1+e1/1+e

যাইহোক, যদি 'জেনে' আপনার অর্থ কিছু নির্দিষ্ট (ব্ল্যাক বক্স) এএনএন আউটপুট ভবিষ্যদ্বাণী করা হয় অন্য কোনও উপায়ে, তবে বাধা হ'ল একটি এএনএনতে বিশৃঙ্খলার উপস্থিতি যা স্বাধীনতার উচ্চতর ডিগ্রিধারী

ভিজ্যুয়ালাইজেশনের মাধ্যমে এএনএন বোঝার বিষয়ে হড লিপসনের কিছু অপেক্ষাকৃত সাম্প্রতিক কাজ এখানে ।


13

সংক্ষিপ্ত উত্তর না হয়

মডেল ব্যাখ্যাটি হ'ল বর্তমান গবেষণার একটি হাইপার-অ্যাক্টিভ এবং হাইপার-হট এরিয়া (পবিত্র গ্রিল বা কিছু মনে করুন), যা বিভিন্ন কাজে গভীর শেখার মডেলগুলির (প্রায়শই অভাবনীয়) সাফল্যের কারণে ইদানীং এগিয়ে আনা হয়েছে; এই মডেলগুলি বর্তমানে কেবল কালো বাক্স, এবং আমরা স্বাভাবিকভাবেই এটি সম্পর্কে অস্বস্তি বোধ করি ...

এই বিষয়টিতে কিছু সাধারণ (এবং সাম্প্রতিক, ডিসেম্বর 2017 হিসাবে) সংস্থান রয়েছে:

এবং আরও ব্যবহারিক স্তরে (কোড ইত্যাদি):

ইদানীং, গভীর শেখার নিউরাল নেটগুলির জন্য আরও তাত্ত্বিক ভিত্তি তৈরি করা শুরু করার আগ্রহের উত্সাহ বাড়ছে। এই প্রসঙ্গে, খ্যাতিমান পরিসংখ্যানবিদ এবং সংবেদনশীল সংবেদক অগ্রণী ডেভিড ডোনহো খুব সম্প্রতি (2017 সালের পড়ুয়া) স্ট্যানফোর্ড, থিওরিজ অফ ডিপ লার্নিংয়ে (স্ট্যাটাস 385) একটি কোর্স প্রদান শুরু করেছেন, প্রায় অনলাইনে উপলব্ধ সমস্ত উপাদান সহ; এটি অত্যন্ত প্রস্তাবিত ...

আপডেটগুলি :


ওহে. এটি একটি ভাল উত্তর বলে মনে হচ্ছে তবে আপনার এটি পরিষ্কার করে কিছুটা সংগঠিত করা দরকার। প্রথম সংস্থানগুলি সবচেয়ে সহায়ক এবং সাধারণ হওয়া উচিত। তারপরে আপনি আইএমএইচও আরও সুনির্দিষ্ট সংস্থান এবং গবেষণা কাগজপত্র তালিকাভুক্ত করতে পারেন। এবং পরে আপনি উদাহরণস্বরূপ টুইটারের থ্রেড বা যাই হোক না কেন তালিকাভুক্ত করতে পারেন।
এনবিরো

10

আপনি এটি যা অনুসন্ধান করছেন তা নিশ্চিত কিনা তবে গুগল নেটওয়ার্কগুলি যখন সাদা শব্দের সাথে খাওয়ানো হয়েছিল তখন ছবিগুলি থেকে তাদের ছবি বের করেছিল।

দেখুন Inceptionism: নিউরাল নেটওয়ার্ক (গুগল গবেষণা ব্লগ) মধ্যে গভীর Going

এই জাতীয় নেটওয়ার্ক যা জানে তা প্রতিনিধিত্ব করে।


8

আমি আশঙ্কা করি যে আমার কাছে নির্দিষ্ট উদ্ধৃতিগুলি কার্যকর নয়, তবে আমি অ্যান্ড্রু এনজি এবং জেফ্রি হিন্টনের মতো বিশেষজ্ঞের উদ্ধৃতি দেখেছি / শুনেছি যেখানে তারা স্পষ্টভাবে বলেছে যে আমরা সত্যিকারের নিউরাল নেটওয়ার্কগুলি বুঝতে পারি না। এটি হ'ল তারা কীভাবে কাজ করে তার কিছু আমরা বুঝতে পারি (উদাহরণস্বরূপ, পিছনে বংশবিস্তারের পিছনে গণিত) তবে তারা কেন কাজ করে তা আমরা সত্যই বুঝতে পারি না । এটি একটি সূক্ষ্ম পার্থক্যের ধরণের, তবে মূল কথাটি হ'ল না, আমরা বলের সাথে খেলছেন এমন একটি বিড়ালকে চিনতে পেরে, আপনি কীভাবে একগুচ্ছ ওজনের একগুচ্ছ পদার্থ থেকে ঠিক চলে যান, এর গভীরতম বিবরণ আমরা বুঝতে পারি না।

কমপক্ষে চিত্রের স্বীকৃতি দেওয়ার ক্ষেত্রে, আমি যে সর্বোত্তম ব্যাখ্যা শুনেছি তা হ'ল একটি নিউরাল নেটওয়ার্কের ধারাবাহিক স্তরগুলি আরও অত্যাধুনিক বৈশিষ্ট্যগুলি শেখে যা পূর্ববর্তী স্তরগুলি থেকে আরও দানাদার বৈশিষ্ট্যগুলি সমন্বিত। এর অর্থ, প্রথম স্তরটি "প্রান্তগুলি" বা "সরলরেখাগুলি" সনাক্ত করতে পারে। পরবর্তী স্তরটি সম্ভবত "বক্স", বা "ত্রিভুজ" এর মতো জ্যামিতিক আকারগুলি শিখতে পারে এবং তারপরে একটি উচ্চতর স্তর সেগুলি পূর্ববর্তী বৈশিষ্ট্যের উপর ভিত্তি করে "নাক" বা "চোখ" শিখতে পারে এবং তারপরে একটি উচ্চ স্তরের স্তরটি এখনও "মুখ" তৈরি শিখতে পারে "চক্ষু", "নাক", "চোয়াল" ইত্যাদির উপর থেকে তবে এটি যেহেতু আমি এটি বুঝতে পারি তা এখনও অনুমানীয় এবং / বা সম্পূর্ণ বিশদে বোঝা যায় না।


2
আমি প্রকৃত উদ্ধৃতি পড়তে আগ্রহী হবে। বিস্তৃত ধারণাগত স্তরে, কেন "তারা ইউনিভার্সাল ফাংশন আনুমানিকর একটি প্রশিক্ষণ সমস্যাটিতে ত্রুটি কমাতে প্রশিক্ষিত হয়"।
নিটসেচানআইএআই

আমি তাদের ট্র্যাক করতে পারি কিনা তা আমি দেখতে পাব। আমি দৃ sure়ভাবে নিশ্চিত যে জিওফ্রে হিন্টনের যে উক্তিটি সম্পর্কে আমি ভাবছি তা কোনও ভিডিওতে রয়েছে .. তা হয় তার কোরাসেরা ক্লাস বা ইউটিউবে থাকা কোনও ভিডিও থেকে। আমি এটা খুঁজে না পেলে, আমি আমার উত্তর সম্পাদনা এবং এটা প্রতি সংযোগ আছে করব।
mindcrime

আমি ভুলিনি। আমার একটু ফ্রি সময় পেলে আমি তাদের সন্ধান করার চেষ্টা করব। আমি মনে করি যে সম্পর্কে আমি ভাবছি তাদের মধ্যে একটি অন্তর্ভুক্ত এমন একটি ভিডিও যা একটি কোর্সেরা কোর্সের অংশ।
মাইন্ডক্রিম

এই গবেষণা একই তথ্যসূত্রগুলি রাখতে সহায়তা করতে পারে: 'তবে তারা কেন এত ভালো পারফরম্যান্স করে, বা কীভাবে তাদের উন্নতি হতে পারে সে সম্পর্কে কোনও স্পষ্ট ধারণা নেই'।
কেনারব

4

এখানে কার্লোস ই পেরেজের একটি প্রশ্নের উত্তর যা গভীর শিক্ষার পিছনে তত্ত্বটি কী?

[...]

ডিপ লার্নিংয়ের অন্তর্নিহিত গণিত বেশ কয়েক দশক ধরে অস্তিত্ব ছিল, তবে আমরা আজ যে চিত্তাকর্ষক ফলাফলগুলি দেখতে পাই তা দ্রুততর হার্ডওয়্যার, আরও ডেটা এবং পদ্ধতিগুলিতে বর্ধিত উন্নতির ফলস্বরূপ।

সাধারণভাবে ডিপ লার্নিংকে অপ্টিমাইজেশন সমস্যা হিসাবে ফ্রেম করা যেতে পারে যেখানে উদ্দেশ্যটি মডেল ত্রুটির একটি কার্য function এই অপ্টিমাইজেশনের সমস্যাটি সমাধান করা খুব কঠিন কারণ বিবেচনা করুন যে মডেলের প্যারামিটার স্পেস (অর্থাত্ নিউরাল নেটওয়ার্কের ওজন) অত্যন্ত উচ্চ মাত্রায় সমস্যার দিকে পরিচালিত করে। একটি অপ্টিমাইজেশন অ্যালগরিদম এই স্থানটি অন্বেষণ করতে খুব দীর্ঘ সময় নিতে পারে। তদুপরি, একটি অ যাচাই করা বিশ্বাস ছিল যে সমস্যাটি উত্তল নয় এবং গণনা চিরকাল স্থানীয় মিনিমে আটকে থাকবে।

[...]

মেশিনগুলি আসলে কেন একজন আকর্ষণকারীতে রূপান্তর করে বা অন্য কথায় জটিল নিদর্শনগুলি সনাক্ত করতে শেখে তার তত্ত্বটি এখনও অজানা।

সংক্ষেপে: আমাদের কিছু ধারণা আছে তবে আমরা যথেষ্ট নিশ্চিত নই।


3

কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে কী ঘটছে তা বিজ্ঞানীরা জানেন?

হ্যাঁ

বিজ্ঞানীরা বা গবেষণা বিশেষজ্ঞরা কি রান্নাঘর থেকে জানেন যে জটিল "গভীর" নিউরাল নেটওয়ার্কের ভিতরে কী ঘটছে, তাত্ক্ষণিকভাবে কমপক্ষে কয়েক মিলিয়ন সংযোগ স্থাপন করছে?

আমার ধারণা "রান্নাঘর থেকে জানা" মানে "বিস্তারিতভাবে জানা"?

আমি আপনাকে এক ধরণের উপমা দেব:

  1. বিমানের ইঞ্জিনিয়ার কি রান্নাঘর থেকে জানেন যে বিমানের অভ্যন্তরে কী ঘটে?
  2. কোনও চিপ ডিজাইনার কী তাঁর ডিপ ডিজাইন করা চিপ (গুলি) এর মধ্যে কী ঘটে সে সম্পর্কে বিস্তারিত জানেন?
  3. কোনও সিভিল ইঞ্জিনিয়ার কি তাঁর নির্মিত বাড়িটি সম্পর্কে সব জানেন?

শয়তানটি বিশদে রয়েছে তবে এখানে একটি গুরুত্বপূর্ণ বিষয়টি এটি কৃত্রিম কাঠামো সম্পর্কে। এলোমেলোভাবে তারা উপস্থিত হয় না। যে কোনও কিছু দরকারী পেতে আপনার প্রচুর জ্ঞান প্রয়োজন। নিউরাল নেটওয়ার্কগুলির জন্য, আমি বলতে পারি যে মূল ধারণার (রোজেনব্ল্যাট পেরসেপ্ট্রন, ১৯৫7) প্রথম প্রয়োগে (মার্কিন ডাক পরিষেবা, ১৯৮৯) প্রকাশের প্রায় 40 বছর লেগেছিল। এবং সেখান থেকে আবার 13 বছর সক্রিয় গবেষণা পুনর্বার সত্যিই চিত্তাকর্ষক সিস্টেমগুলিতে (চিত্রনাট 2012)।

আমরা যা ভালভাবে জানি তা হল প্রশিক্ষণটি কীভাবে কাজ করে । কারণ এটি বাস্তবায়ন করা দরকার। সুতরাং একটি খুব ছোট কাঠামো, আমরা এটি বিস্তারিত জানি।

কম্পিউটারের কথা ভাবুন। চিপ ডিজাইনাররা তাদের চিপ কীভাবে কাজ করে তা খুব ভাল করেই জানেন। তবে লিনাক্স অপারেটিং সিস্টেম কীভাবে কাজ করে তা সম্ভবত তাদের কাছে খুব রুক্ষ ধারণা থাকবে।

আর একটি উদাহরণ পদার্থবিদ্যা এবং রসায়ন: পদার্থবিজ্ঞান মহাবিশ্বের মূল শক্তিগুলি বর্ণনা করে। তার মানে কি তারা রসায়ন সম্পর্কেও সব কিছু জানেন? কোনভাবেই না! একজন "নিখুঁত" পদার্থবিজ্ঞানী রসায়নের সমস্ত বিষয় ব্যাখ্যা করতে পারেন ... তবে এটি বেশ কার্যকর হবে না। তাঁর আরও অনেক তথ্যের প্রয়োজন হবে, অপ্রাসঙ্গিক অংশগুলি এড়িয়ে যেতে সক্ষম হবেন না। কেবলমাত্র কারণেই তিনি "বেশি জুম করেছেন" - এমন বিশদ বিবেচনা করে যা অনুশীলনে রয়েছে আকর্ষণীয় বা গুরুত্বপূর্ণ নয়। দয়া করে নোট করুন যে পদার্থবিজ্ঞানের জ্ঞান ভুল নয়। হতে পারে যে কেউ এটি থেকে রসায়নবিদ থেকে জ্ঞানও কাটাতে পারতেন। তবে অণু মিথস্ক্রিয়ার এই "উচ্চ-স্তরের" বোঝার অনুপস্থিত।

এই দুটি উদাহরণের মূল অন্তর্দৃষ্টি হ'ল বিমূর্ত স্তর: আপনি সাধারণ কাঠামো থেকে জটিলতা তৈরি করতে পারেন

আর কি?

আমরা ডিজাইনার নিউরাল নেটওয়ার্কগুলির সাথে নীতিগতভাবে কী অর্জনযোগ্য তা আমরা ভালভাবে জানি :

  • গো খেলতে নকশাকৃত একটি নিউরাল নেটওয়ার্ক - তা যত পরিশীলিত হোক না কেন - কখনও দাবা খেলতে সক্ষম হবে না। আপনি অবশ্যই এর চারপাশে আরেকটি বিমূর্ত স্তর যুক্ত করতে এবং জিনিসগুলিকে একত্রিত করতে পারেন। তবে এই পদ্ধতির মানুষের প্রয়োজন।
  • বিড়ালদের থেকে কুকুরের পার্থক্য করার জন্য ডিজাইন করা একটি নিউরাল নেটওয়ার্ক যা কেবল পুডেল এবং ফারসি বিড়াল দেখেছে সম্ভবত যখন এটি ইয়র্কশায়ার টেরিয়ার্সের সিদ্ধান্ত নিতে হবে তখন সত্যিই খারাপ সম্পাদন করবে।

ওহ, এবং অবশ্যই আমাদের নিউরাল নেটওয়ার্কগুলির জন্য বিশ্লেষণাত্মক পদ্ধতি রয়েছে। কনভলিউশনাল নিউরাল নেটওয়ার্ক আর্কিটেকচারের বিশ্লেষণ এবং অনুকূলকরণ সম্পর্কে আমি আমার মাস্টার্স থিসিস লিখেছি । এই প্রসঙ্গে LIME (স্থানীয় ব্যাখ্যামূলক মডেল-অগ্নোস্টিক ব্যাখ্যা) দুর্দান্ত:

এখানে চিত্র বর্ণনা লিখুন


1
তাদের বেশিরভাগ জৈবিক মডেল দ্বারা প্রভাবিত..তাহলে বিজ্ঞানীরা এনএন এর একটি সমস্যার ফাংশন হিসাবে তৈরি করেছিলেন তা বিশ্বাস করা এক ধরণের কঠিন ... বিশেষত যখন কারও নির্দিষ্ট ধারণা নেই যে কোনও নির্দিষ্ট স্থাপত্য বা হাইপারপ্যারামিটারগুলির একটি নির্দিষ্ট সেট কেন ভাল কাজ করে? একটি প্রদত্ত সমস্যা ... আমি সঠিক হাইপারপ্যারামিটারের বিষয়ে কথা বলছি না তবে অনুমিত হাইপারপ্যারামিটারগুলি কোনও প্রদত্ত সমস্যার জন্য কী কাজ করতে পারে তার কোনও সাধারণ ধারণা নেই বলে মনে হচ্ছে (সমস্যাটি ভালভাবে সংজ্ঞায়িত হয়েছে) .. সুতরাং কোনও বিজ্ঞানী জানেন না যে ভিতরে কী ঘটছে একটি এনএন।
দত্তএ

প্রারম্ভিক দিনের অটোমোবাইল / এয়ারক্রাফ্ট ইঞ্জিনিয়ারদের সম্পর্কে চিন্তা করুন। আপনি কি বলবেন যে তারা তাদের বিমান / অটোমোবাইলের অভ্যন্তরে কী ঘটছে তা জানেন না, কারণ তারা এগুলি তৈরি করেন নি, কারণ তাদের আকৃতিটি বায়ুচৈতনিক হয়নি?
মার্টিন থোমা

1
অফসি ... প্রযুক্তির অভাবে কিছু না জানা ... তাত্ত্বিকভাবে না জানার চেয়ে কি আলাদা কিছু আছে..আমি বিশ্বাস করি এটি বিমানের ক্ষেত্রে প্রযুক্তি ছিল..এইখানে আমরা গাণিতিকভাবে প্রক্রিয়া করতে পারছি না ... তাই প্রযুক্তি ভুলে যেতে পারি
দত্তআ

1

আমি কেবল কিছু যুক্ত করতে চেয়েছিলাম:

এটি বিজ্ঞানীর দ্বারা আপনি কী বোঝাতে চাইছেন তার উপর নির্ভর করে:

আমি বৈদ্যুতিক ইঞ্জিনিয়ারিংয়ের পিএইচডি শিক্ষার্থী এবং আমি অনেক গবেষককে এএনএন-এর সাথে কাজ করতে দেখেছি, রিগ্রেশন, প্রেডিকশন কন্ট্রোল, অ্যাডাপটিভ কন্ট্রোল এবং শ্রেণিবিন্যাস সমস্যার মতো সমস্যা রয়েছে।

আপনি স্পষ্টভাবে লক্ষ করতে পারেন যে কোডিং দক্ষতায় তাদের অভাব একটি বড় অসুবিধা, এবং তারা সত্যই বুঝতে পারে না যে কোনও এএনএন-এর ভিতরে কী চলছে, এখন আমি ডিপ নিয়েও কথা বলছি না , তারা অ্যাডলাইনস এবং এএনএফআইএসের মতো সাধারণ জিনিস বোঝার লড়াই করে! আপনি তাদের যা শুনেছেন তা হ'ল: এটি ডেটা দিন এবং এটি খাপ খাইয়ে নেবে!


1
যদিও আপনি সম্ভবত ধারণাটি সঠিকভাবে রয়েছেন, আপনি কোনও পেডেন্টিক টিরেডের পরিবর্তে সমাজতাত্ত্বিক পর্যবেক্ষণ হিসাবে নিজের উত্তরটি পুনরায় লিখলে আপনি কিছু ভোট পেতে পারেন এবং সম্ভবত কিছুটা গঠনমূলক সাহায্য করতে পারেন।
ফৌরিস্টিয়ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.