নিউরাল নেটওয়ার্কগুলি অ্যালগোরিদমগুলি তৈরি করতে ব্যবহার করা যেতে পারে?


9

বোর্ড গেমস খেলতে নিউরাল নেটওয়ার্কগুলির আরও নতুন এবং নতুন সাফল্যের পরে, একজন অনুভব করে যে আমরা পরবর্তী লক্ষ্যটি স্টারক্র্যাফটে মানুষকে মারার চেয়ে আরও কার্যকর কিছু হতে পারে। আরও স্পষ্টভাবে, আমি ভাবছিলাম কিনা

ক্লাসিক অ্যালগোরিদমিক সমস্যাগুলি সমাধান করার জন্য নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়া যেতে পারে?

এখানে আমি বোঝাতে চাইছি যে উদাহরণস্বরূপ নেটওয়ার্কটি ভারী প্রান্তগুলির সাথে একটি ইনপুট গ্রাফ এবং দুটি উল্লম্ব এবং নির্দিষ্ট করা হবে এবং আমরা এটিকে যত তাড়াতাড়ি একটি সংক্ষিপ্ততম খুঁজতে বললাম । তারপরে আমি অনুমান করি যে নিউরাল নেটওয়ার্কটি ডিজকস্ট্রা বা অনুরূপ কিছু ব্যবহার করার জন্য আবিষ্কার এবং প্রশিক্ষণ দেবে।Gstst

এক দিকে, আমরা জানি যে, হয় নিউরাল নেটওয়ার্ক কম্পিউটেশানাল শক্তিরTC0 । অন্যদিকে, আমি জানি না এটি অগত্যা আমার প্রশ্নের সাথে সম্পর্কিত কিনা। তবুও, বেশিরভাগ সমস্যার জন্য আমরা জানি না যে সেগুলি সমাধান করা যায় কি না। নিউরাল নেটওয়ার্ক নিজেই প্রশিক্ষণ দিতে পারে কিনা তা দেখে, দ্রুত অ্যালগরিদম আছে কিনা তা একটি ভাল সূচক হতে পারে। উদাহরণস্বরূপ, যদি নিউরাল নেটওয়ার্কগুলি স্যাট দ্রুত সমাধানের জন্য নিজেকে প্রশিক্ষণ দিতে না পারে, তবে এটি এটি (আরও বেশি) সম্ভবত এটি করে যে । আমি অবাক হই যে গ্রাফিক্সমোরফিজম বা ফ্যাক্টরিজেশন সহ একটি নিউরাল নেটওয়ার্ক কী করবে।TC0NPTC0

অবশ্যই, অ্যালগরিদম বের করা সম্পূর্ণ ভিন্ন প্রশ্ন different আমি সন্দেহ করি যে বিশেষজ্ঞরা কীভাবে এটি করতে জানেন, তবে এটি নিয়ে আলোচনা করা এই প্রশ্নের বিষয় নয়।

দুটি দিন পরে যুক্ত করা হয়েছে: উত্তরগুলি দেখার পরে, আমাকে উল্লেখ করতে দিন যে আপনি যদি নেতিবাচকভাবে উত্তর দেন তবে আমি জানতে চাই

ডিজকস্ট্রা বা গ্রাফিসমোরফিজমের চেয়ে দাবা খেলা কেন সহজ?


মন্তব্যগুলি বর্ধিত আলোচনার জন্য নয়; এই কথোপকথন চ্যাটে সরানো হয়েছে ।
লেভ Reyzin

উত্তর:


2

রেজা জাদেহে এই ব্লগ অনুসারে , প্রশিক্ষণের উদাহরণের মাত্র দুই-তৃতীয়াংশের জন্য এমনকি সঠিক আউটপুট উত্পাদন করতে নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেওয়া গণনাগতভাবে কঠোর:

সত্যই, 1988 সালে জে। স্টিফেন জড নিম্নলিখিত সমস্যাটিকে এনপি-হার্ড হিসাবে দেখায়:

একটি সাধারণ নিউরাল নেটওয়ার্ক এবং প্রশিক্ষণের উদাহরণগুলির একটি সেট দেওয়া, নেটওয়ার্কের জন্য কি সমস্ত প্রশিক্ষণের উদাহরণগুলির জন্য সঠিক আউটপুট তৈরি করা যায় তাই নেটওয়ার্কের জন্য প্রান্তের ওজনের একটি সেট উপস্থিত থাকে?

জড আরও দেখায় যে সমস্যাটি কেবল এনপি-হার্ড থেকেই যায় যদিও প্রশিক্ষণের উদাহরণের মাত্র দুই-তৃতীয়াংশের জন্য সঠিক আউটপুট তৈরি করার জন্য কোনও নেটওয়ার্কের প্রয়োজন হয়, যার দ্বারা বোঝা যায় যে স্নায়ুর নেটওয়ার্ককে প্রায় প্রশিক্ষণ দেওয়া সবচেয়ে খারাপ ক্ষেত্রেও অভ্যন্তরীণভাবে কঠিন। 1993 সালে, ব্লাম এবং রিভেস্ট সংবাদটিকে আরও খারাপ করে তোলে: এমনকি কেবল দুটি স্তর এবং তিনটি নোড সহ একটি সাধারণ নেটওয়ার্ক প্রশিক্ষণ দেওয়া এনপি-হার্ড!


1
এটি আমার প্রশ্নের উত্তর কীভাবে দেয় তা আমি সত্যিই দেখছি না।
domotorp

আপনি পোস্টটি সম্পাদনার আগে আপনার প্রথম প্রশ্নটি এনএন প্রশিক্ষণ সম্পর্কে। যেহেতু আপনি সিসি ট্যাগ যুক্ত করেছেন, আমার উত্তরটি দেখায় যে আপনার অ্যালগোরিদমিক সমস্যা পি বা এনপিসিতে রয়েছে তা নির্বিশেষে এনএনকে প্রশিক্ষণ দেওয়া শক্ত
মোহাম্মদ আল তুর্কিস্ত্রি

আমি অস্পষ্ট হলে দুঃখিত।
ডমোটরপ

0

এটি সম্পূর্ণ উত্তর নয় এবং আমি নিউরাল নেট সম্পর্কে খুব অভিজ্ঞ নই, তবে সম্ভবত সহায়ক।

এনএনগুলি মূলত একটি ইনপুট দেওয়া হয় এবং একটি প্রতিক্রিয়া তৈরি করে। এরপরে তারা অনুশীলনের মাধ্যমে ডোমেনের "অনুরূপ" ইনপুটগুলিতে অনুরূপ প্রতিক্রিয়া তৈরি করতে প্রশিক্ষণপ্রাপ্ত হয়, উদাহরণস্বরূপ, একই প্রাণীর চিত্রগুলির একই লেবেল, বা "ভাল" দাবা পজিশনে উচ্চ রেটিং যেখানে ভাল মানে উচ্চ জয়ের সম্ভাবনা।

সুতরাং আমি যেমন মন্তব্য করেছি, নিউরাল জাল গণনার একটি অ-ইউনিফর্ম মডেল যা টুরিং মেশিনে চালিত ধাপে ধাপে অ্যালগরিদমগুলির চেয়ে একেবারে অন্যভাবে কাজ করে। পরিবর্তে, তাদেরকে "নরম" সার্কিট হিসাবে মনে করুন যা বুলিয়ানের চেয়ে অবিচ্ছিন্ন গণিত ব্যবহার করে এবং তাচিটে বা প্রশিক্ষণপ্রাপ্ত হতে পারে এবং এটিকে ভুল হতে দেওয়া হয়।

ডিজকস্ট্রা বা গ্রাফিসমোরফিজমের চেয়ে দাবা খেলা কেন সহজ?

আংশিকভাবে, কাউকে তার ক্ষমতার সর্বাধিক প্রশ্নের জবাব জিজ্ঞাসা করা এবং এটি সঠিক তা প্রমাণের পাশাপাশি একটি সঠিক উত্তর জিজ্ঞাসা করার মধ্যে পার্থক্য। আংশিকভাবে, এটি একটি স্থির-আকারের সমস্যা সমাধানের মধ্যে পার্থক্য এবং একই সাথে সমস্ত সম্ভাব্য ইনপুট আকারের জন্য সমস্যাটি সমাধান করে।

প্রতিবার Dijkstra এর কোনও উদাহরণে চালিত হয়, যা কোনও আকারের হতে পারে, এটি স্পষ্টভাবে প্রমাণ করে যে এর আউটপুটটিই একটি সত্য উত্তর এবং অন্য কোনও নয়। দাবা এবং চিত্রের স্বীকৃতিতে, কেউ তার সেরা উত্তর দেয় এবং ত্রুটিগুলি সহ্য করা হয়। তদতিরিক্ত, একবারে এক আকারের এই সমস্যাগুলি সমাধান করার জন্য কেবল একটিই নেটওয়ার্ক প্রশিক্ষণ দেয়। আমি মনে করি না যে আমরা সম্পূর্ণরূপে বিভিন্ন আকার এবং আকারের সমস্যার দৃষ্টান্তগুলির যেমন নিউরাল নেট সমাধান কীভাবে সাধারণ করতে পারি তা এখনও জানি।

আমি মনে করি না আমাদের ধারণা করা উচিত যে নিউরাল নেটগুলি সংক্ষিপ্ত-পাথ বা অনুরূপ অ্যালগোরিদমিক সমস্যাগুলি সমাধান করতে পারে না , তবে তারা ধাপে ধাপে অ্যালগরিদমের তুলনায় মৌলিকভাবে আলাদাভাবে সমস্যার সমাধান করে যা সর্বদা সঠিক।

নিউরাল নেট এবং সার্কিটের মধ্যে সাদৃশ্যটির দিকে ফিরে গিয়ে লক্ষ্য করুন যে সার্কিটগুলি কয়েক দশক ধরে অধ্যয়ন করা হয়েছে, তবুও আমার আগের প্রশ্নের (5) উত্তর না পেয়ে বিচার করে আমরা প্রদত্তের জন্য পুরোপুরি সঠিক সার্কিট কীভাবে তৈরি করব সে সম্পর্কে আমরা প্রায় কিছুই জানি না ইউনিফর্ম অ্যালগরিদম (টুরিং মেশিন )কে একটি সার্কিটে রূপান্তর করা ব্যতীত সমস্যা।


আমি মনে করি না যে একটি উত্তর থাকা কোনও পার্থক্য করে - দু'জন খেলোয়াড় কে আরও সংক্ষিপ্ত পথের সন্ধান করতে পারে এমন প্রতিযোগিতা করে ডিজকસ્ત્ર খেলতে পারে। স্কেলাবিলিটি আরও গুরুতর সমস্যা হতে পারে - আপনি কী মনে করেন এনএনরা এনআইএম খেলতে শিখতে পারে?
ডমোটরপ

@ ডমোটরপ, আমি মনে করি সঠিক অ্যালগরিদম এবং ভুল তবে আনুমানিক হিউরিস্টিকের মধ্যে একটি বিশাল ধারণাগত এবং ব্যবহারিক পার্থক্য রয়েছে। দাবা আনুমানিক সংক্ষিপ্ততম পাথের চেয়ে শক্ত কেন আপনি জিজ্ঞাসা করেননি, আপনি জিজ্ঞাসা করেছিলেন যে দাজক্ষত্রের চেয়ে দাবা কেন আরও শক্ত, যা সমস্ত ইনপুট আকারে 100% সময় সঠিকভাবে সঠিক। পুনঃ নিম, ধারণা নেই; আপনার এমন একটি এনএন আর্কিটেকচার দরকার যা শুরু করার জন্য ইচ্ছামত বৃহত ইনপুট গ্রহণ করে ...
usul

0

আমি কোনও উপায়ে বিশেষজ্ঞ নই, তবে কেন তা এখনও দেখছি না।

নিউরাল নেটওয়ার্কগুলি মৌলিকভাবে "কস্ট / বেনিফিট মডেল" এর কিছু ধরণের অনুসারে অপ্টিমাইজেশন সম্পাদন করে যা প্রায়শই আগে-আগে পরিচিত। তদ্ব্যতীত, অনুসন্ধানের স্থানটি কার্যকরভাবে বৈধ এবং অবৈধ চালগুলি যা পরিচিত এবং "সংশ্লেষগুলি" যা সংজ্ঞা দেওয়া সহজ with এমনকি আলফাজিরো এবং আলফাগোর জন্যও ব্যয় কার্যগুলি সম্ভবত উইন-রেট এবং ফলস্বরূপ উইন-রেট বিতরণ এবং সম্ভবপর পদক্ষেপের পরে সমস্ত সম্ভাব্য পদক্ষেপের জন্য বিতরণ বা তার জন্য কিছু বাত্সরিকতার উপর ভিত্তি করে।

অ্যালগরিদম তৈরির জন্য, আপনি মূলত প্রোগ্রামটিকে একটি সঠিক স্ট্রিং আউটপুট করতে শিখতে জিজ্ঞাসা করছেন (ইতিমধ্যে পরিচিত একটি অন্তর্নিহিত এনকোডিং এবং ব্যয় ফাংশন সহ) যা একটি প্রোগ্রামের সাথে সম্পর্কিত যা "একটি অ্যালগরিদম কার্যকর করে।" তবে, সেখানে সম্ভবত অসীম অনেকগুলি অ্যালগরিদম রয়েছে যার জন্য আপনি একটি প্রোগ্রাম প্রয়োগ করেন। সুতরাং সম্ভবত আপনি সঠিক "ফিটনেস" মেট্রিকগুলি সংজ্ঞায়িত করতে চাইবেন।

তবে, এমনকি কিছু প্রোগ্রামের জন্য, "ফিটনেস" মেট্রিকগুলি সংজ্ঞায়িত করা কিছুটা কঠিন হতে পারে। সময়? স্থান ব্যবহার? "পার্শ্ব প্রতিক্রিয়া?" সর্বোত্তমভাবে, আপনি "সংক্ষিপ্ততম প্রোগ্রাম" তৈরি করবেন যা কেবল আপনি এটি করতে চান তা করে।

আমি মনে করি আপনি যদি সঠিক ফিটনেস মেট্রিক্স এবং সমন্বয় অ্যালগরিদমগুলি খুঁজে পান তবে আপনি এটি করতে সক্ষম হবেন।


-3

"নিউরাল নেটওয়ার্কগুলি" একটি ভেক্টরকে একটি মাত্রিক স্থান থেকে অন্য মাত্রিক স্থানগুলিতে রূপান্তর করে। সুতরাং এগুলি উচ্চতর, অত্যন্ত অ-রৈখিক ফাংশন অনুমানকারীগুলির চেয়ে বেশি কিছু নয়। এমনকি নিউরাল নেটওয়ার্কগুলি তাদের ক্ষয়ক্ষতি হ্রাসের জন্য প্রায় অ্যালগরিদম ব্যবহার করে। তবে নতুন অ্যালগরিদম তৈরির জন্য নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়া প্রশ্নবিদ্ধ। টমাস মিকোলভ এই ক্ষেত্রটিতে স্ট্যাক সংযোজনিত পুনরাবৃত্ত নিউরাল নেটওয়ার্কের সাথে কিছু কাজ করেছিলেন এবং আমি এই ডোমেনটির জন্য "নিউরাল টিউরিং মেশিন" সম্পর্কেও শুনেছি। তবে সর্বোত্তম কৌশলগুলি অনুসন্ধান করা রিইনফোর্সমেন্ট লার্নিংয়ের অধ্যয়নের মৌলিক কারণ যা আপনার প্রশ্নের সাথে কিছুটা সম্পর্কিত। তবে নতুন অ্যালগরিদমগুলি তৈরির জন্য নিউরাল নেটওয়ার্ক ব্যবহার করা সম্ভব নয়, অদূর ভবিষ্যতে কমপক্ষে।


আমি মনে করি উপযুক্ত গেমের জন্য একটি অনুকূল কৌশল সম্পর্কিত সমস্যাটির জন্য সর্বোত্তম অ্যালগরিদমের মতো।
ডমোটরপ

@ মমোটরপ "কৌশল" হ'ল একটি অ্যালগরিদমের চেয়ে বেশি
ধর্মীয় তাত্ত্বিক

-6

আমি একজন কিউএ অটোমেশন ইঞ্জিনিয়ার তাই স্নায়বিক নেটওয়ার্কগুলিতে দক্ষতার দাবি করবেন না, তবে, তাত্ত্বিকভাবে, হ্যাঁ এনএন নিজেই অ্যালগোরিদম তৈরি করতে পারে। মানুষেরা নিজেরাই কোনও স্তরে এনএন থাকে এবং আমরা অ্যালগোরিদম তৈরি করি, সুতরাং এটি যুক্তিযুক্ত যে দাঁড়াচ্ছে যে আমরা যে কৃত্রিম এনএন সিস্টেম তৈরি করি তারা নিজেরাই অ্যালগোরিদম তৈরি করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.