কৃত্রিম নিউরাল নেটওয়ার্ক ওজনের (এএনএন) এমএলই অনুমান অবশ্যই সম্ভব ; প্রকৃতপক্ষে, এটি সম্পূর্ণরূপে আদর্শ। শ্রেণিবদ্ধকরণ সমস্যাগুলির জন্য, একটি আদর্শ উদ্দেশ্যমূলক ক্রস হ'ল ক্রস-এনট্রপি, যা দ্বিপদী মডেলের নেতিবাচক লগ-সম্ভাবনার সমান। রিগ্রেশন সমস্যার জন্য, অবশিষ্ট স্কোয়ার ত্রুটি ব্যবহৃত হয়, যা ওএলএস রিগ্রেশন এর এমএলই এর সমান্তরাল হয়।
ক্লাসিকাল পরিসংখ্যান থেকে প্রাপ্ত এমএলইয়ের দুর্দান্ত বৈশিষ্ট্যগুলিও নিউরাল নেটওয়ার্কগুলির এমএলইয়ের জন্য ধারণ করে এমনটি ধরে নিয়ে কিছু সমস্যা রয়েছে।
এএনএন অনুমানের সাথে একটি সাধারণ সমস্যা রয়েছে: এমনকি সিঙ্গল-লেয়ার এএনএন-এর অনেকগুলি প্রতিসম সমাধান রয়েছে। লুকানো স্তরটির জন্য ওজনের লক্ষণগুলি বিপরীত করা এবং লুকানো স্তরটির অ্যাক্টিভেশন প্যারামিটারের চিহ্নগুলিকে বিপরীত করা উভয়ের সমান সম্ভাবনা। অতিরিক্তভাবে, আপনি যে কোনও লুকানো নোডকে অনুমতি দিতে পারেন এবং এই ক্রিয়াকলাপগুলিরও একই সম্ভাবনা রয়েছে। এটি ফলস্বরূপ অনিবার্য কারণ আপনাকে অবশ্যই স্বীকার করতে হবে যে আপনি সনাক্তকরণের বিষয়টি ছেড়ে চলেছেন। তবে, যদি সনাক্তকরণযোগ্যতা গুরুত্বপূর্ণ না হয় তবে আপনি সহজেই গ্রহণ করতে পারেন যে এই বিকল্প সমাধানগুলি কেবল প্রতিচ্ছবি এবং / বা একে অপরের ক্রমবিন্যাস।
এটি পরিসংখ্যানগুলিতে এমএলইর শাস্ত্রীয় ব্যবহারের বিপরীতে যেমন কোনও ওএলএস রিগ্রেশন: ওএলএসের সমস্যাটি উত্তল, এবং যখন নকশার ম্যাট্রিক্স পূর্ণ পদে থাকে তখন কঠোরভাবে উত্তল হয়। দৃ con় উত্তলতা বোঝায় যে এখানে একটি একক, অনন্য মিনিমাইজার রয়েছে।
আনঅনস্রষ্টিত সমাধান ব্যবহার করার সময় এএনএনগুলি ডেটাগুলিকে অতিরিক্ত মানিয়ে নেবে। ওজন উত্স থেকে দূরে স্রষ্টাযোগ্য বৃহত্তর মানগুলির দিকে ঝুঁকবে which ওজন ক্ষয় বা অন্যান্য নিয়মিতকরণ পদ্ধতি চাপিয়ে দেওয়ার ফলে ওজন অনুমানের পরিমাণ শূন্যের দিকে সঙ্কুচিত হয়। এটি অগত্যা (1) থেকে অনির্দিষ্টতা সমস্যা সমাধান করে না, তবে এটি নেটওয়ার্কের সাধারণীকরণকে উন্নত করতে পারে।
ক্ষতির ফাংশনটি ননকোনভেক্স এবং অপ্টিমাইজেশন স্থানীয়ভাবে অনুকূল সমাধানগুলি খুঁজে পেতে পারে যা বিশ্বব্যাপী অনুকূল নয়। অথবা সম্ভবত এই সমাধানগুলি স্যাডল পয়েন্ট, যেখানে কয়েকটি অপ্টিমাইজেশন পদ্ধতি স্টল করে। এই গবেষণাপত্রের ফলাফলগুলি দেখতে পেয়েছে যে আধুনিক অনুমানের পদ্ধতিগুলি এই ইস্যুটিকে পাশ কাটাবে।
একটি শাস্ত্রীয় পরিসংখ্যানগত সেটিংয়ে, দন্ডযুক্ত ফিটের পদ্ধতি যেমন ইলাস্টিক নেট, বা নিয়মিতকরণ উত্তলকে একটি র্যাঙ্ক-অভাব (অর্থাত্ নন-উত্তল) সমস্যা তৈরি করতে পারে। এই সত্যটি নিউরাল নেটওয়ার্ক সেটিং পর্যন্ত প্রসারিত হয় না, (1) এ পারমিটেশন ইস্যুর কারণে। এমনকি আপনি যদি আপনার পরামিতিগুলির আদর্শকে সীমাবদ্ধ করেন তবে ওজনকে অনুমতি দেওয়া বা প্রতিসামগ্রী বিপরীত লক্ষণগুলি পরামিতি ভেক্টরের আদর্শকে পরিবর্তন করবে না; বা এটি সম্ভাবনা পরিবর্তন করবে না। সুতরাং ক্ষতি অনুমোদিত বা প্রতিফলিত মডেলগুলির জন্য একই থাকবে এবং মডেলটি এখনও শনাক্ত করা হয়নি।এল1এল2