AIC এবং BIC ব্যবহার করা হয়, যেমন ধাপে ধাপে রিগ্রেশন ression এগুলি আসলে "হিউরিস্টিক্স" এর বৃহত্তর শ্রেণীর অংশ, যা ব্যবহৃত হয়। উদাহরণস্বরূপ, ডিআইসি (ডিভায়েন্স ইনফরমেশন মাপদণ্ড) প্রায়শই বায়েসিয়ান মডেল নির্বাচনের ক্ষেত্রে ব্যবহৃত হয়।
তবে এগুলি মূলত "হিউরিস্টিক্স"। যদিও এটি দেখানো যেতে পারে যে, এআইসি এবং বিআইসি উভয়ই সংক্ষিপ্ত আকারে ক্রস-বৈধকরণের পদ্ধতির দিকে রূপান্তরিত করে (আমি মনে করি এআইসি লেভ-ওয়ান-আউট সিভি, এবং বিআইসির দিকে অন্য কোনও পদ্ধতির দিকে যায়, তবে আমি নিশ্চিত নই), তারা পরিচিত যথাক্রমে আন্ডার-পেনালাইজ এবং অতিরিক্ত-জরিমানা করা। অর্থাৎ এআইসি ব্যবহার করে আপনি প্রায়শই একটি মডেল পাবেন যা এটি হওয়া উচিত তার চেয়ে জটিল, অন্যদিকে বিআইসির মাধ্যমে আপনি প্রায়শই এমন একটি মডেল পান যা খুব সরল।
যেহেতু উভয়ই সিভির সাথে সম্পর্কিত, সিভি প্রায়শই একটি ভাল পছন্দ, যা এই সমস্যায় ভোগেনা।
তারপরে অবশেষে # প্যারামিটারগুলির ইস্যু রয়েছে যা বিআইসি এবং এআইসির জন্য প্রয়োজনীয়। আসল-মূল্যবান ইনপুটগুলিতে সাধারণ ফাংশন আনুমানিক (উদাহরণস্বরূপ কেএনএন) দিয়ে, "আড়াল" পরামিতিগুলি সম্ভব, যেমন দুটি আসল সংখ্যার মতো একই তথ্য সম্বলিত একটি আসল সংখ্যা তৈরি করা (অঙ্কগুলি ছেদ করার উদাহরণ হিসাবে ভাবেন)। সেক্ষেত্রে পরামিতিগুলির আসল সংখ্যা কত? অন্যদিকে, আরও জটিল মডেলগুলির সাথে আপনার পরামিতিগুলিতে বাধা থাকতে পারে, বলুন আপনি কেবলমাত্র θ1>θ2 মতো পরামিতিগুলি ফিট করতে পারেন (যেমন এখানে দেখুন ) see অথবা আপনার অ-সনাক্তকরণযোগ্যতা থাকতে পারে, সেই ক্ষেত্রে পরামিতিগুলির একাধিক মানগুলি একই মডেলটি দেয়। এই সমস্ত ক্ষেত্রে, কেবলমাত্র পরামিতি গণনা একটি উপযুক্ত অনুমান দেয় না।
যেহেতু অনেক সমসাময়িক মেশিন-লার্নিং অ্যালগরিদমগুলি এই বৈশিষ্ট্যগুলি (যেমন সর্বজনীন আনুমানিকতা, প্যারামিটারগুলির অস্পষ্ট সংখ্যা, অ-শনাক্তকরণযোগ্যতা) দেখায়, এআইসি এবং বিআইসি এই মডেলের জন্য কম দরকারী, তারা প্রথম নজরে দেখে মনে হতে পারে than
সম্পাদনা :
আরও কিছু বিষয় যা স্পষ্ট করা যেতে পারে:
- মনে হচ্ছে আমি আন্তঃলিখন্বিত অঙ্কগুলি R→RN মধ্যে একটি সক্ষমতা বিবেচনা করে ভুল করেছিলাম ( এখানে দেখুন )। যাইহোক, এটি কেন কোনও বাইজেকশন নয় তা বিশদটি বুঝতে কিছুটা শক্ত। যাইহোক, এই ধারণাটি কাজ করার জন্য আমাদের আসলে কোনও দ্বিধায়নের প্রয়োজন নেই (একটি আক্ষেপ যথেষ্ট)।
- ক্যান্টরের প্রমাণ অনুসারে (1877) অবশ্যই আর → আর এন এর মধ্যে একটি দ্বিপক্ষীয় হতে হবেR→RN । যদিও এই বাইজিকেশনটি স্পষ্টভাবে সংজ্ঞায়িত করা যায় না, এর অস্তিত্ব প্রমাণিত হতে পারে (তবে এটি পছন্দের অপ্রমাণিত অক্ষ) প্রয়োজন। এই বাইজিকেশনটি তাত্ত্বিক মডেলটিতে এখনও ব্যবহার করা যেতে পারে (কম্পিউটারে এই মডেলটি বাস্তবে বাস্তবায়ন করা সম্ভব না), একটি একক প্যারামিটারকে স্বেচ্ছাসেবী সংখ্যার পরামিতিগুলিতে আনপ্যাক করতে।
- বাইজাকশন হওয়ার জন্য আমাদের R→RN মধ্যে ম্যাপিংয়ের দরকার নেই । যে কোনও সার্জিকটিভ ফাংশন R→RN একক একাধিক পরামিতি আনপ্যাক করার জন্য যথেষ্ট। এই ধরনের সমীক্ষাগুলি অন্য ফাংশনগুলির ক্রম (তথাকথিত স্থান-ভর্তি বক্ররেখাগুলি , যেমন পেনো কার্ভ ) এর সীমা হিসাবে বিদ্যমান হিসাবে দেখানো যেতে পারে ।
- কারণ ক্যান্টরের দ্বারা প্রমাণগুলি গঠনমূলক নয় (এটি কেবল উদাহরণ না দিয়ে বাইজিকেশনটির অস্তিত্ব প্রমাণ করে), না স্থান স্থান-বক্ররেখা (কারণ এগুলি কেবল গঠনমূলক বস্তুর সীমা হিসাবে বিদ্যমান এবং তাই তারা নিজে গঠনমূলক নয়), যুক্তি I তৈরি শুধুমাত্র একটি তাত্ত্বিক প্রমাণ। তত্ত্বের ক্ষেত্রে, আমরা কোনও পছন্দসই মানের (প্রশিক্ষণের সেটটিতে) নীচে বিআইসিকে হ্রাস করতে কোনও মডেলটিতে পরামিতি যুক্ত করতে পারি। তবে, প্রকৃত মডেল বাস্তবায়নে আমাদের স্থান-ভরাট বাঁক আনুমানিক করতে হবে, সুতরাং আনুমানিক ত্রুটি আমাদের আসলে এটি করতে বাধা দিতে পারে (আমি আসলে এটি পরীক্ষা করে দেখিনি)।
- যেহেতু এই সমস্তটির জন্য পছন্দসই অট্টালিকা প্রয়োজন, প্রমাণটি অবৈধ হয়ে যায় যদি আপনি এই অক্ষটি স্বীকার না করেন (যদিও বেশিরভাগ গণিতবিদগণ এটি করেন)। তার অর্থ, গঠনমূলক গণিতে এটি সম্ভব নাও হতে পারে তবে পরিসংখ্যানগুলির জন্য গঠনমূলক গণিত কী ভূমিকা রাখে তা আমি জানি না।
- শনাক্তকরণটি কার্যকরী জটিলতার সাথে অন্তর্নিহিত। যদি কেউ সহজেই একটি সনাক্তযোগ্য N প্যারামিটার মডেল গ্রহণ করে এবং একটি অতিরিক্ত অতিরিক্ত প্যারামিটার যুক্ত করে (যেমন কোথাও ব্যবহৃত হয় না), তবে নতুন মডেলটি অ-সনাক্তযোগ্যভাবে হয়ে যায়। মূলত, এক একটি মডেল জটিলতা আছে ব্যবহার করছে RN+1 একটি সমস্যা আছে যা জটিলতা সমাধানের জন্য RN । একইভাবে, অ-শনাক্তকরণের অন্যান্য ফর্মগুলির সাথে। উদাহরণস্বরূপ অ-শনাক্তযোগ্য প্যারামিটার অনুমতিগুলির ক্ষেত্রে নিন। সেক্ষেত্রে, একটি এমন মডেল ব্যবহার করছে যা RN এর জটিলতা রাখে , তবে, আসল সমস্যাটি কেবল আর এন এর উপর সমতুল্য শ্রেণির সেটগুলির জটিলতা রয়েছেRN। তবে এটি কেবল একটি অনানুষ্ঠানিক যুক্তি, "জটিলতা" এই ধারণার কোনও আনুষ্ঠানিক চিকিত্সা সম্পর্কে আমি জানি না।