আকাইকে তথ্যের মানদণ্ড কেন মেশিন লার্নিংয়ে বেশি ব্যবহৃত হয় না?


16

আমি কেবল "আকাইকে তথ্য মানদণ্ডে" চলে এসেছি এবং আমি মডেল নির্বাচনের উপর এই বিশাল পরিমাণে সাহিত্য লক্ষ্য করেছি (বিআইসির মতো জিনিসগুলিও বিদ্যমান বলে মনে হয়)।

সমসাময়িক মেশিন লার্নিং পদ্ধতিগুলি এই বিআইসি এবং এআইসি মডেল নির্বাচনের মানদণ্ডটি কেন গ্রহণ করবে না?


9
কারও সম্ভাবনা গণনা করা হয় না কেন?
আকসাকাল

1
"সমসাময়িক মেশিন লার্নিং পদ্ধতিগুলি" বলতে কী বোঝ? যতদূর আমি এআইসি এবং বিআইসি ব্যবহার করেছি ঘন ঘন ব্যবহার করা হয়।
ফেরদি

4
এছাড়াও -১ কেন? মনে রাখবেন কোনও বোকা প্রশ্ন নেই - প্রতিটি প্রশ্ন মহাবিশ্বে আলোকপাত করার চেষ্টা করে
প্রতিধ্বনিত

4
@ কেচো: আমি ডাউনওয়েট করিনি, তবে আমি মনে করি আপনি যদি প্রধান দাবির উত্স / সমর্থন করতে পারেন (তবে মেশিন শেখার পদ্ধতিগুলি এই বিআইসি এবং এআইসির মডেল নির্বাচনের মানদণ্ডটি গ্রহণ করে)
ইউজার 603

2
@ আকসাল ধন্যবাদ আমি মনে করি যদি একটি দাবিদার চারপাশে নির্মিত প্রশ্নগুলি সেই দাবিটিকে উত্সাহিত করতে পারে তবে এটি আরও ভাল। আমি একটি সাধারণ নিয়ম হিসাবে মানে।
ব্যবহারকারী 60

উত্তর:


15

AIC এবং BIC ব্যবহার করা হয়, যেমন ধাপে ধাপে রিগ্রেশন ression এগুলি আসলে "হিউরিস্টিক্স" এর বৃহত্তর শ্রেণীর অংশ, যা ব্যবহৃত হয়। উদাহরণস্বরূপ, ডিআইসি (ডিভায়েন্স ইনফরমেশন মাপদণ্ড) প্রায়শই বায়েসিয়ান মডেল নির্বাচনের ক্ষেত্রে ব্যবহৃত হয়।

তবে এগুলি মূলত "হিউরিস্টিক্স"। যদিও এটি দেখানো যেতে পারে যে, এআইসি এবং বিআইসি উভয়ই সংক্ষিপ্ত আকারে ক্রস-বৈধকরণের পদ্ধতির দিকে রূপান্তরিত করে (আমি মনে করি এআইসি লেভ-ওয়ান-আউট সিভি, এবং বিআইসির দিকে অন্য কোনও পদ্ধতির দিকে যায়, তবে আমি নিশ্চিত নই), তারা পরিচিত যথাক্রমে আন্ডার-পেনালাইজ এবং অতিরিক্ত-জরিমানা করা। অর্থাৎ এআইসি ব্যবহার করে আপনি প্রায়শই একটি মডেল পাবেন যা এটি হওয়া উচিত তার চেয়ে জটিল, অন্যদিকে বিআইসির মাধ্যমে আপনি প্রায়শই এমন একটি মডেল পান যা খুব সরল।

যেহেতু উভয়ই সিভির সাথে সম্পর্কিত, সিভি প্রায়শই একটি ভাল পছন্দ, যা এই সমস্যায় ভোগেনা।

তারপরে অবশেষে # প্যারামিটারগুলির ইস্যু রয়েছে যা বিআইসি এবং এআইসির জন্য প্রয়োজনীয়। আসল-মূল্যবান ইনপুটগুলিতে সাধারণ ফাংশন আনুমানিক (উদাহরণস্বরূপ কেএনএন) দিয়ে, "আড়াল" পরামিতিগুলি সম্ভব, যেমন দুটি আসল সংখ্যার মতো একই তথ্য সম্বলিত একটি আসল সংখ্যা তৈরি করা (অঙ্কগুলি ছেদ করার উদাহরণ হিসাবে ভাবেন)। সেক্ষেত্রে পরামিতিগুলির আসল সংখ্যা কত? অন্যদিকে, আরও জটিল মডেলগুলির সাথে আপনার পরামিতিগুলিতে বাধা থাকতে পারে, বলুন আপনি কেবলমাত্র θ1>θ2 মতো পরামিতিগুলি ফিট করতে পারেন (যেমন এখানে দেখুন ) see অথবা আপনার অ-সনাক্তকরণযোগ্যতা থাকতে পারে, সেই ক্ষেত্রে পরামিতিগুলির একাধিক মানগুলি একই মডেলটি দেয়। এই সমস্ত ক্ষেত্রে, কেবলমাত্র পরামিতি গণনা একটি উপযুক্ত অনুমান দেয় না।

যেহেতু অনেক সমসাময়িক মেশিন-লার্নিং অ্যালগরিদমগুলি এই বৈশিষ্ট্যগুলি (যেমন সর্বজনীন আনুমানিকতা, প্যারামিটারগুলির অস্পষ্ট সংখ্যা, অ-শনাক্তকরণযোগ্যতা) দেখায়, এআইসি এবং বিআইসি এই মডেলের জন্য কম দরকারী, তারা প্রথম নজরে দেখে মনে হতে পারে than

সম্পাদনা :

আরও কিছু বিষয় যা স্পষ্ট করা যেতে পারে:

  1. মনে হচ্ছে আমি আন্তঃলিখন্বিত অঙ্কগুলি RRN মধ্যে একটি সক্ষমতা বিবেচনা করে ভুল করেছিলাম ( এখানে দেখুন )। যাইহোক, এটি কেন কোনও বাইজেকশন নয় তা বিশদটি বুঝতে কিছুটা শক্ত। যাইহোক, এই ধারণাটি কাজ করার জন্য আমাদের আসলে কোনও দ্বিধায়নের প্রয়োজন নেই (একটি আক্ষেপ যথেষ্ট)।
  2. ক্যান্টরের প্রমাণ অনুসারে (1877) অবশ্যই আরআর এন এর মধ্যে একটি দ্বিপক্ষীয় হতে হবেRRN । যদিও এই বাইজিকেশনটি স্পষ্টভাবে সংজ্ঞায়িত করা যায় না, এর অস্তিত্ব প্রমাণিত হতে পারে (তবে এটি পছন্দের অপ্রমাণিত অক্ষ) প্রয়োজন। এই বাইজিকেশনটি তাত্ত্বিক মডেলটিতে এখনও ব্যবহার করা যেতে পারে (কম্পিউটারে এই মডেলটি বাস্তবে বাস্তবায়ন করা সম্ভব না), একটি একক প্যারামিটারকে স্বেচ্ছাসেবী সংখ্যার পরামিতিগুলিতে আনপ্যাক করতে।
  3. বাইজাকশন হওয়ার জন্য আমাদের RRN মধ্যে ম্যাপিংয়ের দরকার নেই । যে কোনও সার্জিকটিভ ফাংশন RRN একক একাধিক পরামিতি আনপ্যাক করার জন্য যথেষ্ট। এই ধরনের সমীক্ষাগুলি অন্য ফাংশনগুলির ক্রম (তথাকথিত স্থান-ভর্তি বক্ররেখাগুলি , যেমন পেনো কার্ভ ) এর সীমা হিসাবে বিদ্যমান হিসাবে দেখানো যেতে পারে ।
  4. কারণ ক্যান্টরের দ্বারা প্রমাণগুলি গঠনমূলক নয় (এটি কেবল উদাহরণ না দিয়ে বাইজিকেশনটির অস্তিত্ব প্রমাণ করে), না স্থান স্থান-বক্ররেখা (কারণ এগুলি কেবল গঠনমূলক বস্তুর সীমা হিসাবে বিদ্যমান এবং তাই তারা নিজে গঠনমূলক নয়), যুক্তি I তৈরি শুধুমাত্র একটি তাত্ত্বিক প্রমাণ। তত্ত্বের ক্ষেত্রে, আমরা কোনও পছন্দসই মানের (প্রশিক্ষণের সেটটিতে) নীচে বিআইসিকে হ্রাস করতে কোনও মডেলটিতে পরামিতি যুক্ত করতে পারি। তবে, প্রকৃত মডেল বাস্তবায়নে আমাদের স্থান-ভরাট বাঁক আনুমানিক করতে হবে, সুতরাং আনুমানিক ত্রুটি আমাদের আসলে এটি করতে বাধা দিতে পারে (আমি আসলে এটি পরীক্ষা করে দেখিনি)।
  5. যেহেতু এই সমস্তটির জন্য পছন্দসই অট্টালিকা প্রয়োজন, প্রমাণটি অবৈধ হয়ে যায় যদি আপনি এই অক্ষটি স্বীকার না করেন (যদিও বেশিরভাগ গণিতবিদগণ এটি করেন)। তার অর্থ, গঠনমূলক গণিতে এটি সম্ভব নাও হতে পারে তবে পরিসংখ্যানগুলির জন্য গঠনমূলক গণিত কী ভূমিকা রাখে তা আমি জানি না।
  6. শনাক্তকরণটি কার্যকরী জটিলতার সাথে অন্তর্নিহিত। যদি কেউ সহজেই একটি সনাক্তযোগ্য N প্যারামিটার মডেল গ্রহণ করে এবং একটি অতিরিক্ত অতিরিক্ত প্যারামিটার যুক্ত করে (যেমন কোথাও ব্যবহৃত হয় না), তবে নতুন মডেলটি অ-সনাক্তযোগ্যভাবে হয়ে যায়। মূলত, এক একটি মডেল জটিলতা আছে ব্যবহার করছে RN+1 একটি সমস্যা আছে যা জটিলতা সমাধানের জন্য RN । একইভাবে, অ-শনাক্তকরণের অন্যান্য ফর্মগুলির সাথে। উদাহরণস্বরূপ অ-শনাক্তযোগ্য প্যারামিটার অনুমতিগুলির ক্ষেত্রে নিন। সেক্ষেত্রে, একটি এমন মডেল ব্যবহার করছে যা RN এর জটিলতা রাখে , তবে, আসল সমস্যাটি কেবল আর এন এর উপর সমতুল্য শ্রেণির সেটগুলির জটিলতা রয়েছেRN। তবে এটি কেবল একটি অনানুষ্ঠানিক যুক্তি, "জটিলতা" এই ধারণার কোনও আনুষ্ঠানিক চিকিত্সা সম্পর্কে আমি জানি না।

এই পোস্টে চিমি রাখার যত্ন stats.stackexchange.com/questions/325129/… ? আমি কিছুক্ষণের জন্য এর সাথে ভাগ্য পাইনি।
স্ক্যান্ডার এইচ।

1
@ লাইকাও আপনি কীভাবে হিডিং পরামিতিগুলির "কৌশলগুলি", যেমন সংখ্যার ছেদ করার ক্ষেত্রে যেমন উল্লেখ করতে পারেন?
horaceT

@ হোরেসটি দুর্ভাগ্যক্রমে আমি কোনও কাগজ সম্পর্কে জানি না, যা এই উদাহরণ দেয়। এমডিএলে কাগজপত্রগুলিতে "ফাংশনাল জটিলতা" (যেমন lpl.psy.ohio-state.edu/documents/MNP.pdf দেখুন EQ 10) ধারণা রয়েছে। প্রায়শই উদাহরণ সীমাবদ্ধ প্যারামিটারগুলি দিয়ে তৈরি করা হয় (যেমন রিসার্চগেট.এন . / প্রজাতন্ত্র / ))। আমি এটি আলোচনা করার সময় উদাহরণটি ঘুরিয়ে দিতে চাই এবং দেখাই যে একটি জটিল একক পরামিতি একাধিক সাধারণ পরামিতিগুলি ক্যাপচার করতে পারে কারণ আমি এটি আরও স্বজ্ঞাত বলে মনে করি।
LiKao

f1,2:RR2f1,N:RRNNf1,NNN1

@ লিকাও এটি 'বেশ আকর্ষণীয়'। প্লিজ রেফারেন্স বলেছিল "ফাইলিং কার্ভস" এর প্রমাণ। আমি দেখতে পেতাম যে সীমাবদ্ধ পরামিতিগুলির স্বাধীনতার "কম" ডিগ্রি রয়েছে। নির্লজ্জভাবে, যদি f (x, y) = 0, y কেবল x এর একটি কার্য; আপনি কেবল g (x) রেখেছেন যেখানে y y সীমাবদ্ধ অপ্টিমাইজেশান দিয়ে আপনি একই জিনিস করতে পারবেন না।
horaceT
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.