মডেল জটিলতার ব্যবস্থা


19

একই সংখ্যক পরামিতিগুলির সাথে আমরা দুটি মডেলের জটিলতা কীভাবে তুলনা করতে পারি?

09/19 সম্পাদনা করুন : স্পষ্ট করে বলতে, মডেল জটিলতা সীমিত ডেটা থেকে শিখতে কতটা কষ্টের তা পরিমাপ করে। যখন দুটি মডেল বিদ্যমান ডেটাগুলিকে সমানভাবে ফিট করে, কম জটিলতার সাথে একটি মডেল ভবিষ্যতের ডেটাগুলিতে কম ত্রুটি দেয়। যখন অনুমানগুলি ব্যবহার করা হয়, প্রযুক্তিগতভাবে এটি সর্বদা সত্য নাও হতে পারে, তবে এটি যদি বাস্তবে সত্য হয়। বিভিন্ন আনুমানিক বিভিন্ন জটিলতা ব্যবস্থা দেয়


মডেলগুলি সম্পর্কে কী কী বৈশিষ্ট্য উপলব্ধ রয়েছে সে সম্পর্কে আপনি আরও তথ্য দিতে পারেন?
shabbychef

এটি এক প্রকার উন্মুক্ত প্রশ্ন, সুতরাং আমার প্রশ্নটি হ'ল জটিলতা পরিমাপ করতে আমার কী ধরণের গুণাবলীর প্রয়োজন? সর্বাধিক প্রাথমিক স্তরে, একটি সম্ভাব্যতা মডেল হ'ল সম্ভাবনা বিতরণের একটি সেট এবং আমি সেরা ফিটিং সদস্যকে বাছাই করে মডেলটিকে ডেটাতে ফিট করি
ইয়ারোস্লাভ বুলাটোভ

3
"জটিলতা" আসলে কী? (এটি কোনও উগ্র প্রশ্ন নয়!) আনুষ্ঠানিক সংজ্ঞা না থাকলে আমরা কোনও কিছুর বৈধ তুলনা করার আশা করতে পারি না।
whuber

এটিই আমি মূলত জিজ্ঞাসা করছি
ইয়ারোস্লাভ বুলাটোভ

2
তবে আপনি কমপক্ষে কোনও মডেলটির কোন দিকটি আপনি "জটিলতা" শব্দটিতে ধারণ করার চেষ্টা করছেন তা সম্পর্কে কোনও ইঙ্গিত দিতে পারেন না? তা ছাড়া, এই প্রশ্নটি কেবল একটি যুক্তিসঙ্গত উত্তর স্বীকার করার জন্য অস্পষ্ট to
whuber

উত্তর:


12

ন্যূনতম বিবরণ দৈর্ঘ্যের বিভিন্ন ব্যবস্থাসমূহের (উদাহরণস্বরূপ, সর্বাধিক সর্বাধিক সম্ভাবনা, ফিশার ইনফরমেশন আনুমানিকতা) উল্লেখ করার মতো আরও দুটি পদ্ধতি রয়েছে:

  1. প্যারামেট্রিক বুটস্ট্র্যাপ । দাবি করা এমডিএল ব্যবস্থার চেয়ে এটি প্রয়োগ করা অনেক সহজ। ওয়েগনমেকার এবং সহকর্মীদের দ্বারা একটি দুর্দান্ত কাগজ হ'ল:
    ওয়াগেনমেকার্স, ই.জে., র্যাটক্লিফ, আর।, গোমেজ, পি।, এবং আইভারসন, জিজে (2004)। প্যারামেট্রিক বুটস্ট্র্যাপ ব্যবহার করে মডেল নকলকরণের মূল্যায়ন করাগাণিতিক মনোবিজ্ঞান জার্নাল , 48, 28-50।
    বিমূর্ত:

    আমরা একটি প্রতিযোগী মডেল দ্বারা উত্পন্ন ডেটা জন্য অ্যাকাউন্ট হিসাবে মডেল এর ক্ষমতা হিসাবে সংজ্ঞায়িত, মডেল অনুকরণের পরিমাণ নির্ধারণ করার জন্য একটি সাধারণ নমুনা পদ্ধতি উপস্থিত। প্যারামেট্রিক বুটস্ট্র্যাপ ক্রস-ফিটিং পদ্ধতি (পিবিসিএম; সিএফ। উইলিয়ামস (জেআর স্ট্যাটিস্ট। সোক। বি 32 (1970) 350; বায়োমেট্রিক্স 26 (1970) 23)) নামে পরিচিত এই নমুনা পদ্ধতিটি ধার্মিকতার সাথে পার্থক্যের বিতরণ উত্পন্ন করে প্রতিযোগী মডেল প্রতিটি অধীনে প্রত্যাশিত। পিবিসিএমের ডেটা অবহিত সংস্করণে, উত্পাদিত মডেলগুলি বিবেচনাধীন পরীক্ষামূলক ডেটা ফিট করে নির্দিষ্ট পরামিতি মানগুলি অর্জন করে। মডেল পর্যাপ্ততার পরিমাণ নির্ধারণের জন্য ডেটা অবহিত পার্থক্য বিতরণকে ধার্মিকতার সাথে পরিপূর্ণ পার্থক্যটির সাথে তুলনা করা যেতে পারে। পিবিসিএম এর তথ্য অজ্ঞাত সংস্করণে, উত্পাদক মডেলগুলির পূর্ববর্তী জ্ঞানের ভিত্তিতে প্যারামিটার মানগুলির তুলনামূলকভাবে বিস্তৃত পরিসীমা থাকে। অবহিত ডেটা এবং ডেটা অজ্ঞাতপরিচয় উভয়ের প্রয়োগের বেশ কয়েকটি উদাহরণ সহ চিত্রিত করা হয়েছে।

    আপডেট: প্লেইন ইংরাজীতে মডেল অনুকরণের মূল্যায়ন। আপনি দুটি প্রতিযোগী মডেলগুলির মধ্যে একটি নিয়ে যান এবং এলোমেলোভাবে সেই মডেলের জন্য পরামিতিগুলির একটি সেট বাছাই করুন (হয় তথ্য অবহিত বা না হয়)। তারপরে, আপনি পরামিতিগুলির চয়ন করা সেট সহ এই মডেলটি থেকে ডেটা উত্পাদন করেন। এর পরে, আপনি উভয় মডেলকে উত্পাদিত ডেটা ফিট করতে এবং দুটি প্রার্থী মডেলের মধ্যে কোনটি আরও ভাল ফিট করে তা পরীক্ষা করে দেখুন। যদি উভয় মডেলই সমান নমনীয় বা জটিল হয় তবে যে মডেল থেকে আপনি ডেটা তৈরি করেছেন তার আরও ভাল মান দেওয়া উচিত। তবে, অন্য মডেলটি আরও জটিল হলে, এটি আরও ভাল ফিট করতে পারে, যদিও অন্য মডেল থেকে ডেটা তৈরি করা হয়েছিল। আপনি উভয় মডেলের সাথে এটি বেশ কয়েকবার পুনরাবৃত্তি করেন (অর্থাত, উভয় মডেলই ডেটা তৈরি করতে দেয় এবং দেখতে দেয় যে দুটির মধ্যে কোনটি আরও ভাল ফিট করে)। অন্যান্য মডেলের উত্পাদিত ডেটা "ওভারফিটগুলি" যে মডেলটি আরও জটিল এটি।

  2. ক্রস-বৈধকরণ : এটি কার্যকর করাও বেশ সহজ। এই প্রশ্নের উত্তর দেখুন । তবে নোট করুন যে এটির সাথে সমস্যাটি হ'ল নমুনা-কাটিয়া বিধি (লেভ-ওয়ান-আউট, কে-ফোল্ড, ইত্যাদি) এর মধ্যে পছন্দটি একটি অ-নীতিবিরোধী।


আমি "মডেল নকলকরণ" সত্যিই বুঝতে পারি না, তবে ক্রস-বৈধতা কেবল জটিলতার মূল্যায়ন করার কাজটি স্থগিত করে বলে মনে হচ্ছে। যদি আপনি ক্রস-বৈধতা হিসাবে আপনার পরামিতিগুলি এবং আপনার মডেল বাছাই করার জন্য ডেটা ব্যবহার করেন , তবে প্রাসঙ্গিক প্রশ্নটি এই "মেটা" -র জন্য ভাল সঞ্চালনের জন্য প্রয়োজনীয় ডেটার পরিমাণের অনুমান কীভাবে হয়
ইয়ারোস্লাভ বুলাটোভ

@ ইয়ারোসলা: আপনার সমস্যাটি আমি ক্রস-বৈধতার সাথে সত্যই বুঝতে পারি না, তবে সত্যি বলতে আমি সেখানে কোনও বিশেষজ্ঞ নই। যাইহোক, আমি সত্যিই মডেল অনুকরণের পরিমাপের জন্য একটি পয়েন্ট তৈরি করতে চাই। অতএব, আমার আপডেট উত্তর দেখুন।
হেনরিক

4

আমি মনে করি এটি আসল মডেল ফিটিং পদ্ধতির উপর নির্ভর করবে। সাধারণভাবে প্রযোজ্য পরিমাপের জন্য, আপনি ইয়ে 1998 সালে বর্ণিত স্বাধীনতার সাধারণ ডিগ্রিগুলি বিবেচনা করতে পারেন - মূলত মডেল অনুমানের পরিবর্তনের সংবেদনশীলতা পর্যবেক্ষণের ঘাঁটিঘাঁটি - যা মডেল জটিলতার পরিমাপ হিসাবে বেশ কার্যকর।


এইচএম ... কাগজটি রিগ্রেশন সম্পর্কিত সমস্ত বিষয়, আমি অবাক হয়েছি যদি এটি পৃথক সম্ভাবনা অনুমানের জন্য ব্যবহার করা যায়। এছাড়াও, আমি সত্যই বুঝতে পারি না যে তিনি এর জন্য কী অনুপ্রেরণা দেন - জিডিএফ হ'ল প্যারামিটারগুলির সংবেদনশীলতার একটি ডিগ্রি যা ডেটাতে ছোট পরিবর্তন হয় তবে এটি কেন গুরুত্বপূর্ণ? আমি আলাদা প্যারামিটারাইজেশন বেছে নিতে পারি যেখানে মূল প্যারামিটারাইজেশনে প্যারামিটারগুলিতে ছোট পরিবর্তনগুলি নতুন প্যারামিটারাইজেশনের বড় পরিবর্তনের সাথে সামঞ্জস্য হয় তাই এটি ডেটাতে আরও সংবেদনশীল বলে মনে হবে, তবে এটি একই মডেল
ইয়ারোস্লাভ বুলাটোভ

ইয়ারোস্লাভ:> * আমি আলাদা প্যারামিটারাইজেশন বেছে নিতে পারি যেখানে মূল প্যারামিটারাইজেশনে প্যারামিটারগুলিতে ছোট পরিবর্তনগুলি নতুন প্যারামিটারাইজেশনের বড় পরিবর্তনের সাথে সামঞ্জস্য হয়, সুতরাং এটি ডেটাতে আরও সংবেদনশীল বলে মনে হবে * আপনি একটি উদাহরণ দিতে পারেন (একটি অ্যাফাইন ইক্যুয়ারিয়েন্ট আনুষাঙ্গিক জড়িত)? ধন্যবাদ,
ইউজার 603

1
ডুএফ-র লিনিয়ার রিগ্রেশন হ্যাট ম্যাট্রিক্স বা সংবেদনশীলতার যোগফলের সন্ধান করে - সুতরাং অনুপ্রেরণা / ধারণাটি এতটা দূরের নয়। তিবশিরানী ও নাইট প্রস্তাবিত কোভারিয়েন্স ইনফ্ল্যাশন মাপদণ্ড যা সংবেদনশীলতার পরিবর্তে মডেল অনুমানের সমবায় দেখতে পায়। জিডিএফ অনেকগুলি মডেল পদ্ধতিতে যেমন কার্ট এবং তরঙ্গলেটের থ্রোসোল্ডিংয়ের ক্ষেত্রে প্রয়োগ করা হয়েছে (অ্যাডাপটিভ মডেল নির্বাচনের জন্য ইয়েসের কাগজটিতে আরও বিশদ রয়েছে), এবং জটিলতার জন্য নিয়ন্ত্রণের জন্য নকশাকৃত পদ্ধতিতে, তবে আমি কোনও পৃথক অনুমানের ক্ষেত্রে জানি না। মূল্য চেষ্টা করতে পারে ...
Ars

"অ্যাফাইন সমতুল্য অনুমানকারী" সম্পর্কে জানেন না, তবে ধরুন আমরা এর পরিবর্তে সর্বাধিক সম্ভাবনা অনুমানের উপর নির্ভর করি। Q = f (p) যাক যেখানে f কিছু হ্রাস হয়। পি 0, কিউ 0 টি প্যারামিটারাইজেশনের ক্ষেত্রে এমএলই অনুমানের প্রতিনিধিত্ব করুন। p0, q0 এর ভিন্ন ভিন্ন অ্যাসিম্পটোটিক ভেরিয়েন্স থাকতে পারে, তবে মডেলিংয়ের ডেটা বিবেচনায় এগুলি সমতুল্য। সুতরাং প্রশ্নটি নেমে আসে - কোন প্যারামিটারাইজেশনটি প্রত্যাশিত ঝুঁকির প্রতিনিধিগুলির সংবেদনশীলতা?
ইয়ারোস্লাভ বুলাটোভ

4

ন্যূনতম বিবরণ দৈর্ঘ্য (MDL) এবং ন্যূনতম বার্তা দৈর্ঘ্য (এমএমএল) অবশ্যই চেক আউট মূল্যবান।

এমডিএল হিসাবে, একটি সাধারণ কাগজ যা নরমালাইজড ম্যাক্সিমাম সম্ভাবনা (এনএমএল) পদ্ধতি এবং অ্যাসিপটোটিক আনুমানিকতার চিত্র তুলে ধরে:

এস। ডি রুইজ এবং পি। গ্রানওয়াল্ড। অসীম প্যারাম্যাট্রিক জটিলতার সাথে ন্যূনতম বিবরণ দৈর্ঘ্যের মডেল নির্বাচনের একটি অভিজ্ঞতা অভিজ্ঞতা। গাণিতিক মনোবিজ্ঞান জার্নাল, 2006, 50, 180-192

এখানে, তারা জ্যামিতিক বনাম একটি পোইসন বিতরণের মডেল জটিলতার দিকে নজর দেয়। এমডিএলের একটি দুর্দান্ত (ফ্রি) টিউটোরিয়াল এখানে পাওয়া যাবে

বিকল্পভাবে, এমএমএল এবং এমডিএল উভয়ের সাথে পরীক্ষিত তাত্পর্যপূর্ণ বিতরণের জটিলতার উপর একটি কাগজ এখানে পাওয়া যাবে । দুর্ভাগ্যক্রমে, এমএমএলে কোনও আপ-টু-ডেট টিউটোরিয়াল নেই তবে বইটি একটি দুর্দান্ত রেফারেন্স এবং অত্যন্ত প্রস্তাবিত।


1
আমি সেই কাগজটি পড়েছি এবং মনে হয় স্টোকাস্টিক জটিলতা একই মাত্রার মডেলগুলির মধ্যে পার্থক্য করতে না পারার সমস্যাটিকে ঠিক করে দেয়, তবে কখনও কখনও বিভিন্ন মাত্রার মডেলের মধ্যে পার্থক্য করতে না পারার সমস্যাটি প্রবর্তন করে। জ্যামিতিক বিতরণ অসীম জটিলতার জন্য বরাদ্দ করা হয়েছে, অবশ্যই আমরা এমন সাধারণ মডেলের জন্য প্রত্যাশা করব না!
ইয়ারোস্লাভ বুলাটোভ

অসীম স্টোকাস্টিক জটিলতা (এসসি) সম্পর্কে খুব ভাল পয়েন্ট। অসীম এসসি সমস্যার সমাধান বিদ্যমান, তবে খুব মার্জিত নয়; রিসানেনের পুনর্নির্ধারণ রৈখিক মডেলগুলিতে ভাল কাজ করে তবে পোয়েসন / জ্যামিতিক সমস্যার জন্য এটি করা সহজ নয়। পোইসন / জ্যামিতিক ডেটার এমএমএল (বা এসএমএমএল) এনকোডিং যদিও ঠিক আছে।
ইমালকালিক

3

সর্বনিম্ন বিবরণ দৈর্ঘ্য অনুসরণ করার মতো একটি উপায় হতে পারে।


2
কেবলমাত্র একটি দ্রষ্টব্য নোট: ন্যূনতম বর্ণনার দৈর্ঘ্যটি খুব শক্তিশালী এবং দরকারী, তবে ফলাফলগুলি পেতে বয়সগুলি নিতে পারে, বিশেষত যখন সর্বাধিক সংখ্যক সম্ভাবনা সহকারে বৃহত্তর ডেটাসেট ব্যবহার করা হয়। আমি একবার মাত্র একটি মডেলের জন্য এটি পেতে ফরট্রান কোডটি 10 ​​দিনের জন্য
চালিয়েছি

2

"মডেল জটিলতা" দ্বারা একটি সাধারণত মডেল জায়গার theশ্বর্য বোঝায়। নোট করুন যে এই সংজ্ঞাটি ডেটার উপর নির্ভর করে না। লিনিয়ার মডেলগুলির জন্য, মডেলের জায়গার theশ্বর্যটি স্থানের হ্রাসের সাথে তুচ্ছভাবে পরিমাপ করা হয়। কিছু লেখক এটিকেই "স্বাধীনতার ডিগ্রি" বলে অভিহিত করেছেন (যদিও historতিহাসিকভাবে, স্বাধীনতার ডিগ্রিগুলি মডেলের স্থান এবং নমুনা ব্যবস্থার পার্থক্যের জন্য সংরক্ষিত ছিল)। অ লিনিয়ার মডেলগুলির জন্য, জায়গার nessশ্বর্যকে পরিমাণমতো করা কম তুচ্ছ। জেনারালাইজড ডিগ্রি অফ ফ্রিডম (অ্যারসের জবাব দেখুন) এমন একটি পরিমাপ। এটি প্রকৃতপক্ষে খুব সাধারণ এবং গাছ, কেএনএন এবং পছন্দগুলির মতো কোনও "অদ্ভুত" মডেলের জায়গার জন্য ব্যবহার করা যেতে পারে। ভিসি মাত্রা অন্য পরিমাপ।

উপরে উল্লিখিত হিসাবে, "জটিলতা" এর এই সংজ্ঞাটি ডেটা স্বাধীন। সুতরাং একই সংখ্যার প্যারামিটার সহ দুটি মডেলের সাধারণত একই "জটিলতা" থাকবে।


1

ইয়ারোস্লাভের মন্তব্য থেকে হেনরিকের জবাব:

তবে ক্রস-বৈধতা কেবল জটিলতা নির্ধারণের কাজটি স্থগিত করে বলে মনে হচ্ছে। যদি আপনি ক্রস-বৈধতা হিসাবে আপনার পরামিতিগুলি এবং আপনার মডেল বাছাই করার জন্য ডেটা ব্যবহার করেন, তবে প্রাসঙ্গিক প্রশ্নটি এই "মেটা" -ফিটারের জন্য সঞ্চালনের জন্য প্রয়োজনীয় পরিমাণের ডেটা কতটা অনুমান করে?

kkবাড়ে। আরও সুনির্দিষ্টভাবে: আমি ভাবছি যে সেখানে দুটি মডেলের মধ্যে কোনও পার্থক্য রয়েছে কিনাসিভী() একটি ফাংশন হিসাবে কর্মক্ষমতা প্রমাণ হিসাবে নেওয়া যেতে পারে যে এই মডেলটি (যার যার আপেক্ষিক পারফরম্যান্স কমবে তখন বৃদ্ধি) কম জটিল এক হবে।

এমনকি আপনি এটিকে একটি 'তাত্পর্য' স্বাদ দিতে পারেন যেহেতু পদ্ধতির ফলাফলটি নমুনা পূর্বাভাস ত্রুটির বাইরে পার্থক্যের ক্ষেত্রে পদগুলির (একক) ক্ষেত্রে সরাসরি থাকে।


1
আমি সম্মত হব যে ক্রস ভ্যালিডেশন মডেল জটিলতা পরিমাপের সমস্যা সমাধান করে। হতে পারে আমি ভুল প্রশ্ন জিজ্ঞাসা করছি, কারণ একটি ব্যবহারিক প্রশ্ন হ'ল ফিটিং পদ্ধতির নমুনা জটিলতা। ক্রস-বৈধ যাচাই করা শিক্ষার্থী বিভিন্ন মডেল চেষ্টা করে এবং সর্বনিম্ন ক্রস বৈধতা ত্রুটিযুক্ত একটি বেছে নেবে। এখন প্রশ্নটি হল - এই শিক্ষার্থী কি সর্বাধিক সম্ভাবনার দ্বারা একক মডেলকে ফিট করে এমন একের চেয়ে বেশি মানিয়ে নিতে পারে?
ইয়ারোস্লাভ বুলাটোভ

ইয়ারোস্লাভ বুলাটোভ:> হ্যাঁ তবে আপনি কেবল নেস্টেড মডেলগুলির তুলনা করতে এমএল ব্যবহার করতে পারেন। ইনফার যেমন আপনি নির্দিষ্ট করেছেন (আপনার প্রশ্নে) একই সংখ্যক পরামিতিগুলির সাথে মডেলগুলি উল্লেখ করেছেন, তবে সেগুলি বাসাতে পারে না।
ব্যবহারকারী 60

আরেকটি সমস্যা হ'ল ক্রস-বৈধকরণ মডেল জটিলতার আমাদের বোঝার সাথে যোগ করে না। এআইসি / বিআইসির মতো ব্যবস্থাগুলি এটি পরিষ্কার করে দেয় যে প্রচুর প্যারামিটারগুলি ওভারফিটকে উত্সাহ দেয়। এখন প্রশ্নটি হয়ে ওঠে - মাত্রা ছাড়াও মডেলের কী দিকগুলি অতিরিক্ত পরিমাণে বাড়ানোর ক্ষমতা বাড়ায়?
ইয়ারোস্লাভ বুলাটোভ

ইয়ারোস্লাভ:> আবারও খুব ভাল বিষয়।
ব্যবহারকারী 60

ওভারফিটিং যদি সংকেত ছাড়াও শব্দকে ফিট করার জন্য কোনও মডেল ফিটিং পদ্ধতির প্রবণতা হয়, তবে আমরা এই জাতীয় প্রবণতাগুলি কোথায় তৈরি হতে পারে তা দেখার জন্য একটি প্রদত্ত প্রক্রিয়াটি দেখতে পারি। সম্ভবত কল্পনা বা জ্ঞানের অভাবের কারণে, কয়েকটি ভিন্ন পদ্ধতি বিবেচনা করার সময়, আমি এটিকে এমন কিছুতে সিদ্ধ করতে পারিনি যা "পরামিতির সংখ্যা" (বা "প্যারামিটারের কার্যকর সংখ্যা") হিসাবে পুনরুদ্ধার করা যায় না। আমরা এটিকে তার মাথায় উল্টাতে এবং জিজ্ঞাসা করতে পারি: অন্য সব সমান, যখন আমরা আমাদের ডেটাতে শব্দটি প্রবর্তন করি তখন কী ঘটে? তারপরে আমরা ইয়ে এর জিডিএফ এর মতো পদক্ষেপে পৌঁছে যাই।
আর্স

0

মডেল তুলনার জন্য তথ্যের মানদণ্ড সম্পর্কে কী? উদাহরণস্বরূপ http://en.wikedia.org/wiki/Akaike_information_criterion দেখুন

মডেল জটিলতা এখানে মডেল এর পরামিতি সংখ্যা।


এআইসি মডেল জটিলতার একটি পরিমাপ নয়।
সোভেন হোহেনস্টেইন

@ সোভেনহোহেনস্টেইন, তাঁর শেষ বাক্য থেকে, আমি জড়ো করেছি যে তিনি এআইসি নিজেই পরামর্শ দিচ্ছেন না যে মডেল জটিলতার একটি পরিমাপ। ব্রাউজ 42, নোট করুন যে প্রশ্নটি বিশেষভাবে মডেলগুলি সম্পর্কে ডাব্লু / একই পরামিতিগুলির বিষয়ে জিজ্ঞাসা করে। সুতরাং, এআইসি এসএসই বা বিচ্যুতি, বা যাই হোক না কেন হ্রাস পাবে।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.