পরিবর্তনশীল নির্বাচন বনাম মডেল নির্বাচন


12

সুতরাং আমি বুঝতে পারি যে চলক নির্বাচনটি মডেল নির্বাচনের একটি অংশ। তবে মডেল নির্বাচনটি আসলে কী নিয়ে গঠিত? এটি কি নীচের চেয়ে বেশি:

1) আপনার মডেল জন্য একটি বিতরণ চয়ন করুন

2) ব্যাখ্যামূলক ভেরিয়েবল চয়ন করুন,?

আমি এটি জিজ্ঞাসা করছি কারণ আমি বার্নহাম এবং অ্যান্ডারসন: এআইসি বনাম বিআইসির একটি নিবন্ধটি পড়ছি যেখানে তারা মডেল নির্বাচনের ক্ষেত্রে এআইসি এবং বিআইসি সম্পর্কে কথা বলে। এই নিবন্ধটি পড়ে আমি বুঝতে পারি যে আমি 'মডেল নির্বাচন' কে 'পরিবর্তনশীল নির্বাচন' হিসাবে ভাবছিলাম (রেফারেন্স মন্তব্যগুলি কি বিআইসি একটি সত্যিকারের মডেল সন্ধানের চেষ্টা করে? )

নিবন্ধের একটি অংশ যেখানে তারা 12 সাধারণের "জেনারেলটির" ডিগ্রি বৃদ্ধির সাথে আলোচনা করে এবং কেএল-তথ্য 12 টি মডেলের বিরুদ্ধে চক্রান্ত করা হয় তখন এই মডেলগুলি "টেপারিং এফেক্টস" (চিত্র 1) দেখায়:

বিবিধের বিভিন্ন ফিলোসফিজ এবং টার্গেট মডেলস ... এটি সত্ত্বেও বিআইসির টার্গেটটি এআইসির টার্গেট মডেলের চেয়ে বেশি সাধারণ মডেল হলেও, বিআইসি দ্বারা প্রায়শই নির্বাচিত মডেলটি এন-এর চেয়ে বড় না হলে মডেল 7-এর চেয়ে কম সাধারণ হবে । এটি মডেল ৫ বা be হতে পারে It এটি জানা যায় (সাহিত্যের অসংখ্য কাগজপত্র এবং সিমুলেশন থেকে) যে টেপারিং-এফেক্ট প্রসঙ্গে (চিত্র 1), এআইসি বিআইসির চেয়ে আরও ভাল অভিনয় করে। এটি যদি কারও আসল ডেটা বিশ্লেষণের প্রসঙ্গ হয় তবে এআইসি ব্যবহার করা উচিত।

কিভাবে BIC করতে কি কখনো একটি মডেল মডেল নির্বাচন আমি বুঝতে পারছি না যে এআইসি চেয়ে আরো জটিল নির্বাচন করুন! "মডেল নির্বাচন" বিশেষত কী এবং বিআইসি এআইসির তুলনায় আরও বেশি "জেনারেল" মডেল নির্বাচন করে?

আমরা যদি ভেরিয়েবল নির্বাচনের কথা বলছি, তবে বিআইসিকে অবশ্যই সর্বদা সর্বনিম্ন পরিমাণের ভেরিয়েবলের মডেলটি বেছে নিতে হবে, সঠিক? সাথে BIC শব্দটি সবসময় দণ্ডিত চেয়ে বেশি ভেরিয়েবল যোগ হবে এআইসি শব্দটি। তবে " বিআইসির টার্গেটটি এআইসির টার্গেট মডেলের চেয়ে বেশি সাধারণ মডেল " কি এটি অযৌক্তিক নয় ?2ln(N)k2k

সম্পাদনা :

মন্তব্যগুলিতে আলোচনার মাধ্যমে এআইসি বা বিআইসিকে অপরটির চেয়ে পছন্দ করার কোনও কারণ আছে কি? আমরা মন্তব্যগুলিতে @ মিশেল চেরনিক এবং @ ব্যবহারকারী 13273 এর মধ্যে একটি ছোট আলোচনা দেখি, আমাকে বিশ্বাস করতে পরিচালিত করে যে এটি এমন একটি বিষয় যা তুচ্ছ নয়:

আমি মনে করি এই আলোচনাকে "বৈশিষ্ট্য" নির্বাচন বা "কোভারিয়েট" নির্বাচন হিসাবে বলা আরও উপযুক্ত। আমার কাছে, মডেল নির্বাচন ত্রুটির বিতরণ, লিঙ্ক ফাংশনের ফর্ম এবং কোভেরিয়েটগুলির ফর্মের স্পেসিফিকেশন যুক্ত অনেক বেশি বিস্তৃত। যখন আমরা এআইসি / বিআইসির কথা বলি, আমরা সাধারণত এমন পরিস্থিতিতে থাকি যেখানে মডেল বিল্ডিংয়ের সমস্ত দিকগুলি সংশোধন করা হয়, কোভেরিয়েটগুলির নির্বাচন ব্যতীত। - ব্যবহারকারীর 13273 আগস্ট 13 '12 21 21 এ

কোনও মডেলকে অন্তর্ভুক্ত করার জন্য নির্দিষ্ট কোভেরিয়েটগুলি সিদ্ধান্ত নেওয়া সাধারণত শব্দটি মডেল নির্বাচনের দ্বারা যায় এবং শিরোনামে মডেল নির্বাচনের সাথে প্রচুর বই রয়েছে যা মূলত সিদ্ধান্ত নিচ্ছে মডেলটিতে কোন মডেলকে কোভারিয়েট / প্যারামিটার অন্তর্ভুক্ত করা উচিত। - মাইকেল চেরনিক 24 '12 আগস্ট 14:44 এ


3
ভাল প্রশ্ন! রেজুলেশনের কমপক্ষে একটি অংশটি এই কাগজের পরিভাষায় বিআইসির "টার্গেট" এর মধ্যে পার্থক্য করা হয় - সত্যিকারের মডেল, যা এটি একটি খুব বড় নমুনার আকারের সাথে বেছে নেবে - এবং যে মডেলটি কোনও নির্দিষ্ট নমুনাটি বেছে নিতে দেখা যায় আকার। কোনও ক্রমবর্ধমান নম্বর সহ মডেলগুলির নেস্টেড ক্রমটি বিবেচনা করার সময় তখন কোনও বৈপরীত্য নেই। পরামিতি এই বলে যে এ লক্ষ্য সাথে BIC 9 পরামিতি সঙ্গে মডেল, যদিও একটি মধ্যপন্থী নমুনা আকারে সাথে BIC পছন্দ 4 পরামিতি সঙ্গে মডেল, & এআইসি সঙ্গে 6. এক
Scortchi - পুনর্বহাল মনিকা

1
@ স্কার্টচি: ভাল উদাহরণ, তবে আমরা যখন নেস্টেড মডেলগুলির বিষয়ে কথা বলছি তখন কোনও টার্গেট মডেলটির ধারণাটি কি পুরোহিত নয় ? যদি প্রসঙ্গটি নেস্টেড মডেলগুলির একটি সেট (তবে আমরা পরিবর্তনশীল নির্বাচনের বিষয়ে কথা বলছি): বিআইসির কাছে আরও জটিল টার্গেটের মডেল থাকতে পারে তবে এআইসির চেয়ে কখনও জটিল মডেলটি বেছে নেবে না। অন্য যে কোনও প্রসঙ্গে (আমরা মডেল নির্বাচনের বিষয়ে কথা বলছি) (বৃহত্তর নমুনা আকারের সাথে) কাগজটি দাবি করেছে যে বিআইসি এআইসির চেয়ে আরও জটিল ("সাধারণ") টার্গেট মডেলটি বেছে নেবে। এটি কীভাবে বিশেষভাবে ঘটে, তা এখনও আমার কাছে পরিষ্কার নয়।
এরোজেনিন

@ ইরোসেননিন আপনার নিজের এই সাধারণ প্রশ্নের উত্তর খুঁজতে কি কখনও পরিচালনা করেছেন?
জিপজ্যাপিং ২

উত্তর:


3

কখনও কখনও মডেলাররা পরিবর্তনশীল নির্বাচনকে মডেল বিকাশের একটি পৃথক ধাপে পৃথক করে। উদাহরণস্বরূপ, তারা প্রথমে অনুসন্ধান বিশ্লেষণ সম্পাদন করবে, একাডেমিক সাহিত্য এবং শিল্প চর্চা গবেষণা করবে এবং তারপরে প্রার্থী ভেরিয়েবলগুলির একটি তালিকা উপস্থিত করবে। তারা এই পদক্ষেপের পরিবর্তনশীল নির্বাচনকে কল করবে ।

এর পরে, তারা এমন OLS ঔজ্জ্বল্যের প্রেক্ষাপটে মডেল হিসেবে বিভিন্ন পরিবর্তনশীল সমন্বয় সঙ্গে বিভিন্ন বিবরণীর একটি গুচ্ছ দৌড়ানো উচিৎ: যেখানে পরিবর্তনশীল উল্লেখ করে একটি মডেল । তারা বাছাই চাই সেরা সমস্ত মডেলের মডেল আউট হস্তচালিত বা একটি স্বয়ংক্রিয় রুটিন হবে। সুতরাং, এই লোকগুলি উত্তরোত্তর পর্যায়ে মডেল নির্বাচনের কল করবে ।

yi=jmXijmβjm+εi,
jmjmm

এটি মেশিন লার্নিংয়ে লোকেরা যখন ভেরিয়েবলগুলি নিয়ে আসে তখন কীভাবে বৈশিষ্ট্য ইঞ্জিনিয়ারিং সম্পর্কে কথা বলে to আপনি বৈশিষ্ট্যগুলিকে লাসো বা অনুরূপ ফ্রেমওয়ার্কগুলিতে প্লাগ করুন যেখানে আপনি এই বৈশিষ্ট্যগুলি (ভেরিয়েবল) ব্যবহার করে একটি মডেল তৈরি করেন। এই প্রসঙ্গে ভেরিয়েবল নির্বাচনকে আলাদা একটি পদক্ষেপে আলাদা করার জন্য এটি একটি ধারণা তৈরি করে, কারণ আপনি অ্যালগরিদমকে ভেরিয়েবলগুলির জন্য সঠিক গুণফলগুলি বেছে নিতে দিয়েছিলেন এবং কোনও ভেরিয়েবলগুলি মুছে ফেলবেন না। আপনার রায় (যা পরিবর্তনশীল কোনও মডেল হিসাবে যায় সে সম্পর্কে) পরিবর্তনশীল নির্বাচনের পদক্ষেপে বিচ্ছিন্ন হয়, তারপরে বাকীটি ফিটনেস অ্যালগরিদম পর্যন্ত।

আপনি যে কাগজটি উদ্ধৃত করেছেন তার প্রসঙ্গে, এটি সমস্ত অপ্রাসঙ্গিক। কাগজটি বিভিন্ন মডেলের নির্দিষ্টকরণের মধ্যে নির্বাচন করতে বিআইসি বা এআইসি ব্যবহার করে। এই ক্ষেত্রে পৃথক পদক্ষেপ হিসাবে আপনার পরিবর্তনশীল নির্বাচন ছিল কিনা তা বিবেচ্য নয়। ভেরিয়েবলগুলি কোনও নির্দিষ্ট মডেলের স্পেসিফিকেশন , তারপরে আপনি সেরা বাছাই করার জন্য তাদের বিআইসি / এআইসির দিকে তাকান। তারা নমুনা আকার এবং ভেরিয়েবল সংখ্যা জন্য অ্যাকাউন্ট।m

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.