আমরা যদি কেবলমাত্র পূর্বাভাস বা ভবিষ্যদ্বাণীতে না হয়ে মডেল প্যারামিটারগুলি অনুমান করতে (এবং ব্যাখ্যা করতে) আগ্রহী তবেই নিয়মিতকরণ কার্যকর হতে পারে?
আমি লক্ষ্য করি যে যদি আপনার লক্ষ্যটি নতুন ডেটাতে ভাল পূর্বাভাস দেওয়া হয় তবে নিয়মিতকরণ / ক্রস-বৈধকরণ কীভাবে চূড়ান্ত কার্যকর। তবে আপনি যদি traditionalতিহ্যবাহী অর্থনীতি করছেন এবং আপনার যত্ন নেওয়া সমস্তই ? অনুমান করছে ? ক্রস-বৈধকরণ কি সেই প্রসঙ্গে কার্যকর হতে পারে? আমি যে ধারণাগত অসুবিধার সাথে লড়াই করছি তা হ'ল আমরা পরীক্ষার তথ্যগুলিতে গণনা করতে পারি তবে আমরা কখনই ম্যাথ্যাক্যাল কারণ সত্য কখনও সংজ্ঞা অনুসারে হয় না observed (এই ধারণাটি গ্রহণ করুন যে এমনকি সত্য- , অর্থাত আমরা যে মডেলগুলি থেকে ডেটা তৈরি হয়েছিল তার পরিবারকে আমরা জানি))এল ( ওয়াই , ওয়াই ) এল ( β , β ) β β
মনে করুন আপনার ক্ষতি । আপনি একটি পক্ষপাতিত্ব-বৈকল্পিক ব্যবসায়ের মুখোমুখি, তাই না? সুতরাং, তত্ত্বগতভাবে, আপনি কিছু নিয়মিতকরণ করা থেকে ভাল হতে পারে। তবে কীভাবে আপনি আপনার নিয়মিতকরণের পরামিতিটি নির্বাচন করতে পারেন?
সহগ \ বিটা \ সমতুল্য (\ বিটা_1, \ বিটা_2, \ এলডটস, \ বিটা_ কে) সহ লিনিয়ার রিগ্রেশন মডেলের একটি সাধারণ সংখ্যাসূচক উদাহরণটি দেখে আমি খুশি হব , যেখানে গবেষকের ক্ষতির ফাংশন যেমন , বা এমনকি । কীভাবে, বাস্তবে, কেউ উদাহরণগুলিতে প্রত্যাশিত ক্ষতির উন্নতি করতে ক্রস-বৈধতা ব্যবহার করতে পারে?
সম্পাদনা : ডি জনসন আমাকে https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf- এ নির্দেশ করেছেন , যা এই প্রশ্নের সাথে সম্পর্কিত। লেখকরা তা লিখেন
মেশিন লার্নিং কৌশলগুলি ... \ টুপি {ওয়াই pred পূর্বাভাসের জন্য একটি শৃঙ্খলাবদ্ধ উপায় সরবরাহ করে যা (i) পক্ষপাত-বৈকল্পিক বাণিজ্য কীভাবে করা যায় তা সিদ্ধান্ত নেওয়ার জন্য ডেটা নিজেই ব্যবহার করে এবং (ii) খুব সমৃদ্ধ সংস্থার উপর অনুসন্ধানের অনুমতি দেয় ভেরিয়েবল এবং ক্রিয়ামূলক ফর্ম। কিন্তু সবকিছু ব্যয়ে আসে: এক সবসময় মনে রাখা উচিত যে, কারণ তারা জন্য অপেক্ষায় হয় তারা না (অন্যান্য অনেক অনুমানের ছাড়া) খুব দরকারী গ্যারান্টী জন্য দিতে ।
আরেকটি প্রাসঙ্গিক কাগজ, আবার ডি জনসনকে ধন্যবাদ: http://arxiv.org/pdf/1504.01132v3.pdf । এই কাগজটি উপরে যে প্রশ্নটি সহ আমি লড়াই করেছিলাম তার ঠিকানা দেয়:
একটি ... কার্যকারিতা অনুক্রমের সমস্যার বাইরে অফ শেল্ফ অফ রিগ্রেশন ট্রি হিসাবে মেশিন লার্নিং পদ্ধতির প্রয়োগের মৌলিক চ্যালেঞ্জ হ'ল ক্রস-বৈধতার ভিত্তিতে নিয়মিতকরণের পদ্ধতিগুলি সাধারণত "স্থল সত্য" পর্যবেক্ষণের উপর নির্ভর করে যা প্রকৃত ফলাফলগুলি একটি ক্রস-বৈধতা নমুনায়। তবে, যদি আমাদের লক্ষ্য চিকিত্সার প্রভাবগুলির গড় স্কোয়ার ত্রুটিটি হ্রাস করা হয়, তবে আমরা [11] "কার্যকারিক অনুক্রমের মৌলিক সমস্যা" বলে অভিহিত করেছি: কার্যকারিতা কোনও পৃথক ইউনিটের জন্য পরিলক্ষিত হয় না, এবং তাই আমরা সরাসরি করি না একটি স্থল সত্য আছে। আমরা চিকিত্সার কার্যকারণ কার্যকারণের গড়-স্কোয়ার ত্রুটির পক্ষপাতহীন প্রাক্কলন তৈরির জন্য পদ্ধতির প্রস্তাবের মাধ্যমে এটিকে সম্বোধন করি।