[একই উত্তর এখানে জিজ্ঞাসা করা হয়েছিল ]
আমি এল 1 নিয়মিতকরণ (লসো লজিস্টিক রিগ্রেশন) এর সাথে একটি লজিস্টিক রিগ্রেশন মডেল ফিট করেছি এবং আমি তাত্পর্যপূর্ণ জন্য ফিটেড সহগের পরীক্ষা করতে এবং তাদের পি-মান পেতে চাই। আমি জানি ওয়াল্ডের পরীক্ষাগুলি (উদাহরণস্বরূপ) নিয়মিতকরণ ছাড়াই সম্পূর্ণ সহনশীলতায় পৃথক সহগের তাত্পর্য পরীক্ষা করার একটি বিকল্প, তবে লাসোর সাথে আমার মনে হয় আরও সমস্যা দেখা দিয়েছে যা সাধারণত ওয়াল্ড সূত্র প্রয়োগ করতে দেয় না। উদাহরণস্বরূপ, পরীক্ষার জন্য জড়িত ভেরিয়েন্স অনুমানগুলি স্বাভাবিক অভিব্যক্তিগুলি অনুসরণ করে না। আসল লাসো পেপার
http://statweb.stanford.edu/~tibs/lasso/lasso.pdf
সহগের বৈকল্পিকগুলি অনুমান করার জন্য একটি বুটস্ট্র্যাপ-ভিত্তিক প্রক্রিয়া প্রস্তাব করে যা পরীক্ষার জন্য (আবার, আমি মনে করি) পরীক্ষার প্রয়োজন হতে পারে (বিভাগের ২.২, পৃষ্ঠা ২ 27২ এর শেষ অনুচ্ছেদ এবং ২3৩ এর শুরু):
একটা পদক্ষেপ বুটস্ট্র্যাপ মাধ্যমে হল: পারেন সংশোধন করা যেতে পারে বা আমরা ধরে নিখুত হতে পারে প্রতিটি বুটস্ট্র্যাপ নমুনা জন্য। ফিক্সিং সেরা উপসেটটি ( বৈশিষ্ট্যগুলির ) নির্বাচন করা এবং তারপরে সেই উপসেটের জন্য সর্বনিম্ন স্কোয়ারের স্ট্যান্ডার্ড ত্রুটি ব্যবহার করার সাথে সমান
আমি যা বুঝি তা হ'ল নিয়মিত প্যারামিটারের জন্য এটি সর্বোত্তম মান (এটি বুটস্ট্র্যাপের অংশ নয়) সন্ধান না করা পর্যন্ত পুরো ডেটাসেটের সাথে বারবার একটি লাসো রিগ্রেশন ফিট করুন এবং তারপরে লাস্টোর দ্বারা নির্বাচিত বৈশিষ্ট্যগুলিকে সাবমিরগুলিতে ওএলএস রেজিস্ট্রেশনগুলি ফিট করতে ব্যবহার করুন তথ্যগুলির মধ্যে এবং সেই সমস্তগুলির মধ্যে প্রতিটি থেকে বৈকল্পিকগুলি গণনা করার জন্য সাধারণ সূত্রগুলি প্রয়োগ করুন। (এবং তারপরে প্রতিটি সহগের চূড়ান্ত বৈকল্পিক প্রাক্কলন পাওয়ার জন্য প্রতিটি গুণকের এই সমস্ত বৈকল্পগুলির সাথে আমার কী করা উচিত?)
তদুপরি, সহগের লাসোর অনুমান এবং বুটস্ট্র্যাপ-আনুমানিক বৈকল্পগুলির সাথে যথাযথ তাত্পর্য পরীক্ষা (উদাহরণস্বরূপ ওয়াল্ডের পরীক্ষা যা অনুমান করা বিটা এবং রূপগুলি ব্যবহার করে) ব্যবহার করা কি সঠিক? আমি মোটামুটি নিশ্চিত যে এটি না, তবে যে কোনও সহায়তা (একটি ভিন্ন পরীক্ষা ব্যবহার করুন, আরও সোজাসাপ্টা পদ্ধতির ব্যবহার করুন, তলিয়ে যাওয়া ...) স্বাগত অপেক্ষা বেশি।
উত্তরগুলি অনুসারে এখানে আমি সন্দেহ করি অনুমান এবং পি-মানগুলি পাওয়া যায় না। আমার ক্ষেত্রে, পি-মানগুলি একটি বাহ্যিক প্রয়োজনীয়তা (যদিও এল 1 নিয়মিতকরণের ব্যবহার আমার পছন্দ ছিল)।
অনেক ধন্যবাদ
সম্পাদনা যদি লাসো লজিস্টিক রিগ্রেশনটির পূর্ববর্তী রান দ্বারা নির্বাচিত কেবলমাত্র ভেরিয়েবলগুলি ব্যবহার করে আমি কোনও ওএলএস লজিস্টিক রিগ্রেশন ফিট করি? স্পষ্টতই ( এখানে দেখুন ),
ক্রস-বৈধতা করার পরে আবার মডেল চালানোর দরকার নেই (আপনি কেবল cv.glmnet আউটপুট থেকে সহগুণ পাবেন) এবং বাস্তবে আপনি যদি নতুন লজিস্টিক রিগ্রেশন মডেলটিকে দন্ড ছাড়াই ফিট করেন তবে আপনি ব্যবহারের উদ্দেশ্যকে পরাস্ত করছেন ating ফাঁস-দড়ি
তবে আমি যদি ভেরিয়েবলের সংখ্যা কম রাখার সময় পি-ভ্যালু গণনা করতে সক্ষম হওয়ার একমাত্র উদ্দেশ্য নিয়ে এটি করি? এটা কি খুব নোংরা উপায়? :-)