কিভাবে সমর্থনযোগ্য এটা পছন্দ করে হয়


11

আমি যখন আমার ল্যাম্বদা ক্রস-বৈধতার মাধ্যমে নির্ধারণ করি তখন সমস্ত সহগ শূন্য হয়। তবে আমার কাছে সাহিত্যের কিছু ইঙ্গিত রয়েছে যে ভবিষ্যদ্বাণীকারীদের মধ্যে কিছু অবশ্যই ফলাফলটিকে প্রভাবিত করে। ল্যাম্বডাকে ইচ্ছামত বেছে নেওয়া কি জঞ্জাল যাতে একজনের ইচ্ছা মতো ততটুকু স্প্ররিস থাকে?

আমি কোনও কক্স মডেলের জন্য 135 এর মধ্যে শীর্ষ 10 বা তাই ভবিষ্যদ্বাণী নির্বাচন করতে চাই এবং দুর্ভাগ্যক্রমে প্রভাব আকারগুলি ছোট।


6
আপনার অ-ডেটা ভিত্তিক তথ্য থাকার কারণে আপনার মতো মনে হচ্ছে একটি তথ্যবহুল ব্যবহার করা উচিত।
সম্ভাব্যতাব্লোগিক

গভীরভাবে আমি অনুভব করছি যে এটি সঠিক হবে, দুর্ভাগ্যক্রমে আমার এখন পর্যন্ত এই কাজটি শুরু করার বিষয়ে এখনও পরিসংখ্যানগত দক্ষতার অভাব রয়েছে।
মিউরা

1
আপনি দুটি ভিন্ন জিনিসকে বিভ্রান্ত করে দেখায়: (1) সাহিত্য যদি আপনাকে নির্দিষ্ট ভবিষ্যদ্বাণী ব্যবহার করতে বলে, তবে সেগুলি সমস্ত মডেলে অন্তর্ভুক্ত করুন। (২) পরিবর্তে আপনি এটিকে পুনরায় ব্যাখ্যা করতে বলে মনে করছেন যে আপনাকে অনেক ভবিষ্যদ্বাণীকারীদের মধ্যে একটি নির্দিষ্ট সংখ্যা নির্বাচন করা উচিত , সেগুলি সাহিত্যে উল্লিখিত নির্দিষ্টগুলি অন্তর্ভুক্ত না করেই হোক। আপনি আসলে যা অর্জন করতে চাইছেন তা কি আপনি স্পষ্ট করে বলতে পারেন?
শুক্র

উত্তর:


4

p(βi)=λ2exp(λ|βi|),
λ

3

লাসো সম্পাদন করার জন্য একটি দুর্দান্ত উপায় রয়েছে তবে একটি নির্দিষ্ট সংখ্যক ভবিষ্যদ্বাণী ব্যবহার করুন। এটি ইফ্রনের কাগজে বর্ণিত সর্বনিম্ন কোণ রিগ্রেশন (এলএআর বা এলএআরএস)। পুনরাবৃত্তির প্রক্রিয়া চলাকালীন এটি বেশ কয়েকটি লিনিয়ার মডেল তৈরি করে, প্রতিটি নতুনের কাছে আরও একটি ভবিষ্যদ্বাণী থাকে, তাই আপনি পছন্দসই সংখ্যক ভবিষ্যদ্বাণী সহ একটি নির্বাচন করতে পারেন।

l1l2


3
যদিও লারস এবং লাসো নিবিড়ভাবে সম্পর্কিত, একটি নির্দিষ্ট সংখ্যক ভবিষ্যদ্বাণীকের জন্য, তারা এমনকি একই ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে পারে না। লাশোর জন্য একটি পেনাল্টি মান বেছে নিতে পারে যা পছন্দসই সংখ্যক ভবিষ্যদ্বাণী দেয়, তবে উভয় ক্ষেত্রেই পছন্দটি অনন্য হবে না! সুতরাং ওপি এখনও একটি সু-সংজ্ঞায়িত পদ্ধতি সরবরাহ করেনি, যা সমস্যার অংশ। লারসের জন্য, এখানে একটি দুর্দান্ত সুবিধা রয়েছে যে নির্দিষ্ট সংখ্যক ভবিষ্যদ্বাণীকারীদের দন্ডের মানগুলি একটি অন্তরাল গঠন করে, সুতরাং একটি সমাপ্তি (কোনটি?) বা মিডপয়েন্ট বা অন্য কোনও মানদণ্ড বাছাই করা কিছুটা সহজ।
মূল

1
হ্যাঁ, এটি সত্য যে ল্যারস এবং লাসো অভিন্ন নয়, লারস-ভিত্তিক কৌশলটি ব্যবহার করে লাসো সমাধানগুলি পাওয়ার জন্য মূল নিবন্ধে লেখকরা প্রস্তাবিত এলএআরএস-এর একটি সাধারণ পরিবর্তন চালু করা যেতে পারে।
আলেক্সি জায়টসেভ

হ্যাঁ, আলেক্সি, এটা সত্য। আমার ধারণা আমার মন্তব্যটি কেন প্রথম স্থানে এলএআরএসে স্থানান্তরিত হয় তার চারদিকে ঘোরে। একজন সাধারণত লাশোর জন্য পেনাল্টি প্যারামিটারের একটি মান চয়ন করতে পারে যা পছন্দসই সংখ্যক ভবিষ্যদ্বাণী লাভ করে। উদাসীন অবস্থায় থাকা মূল বিষয়টি হ'ল কোনও ব্যক্তিকে কীভাবে অনন্য নির্বাচন করতে হবে এবং ওপি'র ক্ষেত্রে কী কী পরিণতি হতে পারে। :)
কার্ডিনাল

2

|S|=|{j:βj0}|β|S|2p|S|(p|S|) মডেল, যা অনেক কম।

লাসোর তত্ত্বটি নিয়মিতকরণের পরামিতি- পর্যাপ্ত পরিমাণে নির্ভর করে যাতে নির্বাচিত মডেলটিকে পর্যাপ্ত পরিমাণে ছড়িয়ে যায়। এটি হতে পারে যে আপনার 10 টি বৈশিষ্ট্য খুব বেশি বা খুব কম, যেহেতু নীচে একটি উপরের পরিণত করা তুচ্ছ নয়।λ | এস |λλ|S|

যাক জন্য আমাদের তথ্য চালিত অনুমান হতে , এবং করা । তারপরে, সম্ভবত আপনি এটি নিশ্চিত করার চেষ্টা করছেন যে 've যাতে আপনি অন্তত প্রাসঙ্গিক বৈশিষ্ট্যগুলি পুনরুদ্ধার করেছেন? অথবা হতে পারে আপনি সেই establish প্রতিষ্ঠার চেষ্টা করছেন যাতে আপনি জানতে পারেন যে আপনি যে বৈশিষ্ট্যগুলি পেয়েছেন সেগুলি সার্থক? এই ক্ষেত্রে, আপনার পদ্ধতিটি এর আপেক্ষিক মাপের পূর্বের তথ্য থাকলে আপনার পদ্ধতি আরও ন্যায়সঙ্গত হবে । বিটা * এস ={β^βএস* এস এসএস*এস*S^={j:β^j0}SS^S^SS

এছাড়াও, নোট করুন, উদাহরণস্বরূপ, লাসো সঞ্চালনের সময় আপনি কিছু সহগকে আনপেনালাইজড রেখে যেতে পারেন glmnet

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.