লিনিয়ার রিগ্রেশন জন্য ভবিষ্যদ্বাণীকারীদের সেরা উপসেট গণনা করা


9

উপযুক্ত ভবিষ্যদ্বাণীকারীদের সাথে মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন মধ্যে ভবিষ্যদ্বাণীকারীদের নির্বাচনের জন্য , সমস্ত সাবসেটগুলি স্পষ্টভাবে পরীক্ষা না করে ভবিষ্যদ্বাণীকারীদের একটি 'সর্বোত্তম' উপসেট খুঁজে পেতে কোন পদ্ধতিগুলি পাওয়া যায় ? 'ফলিত বেঁচে থাকার বিশ্লেষণে' হোস্টার ও লেমশো কুকের পদ্ধতির বিষয়ে উল্লেখ করেছেন তবে আমি মূল কাগজটি খুঁজে পাই না। এই পদ্ধতিটি, বা আরও উন্নততর আরও আধুনিক কৌশলটি কি কেউ বর্ণনা করতে পারবেন? কেউ সাধারণত বিতরণ ত্রুটিগুলি ধরে নিতে পারে।p2p


1
আপনি কি নিম্নলিখিত কাগজটি উল্লেখ করছেন? কুক, এওয়াইসি (1984) একটি আনুপাতিক বিপদ মডেলগুলিতে সমস্ত সাবসেটের রিগ্রেশন। বায়োমেট্রিকা, 71, 587-592
সিএল

হ্যাঁ আমার মনে হয় আমাকে কোনওভাবে কাগজটি খনন করতে হবে। যদিও এটি পুরানো মনে হচ্ছে।
shabbychef

2
এর মধ্যে এই নিবন্ধটি সন্ধান করুন, তিবশিরানী (স্টাট। মেড। 1997: 16: 385-395), j.mp/bw0mB9 থেকে কক্স মডেলটিতে চলক নির্বাচনের জন্য লাসো পদ্ধতিটি । আছে HTH
chl

1
এবং এটি আরও সাম্প্রতিক এক ( penalizedআর প্যাকেজের সাথে ঘনিষ্ঠভাবে সংযুক্ত ), j.mp/cooIT3 । সম্ভবত এটিও, j.mp/bkDQUj । চিয়ার্স
chl

উত্তর:


12

আমি কুকের পদ্ধতিটি কখনও শুনিনি, তবে আজকের আলোচ্য বিষয়টি এল 1 হ্রাসকরণ is যুক্তিযুক্ত কারণ আপনি যদি রিগ্রেশন সহগের নিখুঁত মানের একটি পেনাল্টি শব্দটি ব্যবহার করেন তবে গুরুত্বহীন বিষয়গুলি শূন্যের দিকে চলে যাওয়া উচিত।

এই কৌশলগুলির কিছু মজার নাম রয়েছে: লাসো, লারস, ড্যান্টজিগ নির্বাচক। আপনি কাগজপত্রগুলি পড়তে পারেন, তবে শুরু করার জন্য একটি ভাল জায়গা হ'ল এলিমেন্টস স্ট্যাটিস্টিকাল লার্নিং , অধ্যায় 3।


2
বিটিডাব্লু , দণ্ডিত আর প্যাকেজ ( j.mp/bdQ0Rp ) জেনারালাইজড লিনিয়ার এবং কক্স মডেলগুলির জন্য l1 / l2 দন্ডিত অনুমান অন্তর্ভুক্ত করে।
chl

মতলব জমিতে আটকে
গিয়েছি

LARS দুর্দান্ত, বিটিডাব্লু। খুব দুর্দান্ত জিনিস। আমি কীভাবে এটি কক্স
প্রপেনশনাল

2
গ্ল্যামনেট সফ্টওয়্যারটিতে একটি লসোডড কক্স পিএইচ মডেল রয়েছে: cran.r-project.org/web/packages/glmnet/index.html একটি ম্যাটল্যাব সংস্করণ রয়েছে (এটি নিশ্চিত না যদিও এটি একটি কক্স মডেল করে কিনা): www-stat .stanford.edu / ib tibs / glmnet-matlab
সাইমন বায়ার্ন

3

এটি একটি বিশাল বিষয়। পূর্বে উল্লিখিত হিসাবে, হাসিটি, তিবশিরানী এবং ফ্রেডম্যান স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদানগুলির Ch3 এ একটি ভাল পরিচয় দেয়।

কয়েকটি পয়েন্ট। 1) "সেরা" বা "অনুকূল" বলতে কী বোঝ? এক অর্থে যা সর্বোত্তম তা অন্য কোনও ক্ষেত্রে সেরা নাও হতে পারে। দুটি সাধারণ মানদণ্ড হ'ল ভবিষ্যদ্বাণীমূলক যথার্থতা (ফলাফলের পরিবর্তনশীলটির পূর্বাভাস দেওয়া) এবং সহগের নিরপেক্ষ अनुमानক উত্পাদন করা। কিছু পদ্ধতি যেমন লাসো এবং রিজ রিগ্রেশন অনিবার্যভাবে পক্ষপাতদুষ্ট গুণফলের অনুমানকারী উত্পাদন করে।

2) "সেরা সাবসেটস" শব্দটি নিজেই দুটি পৃথক ইন্দ্রিয়তে ব্যবহার করা যেতে পারে। সাধারণত সমস্ত ভবিষ্যদ্বাণীকারীদের মধ্যে সেরা উপসেটটি উল্লেখ করা যা কিছু মডেল বিল্ডিংয়ের মানদণ্ডকে অনুকূল করে। আরও সুনির্দিষ্টভাবে এটি ফার্নিভাল এবং উইলসনের দক্ষ অ্যালগরিদমকে উল্লেখ করতে পারে যে মাঝারি (~ 50) সংখ্যক রৈখিক ভবিষ্যদ্বাণী (লিপস এবং বাউন্ডস দ্বারা রেজিস্ট্রেশনসমূহ। টেকনোমেট্রিক্স, খণ্ড। 16, নং 4 (নভেম্বর, 1974), পিপি-র মধ্যে সেই উপসেটটি খুঁজে পাওয়ার জন্য) 499-51)

http://www.jstor.org/stable/1267601


1) হ্যাঁ, প্রশ্নটি কিছুটা অস্পষ্ট; যেমনটি আপনি উল্লেখ করেছেন, 'অনুকূল' এর অনেক সংজ্ঞা রয়েছে: তথ্য মাপদণ্ড, ক্রস বৈধকরণ ইত্যাদির মাধ্যমে, আমি যে সমস্যাবাদী সমস্যাটি দেখেছি তার বেশিরভাগ ধাপে ধাপে পূর্বাভাসকারী সংযোজন / অপসারণ: একক পাস ফরোয়ার্ড সংযোজন বা বিয়োগ ইত্যাদি ইত্যাদি proceed যাইহোক, হোসমার এবং লেমশো এই পদ্ধতির (ললেস অ্যান্ড সিংহলের কাজের বিভিন্ন রূপ) উল্লেখ করে, যা কোনওভাবে 'ম্যাজিক্যালি' এমএলআরের একক গণনা দ্বারা ভবিষ্যদ্বাণীকে নির্বাচিত করে (কিছু অন্যান্য স্টাডিয়াকে মডুলো করে)। আমি এই পদ্ধতিটি সম্পর্কে খুব কৌতূহলী ...
shabbychef

0

আমি যা শিখেছি যে প্রথমে সেরা সাবসেট পদ্ধতির স্ক্রিনিং সরঞ্জাম হিসাবে ব্যবহার করি, তারপরে ধাপে ধাপে নির্বাচন পদ্ধতি আপনাকে শেষ পর্যন্ত কোন মডেল সেরা উপসেট মডেল হতে পারে তা সিদ্ধান্ত নিতে সহায়তা করে (এই মুহুর্তে এই মডেলগুলির সংখ্যা হ্যান্ডেল করার জন্য বেশ ছোট)। যদি কোনও মডেল মডেলের শর্তগুলি পূরণ করে, ডেটাতে প্রবণতার সংক্ষিপ্তসার করার জন্য একটি ভাল কাজ করে এবং সর্বাধিক গুরুত্বপূর্ণভাবে আপনাকে আপনার গবেষণার প্রশ্নের উত্তর দেওয়ার অনুমতি দেয়, তবে আপনার কাজটি সংহত করে।


1
আমি মনে করি আপনি এটি ভ্রষ্ট করতে পারেন। সেরা উপগ্রহগুলি ধাপে ধাপের চেয়ে আরও বেশি গণনামূলকভাবে ব্যয়বহুল, তবে প্রয়োজনীয়ভাবে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে বাড়িয়ে দেয় এমন কিছু হয়, তাই আপনি স্ক্রিনে এবং পরে সর্বোত্তম উপগ্রহগুলির জন্য ধাপের দিকটি ব্যবহার করবেন। এফডব্লিউআইডাব্লু, আমি এই কৌশলগুলির নিখুঁত ব্যবহারের সাথে দ্বিমত পোষণ করছি না কারণ কারণে আমি আমার উত্তরে এখানে আলোচনা করছি: স্বয়ংক্রিয় মডেল নির্বাচনের জন্য অ্যালগরিদম
গাং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.