পরিবর্তনশীল নির্বাচনের জন্য লাসো ব্যবহারের পরে অনুমান ference


17

আমি তুলনামূলকভাবে কম মাত্রিক সেটিং (এন >> পি) এ বৈশিষ্ট্য নির্বাচনের জন্য লাসো ব্যবহার করছি। লাসোর একটি মডেল ফিট করার পরে, আমি কোনও জরিমানা ছাড়াই কোনও মডেল ফিট করতে ননজারো সহগ সহ কোভেরিয়েটগুলি ব্যবহার করতে চাই। আমি এটি করছি কারণ আমি নিরপেক্ষ অনুমান করতে চাই যা লাসো আমাকে দিতে পারে না। আমি নিরপেক্ষ অনুমানের জন্য পি-মান এবং আত্মবিশ্বাসের অন্তরগুলিও চাই।

এই বিষয়টিতে সাহিত্য খুঁজতে আমার সমস্যা হচ্ছে। আমি যে সাহিত্যের সর্বাধিক সন্ধান পাই তা হ'ল লাশোর অনুমানের উপর আত্মবিশ্বাসের অন্তর স্থাপন সম্পর্কে, কোনও প্রতিস্থাপনের মডেল নয়।

আমি যা পড়েছি তা থেকে পুরো ডেটাসেটটি ব্যবহার করে কেবল কোনও মডেলকে রিফাইটিং করা অবাস্তবভাবে ছোট পি-মান / স্টাডি ত্রুটির দিকে পরিচালিত করে। এই মুহুর্তে, নমুনা বিভাজন (ওয়াসারম্যান এবং রোডার (2014) বা মিনশাউসেন এট আল। (২০০৯) এর স্টাইলে মনে হচ্ছে এটি একটি দুর্দান্ত ক্রিয়া বলে মনে হচ্ছে, তবে আমি আরও পরামর্শের সন্ধান করছি।

কেউ কি এই সমস্যার মুখোমুখি হয়েছেন? যদি তা হয় তবে আপনি দয়া করে কিছু পরামর্শ দিতে পারেন।


আমি বুঝতে পারছি না যে লসো অনুমানকারী যতক্ষণ আস্থার অন্তরগুলি (কমপক্ষে অ্যাসেম্পোটোটিকভাবে) সঠিক কভারেজের ক্ষেত্রে যথাযথ কভারেজ দেয় ততক্ষণ পক্ষপাতিত্ব করা উচিত। আপনি কি লাসোর দ্বারা পুনরুদ্ধার করা সহায়তায় ওএলএসের অনুমানের ফিট করতে চান এই কারণটি?
ব্যবহারকারী795305

সম্ভবত আমি যা পড়েছি তা ভুল বুঝেছি, তবে কী asympototically সঠিক কভারেজটি পক্ষপাতদুষ্ট অনুমানকে বোঝায় না, প্রকৃত বিরল-কিন্তু-পক্ষপাতহীন অনুমান নয়?
এলি

1
"সত্যিকারের অপ্রতুল-তবে-পক্ষপাতহীন" অনুমানের দ্বারা আপনি কী বোঝেন তা আমি নিশ্চিত নই, তবে যদি আপনি জানেন যে লসোর অনুমানের সাথে asympototically সঠিক কভারেজের সাথে আত্মবিশ্বাসের অন্তর রয়েছে, আরও কিছু করার দরকার নেই। গ্রীনপারকার (+1) দ্বারা স্রেফ লিঙ্কযুক্ত কাগজটি একটি সত্যিই আকর্ষণীয় (এবং আমি এই বিষয়ে আমার কাছে জানা সবচেয়ে সাম্প্রতিক একটি) যা আপনি কীভাবে লাসোতে তত্পরতার সাথে সঠিকভাবে আত্মবিশ্বাসের ব্যবধান বিকাশ করতে পারবেন তা নিয়ে আলোচনা করে (অংশে) co সহগ ients আমি এটি উল্লেখ করার চেষ্টা করছি যে পক্ষপাতহীন সহগগুলি পাওয়ার জন্য আপনাকে ওএলএস ফিট করার দরকার নেই, কারণ নিরপেক্ষতা কোনও বিষয় নয়।
ব্যবহারকারী795305

আমি মনে করি আমি ভুল বুঝেছি। আপনি যে অ্যাসিম্পোটোটিক্যালি সঠিক কভারেজটি উল্লেখ করছেন তা হ'ল সত্য প্যারামিটারের ক্ষেত্রে। সুতরাং লাসো পক্ষপাতদুষ্ট সহগগুলি দিলেও, আমরা আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করতে পারি যার সত্য প্যারামিটারের জন্য সঠিক কভারেজ রয়েছে?
এলিক

2
আপনি কোনও মডেল বাছাই করেছেন, লাসো ব্যতীত আপনি যদি অনুমান করেন তবে আপনার আনসুমিত অনুমান হবে না। সিলেক্ট-ভেরিয়েবল-তারপরে-ফিট-হয়ে-ওএলএস-এর পরে মডেলের শর্তগুলির সহগগুলি আসলে 0 থেকে দূরে থাকবে (পরিবর্তনশীল নির্বাচনের অন্যান্য ফর্মের মতো)। অল্প পরিমাণে সংকোচন আসলে পক্ষপাতিত্ব হ্রাস করতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


12

পূর্বের প্রতিক্রিয়াগুলিতে যুক্ত করতে। আপনার অবশ্যই তিবশিরানী এবং সহকর্মীদের সাম্প্রতিক কাজটি পরীক্ষা করা উচিত। তারা লসো-টাইপ পদ্ধতির জন্য সিলেকশন-সংশোধন পি-ভ্যালু এবং আত্মবিশ্বাসের ব্যবধানগুলি অনুমিত করার জন্য একটি কঠোর কাঠামো তৈরি করেছে এবং একটি আর-প্যাকেজ সরবরাহ করে।

দেখা:

লি, জেসন ডি, ইত্যাদি। "লাসোতে প্রয়োগের সাথে যথাযথ পোস্ট-নির্বাচন অনুমান।" পরিসংখ্যানগুলির অ্যানালস 44.3 (2016): 907-927। ( https://projecteuclid.org/euclid.aos/1460381681 )

টেলর, জনাথন এবং রবার্ট জে টিবশিরানী। "পরিসংখ্যানগত পড়াশোনা এবং নির্বাচনী অনুমান"। জাতীয় বিজ্ঞান একাডেমির কার্যক্রম 112.25 (2015): 7629-7634।

আর-প্যাকেজ:

https://cran.r-project.org/web/packages/selectiveInference/index.html


17

সাধারণত, লাসোর মাধ্যমে পরিবর্তনশীল নির্বাচন করার পরে কোনও জরিমানা ব্যবহার না করে পুনরায় ফিরিয়ে আনা "প্রতারণা" হিসাবে বিবেচিত হয় যেহেতু আপনি ইতিমধ্যে ডেটা দেখেছেন এবং ফলিত পি-মান এবং আত্মবিশ্বাসের বিরতি স্বাভাবিক অর্থে বৈধ নয়।

p

লাসোর দ্বারা নির্বাচিত ভেরিয়েবলগুলির সেট হ'ল উচ্চ সম্ভাবনার সাথে ডিটারিমেন্টিক এবং অ ডেটা নির্ভর।

সুতরাং, দুবার ডেটাতে উঁকি দেওয়া কোনও সমস্যা নয়। আপনার সমস্যার জন্য কাগজ হোল্ডে বর্ণিত শর্তগুলি আছে কিনা তা আপনাকে দেখতে হবে।

(কাগজটিতেও প্রচুর দরকারী রেফারেন্স রয়েছে)


রেফারেন্স:

ঝাও, এস।, শোজাই, এ।, এবং উইটেন, ডি (2017)। অনিবার্য প্রতিরক্ষার ক্ষেত্রে: উচ্চ-মাত্রিক অনুমানের জন্য একটি খুব নির্বোধ পন্থা। থেকে প্রাপ্ত: https://arxiv.org/pdf/1705.05543.pdf


9
+1 টি এটি এর মূল্য, তা সত্ত্বেও, লেখক স্পষ্টভাবে না হয় না "আমরা প্রয়োগ করা হচ্ছে ... পদ্ধতির সবচেয়ে বাস্তব তথ্য বিশ্লেষণ সেটিংসে উপরে বর্ণিত প্রচার না:: আমরা আত্মবিশ্বাসী" খুব অত্যধিক ডেটা সেটিংসে "ব্যতীত তাদের পদ্ধতির সুপারিশ যে বাস্তবে ... নমুনার আকার ছোট বা মাঝারি হলে এই পদ্ধতিটি খারাপভাবে সম্পাদন করবে এবং / অথবা অনুমানগুলি পূরণ হয় না "(পৃষ্ঠা ২ 27 তে)। রেকর্ডের জন্য, এই কাগজটি ঝাও, শোজাই এবং উইটেন, ইন ডিফেন্স অফ দ্য ইনডিফেসেবল: হাই ডাইমেনশনাল ইনফারেন্সের (16 মে 2017) একটি খুব নিখুঁত পন্থা
whuber

@ হুবার এবং এই কাগজটি আর্ক্সiv.org-এও মনে রাখবেন - নিশ্চিত নয় যে এটি পিয়ার-রিভিউ করা হয়েছে কিনা তাই লেখকের পদ্ধতি পদ্ধতিতে অন্যান্য সমস্যা থাকতে পারে।
রবার্টএফ

0

আমি অর্ডোগোনাল / ডাবল মেশিন লার্নিং সাহিত্য থেকে কিছু কাগজপত্র যুক্ত করতে চেয়েছিলাম যা ফলিত একনোমেট্রিক্স সাহিত্যে জনপ্রিয় হয়ে উঠছে।

  • বেলোনি, আলেকজান্দ্রে, ভিক্টর চেরনোজুকভ এবং খ্রিস্টান হ্যানসেন। "উচ্চ-মাত্রিক নিয়ন্ত্রণগুলির মধ্যে নির্বাচনের পরে চিকিত্সার প্রভাবগুলির উপর গুরুত্ব।" অর্থনৈতিক স্টাডিজের পর্যালোচনা 81.2 (2014): 608-650।

    এই কাগজটিতে লাসো ব্যবহার করে "অন্যান্য" নিয়ন্ত্রণগুলি নির্বাচন করার পরে কোনও ভেরিয়েবলের প্রভাবের একটি ওএলএস অনুমানের তাত্ত্বিক বৈশিষ্ট্যগুলিকে সম্বোধন করে।

  • ভিক্টর চেরনোজুকভ, ডেনিস চেতেরিকভ, মের্ট ডেমায়ারার, এথার ডুফ্লো, ক্রিশ্চান হ্যানসেন, হুইটনি নেভি, জেমস রবিনস, চিকিত্সা এবং কাঠামোগত পরামিতিগুলির জন্য ডাবল / ডিবিয়াসড মেশিন লার্নিং, দ্য ইকোনোমেট্রিক্স জার্নাল, খণ্ড 21, সংখ্যা 1, 1 ফেব্রুয়ারী 2018, পৃষ্ঠা C1 – C68 , https://doi.org/10.1111/ectj.12097

    এটি একটি উচ্চ-মাত্রিক উপদ্রব পরামিতি (কনফাউন্ডার্স) এর জন্য অ-রৈখিক নিয়ন্ত্রণের জন্য নন-প্যারাম্যাট্রিক পদ্ধতিগুলি (এমএল অ্যালগরিদম) ব্যবহার করার জন্য বিস্তৃত তত্ত্বটি বিকাশ করে এবং তারপরে ফলাফলের উপর নির্দিষ্ট কোভেরিয়েটের প্রভাব অধ্যয়ন করে। তারা আংশিক-লিনিয়ার ফ্রেমওয়ার্ক এবং সম্পূর্ণ প্যারামেট্রিক ফ্রেমওয়ার্কগুলি নিয়ে কাজ করে। তারা এমন পরিস্থিতিতেও বিবেচনা করে যেখানে আগ্রহের পরিবর্তনশীল বিভ্রান্ত হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.