ইলাস্টিক নেট সম্পর্কিত বিভ্রান্তি


10

আমি ইলাস্টিক নেট সম্পর্কিত এই নিবন্ধটি পড়ছিলাম। তারা বলে যে তারা স্থিতিস্থাপক নেট ব্যবহার করে কারণ আমরা কেবল লাসো ব্যবহার করলে এটি ভবিষ্যতবাণীকারীদের মধ্যে কেবলমাত্র একটি ভবিষ্যদ্বাণীকে বেছে নিয়েছে যা অত্যন্ত সম্পর্কিত corre তবে আমরা যা চাই এটি তা নয়। আমি বোঝাতে চাইছি এটি বহুবিশ্বের সমস্যা থেকে আমাদের বাঁচায় এটি তা নয়।

কোন পরামর্শ / ব্যাখ্যা?

উত্তর:


11

ধরুন, দুটি ভবিষ্যদ্বাণীকারী প্রতিক্রিয়াটির উপর শক্তিশালী প্রভাব ফেলেছে তবে আপনি যে মডেলটি থেকে আপনার মডেলটি তৈরি করেন তার মধ্যে খুব বেশি সম্পর্কযুক্ত। আপনি যদি মডেলটি থেকে একটি ড্রপ করেন তবে এটি অনুরূপ জনসংখ্যার নমুনাগুলির জন্য ভাল ভবিষ্যদ্বাণী করবে না যেখানে ভবিষ্যদ্বাণীকারীরা খুব বেশি সম্পর্কযুক্ত নয়।

যদি আপনি বহুগুণরেখার উপস্থিতিতে আপনার গুণাগুণ অনুমানের নির্ভুলতাটি উন্নত করতে চান তবে আপনাকে কিছুটা পক্ষপাতিত্ব উপস্থাপন করতে হবে, এটি বৈষম্যের আরও বড় হ্রাস দ্বারা সেট করে। একটি উপায় হ'ল প্রাসঙ্গিকদের পুরোপুরি সরিয়ে SS ল্যাসো দিয়ে, বা, পুরানো দিনগুলিতে, ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে ধাপে বাড়ানোর পদ্ধতিটি যা পুরোপুরি শোনায় — আরেকটি হ'ল রিজ রিগ্রেশন বা পুরানো দিনগুলিতে প্রথম কয়েকটি মূল উপাদানগুলিতে রিগ্রেশন করে সমস্ত অনুমানকে কিছুটা বাইজ করে। পূর্ববর্তীটির একটি অসুবিধা হ'ল এটি খুব অনিরাপদ যদি মডেলটি মূল নমুনায় ঘটেছিল তাদের থেকে দূরে ভবিষ্যদ্বাণীমূলক নিদর্শনগুলির জন্য প্রতিক্রিয়াগুলির পূর্বাভাস দেওয়ার জন্য ব্যবহার করা হত, কারণ ভবিষ্যদ্বাণীকারীরা কেবলমাত্র অন্যদের সাথে একসাথে বেশি ব্যবহার না করায় তারা বাদ পড়ে যায় , প্রায় কলিনারি, ভবিষ্যদ্বাণীকারী। (যে এক্সট্রাপোলেশন সর্বদা সম্পূর্ণ নিরাপদ নয়)) ইলাস্টিক নেটটি দুটি ব্যবহারকারীর মিশ্রণ হিসাবে @ ব্যবহারকারী 12436 ব্যাখ্যা করেছেন, এবং মডেলটিতে সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারীদের গোষ্ঠী রাখার প্রবণতা রয়েছে।


কেন এটি নতুন এই নমুনায় ভাল পূর্বাভাস দেবে না?
ব্যবহারকারী31820

1
কারণ মডেলটির একটি গুরুত্বপূর্ণ ভবিষ্যদ্বাণী অনুপস্থিত।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
দুটি জন ভবিষ্যদ্বাণীকারী জনগোষ্ঠীর একটি প্রতিনিধির নমুনায় পারস্পরিক সম্পর্কযুক্ত হলে, তাদের কি অন্য নমুনায় সহযোগিতা করা উচিত নয়? যদি আপনি ডেটাতে এমন কোনও মডেল ব্যবহার করেন যা "মূল নমুনায় উপস্থিত থেকে দূরে থাকে", তবে এটি কোনও মডেলের সীমান্ত অবৈধ ব্যবহার নয়?
ম্যাথু ড্রুরি

@ ম্যাথড্রুরি: ঠিক আছে যদি মডেলের "সঠিক" - যদি বিরক্ত করার মতো কোনও অরক্ষিত কনফন্ডার নেই, এবং যদি কার্যকরী ফর্মটি বহির্মুখী হয় - তবে নমুনায় ভবিষ্যদ্বাণীকারীদের বিতরণে কিছু আসে যায় না (অবশ্যই এটি যথার্থতা নির্ধারণ করে অনুমান এবং পূর্বাভাস)। সুতরাং এক চূড়ান্ত আপনার কার্যকারণ সংক্রান্ত কারণগুলির উপর একটি সু-নিয়ন্ত্রিত পরীক্ষামূলক গবেষণা থেকে ডেটা তৈরির জন্য একটি যান্ত্রিক মডেল থাকতে পারে; অন্যটিতে পরিমাপের জন্য নিখুঁত সহজ যা ভেরিয়েবলগুলির একগুচ্ছ উপর একটি পর্যবেক্ষণ গবেষণা থেকে সংগৃহীত ডেটা উপর নির্মিত একটি অভিজ্ঞতামূলক মডেল।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

এই বাক্যটি : " পুরানো দিনগুলিতে,
ধাপের ধাপের

4

তবে আমরা যা চাই এটি তা নয়। আমি বোঝাতে চাইছি এটি বহুবিশ্বের সমস্যা থেকে আমাদের বাঁচায় তাই নয়।

হ্যাঁ! এবং না. ইলাস্টিক নেট হ'ল নিয়মিতকরণের দুটি কৌশল, এল 2 নিয়মিতকরণ (রিজ রিগ্রেশন ব্যবহৃত হয়) এবং এল 1 নিয়মিতকরণ (ল্যাসোতে ব্যবহৃত) এর সংমিশ্রণ।

লাসো প্রাকৃতিকভাবে বিরল মডেল উত্পাদন করে, অর্থাৎ বেশিরভাগ ভেরিয়েবল সহগকে 0-এ সঙ্কুচিত করা হবে এবং কার্যকরভাবে মডেল থেকে বাদ দেওয়া হবে। সুতরাং কমপক্ষে উল্লেখযোগ্য ভেরিয়েবলগুলি সঙ্কুচিত হয়ে যায়, অন্যগুলি সঙ্কুচিত করার আগে, রিজের মতো নয়, যেখানে সমস্ত ভেরিয়েবল সঙ্কুচিত হয়, তবে সেগুলির কোনওটিই 0 তে সঙ্কুচিত হয় না।

ইলাস্টিক নেট এই উভয় পদ্ধতির একটি লিনিয়ার সংমিশ্রণ ব্যবহার করে। পদ্ধতিটি নিয়ে আলোচনার সময় হাসটি যে নির্দিষ্ট ক্ষেত্রে উল্লেখ করেছিলেন তা বড় পি, ছোট এন এর ক্ষেত্রে হয়েছিল। যার অর্থ: তুলনামূলকভাবে কয়েকটি পর্যবেক্ষণ সহ উচ্চ মাত্রিক ডেটা। এই ক্ষেত্রে লাসো কেবলমাত্র সর্বদা n ভেরিয়েবল নির্বাচন করবে, বাকি সমস্তগুলি মুছে ফেলার সময়, হোস্টির কাগজটি দেখুন

এটি সর্বদা আসল ডেটাসেটের উপর নির্ভর করবে, তবে আপনি ভালভাবে ধারণা করতে পারেন যে আপনি সবসময় আপনার মডেলগুলির ভেরিয়েবলের সংখ্যার উপরের সীমাটি আপনার পর্যবেক্ষণের সংখ্যার চেয়ে সমান বা তার চেয়ে কম রাখতে চান না।


তবে মাল্টিকোলাইনারিটির কী? ইলাস্টিক নেট মাল্টি কোলাইনারি বৈশিষ্ট্যগুলি নির্বাচন করতে দেয় যা ভাল না?
user31820

আমি মনে করি না যে অনেকগুলি বাস্তব ডেটাসেটে পুরোপুরি মাল্টিকল্লিনিয়ার ভেরিয়েবল রয়েছে। উচ্চ সম্পর্কের সাথে ভেরিয়েবলগুলি প্রায় কোলাইনারি হতে পারে, যা এখনও একটি সমস্যা, তবে আপনি যেটি গ্রহণ করতে ইচ্ছুক হতে পারেন সেগুলি যদি উভয়ই আপনার মডেলের জন্য গুরুত্বপূর্ণ।
অর্থ-অর্থ-

উপরে যুক্ত লিঙ্কটি ইয়াহু.কমের দিকে নিয়ে যায়। এছাড়াও, [কাগজ] ( onLelelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/… ) জো এবং হাস্টির (ইলাস্টিক নেট ওয়ান)।
কার্তিক এস

2

লাসো এবং ইলাস্টিক নেট উভয় উচ্চ-মাত্রিক ডেটা সেটিংগুলিতে পরিবর্তনশীল বা বৈশিষ্ট্য নির্বাচন করার দক্ষ পদ্ধতি (রোগী বা নমুনাগুলির চেয়ে অনেক বেশি ভেরিয়েবল; যেমন, 20,000 জিন এবং 500 টিউমারের নমুনা)।

এটি দেখানো হয়েছে (হাস্টি এবং অন্যদের দ্বারা) যে ডেটা অত্যন্ত সংযুক্ত থাকলে ইলাস্টিক নেট লাসোকে ছাড়িয়ে যেতে পারে। লাসো কেবলমাত্র পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবল নির্বাচন করতে পারে এবং কোনটি নির্বাচিত তা যত্ন করে না। যখন কেউ একটি স্বাধীন ডেটাসেটে নির্বাচিত ভেরিয়েবলগুলি বৈধ করতে চায় তখন এটি সমস্যা হতে পারে। লাসোর দ্বারা নির্বাচিত ভেরিয়েবলটি সমস্ত সম্পর্কিত সম্পর্কযুক্ত ভেরিয়েবলগুলির মধ্যে সেরা অনুমানক নাও হতে পারে। ইলাস্টিক নেট অত্যন্ত সংযুক্ত ভেরিয়েবলের গড় ব্যবহার করে এই সমস্যাটি সমাধান করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.