লাসোর আগে মানিককরণ কি আসলেই প্রয়োজনীয়?


28

আমি Lassoরিগ্রেশন জাতীয় কিছু আগে ভেরিয়েবলকে মানীকরণের তিনটি প্রধান কারণ পড়েছি :

1) সহগের ব্যাখ্যা।

2) সংকোচনের পরবর্তী সহগ অনুমানের তুলনামূলক পরিমাণের দ্বারা গুণমানের গুরুত্বকে র‌্যাঙ্ক করার ক্ষমতা।

3) বাধা প্রয়োজন নেই।

তবে আমি সবচেয়ে গুরুত্বপূর্ণ বিষয়টি নিয়ে ভাবছি। আমাদের কী ভাবার কারণ আছে যে মডেলাইজেশনটি মডেলটির নমুনা সাধারণীকরণের বাইরে উন্নতি করবে? আমার মডেলটিতে আমার কোনও ইন্টারসেপ্টের দরকার নেই কিনা তাও আমি খেয়াল করি না; একটি যুক্ত করা আমার ক্ষতি করে না।


1
স্পষ্টতা: আপনি জিজ্ঞাসা করতে চেয়েছেন, "শর্তযুক্ত যে মানসম্মতকরণ alচ্ছিক (বিশেষের একটি ক্ষেত্রে যেখানে ফলাফলগুলি বিভিন্ন মাত্রার দ্বারা অনুকরণ করা হয় না), তারপরে নমুনাটি কী নমুনা ছাড়াই সাধারণীকরণের উন্নতি করবে?" এটা কি সঠিক?
ড্রু 75

@ ড্র্রু I৫ আমি কেসগুলি বিচ্ছেদের পছন্দ করি উদাহরণস্বরূপ, ফলাফলগুলি "বিভিন্ন মাত্রার দ্বারা স্কুড" হওয়ার ফলে এটি কীভাবে সহায়তা করে যখন ফলাফলগুলি স্কিউড না করা হয় তখন এটি কার্যকর হয়, সর্বোত্তম উত্তরটি বিভিন্ন পরিস্থিতিতে আবৃত হবে।
জেস

1
তাহলে আপনার প্রশ্নটি লাসো সম্পর্কে নয় (কারণ সাধারণভাবে লাসোর আগে মানিককরণ প্রয়োজন)। এটা আরও সাধারণ। সম্ভবত শিরোনাম এবং প্রশ্নের প্রথম বাক্যটি পরিবর্তন করুন।
ড্রু 75

@ ড্রু: এটি বরং প্রশ্নোত্তর: কেন এটি প্রয়োজনীয় (কখন তা নয়?)? ফলাফলগুলি স্কু করার অর্থ কী (কোনও তুলনায়?)? আমি মনে করি প্রশ্নটি দাঁড়িয়ে আছে ঠিক আছে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ ড্র্রু 75 আমার প্রশ্ন লাসো সম্পর্কে।
জেস

উত্তর:


21

লাসোর রিগ্রেশন প্রতিটি ভেরিয়েবলের সাথে যুক্ত সহগের আকারের প্রতিবন্ধকতা রাখে। তবে এই মানটি প্রতিটি ভেরিয়েবলের পরিমাণের উপর নির্ভর করবে। অতএব এটি ভেরিয়েবলগুলি কেন্দ্র এবং হ্রাস বা মানক করা প্রয়োজন।

ভেরিয়েবলগুলি কেন্দ্র করে ফেলার অর্থ হ'ল আর কোনও বাধা নেই। এটি উপায় দ্বারা, রিজ রিগ্রেশন সমানভাবে প্রযোজ্য।

আর একটি ভাল ব্যাখ্যা হ'ল এই পোস্টটি: রিগ্রেশনে ডেটা কেন্দ্রিং এবং মানককরণের প্রয়োজন


এটি হয় কোনও উত্তর নয় বা আমার প্রশ্নের চূড়ান্ত পরোক্ষ উত্তর নয়। আপনার উত্তর এবং নমুনা সাধারণীকরণের বাইরে লিঙ্কটি ব্যাখ্যা করুন (যা ছিল প্রশ্ন)।
জেস

10
@ জেস: এটি মানদণ্ডের মূল কারণকে সম্বোধন করে , যা আপনি আপনার তালিকা থেকে বাদ দিয়েছেন: আপনি যদি ছোট সহগের সাথে ভবিষ্যদ্বাণীকে বাদ দিতে চান (বা অন্যথায় সহগের মাত্রার উপর নির্ভর করে একটি জরিমানার শর্ত ব্যবহার করতে চান), আপনাকে সিদ্ধান্ত নিতে হবে যে "ছোট" "। যদিও লাসো বা অন্যান্য দণ্ডিত রিগ্রেশন পদ্ধতির আগে মানীকরণ বাধ্যতামূলক নয়, তবে এটি খুব কমই ঘটেছে যে ভবিষ্যদ্বাণীকারীদের মাপার জন্য মূল স্কেলগুলি এই উদ্দেশ্যে কার্যকর।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

3
এবং কেন্দ্রীকরণের বিষয়টি হ'ল আপনি সাধারণত ইন্টারসেপ্টটি ড্রপ বা সঙ্কুচিত করতে চান না।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
λ

2
খুব বিস্তৃতভাবে, আপনি সামগ্রিকভাবে কত সঙ্কুচিত করবেন তা এলোমেলো হোল্ড-আউট নমুনাগুলিতে সাধারণীকরণকে প্রভাবিত করবে; অন্যের তুলনায় প্রতিটি ভবিষ্যদ্বাণীকে সংকুচিত করতে কতটা স্বেচ্ছাসেবী সিদ্ধান্ত একই রকম জনগোষ্ঠীর নতুন নমুনাগুলিতে সাধারণীকরণকে প্রভাবিত করতে চলেছে, যেখানে সহগুণগুলি কিছুটা আলাদা, যেখানে প্রশিক্ষণ ব্যবস্থায় ভবিষ্যদ্বাণীকারীদের বিতরণ প্রয়োজনীয়ভাবে তেমন হয় না , এবং সি। (অবশ্যই আপনার প্রশ্নটি আরও পুরোপুরি চিন্তাভাবনার উত্তরের দাবিদার।)
স্কোর্টচি - মনিকা পুনরায় স্থাপন করুন

2

এল 1 পেনাল্টি প্যারামিটার হ'ল পরম বিটা শর্তগুলির সংমিশ্রণ। যদি ভেরিয়েবলগুলি সমস্ত ভিন্ন মাত্রিক হয় তবে এই শব্দটি গাণিতিকভাবে কোনও ত্রুটি না থাকলেও সত্যই এটি যুক্ত হয় না।

তবে, আমি এই সমস্যাটিতে ভুগছে এমন ডামি / শ্রেণিবদ্ধ ভেরিয়েবলগুলি দেখতে পাচ্ছি না এবং তাদের মনে হয় যে তাদের মানক হওয়ার দরকার নেই। এগুলিকে মানীকরণ করা মাত্র ভেরিয়েবলের ব্যাখ্যাযোগ্যতা হ্রাস করতে পারে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.