পরিবর্তনশীল গুরুত্বের র্যাঙ্কিংয়ের ক্ষেত্রে (সমস্ত ধরণের মাল্টিভারিয়েট মডেলের প্রসঙ্গে) আমি কিছুটা নিলিল হয়ে গেছি ।
প্রায়শই আমার কাজ চলাকালীন আমাকে অন্য একটি দলকে একটি পরিবর্তনশীল গুরুত্বের র্যাঙ্কিং উত্পাদন করতে বা আমার নিজস্ব কাজ থেকে একটি পরিবর্তনশীল গুরুত্বের র্যাঙ্কিং তৈরি করতে সহায়তা করতে বলা হয়। এই অনুরোধের প্রতিক্রিয়া হিসাবে, আমি নিম্নলিখিত প্রশ্ন জিজ্ঞাসা
আপনি এই পরিবর্তনশীল গুরুত্ব র্যাঙ্কিংয়ের জন্য কী চান? আপনি এটি থেকে কি শিখতে আশা করি? আপনি এটি ব্যবহার করে কোন ধরণের সিদ্ধান্ত নিতে চান?
আমি যে উত্তরগুলি পেয়েছি প্রায় সবসময় দুটি বিভাগের একটিতে পড়ে
- প্রতিক্রিয়া পূর্বাভাস দেওয়ার ক্ষেত্রে আমি আমার মডেলের বিভিন্ন ভেরিয়েবলের গুরুত্ব জানতে চাই।
- আমি কম গুরুত্বের ভেরিয়েবলগুলি সরিয়ে বৈশিষ্ট্য নির্বাচনের জন্য এটি ব্যবহার করতে চাই।
প্রথম প্রতিক্রিয়াটি হ'ল টোটোলজিক্যাল (আমি একটি পরিবর্তনশীল গুরুত্বের র্যাঙ্কিংটি চাই কারণ আমি একটি পরিবর্তনশীল গুরুত্বের র্যাঙ্কিং চাই)। আমার অবশ্যই ধরে নিতে হবে যে মাল্টিভারিয়েট মডেলের আউটপুট গ্রাস করার সময় এই র্যাঙ্কিংগুলি একটি মানসিক প্রয়োজন পূরণ করে। এটিকে বুঝতে আমার খুব কষ্ট হয়েছে, কারণ পৃথকভাবে "গুরুত্ব" ভেরিয়েবলগুলি র্যাঙ্কিংয়ে প্রশ্নে মডেলটির বহুমাত্রিক প্রকৃতিটিকে স্পষ্টভাবে প্রত্যাখ্যান করে বলে মনে হচ্ছে।
দ্বিতীয় প্রতিক্রিয়াটি মূলত পিছনের নির্বাচনের অনানুষ্ঠানিক সংস্করণে হ্রাস পায় , যার পরিসংখ্যানগত পাপগুলি ক্রসভিলেটেডের অন্যান্য অংশগুলিতে ভালভাবে নথিভুক্ত রয়েছে।
আমি গুরুত্বের স্থান নির্ধারণের অসুস্থ সংজ্ঞায়িত প্রকৃতির সাথেও লড়াই করি। র্যাঙ্কিংটি কীভাবে অন্তর্নিহিত ধারণাটি পরিমাপ করা উচিত সে সম্পর্কে খুব সামঞ্জস্য রয়েছে বলে মনে হয়, এগুলি একটি খুব স্বাদযুক্ত গন্ধ দেয়। গুরুত্বপূর্ণ স্কোর বা র্যাঙ্কিং নির্ধারণ করার অনেকগুলি উপায় রয়েছে এবং তারা সাধারণত ত্রুটিগুলি এবং সতর্কতার দ্বারা ভোগেন:
- এলোমেলো বন এবং জিবিএমের গুরুত্বের র্যাঙ্কিংয়ের মতো এগুলি অত্যন্ত আলগোরিদম নির্ভরশীল হতে পারে।
- অন্তর্নিহিত ডেটাতে প্রতিচ্ছবিগুলির সাথে তীব্রভাবে পরিবর্তিত হয়ে তাদের অত্যন্ত উচ্চতর বৈকল্পিকতা থাকতে পারে।
- তারা ইনপুট ভবিষ্যদ্বাণীগুলির মধ্যে পারস্পরিক সম্পর্ক থেকে ভোগ করতে পারে।
সুতরাং, যা যা বলা হয়েছিল, তার সাথে আমার প্রশ্ন হ'ল পরিবর্তন সংক্রান্ত গুরুত্বের র্যাঙ্কিংয়ের কিছু পরিসংখ্যানগতভাবে বৈধ ব্যবহারগুলি কী কী, বা, এমন আকাঙ্ক্ষার নিষ্ক্রিয়তার জন্য একটি বিশ্বাসযোগ্য যুক্তি (কোনও পরিসংখ্যানবিদ বা সাধারণ লোকের কাছে) কী? আমি সাধারণ তাত্ত্বিক যুক্তি এবং কেস স্টাডি উভয়ইতে আগ্রহী, যে কোনওটি বিষয়টিকে কার্যকর করতে আরও কার্যকর হবে।
glmnet
পাওয়া যায় তখন কেন আমাদের এমন অনানুষ্ঠানিক পদ্ধতি ব্যবহার করা উচিত ?