লজিস্টিক রিগ্রেশন বৈশিষ্ট্যগুলি র‌্যাঙ্কিং


10

আমি লজিস্টিক রিগ্রেশন ব্যবহার করেছি। আমার ছয়টি বৈশিষ্ট্য রয়েছে, আমি এই শ্রেণিবদ্ধের গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি জানতে চাই যা অন্যান্য বৈশিষ্ট্যের চেয়ে ফলাফলকে বেশি প্রভাবিত করে। আমি ইনফরমেশন গেইন ব্যবহার করেছি তবে মনে হয় এটি ব্যবহৃত শ্রেণিবদ্ধের উপর নির্ভর করে না। নির্দিষ্ট শ্রেণিবদ্ধ (যেমন লজিস্টিক রিগ্রেশন) এর উপর ভিত্তি করে বৈশিষ্ট্যগুলি তাদের গুরুত্ব অনুসারে র‌্যাঙ্ক করার কোনও পদ্ধতি আছে কি? কোন সাহায্যের অত্যন্ত প্রশংসা হবে.


3
পণ্য সরবরাহ রিগ্রেশন হয় না একটি ক্লাসিফায়ার। লজিস্টিক রিগ্রেশন প্রত্যক্ষ সম্ভাবনার অনুমানের মডেল তা প্রতিফলিত করতে দয়া করে আপনার প্রশ্নটি পুনরায় লিখুন।
ফ্রাঙ্ক হ্যারেল

1
ফ্র্যাঙ্কহারেলের উত্থাপিত বিন্দুটি বাদ দিয়ে, আপনি কি আপনার আনুমানিক সহগের p মূল্যগুলি দেখেছেন? এটি অবশ্যই র্যাঙ্কিং বৈশিষ্ট্যগুলির সেরা উপায় নয় তবে এটি আপনাকে একটি সূচনা পয়েন্ট দিতে পারে।
usεr11852

9
অবশ্যই, লজিস্টিক রিগ্রেশন সম্ভাব্যতার অনুমান করছে এবং স্পষ্টভাবে জিনিসগুলিকে শ্রেণিবদ্ধ করছে না, তবে কে চিন্তা করে? উদ্দেশ্যটি হ'ল প্রায়শই সিদ্ধান্ত হয় যে কোন শ্রেণিটি সম্ভবত সবচেয়ে বেশি, এবং যদি আপনি এটিই ব্যবহার করছেন তবে এটি শ্রেণিবদ্ধ বলার কিছু নেই।
dsaxton

উত্তর:


5

আমি মনে করি আপনি যে উত্তরটির সন্ধান করছেন তা বরুতা অ্যালগরিদম হতে পারে । এটি একটি মোড়কের পদ্ধতি যা সরাসরি "সমস্ত প্রাসঙ্গিকতা" অর্থে বৈশিষ্ট্যগুলির গুরুত্বকে পরিমাপ করে এবং একটি আর প্যাকেজে প্রয়োগ করা হয় , যা দুর্দান্ত প্লট তৈরি করে এই চক্রান্তযেখানে কোনও বৈশিষ্ট্যের গুরুত্ব y- অক্ষের উপরে থাকে এবং এটি একটির সাথে তুলনা করা হয় নীল নীল এখানে চক্রান্ত। এই ব্লগ পোস্টটি পদ্ধতির বর্ণনা দেয় এবং আমি আপনাকে এটি একটি খুব স্পষ্ট ভূমিকা হিসাবে পড়ার পরামর্শ দিচ্ছি।


p>>n

@ usεr11852 না, আমি করি না। আমি কেবল গত সপ্তাহে বা তার মধ্যে এটি নিজেই এসেছি।
ব্যাবেলপ্রুডেডার

হুমম্ম ... ঠিক আছে, বুরুতা খুব আশাব্যঞ্জক বলে মনে হচ্ছে তবে আমি অসাধারণ নতুন অ্যালগরিদমগুলি সম্পর্কে সর্বদা সন্দেহবাদী না হওয়া পর্যন্ত আমি তাদেরকে বৃহত্তর অধ্যয়নের অংশ হিসাবে না দেখি এবং যেসব ক্ষেত্রে তারা এক্সেল করতে ব্যর্থ হয় ( কোনও নিখরচায় মধ্যাহ্নের তাত্ত্বিকতা নেই )।
usεr11852

আকর্ষণীয় ধারণা তবে লজিস্টিক রিগ্রেশন সম্পর্কিত নয়।
ফ্রাঙ্ক হ্যারেল

"বুরুতা একটি বৈশিষ্ট্য নির্বাচনের পদ্ধতি, কোনও বৈশিষ্ট্য র‌্যাঙ্কিং পদ্ধতি নয়" প্যাকেজ হোমপেজে FAQ এর দেখুন
স্থির ফিশ

3

R2

R2

লজিস্টিক রিগ্রেশন মডেলগুলিতে বৈশিষ্ট্যটির গুরুত্বকে চিহ্নিত করার জনপ্রিয় পদ্ধতির একটি তালিকা:

  1. R2
  2. যোগ্যতা: সম্পূর্ণ মডেল লগের অনুপাত ‐ সম্ভাবনা যা প্রতিটি পূর্বাভাসকারী পৃথকভাবে ব্যাখ্যাযোগ্য
  3. সংমিশ্রণ: ইতিবাচক এবং নেতিবাচক প্রতিক্রিয়াশীল ভেরিয়েবলের মধ্যে পার্থক্য করার জন্য একটি মডেলের দক্ষতা নির্দেশ করে। প্রতিটি ভবিষ্যদ্বাণীকের জন্য একটি পৃথক মডেল নির্মিত হয় এবং গুরুত্ব স্কোর হ'ল একমাত্র সেই ভবিষ্যদ্বাণীকের উপর ভিত্তি করে সত্য ধনাত্মক হওয়ার সম্ভাবনা।
  4. তথ্য মান: তথ্য মান কোনও ভবিষ্যদ্বাণীকের কাছ থেকে প্রাপ্ত ফলাফল সম্পর্কে তথ্যের পরিমাণকে মাপ দেয়। এটি অন্যান্য ভবিষ্যদ্বাণীকে বিবেচনায় না নিয়ে প্রতিটি ভবিষ্যদ্বাণীকের বিশ্লেষণের ভিত্তিতে তৈরি।

তথ্যসূত্র:

  1. একটি লজিস্টিক রিগ্রেশন মধ্যে ব্যাখ্যামূলক পরিবর্তনশীল এর আপেক্ষিক গুরুত্ব পরিমাপ
  2. আরে লিনিয়ার রেজিস্ট্রারদের আপেক্ষিক গুরুত্ব
  3. আপেক্ষিক গুরুত্ব এবং মান, ব্যারি ফিল্ডম্যান (পিএমডি পদ্ধতি)

0

যেখানেxiএবংyআমিবৈশিষ্ট্য ভেক্টর এবং টার্গেট ভেক্টর উদাহরণস্বরূপআমি

minw,bi=1nlog(1+exp(yifw,b(xi)))+λw2
xiyiiwbfw,b(xi)

xx

আপনি যদি ভেরিয়েবলগুলি সত্যই গুরুত্বপূর্ণ তা সন্ধান করতে আগ্রহী হন এবং প্রক্রিয়াটিতে কিছুটা লাথি মারতে আপত্তি করেন না, আপনি করতে পারেন 1

minw,bi=1nlog(1+exp(yifw,b(xi)))+λ|w|

λw

আশা করি এটা কাজে লাগবে. আপনার আরও কিছু প্রশ্ন আছে কিনা জিজ্ঞাসা করুন।


4
এল আর হয় না একটি শ্রেণীবিভাগ প্রকল্প। শ্রেণিবিন্যাসের যে কোনও ব্যবহার ইউটিলিটি / ব্যয় কার্যকারিতা সংজ্ঞায়নের পরে পোস্টস্টিমেশন পদক্ষেপ হিসাবে আসে। এছাড়াও, ওপি শাস্তিযুক্ত সর্বাধিক সম্ভাবনার অনুমানের বিষয়ে জিজ্ঞাসা করেনি। রিগ্রেশন-এ ভেরিয়েবলের আপেক্ষিক গুরুত্বের জন্য প্রমাণ সরবরাহ করতে প্রতিটি ভবিষ্যদ্বাণীকের দ্বারা সরবরাহিত অতিরিক্ত ভবিষ্যদ্বাণীমূলক তথ্যের সীমাগুলির জন্য আস্থা সীমা অর্জনের জন্য বুটস্ট্র্যাপ ব্যবহার করা খুব সহজ। রিগ্রেশন মডেলিং কৌশলগুলির চতুর্থ অধ্যায়ে একটি উদাহরণ উপস্থিত হয় যার অনলাইন নোট এবং আর কোড biostat.mc.vanderbilt.edu/RmS# মেটেরিয়াসে
ফ্রাঙ্ক হ্যারেল

4
প্রফেসর হ্যারেল, দয়া করে। এটা সুস্পষ্ট যে আমরা দুটি ভিন্ন দিক থেকে এটি এগিয়ে যাচ্ছি। আপনি পরিসংখ্যান থেকে এবং আমি মেশিন লার্নিং থেকে এসেছি। আমি আপনাকে, আপনার গবেষণা এবং আপনার ক্যারিয়ারকে শ্রদ্ধা করি তবে আপনি নিজের উত্তর তৈরি করতে খুব মুক্ত এবং ওপি সিদ্ধান্ত নিতে দেন, কোনটি তিনি তার প্রশ্নের উত্তরের উত্তর হিসাবে বিবেচনা করেন। আমি শেখার আগ্রহী, সুতরাং দয়া করে আমাকে আপনার পদ্ধতির শিক্ষা দিন তবে আমাকে আপনার বইটি কিনতে না দিন make
pAt84

1
আমি কেবল লক্ষ করব যে মেশিন লার্নিংয়ের অস্তিত্বের কয়েক দশক আগে ১৯৫৮ সালে পরিসংখ্যানবিদ ডিআর কক্স দ্বারা লজিস্টিক রিগ্রেশন বিকাশ করা হয়েছিল। আপনার যে সূচিত "ক্ষতি ফাংশন" (সম্ভবত উদ্দেশ্যমূলক ফাংশন বলে?) এর শ্রেণিবদ্ধকরণের সাথে কোনও সম্পর্ক নেই বলেও গুরুত্বপূর্ণ important এবং আপনাকে কী বোঝাতে পেরেছিল যে আমার বিস্তৃত নোট এবং অডিও ফাইলগুলি যে সমস্ত তথ্যের সাথে আমি মূল্যবোধের জন্য উল্লেখ করেছি সেগুলি অনলাইনে উপলব্ধ?
ফ্রাঙ্ক হ্যারেল

2
উভয়ই বৈধ পয়েন্ট উত্থাপন হিসাবে আমি উভয় প্রাথমিক মন্তব্য upvated। পরে আমার কাছে ক্ষুদ্র
কলহের

4
পিএস আরও স্পষ্টভাবে এটি বলার চেষ্টা করছেন, পূর্বাভাস / অনুমানের অনুকূলকরণ সর্বোত্তম সিদ্ধান্তের দিকে নিয়ে যায় কারণ ইউটিলিটি ফাংশনটি দ্বিতীয় ধাপে প্রয়োগ করা হয় এবং ভবিষ্যদ্বাণীকারীদের সাথে সম্পর্কযুক্ত থাকার অনুমতি দেওয়া হয়। পূর্বাভাস / অনুমানের অনুকূলকরণ শ্রেণিবদ্ধকরণ এবং তদ্বিপরীতটিকে অনুকূল করে না। শ্রেণিবিন্যাসকে অনুকূলকরণ করা এমন এক অদ্ভুত ইউটিলিটি ফাংশনটি ব্যবহারের সমান যা হাতের ডেটাসেটের জন্য উপযুক্ত এবং নতুন ডেটাসেটে প্রয়োগ নাও হতে পারে। ভাবেন যারা সত্যই শ্রেণিবিন্যাসকে অনুকূলকরণ করতে চান (প্রস্তাবিত নয়) পুরোপুরি অনুমান / পূর্বাভাসকে বাইপাস করে এমন একটি পদ্ধতি ব্যবহার করতে পারেন।
ফ্র্যাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.