আংশিক নির্ভরতা প্লটের y অক্ষকে ব্যাখ্যা করা


22

আমি আংশিক নির্ভরতা প্লটগুলির উপর অন্যান্য বিষয়ের মাধ্যমে পড়েছি এবং তাদের বেশিরভাগের উপর আপনি কীভাবে প্রকৃতপক্ষে বিভিন্ন প্যাকেজগুলি দিয়ে প্লট করেছেন, কীভাবে আপনি সঠিকভাবে ব্যাখ্যা করতে পারেন তা নয়, সুতরাং:

আমি আংশিক নির্ভরতা প্লটগুলির মোটামুটি পরিমাণে পড়ছি এবং তৈরি করছি। আমি জানি তারা আমার মডেল থেকে অন্যান্য সমস্ত ভেরিয়েবল (χc) এর গড় প্রভাবের সাথে ফাংশন ƒS (χS) এর একটি চলক thes এর প্রান্তিক প্রভাব পরিমাপ করে। উচ্চতর y মানগুলির অর্থ হল আমার শ্রেণীর সঠিকভাবে ভবিষ্যদ্বাণী করার ক্ষেত্রে তাদের আরও বেশি প্রভাব রয়েছে। তবে আমি এই গুণগত ব্যাখ্যা দিয়ে সন্তুষ্ট নই।

এই লিঙ্কটি আমার অনেক প্লটের একটি দেখায়।  http://imgur.com/RXqlOky

আমার মডেল (এলোমেলো বন) দুটি বিচক্ষণ শ্রেণীর পূর্বাভাস দিচ্ছে। "হ্যাঁ গাছ" এবং "গাছ নেই"। টিআরআই একটি পরিবর্তনশীল যা এটির জন্য ভাল ভেরিয়েবল হিসাবে প্রমাণিত।

আমি যা ভাবতে শুরু করেছিলাম তা হ'ল ওয়াই মানটি সঠিক শ্রেণিবিন্যাসের সম্ভাবনা দেখাচ্ছে। উদাহরণ: y (0.2) দেখায় যে> ~ 30 এর টিআরআই মানগুলিতে একটি সত্য ধনাত্মক শ্রেণিবিন্যাসকে সঠিকভাবে চিহ্নিত করার 20% সম্ভাবনা রয়েছে।

যেখানে বিপরীতে

y (-0.2) দেখায় যে <~ 15 এর টিআরআই মানগুলিতে একটি সত্য নেতিবাচক শ্রেণিবদ্ধকরণ সঠিকভাবে সনাক্ত করার 20% সম্ভাবনা রয়েছে।

সাহিত্যে যে সাধারণ ব্যাখ্যা করা হয় তা এই জাতীয় শোনায় "টিআরআই 30 এর চেয়ে বেশি মূল্যবোধগুলি আপনার মডেলটিতে শ্রেণিবদ্ধকরণের জন্য ইতিবাচক প্রভাব ফেলতে শুরু করে" এবং এটিই। এটি এমন একটি চক্রান্তের জন্য এত অস্পষ্ট এবং অর্থহীন বলে মনে হচ্ছে যা আপনার ডেটা সম্পর্কে সম্ভাব্যভাবে এত বেশি কথা বলতে পারে।

এছাড়াও, আমার সমস্ত প্লট y অক্ষের জন্য পরিসীমা -1 থেকে 1 এ আউট করে। আমি অন্যান্য প্লটগুলি দেখেছি যা -10 থেকে 10 ইত্যাদি হয় এটি আপনি কতটি শ্রেণীর পূর্বাভাস দেওয়ার চেষ্টা করছেন তার একটি ফাংশন?

আমি ভাবছিলাম যে কেউ যদি এই সমস্যার সাথে কথা বলতে পারেন। সম্ভবত আমাকে কীভাবে এই প্লটগুলি বা এমন কিছু সাহিত্যের ব্যাখ্যা করা উচিত যা আমাকে সাহায্য করতে পারে me আমি এই খুব দূরে পড়া হয়?

আমি পরিসংখ্যানগত শিক্ষার উপাদানগুলি খুব পুঙ্খানুপুঙ্খভাবে পড়েছি: ডেটা মাইনিং, অনুমান এবং পূর্বাভাস এবং এটি একটি দুর্দান্ত সূচনা পয়েন্ট ছিল তবে এটি সম্পর্কে এটি।


প্লটটি টিআরআই 30 অবধি গড় হ্যাঁ গাছের সম্ভাবনা দেখায় এবং এর পরে বৃদ্ধি পায়। এই লিঙ্কটি কীভাবে পিডিপি বাইনারি শ্রেণিবদ্ধকরণ এবং অবিচ্ছিন্ন পরিবর্তনশীল প্লটকে ব্যাখ্যা করবেন তা ব্যাখ্যা করে।
অলসনিয়ারেস্টনিগবর

উত্তর:


13

আংশিক নির্ভরতা প্লটের প্রতিটি পয়েন্ট হ'ল টিআরআই-এর একটি নির্দিষ্ট স্তর প্রদত্ত সমস্ত পর্যবেক্ষণ জুড়ে "হ্যাঁ গাছ" শ্রেণীর পক্ষে গড় ভোট শতাংশ percentage

এটি সঠিক শ্রেণিবিন্যাসের সম্ভাবনা নয়। যথার্থতা, সত্য নেতিবাচক এবং সত্য ধনাত্মকতার সাথে এর কোনও যোগসূত্র নেই।

আপনি যখন শব্দটি দেখুন

টিআরআই 30 এর চেয়ে বেশি মানগুলি আপনার মডেলটিতে শ্রেণিবিন্যাসের জন্য ইতিবাচক প্রভাব ফেলতে শুরু করে

বলার এক দমবন্ধ উপায় way

টিআরআই 30 এর চেয়ে বেশি মানগুলি "হ্যাঁ গাছ" টিআরআই 30 এর চেয়ে কম মানের তুলনায় আরও দৃ strongly়ভাবে ভবিষ্যদ্বাণী করা শুরু করে


2

আংশিক নির্ভরতা ফাংশনটি মূলত আপনাকে সেই পরিবর্তনশীলটির "গড়" প্রবণতা দেয় (মডেলটিতে অন্য সকলকে একীকরণ করে)। এটি সেই প্রবণতার আকৃতি যা "গুরুত্বপূর্ণ"। আপনি বিভিন্ন পূর্বাভাসক ভেরিয়েবলগুলি থেকে এই প্লটের আপেক্ষিক পরিসরটি ব্যাখ্যা করতে পারেন, তবে পরম পরিসীমা নয়। আশা করি এইটি কাজ করবে.


2

Y অক্ষের মানগুলি দেখার একটি উপায় হ'ল তারা অন্য প্লটগুলিতে একে অপরের সাথে সম্পর্কিত। যখন সেই সংখ্যাটি পরম মানগুলিতে অন্যান্য প্লটের তুলনায় বেশি হয়, এর অর্থ এটি আউটপুটে তার চলকটির প্রভাব আরও বেশি গুরুত্বপূর্ণ কারণ।

আপনি যদি আংশিক নির্ভরতা প্লটের পিছনে গণিত এবং সেই সংখ্যাটি কীভাবে অনুমান করাতে আগ্রহী হন তবে আপনি এটি এখানে পেতে পারেন: http://statweb.stanford.edu/~jhf/ftp/uleFit.pdf বিভাগ 8.1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.