মডেল ফিটের জন্য আসলে এআইসি এবং সি-স্ট্যাটিস্টিক (এউসি) যা মাপায় তার মধ্যে পার্থক্য কী?


29

আকাইকে তথ্য মানদণ্ড (এআইসি) এবং সি-স্ট্যাটিস্টিক (আরওসি বক্ররেখার অধীনে অঞ্চল) দুটি লজিস্টিক রিগ্রেশন-এর জন্য উপযুক্ত মডেলের দুটি পদক্ষেপ। দুটি ব্যবস্থার ফলাফল সামঞ্জস্যপূর্ণ না হলে কী চলছে তা বোঝাতে আমার সমস্যা হচ্ছে। আমি অনুমান করি যে তারা মডেল ফিটগুলির সামান্য বিভিন্ন দিক পরিমাপ করছে তবে এই নির্দিষ্ট দিকগুলি কী?

আমার কাছে 3 টি লজিস্টিক রিগ্রেশন মডেল রয়েছে। মডেল এম0 এর কিছু মানক সমাহার রয়েছে। মডেল এম 1 এম 1 এ এক্স 1 যুক্ত করেছে; মডেল এম 2 এক্স 2 কে এম 0 এ যুক্ত করে (সুতরাং এম 1 এবং এম 2 নেস্টেড নয়)।

এমআই থেকে এম 1 এবং এম 2 উভয়ের মধ্যে এআইসির পার্থক্য প্রায় 15, যা X1 এবং এক্স 2 উভয়ই মডেল ফিটকে উন্নত করে এবং প্রায় একই পরিমাণে নির্দেশ করে।

সি-পরিসংখ্যানগুলি: এম 0, 0.70; এম 1, 0.73; এম 2 0.72। এম -0 থেকে এম 1-এর সি-স্ট্যাটিস্টিকের পার্থক্যটি তাৎপর্যপূর্ণ (ডিওলং এট আল 1988 এর পদ্ধতি), তবে এম 0 থেকে এম 2-র মধ্যে পার্থক্যটি উল্লেখযোগ্য নয়, এটি ইঙ্গিত করে যে এক্স 1 মডেল ফিটকে উন্নত করে, তবে এক্স 2 এটি দেয় না।

এক্স 1 নিয়মিত সংগ্রহ করা হয় না। এক্স 2 নিয়মিত সংগ্রহ করার কথা থাকলেও প্রায় 40% ক্ষেত্রে অনুপস্থিত। আমরা সিদ্ধান্ত নিতে চাই যে এক্স 1 সংগ্রহ করা শুরু করবেন, বা এক্স 2 এর সংগ্রহের উন্নতি করতে হবে, বা উভয় ভেরিয়েবলগুলি ফেলে দেওয়া হবে।

এআইসি থেকে আমরা উপসংহারে পৌঁছেছি যে ভেরিয়েবলগুলি মডেলের অনুরূপ উন্নতি করে। সম্পূর্ণ নতুন ভেরিয়েবল (এক্স 1) সংগ্রহের চেয়ে এক্স 2 সংগ্রহের উন্নতি করা সম্ভবত সহজ, সুতরাং আমরা এক্স 2 সংগ্রহের উন্নতি করার লক্ষ্য রাখি। তবে সি-স্ট্যাটিস্টিক থেকে, এক্স 1 মডেলটির উন্নতি করে এবং এক্স 2 না, তাই আমাদের এক্স 2 সম্পর্কে ভুলে যাওয়া উচিত এবং এক্স 1 সংগ্রহ করা শুরু করা উচিত।

যেহেতু আমাদের প্রস্তাবনাটি আমরা কোন পরিসংখ্যানের উপরে ফোকাস করি তার উপর নির্ভর করে, তারা কী পরিমাপ করছে তার মধ্যে আমাদের পার্থক্য পরিষ্কারভাবে বুঝতে হবে।

কোন পরামর্শ স্বাগত।

উত্তর:


25

এআইসি এবং সি-পরিসংখ্যান বিভিন্ন প্রশ্নের উত্তর দেওয়ার চেষ্টা করছে। (এছাড়াও সাম্প্রতিক বছরগুলিতে সি-স্ট্যাটিস্টিক সহ কিছু সমস্যা উত্থাপিত হয়েছে, তবে আমি এটিকে একপাশে এসে হাজির করব)

কঠোরভাবে কথা বলা:

  • AIC আপনাকে জানিয়ে দিচ্ছে যে নির্দিষ্ট মডেল -শ্রেণীবদ্ধকরণ ব্যয়ের জন্য আপনার মডেল কতটা ফিট করে ।
  • এউসি আপনাকে বলছে যে আপনার মডেলটি কীভাবে ভালভাবে কাজ করবে সমস্ত গড়-শ্রেণিবদ্ধকরণ ব্যয় জুড়ে।

আপনি যখন এআইসির গণনা করেন তখন আপনি আপনার লজিস্টিকটিকে ০.৯ বলার পূর্বাভাস হিসাবে 1 (যেমন 0 এর চেয়ে বেশি সম্ভাব্য 1) বলে পূর্বাভাস দিয়ে থাকেন তবে এটি হওয়ার দরকার নেই। আপনি আপনার লজিস্টিক স্কোরটি নিতে এবং বলতে পারেন "0.95 এর উপরে যে কোনও কিছু 1, নীচের সবকিছু 0"। কেন আপনি এই করবেন? ভাল এটি নিশ্চিত করবে যে আপনি যখন সত্যই আত্মবিশ্বাসী তখন কেবল আপনিই একটির ভবিষ্যদ্বাণী করেন। আপনার মিথ্যা ইতিবাচক হারটি সত্যই কম হবে, তবে আপনার মিথ্যা নেতিবাচক চিত্রটি আকাশচুম্বী হবে। কিছু পরিস্থিতিতে এটি খারাপ জিনিস নয় - আপনি যদি কারও বিরুদ্ধে জালিয়াতির অভিযোগ আনতে চলেছেন তবে আপনি সম্ভবত প্রথমে সত্যই নিশ্চিত হতে চান। এছাড়াও, যদি ইতিবাচক ফলাফলগুলি অনুসরণ করা খুব ব্যয়বহুল হয় তবে আপনি সেগুলির মধ্যে খুব বেশি কিছু চান না।

এটি ব্যয়ের সাথে সম্পর্কিত। আপনি যখন 1 কে 0 হিসাবে শ্রেণিভুক্ত করেন তখন একটি ব্যয় হয় এবং যখন আপনি 0 কে 1 হিসাবে শ্রেণিবদ্ধ করেন তখন সাধারণত লজিস্টিক রিগ্রেশন জন্য এআইসি বিশেষ ক্ষেত্রে বোঝায় যখন উভয় ভুল শ্রেণিবদ্ধকরণ সমান হয় ব্যয়বহুল। এটি হ'ল লজিস্টিক রিগ্রেশন আপনাকে ইতিবাচক বা নেতিবাচক কোনও পছন্দ ছাড়াই সঠিক পূর্বাভাসের সেরা সামগ্রিক সংখ্যা দেয়।

আরওসি বক্ররেখা ব্যবহার করা হয়েছে কারণ আপনি যদি বিভিন্ন ব্যয়ের প্রয়োজনীয়তার আওতায় শ্রেণিবদ্ধকারীটিকে এটি ব্যবহার করেন তবে শ্রেণিবদ্ধী কীভাবে সঞ্চালন করবে তা দেখানোর জন্য এটি মিথ্যা পজিটিভের বিরুদ্ধে সত্য পজিটিভকে প্লট করে। সি-স্ট্যাটিস্টিকস সম্পর্কে আসে কারণ যে কোনও আরওসি বক্ররেখা যা অন্যের তুলনায় কঠোরভাবে থাকে তা স্পষ্টতই একটি প্রভাবশালী শ্রেণিবদ্ধ হয়। সামগ্রিকভাবে শ্রেণিবদ্ধকারী কতটা ভাল তা পরিমাপ হিসাবে বক্ররেখার অধীনে অঞ্চলটি পরিমাপ করা স্বজ্ঞাত।

সুতরাং মূলত, আপনি যদি মডেলটি ফিট করার সময় আপনার ব্যয়গুলি জানেন তবে এআইসি (বা অনুরূপ) ব্যবহার করুন। যদি আপনি কেবল একটি স্কোর তৈরি করছেন তবে ডায়াগনস্টিক থ্রেশহোল্ড নির্দিষ্ট করে না নিচ্ছেন তবে তারপরে এটিউ পদ্ধতির প্রয়োজন (নিজেই এওসি সম্পর্কে নিম্নলিখিত সাবধানতা সহ)।

তাহলে সি-স্ট্যাটিস্টিক / এউসি / গিনিতে কী ভুল?

বেশ কয়েক বছর ধরে এইউসি স্ট্যান্ডার্ড পদ্ধতির ছিল এবং এটি এখনও ব্যাপকভাবে ব্যবহৃত হয় তবে এর সাথে বেশ কয়েকটি সমস্যা রয়েছে। একটি জিনিস যা এটি বিশেষভাবে আকর্ষণীয় করে তুলেছিল তা হ'ল এটি শ্রেণিবদ্ধার ক্ষেত্রে উইলকক্স পরীক্ষার সাথে সম্পর্কিত। এটিই সম্ভবত এমন সম্ভাবনা পরিমাপ করা হয়েছে যে একটি শ্রেণির এলোমেলোভাবে বাছাই করা সদস্যের স্কোর অন্য শ্রেণীর এলোমেলোভাবে বাছাই করা সদস্যের চেয়ে বেশি হবে। সমস্যাটি হচ্ছে, এটি প্রায়শই কোনও দরকারী মেট্রিক নয়।

এইউসি-র সাথে সবচেয়ে জটিল সমস্যাগুলি কয়েক বছর আগে ডেভিড হ্যান্ড প্রকাশ করেছিলেন। (নীচে রেফারেন্সগুলি দেখুন) সমস্যার চূড়ান্ত বিষয়টি হ'ল এটিউসি সমস্ত ব্যয়ের তুলনায় গড় করেন, কারণ আরওসি বক্ররের এক্স-অক্ষটি মিথ্যা পজিটিভ রেট, এটি বিভিন্ন ব্যয়ের ব্যবস্থায় যে ওজনকে নির্ধারিত করে তা শ্রেণিবদ্ধের মধ্যে পরিবর্তিত হয়। সুতরাং আপনি যদি দুটি ভিন্ন লজিটিক রিগ্রেশনগুলিতে AUC গণনা করেন তবে এটি উভয় ক্ষেত্রে "একই জিনিস" পরিমাপ করা হবে না। এর অর্থ এটিউ এর উপর ভিত্তি করে মডেলগুলির তুলনা করা সামান্য বুদ্ধিমান।

হ্যান্ড একটি নির্দিষ্ট ব্যয়ের ওজনকে ব্যবহার করে একটি বিকল্প গণনার প্রস্তাব দিয়েছিল এবং এটিকে এইচ-পরিমাপ বলে - আর-তে একটি প্যাকেজ রয়েছে hmeasureযা এই গণনাটি সম্পাদন করবে, এবং আমি তুলনার জন্য এটিউসি বিশ্বাস করি।

এউসির সমস্যা নিয়ে কিছু রেফারেন্স:

  • কখন রিসিভার অপারেটিং বৈশিষ্ট্যযুক্ত বক্ররেখার ক্ষেত্রফল শ্রেণিবদ্ধ কর্মক্ষমতা একটি উপযুক্ত পরিমাপ? ডিজে হ্যান্ড, সি। অ্যাগনোস্টোপল্লোস প্যাটার্ন রিকগনিশন লেটারস 34 (2013) 492–495

    (আমি এটি একটি বিশেষ অ্যাক্সেসযোগ্য এবং দরকারী ব্যাখ্যা বলে মনে করেছি)


2
এবং এখানে ডিজে হ্যান্ডের আরেকটি কাগজ রয়েছে: শ্রেণিবদ্ধের পারফরম্যান্স পরিমাপ: আরওসি বক্ররেখার অধীনে অঞ্চলটির একটি সুসংগত বিকল্প , মেশিন লার্নিং (২০০৯): 77: ১০৩-১৩৩।
chl

এটিই আমি সন্ধান করছিলাম - হ্যাঁ এটির মূল প্রবন্ধটি ছিল (যদিও আমি মনে করি এটি পরবর্তীকালের কাগজপত্রের চেয়ে আরও বেশি প্রযুক্তিগত শ্রোতাদের লক্ষ্য করে লক্ষ্য করা গেছে)।
করোন

3
মূল্য / ইউটিলিটি বিবেচনা বাদে এওসি (সি-ইনডেক্স) এর সাথে সম্মতিযুক্ত সম্ভাবনা পরিমাপের সুবিধা রয়েছে। আমার কাছে নীচের অংশটি হ'ল এটিউকে একটি মডেলের বৈষম্য বর্ণনা করতে ব্যবহার করা উচিত, 2 টি মডেলের তুলনা করার জন্য নয়। তুলনার জন্য আমাদের সর্বাধিক শক্তিশালী পরিমাপ: বিচ্যুতি এবং বিচ্যুতি থেকে উত্পন্ন জিনিসগুলি ব্যবহার করতে হবে: সাধারণীকৃত এবং এআইসি। R2
ফ্র্যাঙ্ক হ্যারেল

করোন এর জবাব দেখে আমি বিভ্রান্ত হয়ে পড়েছি, আমি ভেবেছিলাম কোন মডেলের ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্সের সাথে এআইসির কোনও সম্পর্ক নেই এবং এটি মডেলের জটিলতার সাথে লেনদেন করা ডেটার সম্ভাবনার একটি মাত্রা মাত্র।
ঝুবার্ব

@ বারানকান নিশ্চিত করছেন না যে আপনি "ভবিষ্যদ্বাণীপূর্ণ পারফরম্যান্সের সাথে কিছুই করার নয়" বলতে কী বোঝায়, যদি না আপনি কেবল বোঝেন যে এটি একটি নমুনা ছাড়াই নমুনা নয়? (সম্ভাব্যতা তত ভাল those ডেটা পয়েন্টগুলি "পূর্বাভাস" দেয়)। মুল বক্তব্যটি হ'ল এআইসি একটি নির্দিষ্ট, পূর্বনির্ধারিত সম্ভাব্য ক্রিয়াকলাপের জন্য, তবে এআইসি সেগুলির একটি সেটের তুলনায় গড়। যদি আপনি সম্ভাবনাটি (যেমন প্রান্তিক, ব্যয়, প্রসার ...) জানেন তবে আপনি এআইসি ব্যবহার করতে পারেন।
করোন

3

উদ্ধৃত হ্যান্ড পেপারের ক্লিনিকাল ডায়াগনস্টিকসে বাস্তব বিশ্বের ব্যবহারের কোনও ভিত্তি নেই। তার একটি 0.5 টি এউসি সহ একটি তাত্ত্বিক বক্ররেখা রয়েছে যা পরিবর্তে একটি নিখুঁত শ্রেণিবদ্ধ। তিনি বাস্তব-বিশ্বের ডেটাগুলির একক সেট ব্যবহার করেন, যেখানে মডেলগুলি খুব খারাপ হিসাবে হস্তান্তরিত হয় এবং যখন পরিমাপের আশেপাশের আত্মবিশ্বাসের ব্যবস্থাগুলির জন্য অ্যাকাউন্টিং করা হয় (ডেটা সরবরাহ করা হয়নি তবে অনুমান করা হয়) সম্ভবত এলোমেলো হতে পারে are । রিয়েল-ওয়ার্ল্ড (বা এমনকি উপলব্ধিযোগ্য সিমুলেশন) ডেটার অভাব দেওয়া, এটি একটি ফাঁকা কাগজ। আমি ব্যক্তিগতভাবে হাজার হাজার রোগীর মধ্যে (পর্যাপ্ত পরিমাণে স্বাধীনতার সাথে) হাজার হাজার শ্রেণিবদ্ধের বিশ্লেষণে জড়িত হয়েছি। সেই প্রসঙ্গে তাঁর যুক্তি সংবেদনশীল নয়।

তিনি সুপারিটিভদের কাছেও প্রবণ (কোনও প্রসঙ্গে ভাল লক্ষণ নয়) এবং অসমর্থিত সাধারণীকরণ করেন, যেমন, ব্যয়গুলি জানা যায় না। চিকিত্সায়, এমন ব্যয়গুলি গৃহীত হয় যেমন স্ক্রিনিং টেস্টগুলির জন্য 10% ধনাত্মক ভবিষ্যদ্বাণীমূলক মান এবং চিকিত্সাগত হস্তক্ষেপের জন্য মান সমন্বিত জীবন বছর প্রতি year 100,000 আমার বিশ্বাস করা কঠিন যে ক্রেডিট স্কোরিংয়ের ক্ষেত্রে, ব্যয়গুলি ঠিকভাবে যাওয়াটা বোঝা যায় না he তিনি যদি (অস্পষ্টভাবে) বলছেন যে পৃথক পৃথক পৃথক মিথ্যা ধনাত্মক এবং মিথ্যা নেতিবাচক বিভিন্ন ব্যয় বহন করে, যদিও এটি খুব আকর্ষণীয় বিষয়, এটি সাদৃশ্যপূর্ণ নয় If বাইনারি শ্রেণিবদ্ধ

যদি তাঁর বক্তব্যটি হ'ল আরওসি আকারের বিষয়টি বিবেচনা করে তবে পরিশীলিত ব্যবহারকারীদের পক্ষে এটি সুস্পষ্ট, এবং অস্পষ্ট ব্যবহারকারীদের চিন্তিত হওয়ার জন্য আরও অনেক কিছু আছে, যেমন, ইতিবাচক এবং নেতিবাচক ভবিষ্যদ্বাণীকের মানগুলিতে বিস্তৃতকরণকে অন্তর্ভুক্ত করা।

পরিশেষে, মডেলগুলির ক্লিনিকাল (বা আর্থিক) ব্যবহারের ভিত্তিতে নির্ধারিত বিভিন্ন, বাস্তব-বিশ্বের কাট-অফগুলির ভিত্তিতে কীভাবে ভিন্ন শ্রেণিবদ্ধকারীদের বিচার করা যায় না তা বুঝতে আমার ক্ষতি হয়। স্পষ্টতই, প্রতিটি মডেলের জন্য আলাদা কাট অফগুলি বেছে নেওয়া হবে। মডেলগুলির সাথে তুলনা করা হবে না শুধুমাত্র এটিউস ভিত্তিক। শ্রেণিবদ্ধরা কিছু বিবেচনা করে না, তবে বক্ররেখার আকারটি দেয়।


-1

আমার জন্য, নীচের লাইনটি হ'ল সি-স্ট্যাটিস্টিক (এউসি) বিভিন্ন স্বতন্ত্র ভেরিয়েবলগুলির সাথে মডেলগুলির তুলনা করার সময় সমস্যাযুক্ত হতে পারে (হ্যান্ড যা "শ্রেণিবদ্ধ" হিসাবে উল্লেখ করে তার সাথে মিল রেখে) এটি অন্যান্য অ্যাপ্লিকেশনগুলিতে এখনও কার্যকর। উদাহরণস্বরূপ, বৈধতা অধ্যয়ন যেখানে একই স্টাডিকে বিভিন্ন অধ্যয়নের জনসংখ্যার (ডেটা সেট) জুড়ে তুলনা করা হয়। যদি কোনও মডেল বা ঝুঁকি সূচক / স্কোরকে একটি জনগোষ্ঠীতে উচ্চ বৈষম্যমূলক হিসাবে দেখানো হয় তবে অন্যের মধ্যে নয়, এর অর্থ এই হতে পারে যে এটি সাধারণভাবে খুব ভাল সরঞ্জাম নয় তবে এটি নির্দিষ্ট ক্ষেত্রে হতে পারে।


3
সাধারণভাবে, বিভিন্ন মডেলের তুলনা করতে সি-সূচকটি খুব সংবেদনশীল। আমি সাধারণত জেনারালাইজড বা এআইসিসহ অন্যান্য বিচ্যুতি ভিত্তিক ব্যবস্থা ব্যবহার করব। এবং উল্লেখ্য যে এআইসি শ্রেণিবদ্ধকরণ / কাটপয়েন্টগুলি সম্পর্কিত নয়R2
ফ্র্যাঙ্ক হ্যারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.