ক্রস-বৈধতাযুক্ত শ্রেণিবদ্ধকরণ নির্ভুলতার জন্য আস্থার ব্যবধান


11

আমি একটি শ্রেণিবদ্ধকরণ সমস্যা নিয়ে কাজ করছি যা দুটি ইনপুট এক্স-রে চিত্রের মধ্যে মিলের মেট্রিককে গণনা করে। চিত্রগুলি একই ব্যক্তির হলে ('ডান' লেবেল), একটি উচ্চতর মেট্রিক গণনা করা হবে; দুটি পৃথক ব্যক্তির ইনপুট চিত্রগুলির ('ভুল' এর লেবেল) এর ফলে কম মেট্রিক হবে।

আমি ভুল শ্রেণিবদ্ধের সম্ভাবনা গণনা করার জন্য একটি স্তরিত 10-গুণ ক্রস-বৈধতা ব্যবহার করেছি। আমার বর্তমান নমুনার আকার প্রায় 40 টি সঠিক ম্যাচ এবং 80 টির মতো ভুল ম্যাচ, যেখানে প্রতিটি ডেটাপয়েন্টটি গণনা করা মেট্রিক। আমি ০.০০ এর একটি ভুল শংসাপত্রের সম্ভাবনা পাচ্ছি, তবে এ সম্পর্কে আমার কিছুটা আত্মবিশ্বাসের বিরতি / ত্রুটি বিশ্লেষণের প্রয়োজন।

আমি দ্বি দ্বিগত অনুপাতের আত্মবিশ্বাসের ব্যবধানটি (যেখানে আমি আমার সাফল্যের সংখ্যার জন্য সঠিক লেবেলিং বা ভুল লেবেলিং হিসাবে ক্রস-বৈধকরণের ফলাফলগুলি ব্যবহার করতাম) ব্যবহার করে যাচ্ছিলাম। তবে দ্বিপাক্ষিক বিশ্লেষণের পিছনে একটি অনুমান হ'ল প্রতিটি বিচারের সাফল্যের একই সম্ভাবনা, এবং আমি নিশ্চিত নই যে ক্রস-বৈধকরণে 'ডান' বা 'ভুল' শ্রেণিবিন্যাসের পিছনের পদ্ধতিটি বিবেচনা করা যেতে পারে কিনা সাফল্যের একই সম্ভাবনা।

আমি কেবলমাত্র অন্যান্য বিশ্লেষণের মধ্যেই ভাবতে পারি যে ক্রস-বৈধতা X বার পুনরাবৃত্তি করা এবং শ্রেণিবিন্যাসের ত্রুটির গড় / মানিক বিচ্যুতি গণনা করা, তবে আমি নিশ্চিত নই যে এটি আমার থেকে ডেটা পুনরায় ব্যবহার করার কারণে উপযুক্ত কিনা? অপেক্ষাকৃত ছোট নমুনার আকার বেশ কয়েকবার।

কোন চিন্তা? আমি আমার সমস্ত বিশ্লেষণের জন্য ম্যাটল্যাব ব্যবহার করছি এবং আমার কাছে পরিসংখ্যানের সরঞ্জাম বাক্সটি রয়েছে। যে কোনও এবং সমস্ত সহায়তার প্রশংসা করবে!


0.00 এর বিচ্ছিন্নতা সম্ভাবনাটির অর্থ হল যে আপনি 10 ক্রস-বৈধতা ভাঁজগুলির প্রতিটিতে 100% শ্রেণিবিন্যাসের নির্ভুলতা পেয়েছেন?
অ্যামিবা

হ্যাঁ, এটি সঠিক। প্রতিটি ভাঁজ কোনও ভুল শৃঙ্খলার ফলস্বরূপ; আমি যে 0.00 টি প্রতিবেদন করেছি তা পরীক্ষার কেসগুলির মোট সংখ্যা (120) এর মধ্যে মোট ভুল সংখ্যার (0) প্রতিনিধিত্ব করে।
শান

বিটিডাব্লু, "স্ট্রেইটেড" ক্রস-বৈধতা বলতে কী বোঝ? প্রতিটি সিভির ভাগে আপনার 120/10 = 12 পরীক্ষার নমুনা থাকে, সর্বদা 4 টি ম্যাচ এবং 8 টি অ-মিল রয়েছে?
অ্যামিবা

হ্যাঁ, এটি ঠিক এটি - ম্যাটল্যাবের মধ্যে এটি কীভাবে করা হচ্ছে তা আমি বুঝতে পারি least প্রতিটি ভাগে 'ডান' / 'ভুল' শ্রেণীর লেবেলের সমান অনুপাত থাকতে হবে যা 1: 2 is
শান

উত্তর:


7

বিভিন্ন সারোগেট মডেলের পূর্বাভাসে অস্থিরতার প্রভাব

তবে দ্বিপাক্ষিক বিশ্লেষণের পিছনে একটি অনুমান হ'ল প্রতিটি বিচারের সাফল্যের একই সম্ভাবনা, এবং আমি নিশ্চিত নই যে ক্রস-বৈধকরণে 'ডান' বা 'ভুল' শ্রেণিবিন্যাসের পিছনের পদ্ধতিটি বিবেচনা করা যেতে পারে কিনা সাফল্যের একই সম্ভাবনা।

ভাল, সাধারণত যে সমতাটি এমন একটি অনুমান যা আপনাকে বিভিন্ন সরোগেট মডেলের ফলাফলগুলিকে সাজাতে দেয়।

অনুশীলনে, আপনার অনুমান যে এই অনুমানটি লঙ্ঘিত হতে পারে প্রায়শই সত্য। তবে আপনি এটি পরিমাপ করতে পারবেন কি না। এটিই আমি পুনরাবৃত্ত ক্রস বৈধকরণকে সহায়ক বলে মনে করি: বিভিন্ন সরোগেট মডেল দ্বারা একই মামলার পূর্বাভাসের স্থায়িত্ব আপনাকে মডেলগুলির সমতুল্য (স্থিতিশীল পূর্বাভাস) কিনা তা বিচার করতে দেয়।

এখানে পুনরাবৃত্তি (ওরফে পুনরাবৃত্তি) -ফোল্ড ক্রস বৈধকরণের একটি স্কিম রয়েছে :k
পুনরাবৃত্ত কে-ভাঁজ ক্রস বৈধতা

ক্লাসগুলি লাল এবং নীল। ডান দিকের চেনাশোনাগুলি ভবিষ্যদ্বাণীগুলির প্রতীক। প্রতিটি পুনরাবৃত্তিতে প্রতিটি নমুনা ঠিক একবারে পূর্বাভাস দেওয়া হয়। সাধারণত, গ্র্যান্ড মিডটি পারফরম্যান্সের প্রাক্কলন হিসাবে ব্যবহৃত হয়, স্পষ্টতই ধরে নেওয়া যায় যে সারোগেট মডেলের পারফরম্যান্স সমান। আপনি যদি বিভিন্ন সরোগেট মডেল (যেমন কলামগুলি জুড়ে) দ্বারা করা পূর্বাভাসগুলিতে প্রতিটি নমুনার সন্ধান করেন তবে আপনি দেখতে পারবেন যে এই নমুনার জন্য ভবিষ্যদ্বাণীগুলি কতটা স্থিতিশীল।ik

আপনি প্রতিটি পুনরাবৃত্তির জন্য কার্যকারিতাও গণনা করতে পারেন (অঙ্কনটিতে 3 টি সারি ব্লক)। এর মধ্যে যে কোনও প্রকারের পার্থক্য রয়েছে তার অর্থ এই যে অনুমানটি যে সারোগেট মডেলগুলির সমতুল্য (একে অপরের সাথে তদতিরিক্ত এবং সমস্ত ক্ষেত্রে নির্মিত "গ্র্যান্ড মডেল" এর সাথেও মিলবে)। তবে এটি আপনাকে জানায় যে আপনার কতটা অস্থিরতা রয়েছে। দ্বিপদী অনুপাতের জন্য আমি যতক্ষণ না সত্যিকারের পারফরম্যান্স একই হিসাবে মনে করি (অর্থাত্ একই ক্ষেত্রে সর্বদা একই ক্ষেত্রে ভুলভাবে পূর্বাভাস দেওয়া হয় বা একই সংখ্যাটি ভিন্ন ভিন্ন ক্ষেত্রে ভুলভাবে পূর্বাভাস দেওয়া হয় কিনা) independent আমি জানি না যে কোনও ব্যক্তি বোধগম্যভাবে surrogate মডেলগুলির পারফরম্যান্সের জন্য একটি নির্দিষ্ট বিতরণ গ্রহণ করতে পারে কিনা। তবে আমি মনে করি যে কোনও অবস্থাতেই শ্রেণিবিন্যাসের ত্রুটিগুলির বর্তমানে সাধারণ প্রতিবেদনের চেয়ে একটি সুবিধা যদি আপনি কোনওভাবেই সেই অস্থিরতার কথা জানান।কেk সারোগেট মডেলগুলি প্রতিটি পুনরাবৃত্তির জন্য ইতিমধ্যে পুল করা হয়েছিল, অস্থিরতার বৈচিত্রটি পুনরাবৃত্তির মধ্যে পর্যবেক্ষিত বৈকল্পিকের প্রায় গুণ isk

আমার সাধারণত প্রায় 120 টিরও কম স্বতন্ত্র মামলা নিয়ে কাজ করতে হয়, তাই আমি আমার মডেলগুলিকে খুব দৃ reg়ভাবে নিয়ন্ত্রণ করি put আমি তখন সাধারণত দেখাতে সক্ষম হয়েছি যে সীমাবদ্ধ পরীক্ষার নমুনা আকারের পরিবর্তনের চেয়ে অস্থিরতা বৈকল্পিক । (এবং আমি মনে করি এটি মডেলিংয়ের জন্য বোধগম্য কারণ মানুষ নিদর্শনগুলি সনাক্ত করার দিকে পক্ষপাতদুষ্ট এবং এইভাবে খুব জটিল মডেল তৈরির দিকে আকৃষ্ট হয় এবং এইভাবে অত্যধিক মানানসই)। আমি সাধারণত পুনরাবৃত্তির (এবং , এবং ) এবং সসীম পরীক্ষার নমুনা আকারের গড় পর্যবেক্ষণের পারফরম্যান্সের উপর দ্বি-দ্বিবিশ্বাসের আত্মবিশ্বাসের বিরতিতে পর্যবেক্ষণ করা অস্থিরতা বৈচিত্রের শতকরা প্রতিবেদন করি ।N কে i
nki

অঙ্কনটি ডুমুরের এক নতুন সংস্করণ। এই গবেষণাপত্রে 5: বেলাইট, সি এবং সালজার, আর .: ছোট নমুনা আকারের পরিস্থিতিতে কেমোমেট্রিক মডেলগুলির স্থায়িত্ব মূল্যায়ন ও উন্নতি করা, এনাল বায়ানাল কেম, 390, 1261-1271 (২০০৮)। ডিওআই: 10.1007 / s00216-007-1818-6
নোট করুন যে আমরা যখন কাগজটি লিখেছিলাম তখন আমি বিচ্ছিন্নতার বিভিন্ন উত্সগুলি পুরোপুরি বুঝতে পারি নি যা আমি এখানে ব্যাখ্যা করেছি - এটি মনে রাখবেন। আমি তাই মনে করি যে যুক্তিপ্রদত্ত কার্যকর নমুনা আকারের অনুমানের জন্য সঠিক নয়, যদিও প্রয়োগের সিদ্ধান্তে যে প্রতিটি রোগীর মধ্যে বিভিন্ন টিস্যু ধরণের প্রদত্ত টিস্যু ধরণের একটি নতুন রোগী যতটা সামগ্রিক তথ্য সম্পর্কে অবদান রাখে সম্ভবত এখনও বৈধ (আমার সম্পূর্ণ ভিন্ন ধরণের আছে) প্রমাণ যা সেইভাবে নির্দেশ করে)। তবে আমি এই সম্পর্কে এখনও পুরোপুরি নিশ্চিত নই (না কীভাবে এটি আরও ভাল করা যায় এবং এভাবে চেক করতে সক্ষম হবে) এবং এই সমস্যাটি আপনার প্রশ্নের সাথে সম্পর্কিত নয়।


দ্বি দ্বি আত্মবিশ্বাসের ব্যবধানের জন্য কোন কার্যকারিতা ব্যবহার করবেন?

এখনও অবধি, আমি পরিলক্ষিত গড় পারফরম্যান্সটি ব্যবহার করছি। আপনি সবচেয়ে খারাপ পর্যবেক্ষিত পারফরম্যান্সটিও ব্যবহার করতে পারেন: পর্যবেক্ষণ করা পারফরম্যান্সটি 0.5 এর কাছাকাছি, তারতম্যটি বৃহত্তর এবং এইভাবে আত্মবিশ্বাসের ব্যবধান। সুতরাং, 0.5 এর কাছাকাছি পর্যবেক্ষিত পারফরম্যান্সের আত্মবিশ্বাসের বিরতি আপনাকে কিছু রক্ষণশীল "সুরক্ষা মার্জিন" দেয়।

নোট করুন যে দ্বিপাক্ষিক আত্মবিশ্বাসের অন্তরগুলি গণনা করার জন্য কয়েকটি পদ্ধতিও যদি সফলতার লক্ষিত সংখ্যার পূর্ণসংখ্যা না হয় তবে কাজ করে। রস, টিডিতে বর্ণিত হিসাবে আমি "বায়সিয়ান পোস্টেরিয়র সম্ভাব্যতার সংহতকরণ" ব্যবহার করি
: দ্বিপদী অনুপাত এবং পোইসন রেট অনুমানের জন্য সঠিক আত্মবিশ্বাসের বিরতি, কমপুট বিওল মেড, 33, 509-531 (2003)। ডিওআই: 10.1016 / S0010-4825 (03) 00019-2

(আমি মতলবের জন্য জানি না, তবে আর এ আপনি binom::binom.bayesউভয় আকারের প্যারামিটার সেট করে 1 ব্যবহার করতে পারেন )।


এই চিন্তাগুলি অজানা নতুন মামলার জন্য এই প্রশিক্ষণ ডেটা সেট ফলনের উপর নির্মিত পূর্বাভাস মডেলগুলিতে প্রযোজ্য । আপনি মামলার একই জনসংখ্যা থেকে টানা অন্যান্য প্রশিক্ষণ ডেটা সেট করার generatlize করার প্রয়োজন হলে, আপনি অনুমান করার জন্য কত মডেলের আকারের একটি নতুন প্রশিক্ষণ নমুনা তালিম প্রয়োজন চাই পরিবর্তিত হয়। ("শারীরিকভাবে" নতুন প্রশিক্ষণের ডেটা সেট না করে কীভাবে এটি করা যায় সে সম্পর্কে আমার কোনও ধারণা নেই)n

আরও দেখুন: বেঞ্জিও, ওয়াই এবং গ্র্যান্ডভ্যালেট, ওয়াই: কে-ফোল্ড ক্রস-বৈধকরণের বৈকল্পিকতার কোনও নিরপেক্ষ অনুমানক, মেশিন লার্নিং রিসার্চ জার্নাল, 2004, 5, 1089-1105

(এই বিষয়গুলির সম্পর্কে আরও চিন্তা করা আমার গবেষণা টু-লিস্টে রয়েছে ... তবে আমি পরীক্ষামূলক বিজ্ঞান থেকে আসার পরে আমি পরীক্ষামূলক ডেটা সহ তাত্ত্বিক এবং অনুকরণের উপসংহারের পরিপূরক করতে পছন্দ করি - যা এখানে আমার পক্ষে বিশাল প্রয়োজন কারণ এখানে কঠিন রেফারেন্স পরীক্ষার জন্য স্বতন্ত্র মামলার সেট)


আপডেট: বায়োমিয়াল বিতরণ অনুমান করা কি ন্যায়সঙ্গত?

আমি নীচের মুদ্রা নিক্ষেপ পরীক্ষার মতো কে-ফোল্ড সিভি দেখতে পাচ্ছি: একটি মুদ্রা প্রচুর পরিমাণে নিক্ষেপের পরিবর্তে একই মেশিন দ্বারা উত্পাদিত মুদ্রাগুলিকে অল্প সংখ্যক বার নিক্ষেপ করা হয়। এই ছবিতে, আমার কাছে মনে হয় @ টাল পয়েন্ট দেখায় যে কয়েনগুলি একই নয়। যা স্পষ্টতই সত্য। আমি মনে করি কোনটি করা উচিত এবং কী করা যায় তা সারোগেট মডেলগুলির সমতুল্য অনুমানের উপর নির্ভর করে।k

যদি সরোগেট মডেলগুলির (মুদ্রাগুলি) মধ্যে পারফরম্যান্সের মধ্যে কোনও পার্থক্য থাকে, তবে "traditionalতিহ্যবাহী" অনুমান যে সারোগেট মডেলগুলির সমতুল্য তা ধরে রাখে না। সেক্ষেত্রে কেবল বিতরণ দ্বি-দ্বিণী নয় (যেমন আমি উপরে বলেছি, কোন বিতরণটি ব্যবহার করতে হবে সে সম্পর্কে আমার কোনও ধারণা নেই: এটি প্রতিটি সরোগেট মডেল / প্রতিটি মুদ্রার জন্য দ্বি-দ্বিফলের যোগফল হওয়া উচিত)। তবে নোট করুন, এর অর্থ এই যে সরোগেট মডেলগুলির ফলাফলের পুলিংয়ের অনুমতি নেই। তাই তন্ন তন্ন একটি দ্বিপদ হয় টেস্ট একটি ভাল পড়তা (আমি চেষ্টা উন্নত কিংবা গড় কর্মক্ষমতা আরও আত্মপক্ষ সমর্থন ছাড়া বিন্দু অনুমান হিসাবে ব্যবহার করা যেতে পারে: অস্থিরতা বলছে আমরা প্রকরণ একটি অতিরিক্ত উৎস আছে দ্বারা পড়তা)।n

অন্যদিকে যদি সারোগেটের (সত্য) পারফরম্যান্স একই হয়, তখন আমি "মডেলগুলির সমতুল্য" (একটি লক্ষণটি হ'ল ভবিষ্যদ্বাণীটি স্থিতিশীল) with আমি মনে করি এক্ষেত্রে সমস্ত সার্গেট মডেলের ফলাফলগুলি পোল করা যায়, এবং সমস্ত পরীক্ষার জন্য দ্বিপদী বিতরণ ব্যবহার করা ঠিক হবে: আমি মনে করি সেক্ষেত্রে আমরা সরোগেট মডেলগুলির সত্যিকারের এর সমান হতে মোটে ন্যায়সঙ্গত , এবং এভাবে পরীক্ষাকে একটি মুদ্রা বার নিক্ষেপের সমতুল্য বর্ণনা করে ।পি এনnpn


হাই @ কেবেলাইটস, আমি কেবলমাত্র মন্তব্য করেছি যে আমার সিভি বিশ্লেষণের ফলে সেই নির্দিষ্ট ডেটাসেটের জন্য 2 টি অনন্য মূল্যবোধের ফলাফল হয় (কিছু অন্যান্য ডেটাসেটে এন এর অনন্য মান রয়েছে, সাধারণত এন এর সাথে 5 এরও কম থাকে), যেমন উপরে বর্ণিত অ্যামিবা। এটি দেওয়া, আমি কীভাবে দেখাব যে আমার পূর্বাভাসগুলি কেবলমাত্র আমার একক ডেটাसेट এবং সিভি ব্যবহার করে স্থিতিশীল? দ্বিপদী বিতরণ সম্পর্কে, আমি অ্যাগ্রেস্টি-কলের ব্যবধান বিবেচনা করছিলাম (কোনও সফলতা ছাড়াই উচ্চ সাফল্যের হার / 100% সাফল্যের হারের জন্য কাজ করতে পারি)। মনে হচ্ছে আপনি বলছেন যে আমি দ্বিপদী বিতরণ ব্যবহার করতে পারি, তবে আমি এখনও সাফ না হয়ে কীভাবে সাফল্যের একই পরীক্ষার সেই অনুমানকে ন্যায্যতা দিতে পারি।
শান 23

@ কেবেলাইটস: [আমি আপনার উত্তরের সাথে আমার পূর্ববর্তী মন্তব্য মুছে ফেলেছি এবং এর একটি অংশ এখানে অনুলিপি করেছি।] তবে "ভবিষ্যদ্বাণীগুলি স্থিতিশীল" তা দেখানোর অর্থ কী? পুনরাবৃত্তি সিভিগুলি একেবারে অভিন্ন ফলাফল দেবে না। উদাহরণস্বরূপ, আসুন ধরা যাক ওপি সিভিতে 1000 টি পুনরাবৃত্তি চালায় এবং নির্দিষ্ট বিতরণ সহ 0/120 থেকে 2/120 এ ত্রুটির হার পান। দ্বি দ্বি বৈচিত্রের সাথে এই বৈকল্পিকটি সংযুক্ত করার কোনও উপায় আছে কি? এবং কোন জন্য তখন একটি দ্বিগুণ অন্তর গণনা করে? p
অ্যামিবা

1
@ অ্যামিবা: এক আত্মবিশ্বাসের ব্যবধানে অস্থিরতার কারণে দ্বিপদী বিতরণ কীভাবে অজানা বিতরণের সাথে সংযুক্ত করা যায় তা আমার কোনও ধারণা নেই। সুতরাং আমি সীমাবদ্ধ পরীক্ষার নমুনা আকারের জন্য (ইন) স্থিতিশীলতা এবং দ্বিপদী সিআইয়ের জন্য পর্যবেক্ষণকৃত শতকরা প্রতিবেদন করি। এগুলি কীভাবে সংযুক্ত করা যায় সেগুলি আমি আমার মাথায় রাখি এমন একটি গবেষণামূলক প্রশ্ন, তবে এখনও অবধি আমি কোনও সমাধান খুঁজে পাইনি বা যার সাথে আছে তার সাথে সাক্ষাতও করি না। আমি অনুমান করি আমরা গবেষণার
সর্বাগ্রে পৌঁছেছি

1
@ শীন: আপনি কি আমার সম্পর্কিত সমস্যাগুলি সম্পর্কে সাম্প্রতিক প্রশ্নটি দেখেছেন ? মন্তব্যগুলিতে খুব আকর্ষণীয় (আমার জন্য) আলোচনা চলছে, এবং আমি বর্তমানে নিজেই কিছু সিমুলেশন নিয়ে কাজ করছি। আমি বিশ্বাস করি যে দ্বিপাক্ষিক ধারণাটি খারাপভাবে ভুল! আপনি সেখানে সরবরাহ করা কয়েকটি রেফারেন্সে আগ্রহী হতে পারেন যা একই জিনিস দাবি করে।
অ্যামিবা

1
@ শীন: আমি এই দুটি থ্রেডকে আপডেট রাখার চেষ্টা করব, যার অর্থ এই যে সমস্যাটি আরও স্পষ্ট হয়ে যাওয়ার পরে (এবং যদি) আমি সেখানকার পরিস্থিতি সংক্ষিপ্ত করার এবং এখানে একটি নতুন উত্তর দেওয়ার চেষ্টা করব। আপাতত, আপনি কি এই কাগজটি অন্য থ্রেডের সাথে যুক্ত করেছেন? লেখকরা আপনার প্রশ্নটি হুবহু আলোচনা করে এবং তাদের দাবি একটি বুটস্ট্র্যাপ পদ্ধতি সরবরাহ করে যা তারা ভালভাবে কাজ করে। আমি যদি এখনই আপনার প্রশ্নের উত্তর লিখতে চাই তবে আমি তাদের পদ্ধতিটি সুপারিশ করব। তবে 24 টি কাগজপত্র যা সেই কাগজের উদ্ধৃতি দিয়েছিল তা পরীক্ষা করে প্রথমে বুদ্ধিমান হতে হবে।
অ্যামিবা

3

আমি মনে করি আপনার বহুবার ক্রস-বৈধতা পুনরাবৃত্তি করার ধারণাটি সঠিক।

একই পদ্ধতি পুনরাবৃত্তি করুন আপনার সিভি ধরুন 1000 গুণ যাক, প্রতিটি সময় বিভাজন আপনার অন্যভাবে (10 গুণ সিভি জন্য) 10 অংশে তথ্য (না না লেবেল এলোমেলো)। আপনি শ্রেণিবদ্ধকরণ নির্ভুলতার 1000 অনুমান পাবেন। অবশ্যই আপনি একই ডেটা পুনরায় ব্যবহার করবেন, সুতরাং এই 1000 অনুমানগুলি স্বাধীন হতে যাচ্ছে না। তবে এটি বুটস্ট্র্যাপ পদ্ধতির অনুরূপ: আপনি এই সামগ্রিক নির্ভুলতার প্রাক্কলনকারীকে গড় ত্রুটি হিসাবে এই নির্ভুলতার তুলনায় স্ট্যান্ডার্ড বিচ্যুতি নিতে পারেন । বা 95% আত্মবিশ্বাসের ব্যবধান হিসাবে 95% পার্সেন্টাইল ব্যবধান।

বিকল্পভাবে, আপনি ক্রস-বৈধকরণ লুপ এবং বুটস্ট্র্যাপ লুপ একত্রিত করতে পারেন, এবং কেবল পরীক্ষার সেট হিসাবে আপনার ডেটা 10% এলোমেলো (সম্ভবত স্তরযুক্ত র্যান্ডম) নির্বাচন করতে পারেন এবং এটি 1000 বার করুন। উপরের মত একই যুক্তি এখানেও প্রযোজ্য। যাইহোক, এর পুনরাবৃত্তির তুলনায় উচ্চতর বৈকল্পিকতা তৈরি হবে, সুতরাং আমি মনে করি উপরের পদ্ধতিটি আরও ভাল।

যদি আপনার ভুল শ্রেণিবদ্ধকরণের হার 0.00 হয়, তবে আপনার শ্রেণিবদ্ধকারী শূন্য ত্রুটি করে এবং যদি প্রতিটি বুটস্ট্র্যাপ পুনরাবৃত্তির ক্ষেত্রে এটি ঘটে তবে আপনি শূন্য প্রশস্ত আত্মবিশ্বাসের ব্যবধান পাবেন। তবে এর অর্থ হ'ল আপনার শ্রেণিবদ্ধী বেশ নিখুঁত, আপনার জন্য খুব ভাল।


হাই @ আমেবা, আপনার প্রতিক্রিয়াটির জন্য ধন্যবাদ নমুনাগুলি এলোমেলো করে 1000 বার সিভি পুনরাবৃত্তি করার বিষয়ে আপনার প্রথম পরামর্শ সম্পর্কে আরও কিছু বোঝাতে আপনার কি মনে হবে? পরীক্ষার সেটটির একটি প্রাক-প্রতিষ্ঠিত অনুপাত থাকতে হবে: প্রশিক্ষণ সেট (উদাহরণস্বরূপ 10-ভাঁজ ক্রস-বৈধতার জন্য 10:90)? আমি অনুমান করি যে 10-গুণ বৈধতা পুনরাবৃত্তি করলে সময়ের সাথে তারতম্য আরও বাড়বে কীভাবে আমি কিছুটা অস্পষ্ট।
শান

1
আমি আশঙ্কা করছি যে @ অ্যামিবা প্রস্তাবিত দ্বিতীয় পদ্ধতিটি খুব আশাবাদী: একটি নিখুঁত শ্রেণিবদ্ধকারীর প্রদত্ত ডেটাসেটের উপর নিখুঁত পারফরম্যান্স থাকতে পারে (উদাহরণস্বরূপ, ধরে নিন যে আপনার কাছে মাত্র ৪ টি নমুনা রয়েছে - এটি সকলের শ্রেণিবদ্ধ করার জন্য এটি 1: 8 সঠিকভাবে সুযোগ দ্বারা)। অ্যামিবা হিসাবে উল্লেখ করা হয়েছে, ট্রেন-পরীক্ষা ভাঁজগুলির বিভিন্ন বরাদ্দের চেয়ে ভিন্নতা পরিমাপ করলে 0 প্রস্থের আত্মবিশ্বাসের ব্যবধান তৈরি হবে, যা এই ক্ষেত্রে স্পষ্টতই ভুল।
ত্রিশোলরিয়ান্সস্ক্রিন

1
আমি মনে করি যে শেষ পর্যন্ত, এই সমস্যাটি ডেটা পর্যবেক্ষণের সম্ভাব্যতা খুঁজে নেওয়ার জন্য নেমে আসে যা আমি ইতিমধ্যে পর্যবেক্ষণ করি নি তার চেয়ে পৃথক। আমার নমুনার জন্য আত্মবিশ্বাসের ব্যবস্থাগুলি প্রাপ্তি হ'ল অ্যামিবা আমার মূল প্রশ্নটির জন্য পরামর্শ দিয়েছে (আমি প্রতিটি সিভি পুনরাবৃত্তির জন্য এলোমেলো ভাঁজ ব্যবহার করেছি), এবং ফলাফলটি আরও বাস্তবসম্মত দেখাচ্ছে (95% সিআই: [0.0028, 0.0033])। তবে, আমি জানি না যে এমন আরও কোনও কৌশল আছে যা ভবিষ্যতের ডেটা পূর্বাভাসের জন্য ভাল। সম্ভবত এমন কোনও ধরণের মডেল-ভিত্তিক পদ্ধতির যেখানে আমি আমার ডেটাগুলিতে কার্ভ ফিট করে এবং তাদের ওভারল্যাপ গণনা করি?
শন

3
@ অ্যামিবা: স্পষ্টতার জন্য আপনাকে ধন্যবাদ, আমি অনুমান করি যে আমি আপনার উত্তরটি যথেষ্ট মনোযোগ দিয়ে পড়িনি। তবুও, আমি এখনও এই পদ্ধতির (উভয় প্রক্রিয়া) একটি আশাবাদী পক্ষপাত সম্পর্কে সমস্যায় পড়েছি। বিভিন্ন সিভি বিভক্ত করার চেষ্টা করার সময় নির্ভুলতা পরিমাপ করে, আপনি নির্বিচারে বিভাজনের ফলে যে পরিবর্তনশীল তা অনুমান করেন। তবুও, আপনি এই বিষয়টি উপেক্ষা করেন যে আপনার সম্পূর্ণ ডেটা পর্যবেক্ষণের বৃহত জনসংখ্যার (যেটি আপনি সংগ্রহ করেননি) এলোমেলো নমুনা। আপনার যদি এমন একটি ছোট ডেটাसेट থাকে যা যথাযথভাবে পারফরম্যান্স সম্পাদন করে (সিভি বিভাজন নির্বিশেষে), আপনার আত্মবিশ্বাসের ব্যবধানটি শূন্য এবং এটি ভুল।
Trisoloriansunscreen

1
@ অ্যামিবা: এটি মুশকিল, যেহেতু আপনি পর্যবেক্ষণগুলি নিজেরাই বুটস্ট্র্যাপ করতে পারবেন না (এই ক্ষেত্রে নিকটতম প্রতিবেশী শ্রেণিবদ্ধী বিবেচনা করুন)। আমি নিজেই সেই সমস্যাটির সাথে লড়াই করছি, আসুন দেখি অন্য কেউ ধারণা নিয়ে আসে কিনা।
ত্রিশোলরিয়ান্সস্ক্রিন

2

শ্রেণিবদ্ধকরণ ত্রুটি উভয় বিচ্ছিন্ন এবং একটি অনুচিত স্কোরিং নিয়ম। এটিতে যথাযথতা কম রয়েছে এবং এটি অনুকূল বৈশিষ্ট্যগুলি ভুল বৈশিষ্ট্যগুলির উপর নির্বাচন করে এবং তাদেরকে ভুল ওজন দেয়।


তিনি যদি 99-100% ক্রস-বৈধতাযুক্ত শ্রেণিবিন্যাসের নির্ভুলতা পান তবে ওপি-র ক্ষেত্রে এটি খুব কমই সমস্যা হতে পারে।
অ্যামিবা 14

1
@ অ্যামিবা: 100 বা 0% এর কাছাকাছি সঠিক অনুপাতটি যদি পর্যবেক্ষণ করা হয় তবে এটিও সমস্যা হতে পারে: ক্রমাগত স্কোরগুলির উপর নির্ভরশীল কর্মক্ষমতা ব্যবস্থার বিপরীতে, ডিকোটমাইজিং (কঠোরকরণ) এর পরে পরিমাপ করা কোনও ধরণের পারফরম্যান্স ক্রমাগত শ্রেণিবিন্যাসের স্কোর নির্দেশ করতে পারে না ভবিষ্যদ্বাণীগুলি সিদ্ধান্ত সীমান্তের কাছাকাছি আসবে যতক্ষণ না তারা এখনও সঠিক দিকে রয়েছে। তবে আইএমএইচও-র অনুপাত-প্রকারের পারফরম্যান্স পদক্ষেপগুলি প্রতিবেদন করার বৈধ কারণ রয়েছে (যেমন আপনার পাঠক / সহযোগীরা যদি সেগুলি বুঝতে পারে তবে উদাহরণস্বরূপ ব্রায়ার স্কোরগুলি বুঝতে পারে না)। আমি এটি খুলতে
চাইনি

... আলোচনার লাইন যেহেতু প্রশ্নটিতে অপ্টিমাইজেশনের কোনও ইঙ্গিত ছিল না (এটি যেখানে এটি সত্যই গুরুত্বপূর্ণ হয়ে ওঠে)।
সিবিএলাইটরা এসএক্স

আপনি যদি অনুপাতটিকে "সঠিকভাবে" শ্রেণীবদ্ধ করে গণনা করছেন তবে অবশ্যই কোনও কারণ হিসাবে এটি করা উচিত, যেমন কোনও রায় দেওয়ার জন্য বা কোনও পদক্ষেপ নিতে। অনুপাতগুলি এই উদ্দেশ্যে বিভ্রান্তিকর।
ফ্রাঙ্ক হ্যারেল

1
@ ফ্র্যাঙ্কহারেল: ঠিক আছে, আমার অনুমানের কারণটি এটি একটি কাগজে রিপোর্ট করা। আপনার কি মনে হয় লোকেরা শ্রেণিবদ্ধকরণের অভিযোগগুলি আদৌ বন্ধ করা উচিত?
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.