এই উত্তরটি বেশিরভাগ আর2 তে ফোকাস করবে তবে এই যুক্তিটির বেশিরভাগ অংশ অন্যান্য মেট্রিকগুলিতে যেমন এউসি ইত্যাদিতে প্রসারিত।
এই প্রশ্নের প্রায় অবশ্যই আপনার পক্ষে ক্রসভিলেটেড পাঠকদের পক্ষে ভাল উত্তর দেওয়া যাবে না। আর 2 এর মতো মডেল মেট্রিকগুলি ভাল কিনা তা নির্ধারণের কোনও প্রসঙ্গ-মুক্ত উপায় নেইআর2 । চূড়ান্তভাবে, সাধারণত বিশেষজ্ঞদের বিভিন্ন ধরণের থেকে sensকমত্য পাওয়া সম্ভব: প্রায় 1 এর একটি আর2 সাধারণত একটি ভাল মডেল নির্দেশ করে, এবং 0 এর কাছাকাছি একটি ভয়ানককে নির্দেশ করে। এর মধ্যে একটি পরিসীমা থাকে যেখানে মূল্যায়ন সহজাতভাবে বিষয়গত হয়। এই পরিসীমাটিতে, আপনার মডেল মেট্রিক কোনও ভাল কিনা তা উত্তর দিতে কেবল পরিসংখ্যান বিশেষজ্ঞের চেয়ে বেশি লাগে। এটি আপনার অঞ্চলে অতিরিক্ত দক্ষতা নেয়, যা ক্রসভিলেটেড পাঠক সম্ভবত নেই।
কেন? আমাকে আমার নিজের অভিজ্ঞতা থেকে একটি উদাহরণ দিয়ে চিত্রিত করুন (ছোটখাটো বিশদ বিবরণ পরিবর্তিত হয়েছে)।
আমি মাইক্রোবায়োলজি ল্যাব পরীক্ষাগুলি করতাম। আমি পুষ্টিক ঘনত্বের বিভিন্ন স্তরে কোষগুলির ফ্লাস্ক স্থাপন করব এবং কোষের ঘনত্বের বৃদ্ধি পরিমাপ করব (সময়ের সাথে কোষের ঘনত্বের slাল, যদিও এই বিবরণটি গুরুত্বপূর্ণ নয়)। যখন আমি তারপর এই বৃদ্ধি / পুষ্টির সম্পর্ক অনুকরণে, এটা অর্জন করা খুবই সাধারণ বিষয় ছিল আর2 এর 0.90> মান।
আমি এখন পরিবেশ বিজ্ঞানী। আমি প্রকৃতি থেকে পরিমাপযুক্ত ডেটাসেটের সাথে কাজ করি। আমি যদি এই 'ক্ষেত্র' ডেটাসেটগুলিতে উপরে বর্ণিত ঠিক একই মডেলের ফিট করার চেষ্টা করি, আমি আর2 0.4 এর চেয়ে বেশি হলে আমি অবাক হব ।
আর2
আর2
প্রত্যাশাগুলিতে এই বড় পার্থক্যের কারণ কী? প্রসঙ্গ। এই অস্পষ্ট শব্দটি একটি বিস্তৃত অঞ্চলকে কভার করে, সুতরাং আমি এটিকে আরও কিছু নির্দিষ্ট কারণগুলিতে আলাদা করার চেষ্টা করি (এটি সম্ভবত অসম্পূর্ণ):
1. পরিশোধ / ফলাফল / আবেদন কি?
আর2
আর2পাখির। কয়েক দশক আগে, মার্কিন যুক্তরাষ্ট্রে প্রায় 85% এর যথাযথতা উচ্চ হিসাবে বিবেচিত হত। আজকাল, প্রায় সর্বোচ্চ 99% এর সর্বাধিক নির্ভুলতা অর্জনের মান? সম্ভবত এমন এক বেতন যা প্রতি বছর সম্ভবত 60,000 থেকে সম্ভবত 180,000 ডলার পর্যন্ত সীমাবদ্ধ হতে পারে (কিছু দ্রুত গুগলিংয়ের উপর ভিত্তি করে)। যেহেতু মানুষ এখনও তাদের গতিবেগের মধ্যে সীমাবদ্ধ তাই মেশিন লার্নিং অ্যালগরিদমগুলি একই ধরণের নির্ভুলতা অর্জন করতে পারে তবে দ্রুততর স্থান নির্ধারণের অনুমতি দেয় কয়েক মিলিয়ন এর মূল্য হতে পারে।
(আমি আশা করি আপনি উদাহরণটি উপভোগ করেছেন - বিকল্পটি ছিল সন্ত্রাসীদের খুব প্রশ্নবিদ্ধ অ্যালগরিদমিক সনাক্তকরণ সম্পর্কে হতাশাজনক)
২. আপনার সিস্টেমে অব্যাহত উপাদানগুলির প্রভাব কতটা শক্তিশালী?
R2
৩. আপনার পরিমাপ কতটা নির্ভুল এবং সঠিক?
R2
4. মডেল জটিলতা এবং সাধারণীকরণ
R2R2
R2R2
আইএমও, ওভারফিট করা অনেক ক্ষেত্রে আশ্চর্যরকম সাধারণ। এটি এড়ানোর জন্য কীভাবে সেরা তা জটিল বিষয় এবং আমি যদি আপনার আগ্রহী হয় তবে এই সাইটে নিয়মিতকরণ পদ্ধতি এবং মডেল নির্বাচন সম্পর্কে পড়ার পরামর্শ দিই ।
৫. ডেটা পরিসীমা এবং এক্সট্রাপোলেশন
R2
এগুলি বাদ দিয়ে, যদি আপনি কোনও ডেটাসেটের সাথে একটি মডেল ফিট করেন এবং সেই ডেটাসেটের (যেমন এক্সট্রোপোলেট ) এক্স এক্সের বাইরে কোনও মান পূর্বাভাসের প্রয়োজন হয় তবে আপনি দেখতে পাচ্ছেন যে এর পারফরম্যান্সটি আপনার প্রত্যাশার চেয়ে কম। এটি কারণ আপনি যে সম্পর্কটি অনুমান করেছেন তা আপনার মাপসই করা ডেটা সীমার বাইরেও পরিবর্তিত হতে পারে। নীচের চিত্রটিতে, আপনি যদি কেবল সবুজ বাক্সের দ্বারা নির্দেশিত পরিসীমা পরিমাপ করেন তবে আপনি কল্পনা করতে পারেন যে একটি সরল রেখা (লাল রঙে) তথ্যটি ভালভাবে বর্ণনা করেছে। তবে আপনি যদি সেই লাল রেখার সাথে এই সীমার বাইরে কোনও মানের পূর্বাভাস দেওয়ার চেষ্টা করেন তবে আপনি বেশ ভুল হয়ে যাবেন।
[চিত্র তার সম্পাদিত সংস্করণ এই এক , 'Monod বক্ররেখা' এর জন্য একটি দ্রুত Google অনুসন্ধান মাধ্যমে পাওয়া যায় নি।]
Met. মেট্রিকগুলি আপনাকে ছবির একটি অংশ দেয়
এটি আসলে মেট্রিকগুলির সমালোচনা নয় - এগুলি সংক্ষিপ্তসার , যার অর্থ তারা ডিজাইন করেও তথ্য ফেলে দেয় away তবে এর অর্থ এই যে যে কোনও একক মেট্রিক এমন তথ্য ছেড়ে যায় যা এর ব্যাখ্যার পক্ষে গুরুত্বপূর্ণ হতে পারে। একটি ভাল বিশ্লেষণ একক মেট্রিকের চেয়ে বেশি বিবেচনায় নেয়।
পরামর্শ, সংশোধন এবং অন্যান্য প্রতিক্রিয়া স্বাগত। এবং অন্যান্য উত্তরগুলিও অবশ্যই।