আমি যখন পিআর এর জন্য কেবল একটি মান রাখি তখন কীভাবে একটি যথার্থ-রিকাল বক্ররেখা তৈরি করতে হয়?


12

আমার কাছে একটি ডেটা মাইনিংয়ের অ্যাসাইনমেন্ট রয়েছে যেখানে আমি একটি সামগ্রী-ভিত্তিক চিত্র পুনরুদ্ধার ব্যবস্থা করি। আমার কাছে 5 টি প্রাণীর 20 টি চিত্র রয়েছে। সুতরাং মোট 100 ইমেজ।

আমার সিস্টেমটি 10 ​​টি প্রাসঙ্গিক চিত্রগুলিকে একটি ইনপুট চিত্রটিতে ফিরিয়ে দেয়। এখন আমার সিস্টেমের পারফরম্যান্সটিকে যথার্থ-পুনর্বিবেচনা বক্ররেখার সাথে মূল্যায়ন করা দরকার। তবে, আমি যথার্থ-প্রত্যাহার বক্ররেখার ধারণাটি বুঝতে পারি না। ধরা যাক যে আমার সিস্টেম গরিলা চিত্রের জন্য 10 টি চিত্র প্রত্যাবর্তন করে, তবে এর মধ্যে কেবল 4 টি গরিলা। অন্য 6 টি চিত্র ফিরে এসেছে অন্যান্য প্রাণী '। সুতরাং,

  • যথার্থতা 4/10 = 0.4(প্রাসঙ্গিক ফেরত) / (সমস্ত প্রত্যাবর্তিত)
  • প্রত্যাহার 4/20 = 0.2(প্রাসঙ্গিক ফেরত) / (সমস্ত প্রাসঙ্গিক)

সুতরাং আমি কেবল একটি পয়েন্ট আছে, <0.2,0.4>একটি বক্ররেখা না। আমার কীভাবে একটি বক্রতা আছে (অর্থাত্ পয়েন্টগুলির একটি সেট)? আমি কি ফিরিয়ে দেওয়া চিত্রের সংখ্যা পরিবর্তন করব (এটি আমার ক্ষেত্রে 10 এ স্থির করা হয়েছে)?


2
বেশিরভাগ মডেল একটি শ্রেণীর সাথে সম্পর্কিত হওয়ার সম্ভাবনা নির্ধারণ করে, কোনও শ্রেণি নিজেই নয় - বা আপনি একটি শ্রেণিবদ্ধের বাইরে ছড়িয়ে দেন। সম্ভাব্যতা কাট-অফ পরিবর্তন করে বক্ররেখা উত্পন্ন হয়। আপনি যদি ক্লাসিফায়ারটি ব্যবহার করে উল্লেখ করেন তবে সম্ভবত আরও বিশদ উত্তর পাবেন।
চার্লস 21

আমি বৈশিষ্ট্য ভেক্টরগুলি (রঙ, টেক্সচার এবং আকৃতি) গণনা করি এবং প্রত্যেকটির জন্য মিলের স্কোর অর্জন করি, মোট মিলের স্কোরের জন্য তাদের যোগ করি, তারপরে সাজানো সাজানো। শীর্ষ 10 চিত্র সূচকগুলি সর্বাধিক প্রাসঙ্গিক। চিত্রগুলি অর্ডার হওয়ার পরে আমি চিত্র সূচী থেকে শ্রেণি সূচক পেতে পারি (20 গরিলা, 20 জিরাফ ইত্যাদি) আমি আশা করি যে আমি নিজেকে পরিষ্কার করে দেব, যেহেতু আমি ধারণাগুলি শ্রেণিবদ্ধ / বর্ণনাকারী ইত্যাদি পুরোপুরি বুঝতে পারি না
জেফ

বুঝতে পারলাম আমি প্রশ্ন ভাল করে পড়িনি। ভেবেছিলেন আপনার একটি দ্বি শ্রেণির সমস্যা আছে (গরিলা / ন-গরিলা)। আমার ছাড়িয়ে আরও ক্লাসের পথ সহ, এটি সহায়ক হতে পারে: stats.stackexchange.com/questions/2151/…
চার্লস

উত্তর:


11

পিআর কার্ভ তৈরি করা একটি আরওসি বক্ররেখা উত্পন্ন করার অনুরূপ। এই জাতীয় প্লট আঁকার জন্য আপনার পরীক্ষার সেটটির পুরো র‌্যাঙ্কিং দরকার। এই র‌্যাঙ্কিংটি তৈরি করতে আপনার এমন একটি শ্রেণিবদ্ধ প্রয়োজন যা বাইনারি উত্তরের চেয়ে সিদ্ধান্তের মানকে ছাড়িয়ে যায়। সিদ্ধান্ত মান হ'ল পূর্বাভাসের প্রতি আস্থার একটি পরিমাপ যা আমরা সমস্ত পরীক্ষার দৃষ্টান্তগুলিকে র‌্যাঙ্ক করতে ব্যবহার করতে পারি। উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন এবং এসভিএমের সিদ্ধান্তের মানগুলি যথাক্রমে পৃথক পৃথক হাইপারপ্লেনের সম্ভাবনা এবং একটি (স্বাক্ষরিত) দূরত্ব।

আপনি যদি সিদ্ধান্তের মূল্যগুলি নিষ্পত্তি করে থাকেন তবে আপনি সিদ্ধান্তের মানগুলির উপরে একটি সেট নির্ধারণ করবেন। এই থ্রেশহোল্ডগুলি শ্রেণিবদ্ধের বিভিন্ন সেটিংস : যেমন আপনি রক্ষণশীলতার স্তরটি নিয়ন্ত্রণ করতে পারেন। লজিস্টিক রিগ্রেশনের জন্য, ডিফল্ট প্রান্তিক মান তবে আপনি পুরো পরিসীমা এর উপরে যেতে পারবেন । সাধারণত, থ্রেশহোল্ডগুলি অনন্য সিদ্ধান্তের মান হিসাবে বেছে নেওয়া হয় যা আপনার পরীক্ষার সেটটির জন্য উত্পন্ন মডেল।(এক্স)=0.5(0,1)

প্রান্তিকের প্রতিটি পছন্দে, আপনার মডেল বিভিন্ন পূর্বাভাস দেয় (উদাঃ বিভিন্ন ধরণের ইতিবাচক এবং নেতিবাচক পূর্বাভাস)। যেমন, আপনি tuples একটি সেট যে থ্রেশহোল্ড এ বিভিন্ন স্পষ্টতা এবং রিকল সঙ্গে tuples একটি সেট পেতে, যেমন । পিআর বক্ররেখা উপর ভিত্তি করে আঁকা ।(টিআমি,পিআমি,আরআমি)(পিআমি,আরআমি)

যদি আমি আপনার মন্তব্যটি সঠিকভাবে বুঝতে পারি তবে মোট গণনা করার মতো স্কোরকে সিদ্ধান্তের মান হিসাবে ব্যবহার করা যেতে পারে।


এটি আমার কাছে পরিষ্কার নয়, আপনি কি ওপি'র প্রাণী চিত্র পুনরুদ্ধারের পরিস্থিতির মতো একটি বিশদ উদাহরণ দিয়ে কাজ করতে পারবেন?
এমআর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.