আমি একটি মেশিন লার্নিং কোর্স অধ্যয়ন করছি এবং লেকচার স্লাইডগুলিতে এমন তথ্য রয়েছে যা আমি প্রস্তাবিত বইয়ের সাথে বিরোধিতা পাই।
সমস্যাটি নিম্নলিখিত: তিনটি শ্রেণিবদ্ধ রয়েছে:
- শ্রেণিবদ্ধ একটি থ্রেশহোল্ডগুলির নিম্ন সীমার মধ্যে আরও ভাল পারফরম্যান্স সরবরাহ করে,
- শ্রেণিবদ্ধ বি প্রান্তিকের উচ্চতর পরিসরে আরও ভাল কর্মক্ষমতা সরবরাহ করে,
- শ্রেণিবদ্ধ সি আমরা একটি পি-কয়েন উল্টিয়ে এবং দুটি শ্রেণিবদ্ধ থেকে নির্বাচন করে কী পাই।
একটি আরওসি বক্ররেখা হিসাবে শ্রেণিবদ্ধ সি এর কর্মক্ষমতা কেমন হবে?
লেকচারের স্লাইডগুলিতে উল্লেখ করা হয়েছে যে এই মুদ্রাকে উল্টিয়ে আমরা শ্রেণিবদ্ধ এ এবং বি এর আরওসি বক্ররেখার যাদুকরী " উত্তল হাল " পেতে যাচ্ছি ।
আমি এই বিষয়টি বুঝতে পারি না। কেবল একটি মুদ্রা উল্টিয়ে আমরা কীভাবে তথ্য অর্জন করতে পারি?
বক্তৃতা স্লাইড
বই কি বলে
অন্যদিকে প্রস্তাবিত বই ( ডেটা মাইনিং ... আয়ান এইচ। উইটেন, আইবে ফ্র্যাঙ্ক এবং মার্ক এ। হল ) লিখেছেন যে:
এটি দেখতে, পদ্ধতি A এর জন্য একটি নির্দিষ্ট সম্ভাবনার কাটফট চয়ন করুন যা যথাক্রমে টিএ এবং এফএর সত্য এবং মিথ্যা ধনাত্মক হার দেয় এবং বি বি এবং এফবি দেয় এমন পদ্ধতি বিয়ের জন্য আরও একটি কাটঅফ বেছে নিন। আপনি যদি সম্ভাব্যতা p এবং q এর সাথে এলোমেলোভাবে এই দুটি স্কিম ব্যবহার করেন, যেখানে p + q = 1, তবে আপনি পি এর সত্য এবং মিথ্যা ধনাত্মক হার পাবেন। tA + q। টিবি এবং পি। এফএ + কিউ। FB। এটি পয়েন্ট (টিএ, এফএ) এবং (টিবি, এফবি) যোগ করে সোজা রেখার উপর অবস্থিত একটি বিন্দুর প্রতিনিধিত্ব করে এবং পি এবং কিউ পরিবর্তিত করে আপনি এই দুটি পয়েন্টের মধ্যে পুরো লাইনটি বের করতে পারেন।
আমার বোধগম্যতার সাথে বইটি যা বলেছে তা হ'ল আসলে তথ্য অর্জন করতে এবং উত্তল হলের কাছে পৌঁছানোর জন্য আমাদের কেবল পি-কয়েন উল্টানোর চেয়ে আরও উন্নত কিছু করা দরকার।
আফাইক, সঠিক উপায় (বইয়ের পরামর্শ অনুসারে) নিম্নলিখিত:
- শ্রেণিবদ্ধ A এর জন্য আমাদের সর্বোত্তম প্রান্তিক ওয়া খুঁজে পাওয়া উচিত
- শ্রেণিবদ্ধ বি এর জন্য আমাদের একটি সর্বোত্তম প্রান্তিক ওব খুঁজে পাওয়া উচিত
সি হিসাবে নিম্নলিখিত হিসাবে সংজ্ঞায়িত:
- যদি টি <ওআ, টি দিয়ে শ্রেণিবদ্ধ A ব্যবহার করুন
- যদি টি> ওব, টি সহ শ্রেণিবদ্ধ বি ব্যবহার করুন
- যদি ওএ <টি <ওব, আমরা ওএ এবং ওব এর মধ্যে যেখানে আছি তার একটি রৈখিক সংমিশ্রণ হিসাবে সম্ভাব্যতার দ্বারা ওএ এবং বি এর সাথে শ্রেণীবদ্ধ A এর মধ্যে বেছে নিন।
এটা কি সঠিক? যদি হ্যাঁ, স্লাইডগুলির পরামর্শের তুলনায় কয়েকটি মূল পার্থক্য রয়েছে।
- এটি কোনও সাধারণ মুদ্রা উল্টানো নয়, বরং একটি আরও উন্নত অ্যালগরিদম যার জন্য ম্যানুয়ালি সংজ্ঞায়িত পয়েন্ট দরকার হয় এবং আমরা কোন অঞ্চলে পড়ি তার উপর ভিত্তি করে বেছে নেওয়া হয়।
- এটি কখনই ওএ ও ওবের মধ্যে প্রান্তিক মান সহ শ্রেণিবদ্ধ A এবং B ব্যবহার করে না।
আপনি কি আমাকে এই সমস্যাটি ব্যাখ্যা করতে পারেন এবং এটি বোঝার সঠিক উপায় কী , যদি আমার বোঝাটি সঠিক না হত?
স্লাইডগুলির পরামর্শ মতো আমরা কেবল একটি পি-কয়েন উল্টাতে চাইলে কী হবে? আমি ভাবব যে আমরা একটি আরওসি বক্ররেখা পেতে চাই যা এ এবং বি এর মধ্যে থাকে তবে কোনও নির্দিষ্ট বিন্দুতে এর চেয়ে ভাল কখনই "ভাল" হতে পারে না।
আমি যতদূর দেখতে পাচ্ছি, কীভাবে স্লাইডগুলি সঠিক হতে পারে তা আমি সত্যিই বুঝতে পারি না। বাম দিকে সম্ভাব্য গণনা আমার কাছে তা বোঝায় না।
আপডেট: মূল লেখকের লেখা নিবন্ধটি পাওয়া গেছে যিনি উত্তল হাল পদ্ধতিটি আবিষ্কার করেছিলেন: http://www.bmva.org/bmvc/1998/pdf/p082.pdf