অনিশ্চিত ডেটা দিয়ে তত্ত্বাবধানে শেখা?


11

কোনও অনিশ্চিত ডেটাসেটে তত্ত্বাবধানে শেখার মডেল প্রয়োগ করার জন্য কি বিদ্যমান পদ্ধতি আছে? উদাহরণস্বরূপ, বলুন আমাদের কাছে ক্লাস এ এবং বি সহ একটি ডেটাसेट রয়েছে:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

কীভাবে আমরা এই বিষয়ে একটি মেশিন লার্নিং মডেলকে প্রশিক্ষণ দিতে পারি? ধন্যবাদ।

উত্তর:


11

সংখ্যার গুণমান হিসাবে আপনি নিজের ডেটাতে স্বীকৃতি হিসাবে, আমি মনে করি এই "নিশ্চিততা" অবশ্যই ওজন হিসাবে ব্যবহৃত হতে পারে। উচ্চতর "সুনির্দিষ্টতা" স্কোর সিদ্ধান্তের কার্যক্রমে একটি ডেটামের ওজন বাড়িয়ে তোলে, যা বোঝা যায়।

অনেক তত্ত্বাবধানে শেখার অ্যালগরিদম ওজনকে সমর্থন করে, তাই আপনি যেটি ব্যবহার করতে চান তার একটি ভারী সংস্করণ খুঁজে পেতে হবে।


2
(+1) এবং যেহেতু মূলত ওজনগুলি পয়েন্টগুলির "প্রতিলিপি" হিসাবে কাজ করবে, সম্ভবত কোনও অ্যালগরিদমকে সেভাবে ভারী সংস্করণে গুঁড়িয়ে দেওয়া যেতে পারে, যেমন ওপি উদাহরণে, [5,8,10] এর অনুলিপিগুলিতে পাস করুন 3 টি পয়েন্ট, তাদের [50,80,100]% এর নিশ্চিততা প্রতিফলিত করে। (এটি কখনই সত্যই প্রয়োজন হবে না, যেন এটি নীতিগতভাবে করা যেতে পারে, আলগোরিদমের একটি ভারী ভার্সন থাকতে হবে))
জিওম্যাট 2222

5

A বা B লেবেল রাখার পরিবর্তে আপনি এগুলি স্থির করে নিতে পারেন নিরন্তর মানগুলির সাথে - উদাহরণস্বরূপ, এমন জিনিসের সাথে মিলে যা আপনি নিশ্চিত হলেন , এমন কিছুর সাথে আপনি যা নিশ্চিত তা এবং সাথে সামঞ্জস্য 40% নিশ্চিত । তারপরে, এমন একটি মডেল তৈরি করুন যা বা শ্রেণীর পূর্বাভাস দেওয়ার পরিবর্তে বা মধ্যে স্কোরকে আউটপুট দেয় যার ভিত্তিতে আপনি এর একটি বা অন্যটিকে কতটা ভাবেন (এবং এই স্কোরটি যদি> বা </ 2 এর উপর ভিত্তি করে থাকে) res এটি আপনার শ্রেণিবদ্ধকরণ সমস্যাটিকে রিগ্রেশন সমস্যায় পরিণত করে (যা আপনি শ্রেণিবদ্ধে ফিরে যাওয়ার জন্য প্রান্তিক হয়ে)।1A0B0.6AAB01

উদাহরণস্বরূপ, আপনি হিসাবে (যেখানে উপরে সুনিশ্চিত)। তারপর যখন কিছু ডেটা পরীক্ষা করতে চান, এটা মডেল প্লাগ করুন, এরপর এবং আউটপুট ট্যাগ যদি এবং অন্যথায়।logp(A|x)p(B|x)=logp(A|x)1P(A|x)β0+β1Txp(A|x)Aβ0+β1Tx>0B


সুতরাং আপনার যদি একটি বহু-শ্রেণীর শ্রেণিবিন্যাস সমস্যা ছিল, আপনি ক্লাসের সংখ্যার সমান দৈর্ঘ্য সহ ভেক্টর হিসাবে আপনার লক্ষ্যগুলি সেট করতে পারেন?
হাইপারডো

ক্লাসের সংখ্যা -1, নির্দিষ্টতাগুলি 100% হিসাবে গণ্য করে; উদাহরণটি লজিস্টিক রিগ্রেশন এর অনুরূপ। অনেক শ্রেণিবদ্ধ ব্যক্তি স্কোর উত্পাদন করে (যেমন কোনও মডেলের অধীনে পি (শ্রেণি | ডেটা) এর অনুমান)। এই সমস্ত উত্তরের প্রস্তাবটি হ'ল ক্লাসগুলি সরাসরি ভবিষ্যদ্বাণী করার পরিবর্তে নির্দিষ্টতাগুলি স্কোর হিসাবে দেখুন এবং তার পরিবর্তে সেগুলি পূর্বাভাস দিন। তারপরে, স্কোরগুলি দিয়ে কিছু করুন।
ব্যাটম্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.