গ্রাউন্ড ট্রুথ কি


30

মেশিন লার্নিংয়ের প্রসঙ্গে আমি গ্রাউন্ড ট্রুথ শব্দটি অনেক ব্যবহার করে দেখেছি । আমি অনেক অনুসন্ধান করেছি এবং উইকিপিডিয়ায় নিম্নলিখিত সংজ্ঞাটি পেয়েছি :

মেশিন লার্নিংয়ে, "গ্রাউন্ড ট্রুথ" শব্দটি তত্ত্বাবধানে শেখার কৌশলগুলির জন্য প্রশিক্ষণের সেটটির শ্রেণিবিন্যাসের যথার্থতা বোঝায়। এটি গবেষণা অনুমানকে প্রমাণ বা প্রমাণ করতে স্ট্যাটিস্টিকাল মডেলগুলিতে ব্যবহৃত হয়। "গ্রাউন্ড ট্রুথিং" শব্দটি এই পরীক্ষার জন্য সঠিক উদ্দেশ্য (প্রমাণযোগ্য) ডেটা সংগ্রহের প্রক্রিয়া বোঝায়। সোনার মান সঙ্গে তুলনা করুন।

বায়েশিয়ান স্প্যাম ফিল্টারিং তদারকি করা শেখার একটি সাধারণ উদাহরণ। এই সিস্টেমে অ্যালগরিদমটি ম্যানুয়ালি স্প্যাম এবং নন-স্প্যামের মধ্যে পার্থক্য শেখানো হয়। এটি অ্যালগরিদমকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত বার্তাগুলির স্থল সত্যের উপর নির্ভর করে - গ্রাউন্ড ট্রুথের অপূর্ণতা ফলাফল স্প্যাম / স্প্যাম-নন-স্প্যামের রায়গুলিতে ভুল সংখ্যার সাথে সম্পর্কিত হবে।

মুল বক্তব্যটি হ'ল আমি আসলে এর অর্থ কী তা বুঝতে পারি না। এটি কি প্রতিটি ডেটা অবজেক্টের জন্য ব্যবহৃত লেবেল বা লক্ষ্য ফাংশন যা প্রতিটি ডেটা অবজেক্টকে একটি লেবেল দেয় , বা অন্য কিছু হতে পারে?

উত্তর:


25

মূল প্রশিক্ষণটি আপনি প্রশিক্ষণ এবং পরীক্ষার উদাহরণগুলির জন্য আপনার টার্গেট ভেরিয়েবলের জন্য কী পরিমাপ করেছেন।

প্রায় সমস্ত সময় আপনি নিরাপদে এটিকে লেবেলের মতোই আচরণ করতে পারেন।

কিছু ক্ষেত্রে এটি ঠিক লেবেলের মতো নয়। উদাহরণস্বরূপ আপনি যদি আপনার ডেটা সেট বাড়িয়ে তোলেন তবে গ্রাউন্ড ট্রুথ (আপনার প্রকৃত পরিমাপ) এবং কীভাবে বাড়ানো উদাহরণগুলি আপনি নির্ধারিত লেবেলের সাথে সম্পর্কিত তার মধ্যে একটি সূক্ষ্ম পার্থক্য রয়েছে। তবে এই পার্থক্যটি সাধারণত কোনও সমস্যা হয় না।

গ্রাউন্ড সত্য ভুল হতে পারে। এটি একটি পরিমাপ, এবং এতে ত্রুটি থাকতে পারে। কিছু এমএল পরিস্থিতিতে এটি একটি বিষয়গত পরিমাপ হতে পারে যেখানে অন্তর্নিহিত উদ্দেশ্য সত্যকে সংজ্ঞায়িত করা কঠিন - যেমন বিশেষজ্ঞের মতামত বা বিশ্লেষণ, যা আপনি স্বয়ংক্রিয়ভাবে আশা করছেন। আপনার প্রশিক্ষিত যে কোনও এমএল মডেল প্রশিক্ষণ ও পরীক্ষা করার জন্য ব্যবহৃত স্থল সত্যের গুণগতমানের দ্বারা সীমাবদ্ধ থাকবে এবং এটি উইকিপিডিয়া উক্তিটির ব্যাখ্যার অংশ। এমএল সম্পর্কে প্রকাশিত নিবন্ধগুলিতে ডেটা কীভাবে সংগ্রহ করা হয়েছিল তার পুরো বিবরণ অন্তর্ভুক্ত করা উচিত কেন এটি is


প্রশিক্ষণ চলাকালীন, বৈশিষ্ট্যগুলি থেকে প্রাপ্ত তথ্য (উদাহরণস্বরূপ স্কোর মানচিত্রগুলি) দিয়ে জিটি (উদাহরণস্বরূপ সেগমেন্টেশন সমস্যা) কী সংশোধন বা তৈরি করা যায়?
অ্যালেক্স

@ অ্যালেক্স: সাধারণত হয় না। কিছু পরিস্থিতিতে থাকতে পারে যেখানে একটি সংশোধিত আউটপুট বা আধা-স্বয়ংক্রিয় প্রক্রিয়া পাইপলাইনে পরবর্তী অ্যালগরিদমের জন্য স্থল সত্যকে উত্পন্ন করে। তবে, যদি আপনি কোনও নিয়মের মাধ্যমে নিজস্ব লক্ষ্যগুলি সংশোধন করে অ্যালগরিদমের কথা উল্লেখ করছেন, তবে এটিকে সাধারণত একটি নতুন গ্রাউন্ড সত্য হিসাবে বিবেচনা করা হয় না - পরিবর্তে স্থল সত্যটি প্রশিক্ষণের জন্য সরবরাহ করা মূল বিভাগ হবে। যে কোনও চালাক স্বয়ংক্রিয় সংশোধন পরিবর্তে মডেলের অংশ হতে পারে।
নিল স্লেটার

মানবিক মিথস্ক্রিয়াসহ একটি পরিমার্জন, বা এটি উল্লেখ করা হয়েছে মূল নন-ইমেজ ডেটা (উদাহরণস্বরূপ কিছু উত্স চিত্র 3 ডি মডেল ব্যবহার করে তৈরি করা হয়েছে, সুতরাং আরও ভাল "সত্য" বিভাজন তৈরি করতে পারে) নতুন স্থল সত্য হতে পারে। যদিও আপনি সম্ভবত প্রথম মডেলটিকে পুনরুত্থানের মধ্য দিয়ে প্রজন্মের 2 গ্রাউন্ড ট্রুথ তৈরির জন্য ব্যবহৃত প্রথম প্রজন্মের ধারণার ধারণাটি পৃথক করতে চান এবং দ্বিতীয় মডেলটি একই স্থাপত্যের পরেও দ্বিতীয় মডেল তৈরি করতে ব্যবহার করেছেন Although প্রতিক্রিয়া উপর প্রশিক্ষিত।
নিল স্লেটার

'প্রতিক্রিয়া সম্পর্কে প্রশিক্ষিত' - কাছাকাছি, তবে ঠিক নয়। আপনি যদি এফসিএন মডেলটি দেখে থাকেন তবে শেষ স্তরটি স্কোর মানচিত্র যা জিটি ম্যাপের সাথে একত্রে লগ সফটম্যাক্স ক্ষতি ফাংশনে প্লাগ থাকে। আমি যা করি তা হল স্কোর ম্যাপ নেওয়া, এটি থেকে কিছু তথ্য বের করুন (উদাঃ আর্গম্যাক্স বাইনারি ব্লব সংখ্যা) এবং (কোনওভাবে) জিটি মাস্কটিকে ক্ষতি ফাংশনে প্লাগ করার আগে সংশোধন করুন। এটা কতটা বৈধ?
অ্যালেক্স 21

@ অ্যালেক্স: এটি আপনার মডেলের অংশ, এবং নতুন স্থল সত্য নয়। আপনি নির্বিচারে সিদ্ধান্ত না নিলে একটি নতুন মডেলের লক্ষ্য আপনার সম্মিলিত ফাংশন শিখতে হবে। এই ক্ষেত্রে এটি নতুন মডেলের মূল ভিত্তি - তবে, আপনাকে অবশ্যই এই ডেটার জটিল উত্সটি অবশ্যই লক্ষ্য করা উচিত, কারণ এটি একটি স্বয়ংক্রিয় পদ্ধতিতে মূল পরিমাপ থেকে পরিবর্তন করা হয়েছে।
নীল স্লেটার

2

স্থল সত্য: এটিই আপনার বাস্তবের পূর্বাভাস দিতে চান That

এতে কিছুটা শব্দ হতে পারে তবে আপনি চান যে আপনার মডেলটি এই গ্রাউন্ড সত্যের কারণ হিসাবে ডেটাতে অন্তর্নিহিত প্যাটার্নটি শিখতে পারে। ব্যবহারিকভাবে, আপনার মডেল কখনই স্থল সত্যের পূর্বাভাস দিতে সক্ষম হবে না কারণ স্থল সত্যের কিছুটা শব্দও হবে এবং কোনও মডেল শতভাগ নির্ভুলতা দেয় না তবে আপনি চান যে আপনার মডেলটি যতটা সম্ভব নিকটবর্তী হোক।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.