পিএসি শেখার তত্ত্ব বলতে কী বোঝায়?


15

আমি মেশিন লার্নিংয়ে নতুন। আমি মেশিন লার্নিংয়ের একটি কোর্স অধ্যয়ন করছি (স্ট্যানফোর্ড বিশ্ববিদ্যালয়) এবং আমি বুঝতে পারি না যে এই তত্ত্বটি কী বোঝায় এবং এর ইউটিলিটি কী। আমি ভাবছি যদি কেউ আমার জন্য এই তত্ত্বটি বিশদ করতে পারে।

এই তত্ত্বটি এই সমীকরণের উপর ভিত্তি করে। এখানে চিত্র বর্ণনা লিখুন


2
পিএসি এর অর্থ সম্ভবত প্রায় সঠিক।
মার্ক ক্লেসেন

@ মার্কক্লেসেন, আমি কি এটির মতো ব্যাখ্যা করতে পারি: "এর অর্থ এই যে মেশিন লার্নিং পদ্ধতির কোনও প্রদত্ত সমস্যার সম্ভাবনা সমাধানের প্রস্তাব দেয় এবং এই সমাধানটি প্রায় সঠিকভাবে প্রবণতা অর্জন করে"
BetterEnglish

উত্তর:


16

সম্ভবত আনুমানিক সঠিক (পিএসি) শেখার তত্ত্ব বিশ্লেষণে সহায়তা করে যে কোনও শিক্ষার্থী সম্ভবত কোনও সঠিক শ্রেণিবদ্ধকে আউটপুট দেবে কিনা এবং কি কি পরিস্থিতিতে । (আপনি কিছু উত্স দেখতে পাবেন এল এর জায়গায় A ব্যবহার করে ))LAL

প্রথমে আসুন "আনুমানিক" সংজ্ঞা দিন। থেকেই ধরে নেয়া যায় হয় প্রায় সঠিক যদি ইনপুট বন্টন উপরে ত্রুটি কিছু দ্বারা বেষ্টিত ε , 0 ε 1hHঅর্থাৎ,errorD(h)<ϵ, যেখানেডিইনপুটগুলির উপর বিতরণ theϵ,0ϵ12.errorD(h)<ϵD

পরবর্তী, "সম্ভবত" তাহলে সঙ্গে সম্ভাব্যতা ইচ্ছা আউটপুট যেমন একটি ক্লাসিফায়ার 1 - δ সঙ্গে 0 δ 1L1δ , আমরা সেই শ্রেণিবদ্ধটিকেসম্ভবতপ্রায় সঠিক বলেছি।0δ12

একটি লক্ষ্য ধারণাটি পিএসি-লার্নিংযোগ্য তা জেনে আপনি সম্ভবত একটি প্রায় সঠিক শ্রেণিবদ্ধার শিখতে প্রয়োজনীয় নমুনার আকারটিকে আবদ্ধ করতে পারবেন, যা আপনার পুনরুত্পাদন সূত্রে দেখানো হয়েছে:

m1ϵ(ln|H|+ln1δ)

এটি সম্পর্কে কিছুটা স্বজ্ঞাততা অর্জনের জন্য, ডান দিকে আপনি যখন ভেরিয়েবলগুলি পরিবর্তন করবেন তখন এর প্রভাবগুলি নোট করুন । অনুমতিযোগ্য ত্রুটি হ্রাস হওয়ার সাথে সাথে প্রয়োজনীয় নমুনার আকার বৃদ্ধি পায়। একইভাবে, এটি একটি আনুমানিক সঠিক শিক্ষার্থী সম্ভাবনা সঙ্গে বৃদ্ধি, এবং অনুমান স্থান আকার সঙ্গে এইচ । (আলগাভাবে, একটি হাইপোথিসিস স্পেস হ'ল আপনার অ্যালগোরিদম বিবেচনা করে এমন শ্রেণিবদ্ধগুলির সেট)) আরও স্পষ্টতই, আপনি যত বেশি সম্ভাব্য শ্রেণিবদ্ধার বিবেচনা করছেন বা সঠিক ত্রুটি বা যথাযথতার উচ্চতর সম্ভাবনা চান, সেগুলির মধ্যে পার্থক্য করার জন্য আপনার আরও ডেটা প্রয়োজন।mH

উদাহরণস্বরূপ, মিচেল বলুন, এই দীর্ঘ পরিচিতি বা অনেকগুলি মেশিন লার্নিংয়ের পাঠ্যগুলির মধ্যে একটির জন্য আরও এবং আরও এই সম্পর্কিত ভিডিওগুলি সহায়ক হতে পারে ।


এই হল উত্তর আমি একটি দীর্ঘ সময়ের খুঁজছেন ছিল ধরণ; উভয় সহজ এখনও শব্দ। যদিও অনেক উত্স একটি বিস্তৃত উত্তর সরবরাহ করবে, তবে তাড়াতাড়ি রেফারেন্সের জন্য এটিকে পছন্দ করা হয় না।
Isaবি আইজাক

4

সম্ভবত সঠিকটির সংজ্ঞাটি ভ্যালেন্টের কারণে। এটি মেশিন লার্নিং কী তা গাণিতিকভাবে কঠোর সংজ্ঞা দেওয়া মানে।
আমাকে একটু দৌড় দাও। পিএসি 'হাইপোথিসিস' শব্দটি ব্যবহার করার সময়, বেশিরভাগ লোকেরা অনুমানের পরিবর্তে মডেল শব্দটি ব্যবহার করেন use পরিসংখ্যান সম্প্রদায়ের সম্মতিতে আমি মডেলটিকে পছন্দ করি তবে আমি উভয় ব্যবহার করার চেষ্টা করব। মেশিন লার্নিং কিছু ডেটা দিয়ে শুরু হয়, এবং কেউ এমন একটি অনুমান বা মডেল সন্ধান করতে চায় যা ইনপুটগুলিতে x i ফেরত y i বা খুব কাছের কিছু দেয়। আরও গুরুত্বপূর্ণভাবে দেওয়া নতুন ডেটা - এক্স মডেলটি সম্পর্কিত গণনা বা পূর্বাভাস দেবে(xi,yi)xiyix~ । প্রকৃতপক্ষে কেউ প্রদত্ত (প্রশিক্ষণ) ডেটা সম্পর্কে অনুমান করা কতটা সঠিক তা সম্পর্কে আগ্রহী নয়, এ ছাড়া এটি বিশ্বাস করা শক্ত যে কিছু তথ্য ব্যবহার করে তৈরি করা একটি মডেল সেই ডেটা সেটটিকে সঠিকভাবে প্রতিফলিত করবে না, তবে যে কোনও ভবিষ্যতের ক্ষেত্রে সঠিক হবে ডেটা সেট। দুটি গুরুত্বপূর্ণ সতর্কতা হ'ল 100% যথাযথতার সাথে নতুন ডেটা সম্পর্কে ভবিষ্যদ্বাণী করতে পারে না এবং এমন একটি সম্ভাবনাও রয়েছে যে তথ্য উদাহরণগুলি দেখেছিল যে কোনও গুরুত্বপূর্ণ বিষয়টি মিস করেছে। খেলনার উদাহরণটি হ'ল যদি আমি আপনাকে 'ডেটা' দিই তবে 1,2,3,4 জন 'ভবিষ্যদ্বাণী' করবে যে 5 পরবর্তী নম্বর হবে। আপনি যদি অনুক্রমের পরবর্তী নম্বরটি লোকদের জিজ্ঞাসা করে এটি পরীক্ষা করে থাকেন, তবে বেশিরভাগ লোক 5 বলবে Someone কেউপারেy~
যদিও 1,000,000 বলুন। আপনি যদি সিক্যুয়েন্সটি 1,2,3, ... 999,999 দিয়ে থাকেন তবে একজন নিশ্চিত হন যে পরবর্তী সংখ্যাটি 1,000,000 1,000 তবে পরের সংখ্যাটি 999,999.5 বা 5 হতে পারে point মূল বিষয়টি হ'ল যে কেউ যত বেশি ডেটা দেখবে তত বেশি নিশ্চিত হতে পারে যে কোনও একটি সঠিক মডেল তৈরি করেছে তবে কোনওটি কখনই একেবারে নিশ্চিত হতে পারে না।

সম্ভবত প্রায় সঠিক সংজ্ঞাটি এই ধারণাটির গাণিতিকভাবে সুনির্দিষ্ট সংস্করণ দেয়। প্রদত্ত ডেটা আউটপুট y i এবং এক শ্রেণির মডেল f θ যা অনুমানকে গঠন করে যে কেউ 2 টি প্রশ্ন জিজ্ঞাসা করতে পারে। আমরা আপনার ডেটা ব্যবহার করতে পারি একটি নির্দিষ্ট অনুমান এটি Θxi,1imyifθfΘনতুন মানগুলির পূর্বাভাস দেওয়ার ক্ষেত্রে এটি সত্যই সঠিক হতে পারে? আরও কতটা সম্ভব যে মডেলটি আমরা আশা করি ঠিক ততটাই নির্ভুল? এটি হ'ল আমরা এমন কোনও মডেলকে প্রশিক্ষণ দিতে পারি যা খুব সঠিক হওয়ার সম্ভাবনা খুব বেশি। শন ইস্টার এর উত্তরে যেমন আমরা বলেছি আমরা একটি 'এপসিলন, ডেল্টা' যুক্তিটি করতে পারি তবে হাইপোথেসিসের এক শ্রেণীর (মডেলগুলির শ্রেণি) পিএসি। যে আমরা সম্ভাব্যতা সঙ্গে বলতে পারেন আমাদের মডেল Θ মধ্যে থেকে সঠিক ε । নির্দিষ্ট জোড় ( δ , ϵ ) কে সন্তুষ্ট করতে একজনকে কতটা ডেটা দেখতে হবে তা নির্ভর করে আসল ( δ , ϵ ) এর উপরp>1δfΘϵ(δ,ϵ)(δ,ϵ) অনুমানের প্রদত্ত শ্রেণিটি কতটা জটিল।

আরো সঠিকভাবে, অনুমানের একটি বর্গ বা মডেল θ পিএসি হলে কোনো জুড়ি জন্য ( ε , δ ) সঙ্গে 0 < ε , δ , < .5 একটি নির্দিষ্ট মডেল Θ যেমন যে কোন নতুন তথ্য ~ X , ~ Y , এই মডেল E r r ( f Θ ( ˜ x ) , ˜ y ) < satis কে সম্ভাব্যতা p > দিয়ে সন্তুষ্ট করবেHfθ(ϵ,δ)0<ϵ,δ,<.5fΘx~,y~Err(fΘ(x~),y~)<ϵ যদি মডেলটি কমপক্ষে m = মি ( δ , ϵ , এইচ ) প্রশিক্ষণের উদাহরণসহ নির্বাচিত (প্রশিক্ষিত) হয় । এখানে ভুল মনোনীত ক্ষতি ফাংশন যা সাধারণত হয় ( Θ ( ~ X ) - ~ Y ) 2p>1δm=m(δ,ϵ,H)(fΘ(x~)y~)2

(δ,ϵ)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.