শেখার এবং অনুমানের মধ্যে পার্থক্য কী?


20

মেশিন লার্নিং রিসার্চ পেপারগুলি প্রায়শই শিখন এবং অনুমিতিকে দুটি পৃথক কাজ হিসাবে বিবেচনা করে তবে পার্থক্য কী তা আমার কাছে খুব পরিষ্কার নয়। ইন এই বইয়ের উদাহরণস্বরূপ তারা কাজগুলো উভয় প্রকার Bayesian পরিসংখ্যান ব্যবহার করেন, কিন্তু যে পার্থক্য জন্য একটি প্রেরণা প্রদান করবেন না। এটি সম্পর্কে আমার কাছে কিছু অস্পষ্ট ধারণা থাকতে পারে তবে আমি একটি দৃ definition় সংজ্ঞা দেখতে চাই এবং আমার ধারণাগুলির খণ্ডন বা এক্সটেনশনগুলিও দেখতে চাই:

  • একটি নির্দিষ্ট ডেটা পয়েন্টের জন্য সুপ্ত ভেরিয়েবলের মানগুলি অনুমান করা এবং ডেটার জন্য উপযুক্ত মডেল শেখার মধ্যে পার্থক্য।
  • বৈকল্পিকগুলি বের করে আনার (পার্থক্য) এবং আবর্তনগুলি শেখার মধ্যে পার্থক্য যাতে ভেরিয়েন্সগুলি বের করতে সক্ষম হয় (ইনপুট স্পেস / প্রক্রিয়া / বিশ্বের গতিবিদ্যা শিখিয়ে)।
  • স্নায়বিক বৈজ্ঞানিক উপমা দীর্ঘমেয়াদী ক্ষমতা / হতাশা বনাম স্বল্প-মেয়াদী শক্তি / হতাশার (স্মৃতি চিহ্ন) হতে পারে।

4
এটি সাহায্য করে কিনা তা নিশ্চিত নয়, তবে পরিসংখ্যানগুলির মধ্যে একটি পার্থক্য হ'ল আপনি শিখার বিষয়ে অনুমান (বেশিরভাগ বেইস) বা অনুমান হিসাবে (বেশিরভাগ ফ্রিকোয়ালিস্ট) হিসাবে চিন্তা করতে চান কিনা। প্রাক্তনদের জন্য, সুপ্ত ভেরিয়েবল, প্যারামিটার, পূর্বাভাস, মডেল - সবকিছু সম্পর্কে শেখা একটি অনুমান (যা একটি বিতরণ দেয়) is আধুনিকতার জন্য কিছু শেখার সমস্যাগুলি একটি অনুমান এবং অন্যদের অনুমানের সমস্যা হতে পারে (যা এর জন্য একটি অনুমান এবং নমুনা-তাত্ত্বিকভাবে প্রেরণিত অনিশ্চয়তার পরিসর দেয়)।
কনজুগেটপায়ার

5
"লার্নিং" একটি মেশিন লার্নিং অ্যালগরিদম প্রশিক্ষণের প্রক্রিয়াটির জন্য কেবল একটি উদীয়মান রূপক। আমি মনে করি না এখানে আরও অন্তর্দৃষ্টি পাওয়া যায়।
সাইকোরাক্স বলছে মনিকাকে


1
@Winks আপনি লিঙ্ক প্রশ্ন পড়তে হয়নি এ সব ? উত্তরগুলির মধ্যে কোনওটিই আমি স্বচ্ছতার জন্য জিজ্ঞাসা করছি তার পার্থক্য তৈরি করে না।
লেনার হোয়েট

1
@conjugateprior মেশিন লার্নিংয়ে, কেউই বলবে না যে "সুপ্ত ভেরিয়েবল, প্যারামিটার, পূর্বাভাস, মডেল - সবকিছু সম্পর্কে শেখা একটি অনুকরণ" in উভয়ই বিতরণ তৈরি করতে পারলেও শেখা এবং অনুমানগুলি সম্পূর্ণ পৃথক হিসাবে বিবেচিত হয়।
নিল জি

উত্তর:


11

আমি নীল জি এর উত্তরের সাথে একমত, তবে সম্ভবত এই বিকল্প বাক্সগুলিও সহায়তা করে:

একটি সাধারণ গাউসিয়ান মিশ্রণ মডেলের সেটিংস বিবেচনা করুন। এখানে আমরা মডেল পরামিতিগুলিকে মিশ্রণ মডেলের গাউসিয়ান উপাদানগুলির সেট (তাদের প্রতিটি উপায় এবং রূপ এবং মিশ্রণে প্রত্যেকের ওজন) সেট হিসাবে ভাবতে পারি।

মডেল প্যারামিটারগুলির একটি সেট দেওয়া, অনুমানটি হ'ল কোন উপাদানটি একটি নির্দিষ্ট উদাহরণ উত্পন্ন করে, সাধারণত প্রতিটি উপাদানগুলির জন্য "দায়িত্ব" আকারে identif এখানে সুপ্ত ভেরিয়েবলগুলি কেবলমাত্র একক সনাক্তকারী যার জন্য প্রদত্ত ভেক্টরটি উত্পন্ন করেছে এবং আমরা কোন উপাদানটি সম্ভবত অনুমান করছিলাম তা অনুমান করা হচ্ছে। (এই ক্ষেত্রে, অনুমান সহজ, যদিও আরও জটিল মডেলগুলিতে এটি বেশ জটিল হয়ে ওঠে))

শিক্ষণ Gaussians 'অর্থ নির্বাচন করে, ভেরিয়ানস এবং weightings: এর প্রক্রিয়া, মডেল থেকে নমুনা, মডেল পরামিতি (অথবা মডেল পরামিতি উপর একটি বিতরণ) যে শ্রেষ্ঠ ফিট ডেটা দেওয়া চিহ্নিতকরণের একটি সেট দেওয়া হয়।

প্রত্যাশা-ম্যাক্সিমাইজেশন লার্নিং অ্যালগরিদমকে প্রশিক্ষণের সেটটির জন্য অনুমিতি সম্পাদন হিসাবে বিবেচনা করা যেতে পারে, তারপরে সেই অনুমিতি প্রদত্ত সেরা পরামিতিগুলি শিখুন, তারপরে পুনরাবৃত্তি করা। অনুগ্রহ প্রায়শই এই পদ্ধতিতে শেখার প্রক্রিয়াতে ব্যবহৃত হয় তবে এটি স্বার্থান্বেষীও হয়, উদাহরণস্বরূপ কোন গাওসিয়ান মিশ্রণ মডেলটিতে কোনও উপাদান কোনও প্রদত্ত ডেটা পয়েন্ট উত্পন্ন করে তা বেছে নেওয়া, কোনও লুকানো মার্কোভ মডেলের সবচেয়ে সম্ভবত লুকানো অবস্থার বিষয়ে সিদ্ধান্ত নিতে, আরও সাধারণ গ্রাফিকাল মডেলটিতে অনুপস্থিত মানগুলিকে বোঝানো, ....


1
ও একটি ছোট্ট সতর্কীকরণ এক শেখার মধ্যে জিনিষ ভাঙ্গিয়া এবং এই ভাবে অনুমান করা চয়ন করতে পারেন, কিন্তু এক করতে আরো অনুমান হিসাবে সমগ্র অনেক কাজ নির্বাচন করুন: stats.stackexchange.com/questions/180582/...
conjugateprior

এত লাইন কেন? আমি একটি সহজ উত্তর দেখতে চাই যা তাদের এক-দুটি বাক্যে পৃথক করে। এছাড়াও, সবাই GMMs বা EM এর সাথে পরিচিত নয়।
এনবিরো

9

অনুমান একটি একক ইনপুট উপর ভিত্তি করে একটি কনফিগারেশন চয়ন করা হয়। কিছু প্রশিক্ষণের উদাহরণের উপর ভিত্তি করে শেখা প্যারামিটারগুলি বেছে নিচ্ছে।

শক্তি-ভিত্তিক মডেল ফ্রেমওয়ার্কে (প্রায় সমস্ত মেশিন লার্নিং আর্কিটেকচারের দিকে তাকানোর উপায়), অনুমিতিগুলি নির্দিষ্ট পরামিতিগুলি ধরে রেখে একটি শক্তি ফাংশন হ্রাস করার জন্য একটি কনফিগারেশন বেছে নেয় ; শেখার ক্ষতির কার্যকারিতা হ্রাস করার জন্য পরামিতিগুলি চয়ন করে ।

কনজুগেটপিয়ার হিসাবে উল্লেখ করা হয়েছে, অন্যান্য লোকেরা একই জিনিসটির জন্য বিভিন্ন পরিভাষা ব্যবহার করে। উদাহরণস্বরূপ বিশপ, যথাক্রমে শেখা এবং অনুমান বোঝাতে "অনুমান" এবং "সিদ্ধান্ত" ব্যবহার করে। কার্যকারণ অনুমান মানে শেখা। তবে আপনি যে কোনও শর্তে সিদ্ধান্ত নিন, এই দুটি ধারণা পৃথক।

নিউরোলজিকাল সাদৃশ্য হ'ল ফায়ারিং নিউরনের একটি ধরণ যা একটি কনফিগারেশন; লিঙ্ক শক্তির একটি সেট পরামিতি।


@ এমসিবি "ভেরিয়েন্সগুলি" বলতে আপনার অর্থ কী তা আমি এখনও জানি না। "আক্রমণকারী" অভিধানে একটি শব্দও নয়। হ্যাঁ, অনেকগুলি শেখার অ্যালগরিদম রয়েছে যা ডগালের উত্তরে বর্ণিত EM এর মতো একটি অনুমিত কনফিগারেশনের উপর নির্ভর করে।
নিল জি

@ এমসিবি আমি আপনার প্রশ্নগুলিও বুঝতে পারি না; সম্ভবত এটি একটি উদাহরণ মডেল নির্দিষ্ট করতে এবং আপনি কী বিতরণ / বৈকল্পিক / আক্রমণকারী (?) সম্পর্কে কথা বলছেন তা সুনির্দিষ্ট করতে সহায়তা করবে।
দুগল

আপনার উত্তরের জন্য ধন্যবাদ। সম্ভবত আমি কিছু ভুল বুঝেছি।
লেনার হোয়েট

@ নীলজি আমি বিশ্বাস করি যে এই পরিভাষাটি বেশিরভাগ এমএল দৃষ্টিভঙ্গিতে ব্যবহৃত হয় যেখানে শ্রেণিবিন্যাসের সিদ্ধান্তগুলি অনুবাদ, ঘূর্ণন, পুনরুদ্ধার ইত্যাদির জন্য 'আক্রমণকারী' হওয়া উচিত। একটি ভাল সংক্ষিপ্ত রেফারেন্স খুঁজে পাওয়া যায় না, তবে এটি রয়েছে: en.wikedia.org/wiki / Prior_knowledge_for_pattern_recognition
conjugateprior

@ কনজুগেটেপ্রিয়র আমার মনে হয়েছিল যে সে কী পাচ্ছে, তবে আমি দেখতে চেয়েছিলাম যে সে তার প্রশ্নটি পরিষ্কার করে দেবে কিনা।
নিল জি

4

এটি ক্লাসিক ক্রস-ডিসিপ্লিন লিঙ্গো বিভ্রান্তির মতো দেখাচ্ছে। ওপিতে স্নায়ুবিজ্ঞানের মতো পরিভাষা ব্যবহার করা হচ্ছে বলে মনে হচ্ছে যেখানে প্রশ্নে থাকা দুটি শর্তের ভিন্ন ভিন্ন ধারণা থাকতে পারে। তবে যেহেতু ক্রস ভ্যালিডেটেড সাধারণত পরিসংখ্যান এবং ম্যাচিং লার্নিংয়ের সাথে সম্পর্কিত হয়, আমি সেই ক্ষেত্রগুলিতে এই পদগুলির সাধারণ ব্যবহারের ভিত্তিতে প্রশ্নের উত্তর দেওয়ার চেষ্টা করব।

শাস্ত্রীয় পরিসংখ্যানগুলিতে, অনুমিতি কেবলমাত্র একটি নমুনা সম্পর্কে যা জানেন তা গ্রহণ করা এবং যে জনসংখ্যা থেকে এটি (আশাবাদী) প্রতিনিধি তা সম্পর্কে গাণিতিক বিবৃতি দেওয়ার কাজ। ক্যাসেলা অ্যান্ড বার্জারের নীতিগত পাঠ্যপুস্তক (2002) থেকে: "সম্ভাবনা তত্ত্বের বিষয়টি ভিত্তি যার ভিত্তিতে সমস্ত পরিসংখ্যান নির্মিত হয় ... এই মডেলগুলির মাধ্যমে পরিসংখ্যানবিদরা কেবলমাত্র পরীক্ষার উপর ভিত্তি করে জনসংখ্যা সম্পর্কে সূচনা আঁকতে সক্ষম হন পুরো অংশ "। সুতরাং পরিসংখ্যানগুলিতে, অনুমানটি বিশেষত পি-মান, পরীক্ষার পরিসংখ্যান এবং নমুনা বিতরণ ইত্যাদির সাথে সম্পর্কিত is

শেখার ক্ষেত্রে, আমি মনে করি ওয়াসারম্যানের সমস্ত পরিসংখ্যান (2003) থেকে এই সারণীটি সহায়ক হতে পারে:

এখানে চিত্র বর্ণনা লিখুন


মন্তব্যগুলিতে উল্লেখ করা বিশপের বই সহ অনেকগুলি পাঠ্যপুস্তকের সাথে এটি একমত নয়। শ্রেণীবদ্ধকরণ হ'ল এক ধরণের তত্ত্বাবধানে শেখা যখন লক্ষ্য ভেরিয়েবলগুলি বিভাগ হয়। "অনুমান" শব্দটি একাই অস্পষ্ট: সাধারণত আমাদের অর্থ "ঘনত্বের অনুমান" বা "পরামিতি অনুমান" বা "অনুক্রমিক অনুমান" বা "সর্বাধিক সম্ভাবনার অনুমান"।
নিল জি

1
এছাড়াও, বয়েস নেট কেবল একটি নির্দেশিত অ্যাসাইক্লিক গ্রাফ নয়! এটি এমন এক ধরণের ড্যাগ, যার নোডগুলি প্রস্তাবগুলি উপস্থাপন করে এবং যার প্রান্তগুলি সম্ভাব্য নির্ভরতাগুলি উপস্থাপন করে। এটি শর্তাধীন স্বাধীনতার সম্পর্কগুলি নির্দিষ্ট করে।
নিল জি

1
নিলজি নিকটতম পরিসংখ্যান অনুবাদ সম্ভবত "কাঠামোগত সমীকরণ মডেল" হতে হবে
কনজুগেটপায়ার

2
এবং হতাশাজনক পরিসংখ্যানের ডেটা সম্পর্কে দুটি লাইন থাকা উচিত: সিএস: প্রশিক্ষণ ডেটা, পরিসংখ্যান: ডেটা। সিএস: পরীক্ষার ডেটা, পরিসংখ্যান: বাত?
কনজুগেটপায়ার

পরিসংখ্যান 101: wut = অন্য (আশা র্যান্ডম) আপনার জনসংখ্যার থেকে নমুনা ...
Zoë ক্লার্ক

-1

এটি আশ্চর্যজনক যে এটির জন্য আর কেউ উল্লেখ করেন নি, তবে কেবলমাত্র আপনার ক্ষেত্রে সম্ভাবনা বন্টন রয়েছে এমন ক্ষেত্রেই আপনি অনুমান করতে পারেন। এখানে উইকির উদ্ধৃতি দিতে যা অক্সফোর্ড অভিধানটি উদ্ধৃত করে:

স্ট্যাটিস্টিকাল ইনফারেন্স হ'ল অন্তর্নিহিত সম্ভাব্যতা বন্টনের বৈশিষ্ট্যগুলি হ্রাস করার জন্য ডেটা বিশ্লেষণ ব্যবহার করার প্রক্রিয়া (অক্সফোর্ড অভিধানের পরিসংখ্যান)

https://en.wikipedia.org/wiki/Statistical_inference

Traditionalতিহ্যবাহী নিউরাল নেটওয়ার্কগুলির ক্ষেত্রে, কে-এনএন বা ভ্যানিলা এসভিএমগুলির আপনার অনুমানের সম্ভাবনা ঘনত্ব নেই, বা কোনও ঘনত্ব সম্পর্কে ধারণাও নেই, সুতরাং সেখানে কোনও পরিসংখ্যানগত অনুক্রম নেই। কেবল প্রশিক্ষণ / শেখা। তবে, বেশিরভাগ (সমস্ত?) পরিসংখ্যানগত পদ্ধতিগুলির জন্য, আপনি অনুমিতি এবং শেখার উভয়ই ব্যবহার করতে পারেন, যেহেতু এই পদ্ধতিগুলি জনগণের বন্টন নিয়ে প্রশ্নে কিছু ধারণা অনুধাবন করে।


এটা ভুল. যাইহোক, আপনি চাইলে নিউরাল নেটওয়ার্কগুলি একটি বিতরণ উত্পাদন হিসাবে ব্যাখ্যা করতে পারেন। দেখুন, যেমন আমারী 1998.
নিল জি

এটি ভুল নয়, বা নির্দিষ্ট করুন। আপনি ব্যাখ্যা করতে পারেন, তবে মূলত এরকম কোনও ব্যাখ্যা নেই।
সুইম এস এস

এটি ভুল কারণ লোকে অটোইনসাইডারগুলির মতো মডেলের সাথে ইনফেরেন্স শব্দটি ব্যবহার করে।
নিল জি

সুতরাং, এটি কি ভুল কারণ কিছু গ্রুপ লোক এই শব্দটি ভুলভাবে ব্যবহার করে? বা তাদের এনএনগুলির জন্য কিছু সম্ভাব্য ব্যাখ্যা রয়েছে বলে (আমি অটোরকোডারগুলির সাথে গভীরভাবে পরিচিত নই)? আমি যুক্তিযুক্তভাবে ন্যায়সঙ্গত করেছি যে কেন একটি শব্দ অপরটির চেয়ে আলাদা। সুতরাং, উপরোক্ত সংজ্ঞাটি দেওয়াতে, আমি দেখতে পাচ্ছি যে যারা এনএন, কে-এনএন, বা এসভিএম (সম্ভাব্য ব্যাখ্যা ব্যতীত) সাথে অনুমান শব্দটি ব্যবহার করেন তারা স্বরলিপিটি অপব্যবহার করছেন।
সুইম এস এস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.