আমার ব্যাকগ্রাউন্ডটি মূলত মেশিন লার্নিংয়ে এবং আমি বায়েশিয়ান হাইপোথেসিস পরীক্ষার অর্থ কী তা জানার চেষ্টা করছিলাম। আমি সম্ভাবনার ব্যায়েশিয়ান ব্যাখ্যার সাথে ঠিক আছি এবং সম্ভাব্য গ্রাফিকাল মডেলগুলির প্রসঙ্গে আমি এর সাথে পরিচিত। যাইহোক, যা আমাকে বিভ্রান্ত করছে তা হল পরিসংখ্যানগত অনুক্রমের প্রসঙ্গে "হাইপোথিসিস" শব্দের অর্থ।
আমি মনে করি যে প্রায়শই পরিসংখ্যান এবং অনুমানের ক্ষেত্রে ব্যবহার করা হয় মেশিন লার্নিংয়ের ক্ষেত্রে আমি যে ভোকাবুলারিটি ব্যবহার করতে অভ্যস্ত তা সম্পর্কে আমি বিভ্রান্ত হয়ে পড়ছি।
প্রসঙ্গে তত্ত্বাবধানে থাকা লার্নিং , আমি সাধারণত ভবিষ্যদ্বাণীপূর্ণ ফাংশন থেকে ম্যাপের অর্থাৎ তার লেবেলে উদাহরণ হিসাবে অনুমান মনে । তবে, আমার কাছে মনে হয় যে হাইপোথিসিস শব্দটি আমি যে পাঠ্যগুলিতে করছি তার একই অর্থ নেই same আমি যে রিডিংগুলি পড়ছি তার একটি নির্যাস আটকে দিন:
আপনি মনোযোগ সহকারে পড়লে এটি আরও বলে:
পর্যবেক্ষণ করা তথ্যের জন্য আলাদা মডেল রয়েছে ...
তারা কি শব্দটি মডেল ব্যবহার করেছিল? আমার জন্য শব্দটি মডেলটি আমাকে একটি নির্দিষ্ট ভবিষ্যদ্বাণীপূর্ণ ফাংশনটি নির্বাচন করে ফাংশনের একটি সেট সম্পর্কে ভাবিয়ে তোলে। অর্থাত্ ফাংশনের একটি অনুমান শ্রেণি। উদাহরণস্বরূপ, চতুর্ভুজ ফাংশন (ডিগ্রি 2 এর বহুপদী) অনুমানের শ্রেণি হতে পারে। যাইহোক, আমার কাছে মনে হয় তারা মডেল এবং হাইপোথিসিস শব্দটি এই নিষ্কর্ষের সমার্থক হিসাবে ব্যবহার করেছেন (যেখানে আমার জন্য তারা সম্পূর্ণ আলাদা শব্দ)।
তারপরে এটি উল্লেখ করা যায় যে আমরা হাইপোথিসিসে প্রিয়ারদের রাখতে পারি (বায়সিয়ান সেটিংয়ে করা সম্পূর্ণ যুক্তিসঙ্গত জিনিস):
এছাড়াও আমরা বর্তমান অনুমানের সাথে ডেটাগুলিকে বৈশিষ্ট্যযুক্ত করতে পারি:
এবং আমাদের বর্তমান বিশ্বাসকে কিছু ডেটা দেওয়া (এবং বেয়ের নিয়ম) আপডেট করুন:
তবে, আমি অনুমান করি যে পুরো অনুমানের শ্রেণীর চেয়ে একটি হাইপোথিসিস ক্লাস থেকে নির্দিষ্ট প্যারামিটারে (বলুন ta ) বায়েসিয়ান অনুমান রাখার ক্ষেত্রে আমি বেশি অভ্যস্ত । মূলত যেহেতু মনে হয় যে এই "হাইপোথিসিস" মেশিন লার্নিং প্রসঙ্গে যে অনুশীলনগুলি ব্যবহার করছি তা একই অনুমান নয়, তাই আমার কাছে মনে হয় যে এই অনুমানগুলি একটি অনুমানক শ্রেণীর চেয়ে নির্দিষ্ট- প্যারামিটারের সাথে বেশি মিল রয়েছে ।
এই মুহুর্তে আমি বিশ্বাস ছিল যে, "হাইপোথিসিস" ভবিষ্যদ্বাণীপূর্ণ ফাংশনে একই জিনিস বোঝানো (ক পরামিতি দ্বারা parametrized , উদাহরণস্বরূপ), কিন্তু আমি মনে করি আমি ভুল ছিল ...
আমার বিভ্রান্তিটিকে আরও খারাপ করে তুলতে, পরে এই একই পাঠগুলি প্রতিটি প্রশিক্ষণের উদাহরণে তারা পর্যবেক্ষণ করে একটি নির্দিষ্ট "অনুমান" নির্দিষ্ট করার জন্য এগিয়ে যায়। আমি যা বলতে চাইছি তার একটি এক্সট্রাক্ট আটকানো যাক:
এটি আমাকে বিভ্রান্ত করার কারণটি হ'ল, যদি আমি অনুমানটিকে পরামিতি হিসাবে ব্যাখ্যা করি তবে আমার জন্য আমাদের প্রতিটি নমুনার মানের জন্য একটি নির্দিষ্ট পরামিতি নির্দিষ্ট করে বোঝা যায় না। এই মুহুর্তে আমি উপসংহারে পৌঁছেছি যে অনুমান দ্বারা তারা কী বোঝায় আমি সত্যিই জানতাম না তাই আমি এই প্রশ্নটি পোস্ট করেছি।
যাইহোক, আমি সম্পূর্ণরূপে ছেড়ে দিতে হবে না, আমি গবেষণা frequentist পরিসংখ্যান কি অনুমান উপায়ে এবং নিম্নলিখিত পাওয়া খান একাডেমী ভিডিও । এই ভিডিওটি আসলে আমার কাছে অনেক কিছু বোঝায় (সম্ভবত আপনি ঘন ঘনবাদী! :)) । তবে মনে হয় যে তারা একগুচ্ছ ডেটা পেয়েছেন (কিছু "নমুনা সেট" এর মতো) এবং নমুনা সেটের বৈশিষ্ট্যের ভিত্তিতে তারা সিদ্ধান্ত নেন যে ডেটা সম্পর্কে নাল হাইপোথিসিটি গ্রহণ করবেন বা প্রত্যাখ্যান করবেন কিনা। যাইহোক, আমি যে বায়েসীয় প্রসঙ্গে পড়ছি, আমার কাছে মনে হয় যে প্রতিটি ডেটা [পয়েন্ট] ভেক্টর পর্যবেক্ষণ করা হয়েছে, তারা "সম্ভাবনা অনুপাতের পরীক্ষা" দিয়ে একটি অনুমান দিয়ে "এটি লেবেল" করেছেন:
তারা যেভাবে প্রতিটি ডেটা নমুনায় হাইপোথিসিস নির্ধারণ করছে, এমনকি তত্ত্বাবধানের শিক্ষার সেটিংয়ের মতো মনে হয় আমরা প্রতিটি প্রশিক্ষণ সংস্থায় একটি লেবেল সংযুক্ত করছিলাম। তবে আমি মনে করি না যে তারা এই প্রসঙ্গে কী করছে in তারা কি করছে? প্রতিটি ডেটা নমুনায় হাইপোথিসিস নির্ধারণের অর্থ কী? অনুমানের অর্থ কী? মডেল শব্দের অর্থ কী?
মূলত, আমার বিভ্রান্তির দীর্ঘ ব্যাখ্যা করার পরে, কেউ কি জানেন যে এই প্রসঙ্গে বেয়েসিয়ান অনুমানের পরীক্ষার অর্থ কী?
আমার প্রশ্নের উন্নতি করতে আপনার যদি কোনও স্পষ্টতা বা কোনও কিছু প্রয়োজন হয় বা যাতে প্রশ্নটি বোঝা যায় তবে আমি সাহায্য করতে পেরে অনেক বেশি আনন্দিত :)
উত্তরের জন্য অনুসন্ধানে আমি পরিসংখ্যান অনুমানের পরীক্ষার সাথে সম্পর্কিত কিছু দরকারী জিনিস পেয়েছি:
আপনি যদি কোনও সিএস ব্যাকগ্রাউন্ড থেকে আসে (এটি আমার মতো): এটির একটি বিষয়টির একটি ভাল পরিচয় সম্বোধন করে:
কম্পিউটার বিজ্ঞানীদের জন্য পরিসংখ্যান অনুমানের পরীক্ষার একটি ভাল ভূমিকা কী?
এক পর্যায়ে আমি "ডিফল্ট প্যারামিটারগুলি" সম্পর্কে জিজ্ঞাসা করেছি (যা আমি যা বোঝাতে চেয়েছিলাম তা বোঝানো উচিত। আমি মনে করি এটি একটি স্ট্যান্ডার্ড টার্ম তবে এটি নয়, তাই এখানে আমি এটিকে সম্বোধন করব) এবং আমি মনে করি যে আমি কী বোঝাতে চাইছি তা কীভাবে হয় আপনি প্রতিটি অনুমানের জন্য পরামিতি নির্দিষ্ট করে। উদাহরণস্বরূপ, আপনার নাল অনুমানটি কী এবং এর পরামিতিগুলি কীভাবে আপনি তা স্থির করেন। এটি সম্পর্কিত একটি প্রশ্ন রয়েছে: