অনুমান বনাম অনুমান?


30

মেশিন লার্নিংয়ের প্রসঙ্গে "অনুমান" এবং "অনুমান" এর মধ্যে পার্থক্য কী ?

একটি নবাগত হিসেবে আমি মনে করেন যে আমরা অনুমান র্যান্ডম ভেরিয়েবল এবং অনুমান মডেল প্যারামিটার। আমার এই বোঝার অধিকার আছে?

যদি তা না হয় তবে ঠিক পার্থক্যগুলি কী এবং আমার কখন ব্যবহার করা উচিত?

এছাড়াও, কোনটি "শিখুন" এর প্রতিশব্দ?


আমি এই উত্তরটি কোয়ারায় খুঁজে পেয়েছি এবং এর সঠিকতা সম্পর্কে আমি নিশ্চিত নই।
সিবস জুবিলিং

4
মেশিন লার্নিং হ'ল স্বয়ংক্রিয় পরিসংখ্যান (আমার মতে), সুতরাং আমি নিশ্চিত নই যে সংজ্ঞাগুলি আরও সাধারণভাবে পরিসংখ্যানগুলিতে আলাদা হবে
শেডটালকার

5
ক্যানোনিকাল স্ট্যাটিস্টিকাল সাহিত্য একটি অনুমিত অন্তর্নিহিত মডেল (সিদ্ধান্ত-তাত্ত্বিক কাঠামোর মধ্যে) এবং র্যান্ডম ভেরিয়েবলের মান পূর্বাভাসের অনুমানযোগ্য বৈশিষ্ট্যের মধ্যে স্পষ্ট এবং সামঞ্জস্যপূর্ণ পার্থক্য তৈরি করে । অনুমান একটি বিশেষ ধরণের অনুমিতি। এগুলি অন্বেষণের সাথে এবং কিছুটা হলেও অনুমানের পরীক্ষার সাথেও বিপরীত হতে পারে। "শিখুন" একটি ট্রানজিটিভ ক্রিয়া হিসাবে, এর একটি স্ট্যাটেস্টিকাল অর্থ হয় না।
whuber

@ হুবুহু, একটি নির্বোধ পরামর্শ - এটি একটি উত্তর করুন? ..
স্টাস্ক

2
@ স্টাস্ক এটি হবে - যদি এটি প্রশ্নের সমাধান না করে, যা পরিসংখ্যানের চেয়ে মেশিন লার্নিং সম্পর্কে জিজ্ঞাসা করে । আমি এমএল উত্তরগুলি বুঝতে এবং মূল্যায়ন করার জন্য একটি সামান্য পটভূমি সরবরাহ করার প্রয়াসে এই মন্তব্যটির প্রস্তাব দিয়েছিলাম, বিশেষত যেহেতু সেই উত্তরগুলির মধ্যে কিছু অনুমান, অনুমান এবং পূর্বাভাসের মধ্যে অমান্যকর পার্থক্য করে।
হোয়াট

উত্তর:


30

পরিসংখ্যানগত সূচনাটি কোনও প্রদত্ত ডেটাসেট এবং উল্লিখিত মডেলের ফিট সহ একটি সম্পর্কিত অনুমানমূলক মডেল থেকে আঁকতে পারে এমন সিদ্ধান্তের পুরো সংগ্রহ থেকে তৈরি। উইকিপিডিয়া থেকে উদ্ধৃতি ,

অনুমান হ'ল পরিচিত বা সত্য বলে ধরে নেওয়া এমন জায়গা থেকে যৌক্তিক সিদ্ধান্ত গ্রহণের কাজ বা প্রক্রিয়া।

এবং,

পরিসংখ্যানগত অনুমান অনিশ্চয়তার উপস্থিতিতে সিদ্ধান্তগুলি আঁকতে গণিতকে ব্যবহার করে।

অনুমানটি হ'ল অনুক্রমের কেবলমাত্র একটি দিক যেখানে কোনও একটি অজানা প্যারামিটারগুলি (ডেপুট তৈরি করে এমন হাইপোটিক্যাল মডেলের সাথে যুক্ত) এর উপর ভিত্তি করে ডেটা (এবং সেই পরামিতিগুলির সম্পর্কে সম্ভবত পূর্ববর্তী তথ্য) এর উপর ভিত্তি করে অনুকূল সমাধানগুলি তৈরি করে। এটি সর্বদা রিপোর্ট করা অনুমানের অনিশ্চয়তার মূল্যায়নের সাথে যুক্ত হওয়া উচিত, মূল্যায়ন যা অনুক্রমের একটি অবিচ্ছেদ্য অঙ্গ।

সর্বাধিক সম্ভাবনা হ'ল অনুমানের একটি উদাহরণ, তবে এটি সম্পূর্ণ অনুমেয়টিকে কভার করে না। বিপরীতে, বায়েসিয়ান বিশ্লেষণ একটি সম্পূর্ণ অনুমানের মেশিন সরবরাহ করে।


4
+1 বিশেষত "এটি সর্বদা রিপোর্ট করা অনুমানের অনিশ্চয়তার মূল্যায়নের সাথে যুক্ত হওয়া উচিত" যা মেশিন লার্নিং এবং "ডেটা সায়েন্স" এ করা হয়নি। কোনও পরিচিত ডেটা সেটের বিরুদ্ধে কেবল বেঞ্চমার্কিং এটি নয়।
মোমো

4

যদিও প্রাক্কলন কোনটাই অজানা পরামিতি মান (যেমন, লজিস্টিক রিগ্রেশনে কোফিসিয়েন্টস, অথবা সমর্থন ভেক্টর মেশিন মধ্যে পৃথক hyperplane মধ্যে), সঙ্গে উত্ক্রান্ত লক্ষ্য করে দেয়া হয় পরিসংখ্যানগত অনুমান প্রচেষ্টা অনিশ্চয়তা একটি পরিমাপ এবং / অথবা একটি সম্ভাব্যতা বিবৃতি সংযুক্ত করতে প্যারামিটারের মান (মান ত্রুটি এবং আত্মবিশ্বাসের অন্তর)। পরিসংখ্যানবিদরা যে মডেলটিকে ধরে নিয়েছেন তা যদি প্রায় সঠিক হয় তবে নতুন আগত তথ্য সেই মডেলটির সাথে সামঞ্জস্য অব্যাহত রাখলে অনিশ্চয়তার বিবৃতিগুলির মধ্যে কিছুটা সত্য থাকতে পারে এবং আপনি কতবার ভুল ব্যবহার করতে পারবেন তার একটি পরিমাপ সরবরাহ করে আপনার সিদ্ধান্ত নিতে মডেল।

μσ2μσ2/এন

মেশিন লার্নিং এর নিকটতম অবস্থানটি ক্রোস-বৈধকরণ হয় যখন নমুনাটি প্রশিক্ষণ এবং বৈধকরণের অংশগুলিতে বিভক্ত হয়, পরে আধুনিকতার সাথে কার্যকরভাবে বলা হয়, "নতুন ডেটা যদি পুরানো ডেটার মতো দেখায় তবে সম্পূর্ণ তথ্যের সাথে সম্পর্কিত না হয় যা আমার মডেল সেট আপ করতে ব্যবহৃত হয়েছিল, তবে ত্রুটির হারের একটি বাস্তব পরিমাপ যেমন এবং এই জাতীয় "। এটি পরিসংখ্যানগত অনুমানগুলি তৈরি করে এবং উপরের সিএলটি-র মতো কোনও গাণিতিক ফলাফল জড়িত করে মডেলটির বৈশিষ্ট্যগুলি অনুমান করার চেষ্টা করার পরিবর্তে উপাত্তগুলিতে একই মডেলটি চালিয়ে পুরোপুরি অভিজ্ঞতার সাথে উদ্ভূত হয়। তাত্ক্ষণিকভাবে, এটি আরও সৎ, তবে এটি কম তথ্য ব্যবহার করে, এবং এজন্য আরও বড় আকারের নমুনার আকার প্রয়োজন। এছাড়াও, এটি স্পষ্টতই ধরে নিয়েছে যে প্রক্রিয়াটি পরিবর্তন হয় না,

"উত্তরাধিকারকে অনুমান করা" এই বাক্যটি বোধগম্য হতে পারে (আমি কোনও বায়েশিয়ান নই, গ্রহণযোগ্য পরিভাষাটি আসলে কী তা আমি বলতে পারি না), তবে মনে করি না যে এই অনুমানমূলক পদক্ষেপে কোনও অনুমান করাতে খুব বেশি জড়িত রয়েছে। বায়েশীয় অনুমানের সমস্তগুলি হ'ল পূর্ববর্তী (1) এবং (2) ধরে নেওয়া মডেলটিতে এবং সেগুলি স্থাপন করার পরে, উত্তরকটি স্বয়ংক্রিয়ভাবে অনুসরণ করে (কমপক্ষে তত্ত্বে বাইস উপপাদ্য মাধ্যমে; বাস্তব পদক্ষেপগুলি হ্যালোভ্যালোট জটিল হতে পারে, এবং সিপস জুয়া ... আমাকে ক্ষমা করবেন, গিবস স্যাম্পলিং সেই উত্তরের দিকে যাওয়ার তুলনামূলক সহজ উপাদান হতে পারে)। যদি "পশ্চাত্পদকে অনুমান করা" (1) + (2) বোঝায় তবে এটি আমার কাছে পরিসংখ্যানগত সূচনার স্বাদ। যদি (1) এবং (2) আলাদাভাবে বর্ণিত হয়, এবং তারপরে "উত্তরোত্তর অনুমান করা" অন্য কিছু হয়, তবে আমি করি না '


2

মনে করুন আপনার কাছে কোনও জনসংখ্যার প্রতিনিধি নমুনা রয়েছে।

আপনি যখন কোনও মডেলটি অনুমান করার জন্য সেই নমুনাটি ব্যবহার করেন তখন নির্দিষ্টভাবে নির্ভুলতার সাথে ফলাফলগুলি পুরো জনসংখ্যায় প্রসারিত করা যেতে পারে In অনুমান করা হ'ল কেবল একটি প্রতিনিধি নমুনা ব্যবহার করে জনসংখ্যার উপর অনুমান করা।

অনুমান করা হয় যখন আপনি আপনার ডেটা নমুনায় ফিট করার জন্য কোনও মডেল চয়ন করেন এবং মডেলটির পরামিতিগুলির একটি নির্দিষ্ট নির্ভুলতার সাথে গণনা করেন। একে অনুমান বলা হয় কারণ আপনি কখনই প্যারামিটারগুলির প্রকৃত মানগুলি গণনা করতে পারবেন না যেহেতু আপনার কাছে কেবলমাত্র ডেটা নমুনা রয়েছে, পুরো জনসংখ্যার নয় not


"আপনি যখন কোনও মডেলটি অনুমান করার জন্য কোনও নমুনা ব্যবহার করেন" তখন তা অনুমিত হয় "(এবং এভাবে তার পরামিতিগুলি অনুমান করার জন্য)। "অনুমান করা হয় যখন আপনি গণনা করেন ... মডেলের পরামিতি"। আপনি কোন পার্থক্য দেখতে পাচ্ছেন?
এনবিরো

2

এটি পরিসংখ্যানের ব্যাকগ্রাউন্ড ছাড়াই যে কাউকে উত্তর দেওয়ার চেষ্টা is যারা আরও বিশদে আগ্রহী তাদের জন্য, এই বিষয়টিতে অনেক দরকারী তথ্যসূত্র রয়েছে ( যেমন এটি উদাহরণস্বরূপ )।

সংক্ষিপ্ত উত্তর:

>

->

দীর্ঘ উত্তর:

"অনুমান" শব্দটি প্রায়শই একটি অজানা মানটির জন্য অনুমানের সন্ধানের প্রক্রিয়াটি বর্ণনা করতে ব্যবহৃত হয়, যখন "অনুমান" প্রায়শই পরিসংখ্যানিক অনুক্রমকে বোঝায়, এলোমেলো ভেরিয়েবলগুলির বিতরণ (বা বৈশিষ্ট্য) আবিষ্কার করার এবং সিদ্ধান্তগুলি আঁকতে তাদের ব্যবহার করার প্রক্রিয়া।

এই প্রশ্নের উত্তর দেওয়ার বিষয়ে চিন্তা করুন: আমার দেশের গড়পড়তা ব্যক্তি কতটা লম্বা?

যদি আপনি কোনও অনুমানের সন্ধানের সিদ্ধান্ত নেন তবে আপনি কয়েক দিন ধরে বেড়াতে পারবেন এবং রাস্তায় দেখা অপরিচিত ব্যক্তিদের পরিমাপ করতে পারেন (একটি নমুনা তৈরি করুন) এবং তারপরে আপনার নমুনার গড় হিসাবে উদাহরণ হিসাবে আপনার অনুমানটি গণনা করতে পারেন। আপনি সবেমাত্র কিছু অনুমান করেছেন!

অন্যদিকে, আপনি কিছু অনুমানের চেয়ে বেশি খুঁজে পেতে চাইতে পারেন, যা আপনি জানেন যে একটি সংখ্যা এবং এটি ভুল হতে বাধ্য। আপনি একটি নির্দিষ্ট আত্মবিশ্বাসের সাথে প্রশ্নের উত্তর দেওয়ার লক্ষ্য রাখতে পারেন, যেমন: আমি 99% নিশ্চিত যে আমার দেশের একজনের গড় উচ্চতা 1.60 মিটার থেকে 1.90 মিটারের মধ্যে।

এই জাতীয় দাবি করার জন্য আপনার যে লোকজনের সাথে দেখা হচ্ছে তার উচ্চতা বন্টন সম্পর্কে অনুমান করতে হবে এবং এই জ্ঞানের উপর ভিত্তি করে আপনার সিদ্ধান্তগুলি করা উচিত - যা পরিসংখ্যানগত অনুক্রমের ভিত্তি।

মাথায় রাখতে গুরুত্বপূর্ণ বিষয়টি (শি'ানের উত্তরে উল্লেখ করা হয়েছে) যে অনুমানকারীকে অনুসন্ধান করা এটি পরিসংখ্যানগত অনুক্রমের অংশ।


1
"পরবর্তী এলোমেলো ব্যক্তিটি কতটা লম্বা হবে" এটি অনুমানের চেয়ে পরিসংখ্যান সম্পর্কিত ভবিষ্যদ্বাণের প্রশ্ন । "সমস্ত মানুষের মধ্য 95% এর পরিসীমা কত" এটি একটি (অন্তর) অনুমান। যদিও দুটি প্রশ্নের (এবং সমাধানের পদ্ধতিগুলি) নিবিড়ভাবে সম্পর্কিত এবং একইরকম, তবে কয়েকটি গুরুত্বপূর্ণ উপায়ে এগুলি পৃথক and এবং এরও আলাদাভাবে উত্তর দেওয়া হয়। পার্থক্যটি প্রথম প্রশ্নের পরবর্তী ব্যক্তির এলোমেলোতা থেকে উদ্ভূত হয় , যা দ্বিতীয় প্রশ্নে উপস্থিত নেই।
whuber

আমি সম্মত হই যে উদাহরণগুলি আদর্শ নয়। প্রশ্নের প্রকৃতি প্রদত্ত, আমি উদাহরণ দেওয়ার চেষ্টা করছিলাম যে একটি অ-পরিসংখ্যানবিদ খুব পরিচিত হবে। "অনুমান" সম্পর্কে আমার সবচেয়ে সহজ উত্তরটি হ'ল এটিতে কোনও পরিসংখ্যানের মডেলের পরামিতিগুলির সাথে জড়িত জড়িত থাকে তবে আমি "ফিটিং" এবং "পরিসংখ্যানের মডেল" উভয় শব্দের পরিচয় করিয়ে দেই যার ব্যাখ্যা দরকার require দিনের শেষে, উদাহরণে বর্ণিত পূর্বাভাস সামনের দিকে তাকালেও আমি এখনও এটিকে একটি (বিন্দু) অনুমান হিসাবে বিবেচনা করব।
মানে-থেকে-অর্থ-

পূর্বাভাস না রাখার জন্য উদাহরণটি পরিবর্তন করে।
অর্থ থেকে

1

ঠিক আছে, আজ বিভিন্ন শাখার লোকেরা যারা এমএল অঞ্চলে তাদের কেরিয়ার তৈরি করেন এবং সম্ভবত তারা কিছুটা আলাদা উপভাষা বলে থাকেন।

যাইহোক, তারা যে কোনও পদ ব্যবহার করতে পারে, এর পিছনে ধারণাগুলি আলাদা। সুতরাং এই ধারণাগুলি পরিষ্কার হওয়া গুরুত্বপূর্ণ, এবং তারপরে আপনার পছন্দ অনুসারে সেই উপভাষাগুলি অনুবাদ করুন।

যেমন।

বিশপের পিআরএমএল-এ,

অনুমানের পর্যায়ে যার জন্য আমরা একটি মডেল শিখতে প্রশিক্ষণ ডেটা ব্যবহার করি পি(সি|এক্স)

সুতরাং এটি এখানে Inference= Learning=Estimation

কিন্তু অন্যান্য উপাদানে, অনুমান প্রাক্কলন, থেকে ভিন্ন হতে পারে যেখানে inferenceমানে predictionযখন estimationউপায়ে প্যারামিটার শেখার পদ্ধতি।


0

মেশিন লার্নিংয়ের প্রসঙ্গে, অনুমানটি আপনার পর্যবেক্ষণের ভিত্তিতে সুপ্ত (লুকানো) ভেরিয়েবলগুলির সেটিংস আবিষ্কার করার কাজকে বোঝায়। এর মধ্যে আপনার সুপ্ত ভেরিয়েবলের উত্তর বিতরণ নির্ধারণ করাও অন্তর্ভুক্ত। অনুমানটি "পয়েন্ট অনুমান" এর সাথে জড়িত বলে মনে হয় যা আপনার মডেল পরামিতিগুলি নির্ধারণ করে। উদাহরণগুলির মধ্যে সর্বাধিক সম্ভাবনা অনুমান অন্তর্ভুক্ত। প্রত্যাশা সর্বাধিককরণ (EM) এ, ই পদক্ষেপে, আপনি অনুমিতি করেন। এম পদক্ষেপে, আপনি প্যারামিটার অনুমান করেন।

আমার মনে হয় আমি লোকেরা "উত্তরোত্তর বিতরণ অনুমান" এর চেয়ে "উত্তরোত্তর বিতরণ" অনুমান করা বলতে শুনি। পরেরটি যথাযথ নির্ভুল অনুমান হিসাবে ব্যবহৃত হয় না। এটি ব্যবহার করা হয়, উদাহরণস্বরূপ, প্রত্যাশা প্রচার এবং বৈকল্পিক বয়েসে, যেখানে সঠিক পোস্টেরিয়র অনুমান করা অক্ষম হয় এবং উত্তরোত্তর উপর অতিরিক্ত অনুমান করা উচিত। এই ক্ষেত্রে, অনুমানকৃত পোস্টটি আনুমানিক। লোকেরা "আনুমানিক উত্তরোত্তর" বা "উত্তরোত্তর অনুমান" বলতে পারেন।

এই সব আমার মতামত। এটি কোনও নিয়ম নয়।


0

আমি "অনুমান" অংশটি প্রসারিত করে অন্যের উত্তরগুলিতে যুক্ত করতে চাই। মেশিন লার্নিংয়ের প্রসঙ্গে, অনুমানের একটি আকর্ষণীয় দিকটি অনিশ্চয়তা অনুমান করে। এটি এমএল অ্যালগরিদমগুলির সাথে সাধারণত জটিল: আপনি শ্রেণিবিন্যাসের লেবেলটিতে কোনও নিউরাল নেট বা সিদ্ধান্ত গাছের ছিটকে কীভাবে একটি প্রমিত বিচ্যুতি রাখবেন? প্রচলিত পরিসংখ্যানগুলিতে, বিতরণ অনুমানগুলি আমাদের গণিত করতে দেয় এবং পরামিতিগুলিতে কীভাবে অনিশ্চয়তা মূল্যায়ন করতে পারে তা নির্ধারণ করতে দেয়। এমএলে, কোনও প্যারামিটার, বিতরণীয় অনুমান বা নাও থাকতে পারে।

এই ফ্রন্টগুলিতে কিছু অগ্রগতি হয়েছে, এর কয়েকটি খুব সাম্প্রতিক (বর্তমান উত্তরগুলির চেয়ে সাম্প্রতিক)। একটি বিকল্প হ'ল, অন্যরা যেমন উল্লেখ করেছেন, বায়েশিয়ান বিশ্লেষণ যেখানে আপনার উত্তরোত্তর আপনাকে অনিশ্চয়তার অনুমান দেয়। বুটস্ট্র্যাপ ধরণের পদ্ধতিগুলি দুর্দান্ত। স্টিফান বাজি এবং স্ট্যানফোর্ড এ সুসান অ্যাথে, গত কয়েক বছরের পেয়ে থেকে কিছু কাজ আছে র্যান্ডম বন অনুমান । আনালাগুল্যভাবে, বার্ট একটি বায়েশিয়ান গাছের নকশা পদ্ধতি যা একটি উত্তরোত্তর ফল দেয় যা থেকে অনুমান আঁকতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.