সাধারণ ব্যক্তির ভাষায় কোনও মডেল এবং বিতরণের মধ্যে পার্থক্য কী?


28

উইকিপিডিয়ায় সংজ্ঞায়িত উত্তর (সংজ্ঞা) উচ্চতর গণিত / পরিসংখ্যানের সাথে অপরিচিত যারা তাদের পক্ষে তাত্ক্ষণিকভাবে কিছুটা রহস্যজনক।

গাণিতিক ভাষায়, একটি পরিসংখ্যানগত মডেলটিকে সাধারণত একটি জুড়ি হিসাবে বিবেচনা করা হয় ( is ), যেখানে সম্ভাব্য পর্যবেক্ষণগুলির সমষ্টি, যেমন নমুনা স্থান, এবং সম্ভাবনা বিতরণের একটি সেট উপর । এস পি এসS,PSPS

সম্ভাবনা এবং পরিসংখ্যানগুলিতে, সম্ভাব্যতা বিতরণ একটি এলোমেলো পরীক্ষা, জরিপ, বা পরিসংখ্যানগত অনুক্রমের পদ্ধতির সম্ভাব্য ফলাফলগুলির প্রতিটি পরিমাপযোগ্য উপসেটকে সম্ভাব্যতা নির্ধারণ করে। উদাহরণগুলি পাওয়া যায় যার নমুনা স্থানটি অ-সংখ্যাসূচক, যেখানে বিতরণটি শ্রেণিবদ্ধ বিতরণ হবে।

আমি একটি উচ্চ বিদ্যালয়ের ছাত্র এবং শখের হিসাবে এই ক্ষেত্রে খুব আগ্রহী এবং বর্তমানে একটি statistical modelএবং একটি এর মধ্যে পার্থক্যের সাথে লড়াই করছিprobability distribution

আমার বর্তমান এবং খুব প্রাথমিক, বোঝাপড়া এটি:

  • পরিসংখ্যান সংক্রান্ত মডেলগুলি পরিমাপকৃত পরিমাপিত বিতরণের গাণিতিক প্রচেষ্টা

  • সম্ভাব্যতা বিতরণগুলি পরীক্ষা-নিরীক্ষার বিবরণগুলি থেকে পরিমাপ করা হয় যা এলোমেলো ইভেন্টের প্রতিটি সম্ভাব্য ফলাফলের জন্য সম্ভাব্যতা নির্ধারণ করে

"বিতরণ" এবং "মডেল" শব্দটি পরস্পর পরিবর্তিত ব্যবহৃত - বা কমপক্ষে খুব অনুরূপ পরিস্থিতিতে (যেমন দ্বিপদী বিতরণ বনাম দ্বিপদী মডেল) দেখার সাহিত্যে বিভ্রান্তি আরও বাড়িয়ে তোলে is

কেউ কি আমার সংজ্ঞাগুলি যাচাই / সংশোধন করতে পারেন, এবং সম্ভবত এই ধারণাগুলিগুলিতে আরও আনুষ্ঠানিক (সহজ ইংরাজির দিক দিয়ে হলেও) প্রস্তাব দিতে পারেন?


1
নীচের লাইন: একটি পরিসংখ্যান মডেল এবং সম্ভাব্যতা বিতরণের মধ্যে একেবারেই পার্থক্য নেই। প্রতিটি পরিসংখ্যানের মডেল একটি সম্ভাব্যতা বিতরণ এবং তদ্বিপরীত বর্ণনা করে। তাদের আপনাকে দীর্ঘ পাঠ্যগুলিতে বিভ্রান্ত করতে দেবেন না।
ক্যাগডাস ওজজেঙ্ক 18

3
@Cagdas সংজ্ঞা অনুযায়ী প্রশ্নে উদাহৃত, সেখানে হয় একটি পার্থক্য: একটি পরিসংখ্যান মডেল সম্ভাব্যতা ডিস্ট্রিবিউশন একটি বিশেষ সংগঠিত সংগ্রহ। যখন কেবলমাত্র একটি সম্ভাব্য বিতরণ প্রমাণ হিসাবে উপস্থিত থাকে, তখন আমরা আর পরিসংখ্যানই করি না, কারণ পরিসংখ্যানগত বিশ্লেষণের লক্ষ্য অর্জন করা হয়েছে: আমরা জানি বিতরণ!
whuber

2
@ কেগডাস উইকিপিডিয়া সেরা গ্রন্থগুলির সাথে সংস্থান রাখে। আমি এর সাথে পুরোপুরি একমত
whuber

4
@ ক্যাগডাস ওজেনসিঙ্ক, আপনার তীক্ষ্ণ এবং সুনির্দিষ্ট দাবী প্রমাণ করার জন্য কেন কিছু প্রমাণ উপস্থাপন করবেন না? কর্তৃপক্ষ দ্বারা প্রমাণ খুব কমই (যদি কখনও) গ্রহণযোগ্য হয়। এভিডেন্স ব্যতীত উত্পাদনশীল আলোচনা করা কঠিন (যদি অসম্ভব না হয়); অসমর্থিত দাবিগুলি শোরগোলের চেয়ে খুব কমই বেশি।
রিচার্ড হার্ডি

2
@ রিচার্ড হার্দি প্রশ্নটি "সাধারণ লোকদের শর্তাবলী" জিজ্ঞাসা করেছিল এবং তার যে উত্তর পেয়েছে সেগুলি দেখুন। ক্ষমা করুন তবে কেউ শিক্ষার্থীদের দেখানোর সিদ্ধান্ত নেওয়ার কারণেই আমি শিক্ষার্থীদের ভোগান্তি দেখে ঘৃণা করি। উত্তরটি 2 + 2 = 4 এর মতো সহজ, এবং আমি সত্যিই মনে করি না যে এটির জন্য 20 পৃষ্ঠার অনুমোদনের উল্লেখ রয়েছে।
ক্যাগডাস ওজজেনেক

উত্তর:


25

সম্ভাব্যতা বিতরণ একটি গাণিতিক ফাংশন যা এলোমেলো পরিবর্তনশীল বর্ণনা করে। আরও একটু স্পষ্ট করে বললে, এটি এমন একটি ফাংশন যা সংখ্যাকে সম্ভাব্যতা দেয় এবং এর আউটপুটটি সম্ভাবনার অক্ষগুলির সাথে একমত হতে হয়

পরিসংখ্যানগত মডেল হ'ল সম্ভাবনা বিতরণ ব্যবহার করে গাণিতিক শর্তে কিছু ঘটনা সম্পর্কে একটি বিমূর্ত, আদর্শ বর্ণন। ওয়াশারম্যানের উদ্ধৃতি (2013):

একটি পরিসংখ্যানগত মডেল বিতরণের একটি সেট (বা ঘনত্ব বা রিগ্রেশন ফাংশন)। একটি প্যারাম্যাট্রিক মডেল একটি সেট যা একটি সীমাবদ্ধ পরামিতি দ্বারা পরামিতি করা যেতে পারে। [...] FF

সাধারণভাবে, একটি প্যারামেট্রিক মডেল রূপ নেয়

F={f(x;θ):θΘ}

যেখানে একটি অজানা প্যারামিটার (বা প্যারামিটারের ভেক্টর) যা প্যারামিটার স্পেসে মান নিতে পারে । যদি একটি ভেক্টর তবে আমরা কেবল একটি উপাদানটিতে আগ্রহী , আমরা বাকি পরামিতিগুলিকে উপদ্রব পরামিতি বলি । একটি ননপ্যারামেট্রিক মডেল এমন একটি সেট যা সীমিত সংখ্যক পরামিতি দ্বারা প্যারামিটারাইজ করা যায় না।θ ΘθθF

অনেক ক্ষেত্রে আমরা বিতরণগুলি মডেল হিসাবে ব্যবহার করি (আপনি এই উদাহরণটি পরীক্ষা করতে পারেন )। আপনি মুদ্রা নিক্ষেপের সিরিজের মাথাগুলির একটি মডেল হিসাবে দ্বিপদী বিতরণ ব্যবহার করতে পারেন । সেক্ষেত্রে আমরা ধরে নিই যে এই বিতরণটি সরলকরণে, আসল ফলাফলগুলি বর্ণনা করে। এর অর্থ এই নয় যে আপনি কীভাবে এই জাতীয় ঘটনাটি বর্ণনা করতে পারেন তার একমাত্র উপায়, দ্বিপাক্ষিক বিতরণ এমন কিছু নয় যা কেবলমাত্র এই উদ্দেশ্যে ব্যবহার করা যেতে পারে। মডেল এক বা একাধিক বিতরণ ব্যবহার করতে পারে, অন্যদিকে বায়সিয়ান মডেলগুলি পূর্বের বিতরণগুলিও নির্দিষ্ট করে।

আরও আনুষ্ঠানিকভাবে এটি ম্যাককুলাঘ দ্বারা আলোচিত হয়েছে (2002):

বর্তমানে গৃহীত তত্ত্ব অনুসারে [কক্স এবং হিঙ্কলি (1974), অধ্যায় 1; লেহম্যান (1983), অধ্যায় 1; বার্ডার্ফ-নিলসন এবং কক্স (1994), বিভাগ 1.1; বের্নার্ডো ও স্মিথ (1994), অধ্যায় 4] পরিসংখ্যান মডেল নমুনা স্থান সম্ভাব্যতা ডিস্ট্রিবিউশন একটি সেট । স্থিতিমাপ কর পরিসংখ্যানগত মডেল একটি প্যারামিটার একটি ফাংশন সঙ্গে একসঙ্গে সেট , প্রতিটি প্যারামিটার বিন্দু যা নির্ধারণ একটি সম্ভাব্যতা বিতরণ on । এখানে হল সমস্ত সম্ভাব্যতা বিতরণের সেটSΘP:ΘP(S)θΘPθSP(S)S । নীচের বেশিরভাগ ক্ষেত্রে, ফাংশন হিসাবে মডেলটির মধ্যে পার্থক্য করা গুরুত্বপূর্ণ , এবং ডিস্ট্রিবিউশনগুলির সেট সেট ।P:ΘP(S)PΘP(S)

সুতরাং পরিসংখ্যানের মডেলগুলি তাদের পদগুলিতে ডেটা বর্ণনা করতে সম্ভাব্যতা বিতরণ ব্যবহার করে । প্যারামিটারিক মডেলগুলি পরামিতিগুলির সীমাবদ্ধ সেটগুলির ক্ষেত্রেও বর্ণিত হয়।

এর অর্থ এই নয় যে সমস্ত পরিসংখ্যান পদ্ধতির সম্ভাব্যতা বন্টন প্রয়োজন। উদাহরণস্বরূপ, লিনিয়ার রিগ্রেশন প্রায়শই স্বাভাবিকতা অনুমানের ক্ষেত্রে বর্ণনা করা হয় , তবে বাস্তবে এটি স্বাভাবিকতা থেকে বিদায় নেওয়া বেশ শক্তিশালী এবং আত্মবিশ্বাসের ব্যবধান এবং অনুমানের পরীক্ষার জন্য ত্রুটির স্বাভাবিকতা সম্পর্কে আমাদের ধারণা অনুমিত হওয়া প্রয়োজন। কাজ করার জন্য রিগ্রেশনটির জন্য আমাদের এ ধরনের অনুমানের দরকার নেই, তবে পরিসংখ্যানের সম্পূর্ণ মডেল নির্দিষ্ট করার জন্য এলোমেলো ভেরিয়েবলের ক্ষেত্রে এটি বর্ণনা করা দরকারসুতরাং আমাদের সম্ভাব্য বন্টন দরকার। আমি এই সম্পর্কে লিখছি কারণ আপনি প্রায়শই লোকদের বলতে শুনেছেন যে তারা তাদের ডেটার জন্য রিগ্রেশন মডেল ব্যবহার করেছে - বেশিরভাগ ক্ষেত্রে এর পরিবর্তে তারা বোঝায় যে তারা শর্তসাপেক্ষে জিদ করার চেয়ে লক্ষ্য মান এবং ভবিষ্যদ্বাণীকারীদের মধ্যে লিনিয়ার সম্পর্কের ক্ষেত্রে ডেটা বর্ণনা করে, স্বাভাবিক।


ম্যাককুলাঘ, পি। (2002) একটি পরিসংখ্যান মডেল কি? পরিসংখ্যানগুলির বার্তা , 1225-1267।

ওয়াসারম্যান, এল। (2013) সমস্ত পরিসংখ্যান: পরিসংখ্যানগত অনুক্রমের একটি সংক্ষিপ্ত কোর্স। স্প্রিঙ্গের।


4
@ জেসিএলইটিও যে কারণে আমি বিজ্ঞপ্তিটি যুক্ত করেছি;) শাস্ত্রীয় ওএলএস কেবল লাইনটি ফিট করার বিষয়ে। সাধারণ ধারণা অনুভূতিগুলি কেবল গোলমাল সম্পর্কে হয় যখন মূল ধারণাটি হ'ল আমরা এক্স (y) কে এক্স এর লিনিয়ার ফাংশন হিসাবে মডেলিং করি confidence (ঢিলেঢালাভাবে ভাষী।)
টিম

আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। আপনি সংক্ষিপ্তসার জন্য 2 সংক্ষিপ্ত সংজ্ঞা প্রদান করতে পারেন? (এছাড়াও আমি শেষ পংক্তিটি বুঝতে পারি না In much of the following, it is important to distinguish between the model as a function and the associated set of distributions) আপনি কেবল একই শব্দটি ভাগ করে নেওয়ার দুটি অর্থের মধ্যে অন্তর্নিহিত অস্পষ্টতার বিষয়ে মন্তব্য করছেন modelবা আমি কিছু মিস করছি?
অ্যালানস্ট্যাক

@ অ্যালান দুটি সংক্ষিপ্ত সংজ্ঞা প্রথম দুটি অনুচ্ছেদে সরবরাহ করা হয়েছে, যেখানে উদ্ধৃতি এবং রেফারেন্সগুলিতে আরও কঠোর একটি - আপনি কী স্পষ্ট করতে পারেন তা অস্পষ্ট? উক্তিটির শেষ লাইনটি সম্পর্কে: এটি মূলত বলেছে যে মডেলটি সম্ভাব্যতা বিতরণ এবং পরামিতিগুলির ক্ষেত্রে সংজ্ঞায়িত হয় এবং এটি মনে রাখা ভাল যে এই দুটি দিক রয়েছে, কখনও কখনও এটি আলাদা করা ভাল is আমি কঠোর আলোচনার জন্য উদ্ধৃত কাগজটি সুপারিশ করছি (এটি লিঙ্কের অধীনে অবাধে উপলভ্য)।
টিম

8

tickets কে টিকিটের সেট হিসাবে ভাবেন । আপনি একটি টিকিটে স্টাফ লিখতে পারেন। সাধারণত কোনও বাস্তব-জগতের কিছু ব্যক্তি বা বস্তুর নাম যে এটি "প্রতিনিধিত্ব করে" বা "মডেল" with অন্যান্য জিনিস লেখার জন্য প্রতিটি টিকিটে প্রচুর ফাঁকা জায়গা রয়েছে।S

আপনি প্রতিটি টিকিটের যতগুলি অনুলিপি চান তা তৈরি করতে পারেন। এই বাস্তব-বিশ্ব জনগোষ্ঠী বা প্রক্রিয়াটির জন্য একটি সম্ভাব্যতা মডেল প্রতিটি টিকিটের এক বা একাধিক অনুলিপি তৈরি করে, সেগুলি মিশ্রণ করে এবং একটি বাক্সে রাখে। যদি আপনি - বিশ্লেষক - এটি স্থাপন করতে পারেন যে এই বাক্স থেকে এলোমেলোভাবে একটি টিকিট আঁকার প্রক্রিয়াটি আপনি যা পড়াচ্ছেন তার সমস্ত গুরুত্বপূর্ণ আচরণ অনুকরণ করে, তবে আপনি এই বাক্সটি সম্পর্কে চিন্তাভাবনা করে বিশ্ব সম্পর্কে অনেক কিছু শিখতে পারবেন। কারণ কিছু টিকিট অন্যের তুলনায় বাক্সে অনেক বেশি হতে পারে, তাদের আঁকার সম্ভাবনা বেশি হতে পারে। সম্ভাবনা তত্ত্ব এই সম্ভাবনাগুলি অধ্যয়ন করে।P

টিকিটে সংখ্যাগুলি যখন লেখা হয় (ধারাবাহিক ভাবে) তখন তারা বিতরণে (সম্ভাব্যতা) দেয়। একটি সম্ভাব্যতা বিতরণের নিছক একটি বক্স যার নম্বর কোনো বিরতি মধ্যে থাকা টিকিট অনুপাত বর্ণনা করা হয়েছে।

যেহেতু আমরা সাধারণত বিশ্বটি ঠিক কীভাবে আচরণ করে তা জানি না, তাই আমাদের বিভিন্ন বাক্স কল্পনা করতে হবে যেখানে টিকিটগুলি বিভিন্ন আপেক্ষিক ফ্রিকোয়েন্সি সহ প্রদর্শিত হবে। এই বাক্সে সেট । আমরা যত পর্যাপ্তরূপে মধ্যে বাক্সে এক আচরণকে দ্বারা বর্ণনা করা হচ্ছে দুনিয়া দেখতে । আপনি যে টিকিটটি এড়িয়ে গেছেন তা টিকিটে আপনি কী দেখেন তার ভিত্তিতে এটি কোন বাক্সটি সম্পর্কে যুক্তিসঙ্গত অনুমান করা আপনার উদ্দেশ্য।PP


উদাহরণ হিসাবে (যা ব্যবহারিক এবং বাস্তববাদী, কোনও পাঠ্যপুস্তক খেলনা নয়), ধরুন আপনি কোনও রাসায়নিক বিক্রিয়াটির রেট এর উপর তাপমাত্রার সাথে পরিবর্তিত হওয়ার কারণে অধ্যয়ন করছেন । ধরুন যে রসায়ন তত্ত্বটি ভবিষ্যদ্বাণী করে যে থেকে ডিগ্রি তাপমাত্রার মধ্যে , হারটি তাপমাত্রার সমানুপাতিক।y0100

আপনি প্রতিটি তাপমাত্রায় বিভিন্ন পর্যবেক্ষণ করে এবং ডিগ্রি উভয় জায়গায় এই প্রতিক্রিয়াটি অধ্যয়ন করার পরিকল্পনা করছেন plan অতএব আপনি একটি খুব, খুব বড় সংখ্যক বাক্স তৈরি করেছেন। আপনি টিকিট দিয়ে প্রতিটি বাক্স পূরণ করতে যাচ্ছেন। প্রত্যেকটির উপরে একটি রেট ধ্রুবক লেখা আছে। যে কোনও প্রদত্ত বাক্সের সমস্ত টিকিটের উপরে একই রেট স্থির থাকে। বিভিন্ন বাক্সে বিভিন্ন হারের ধ্রুবক ব্যবহার করা হয়। 0100

হার ধ্রুবক কোনো টিকেট লেখা ব্যবহার করে, আপনি এছাড়াও হার লিখে এবং হার ডিগ্রী: এই কল এবং । তবে এটি এখনও একটি ভাল মডেলের জন্য যথেষ্ট নয়। রসায়নবিদরাও জানেন যে কোনও পদার্থ খাঁটি নয়, কোনও পরিমাণ হুবহু পরিমাপ করা হয় না এবং পর্যবেক্ষণের পরিবর্তনশীলতার অন্যান্য রূপগুলি ঘটে। এই "ত্রুটিগুলি" মডেল করতে আপনি আপনার টিকিটের খুব বেশি কপি তৈরি করেন। প্রতিটি কপি এ আপনার মান বদলাতে এবং । তাদের বেশিরভাগের ক্ষেত্রে আপনি এগুলিকে সামান্য পরিবর্তন করেন। খুব অল্প কিছুতে, আপনি এগুলিকে অনেক পরিবর্তন করতে পারেন। আপনি প্রতিটি তাপমাত্রায় পর্যবেক্ষণ করার পরিকল্পনা করে যতগুলি পরিবর্তিত মান লিখুন। এই পর্যবেক্ষণগুলি সম্ভব প্রতিনিধিত্ব করে0100y0y100y0y100আপনার পরীক্ষার পর্যবেক্ষণযোগ্য ফলাফল। এই টিকিটের প্রতিটি সেট বাক্সে প্রবেশ করুন: আপনি প্রদত্ত হারের ধ্রুবকটির জন্য যা পর্যবেক্ষণ করতে পারেন তার সম্ভাবনা মডেল model

আপনি যা পর্যবেক্ষণ করেন তা সেই বাক্স থেকে টিকিট আঁকতে এবং কেবল সেখানে লেখা পর্যবেক্ষণগুলি পড়ে মডেল করা হয় আপনি এর অন্তর্নিহিত (সত্য) মান দেখতে পাবেন না বা । আপনি (সত্য) হারের ধ্রুবকটি পড়তে পাবেন না। এগুলি আপনার পরীক্ষার দ্বারা বহনযোগ্য নয়।y0y100

প্রতিটি পরিসংখ্যানের মডেলকে অবশ্যই এই (অনুমান) বাক্সগুলির টিকিটগুলি সম্পর্কে কিছুটা অনুমান করা উচিত। উদাহরণস্বরূপ, আমরা আশা করি আপনি যখন এবং of এর মানগুলি সংশোধন করেছেন, তখন আপনি ধারাবাহিকভাবে পক্ষপাতিত্বের একরকম হতে পারে (ধারাবাহিকভাবে বাক্সের মধ্যে) একটির ক্রমাগত বৃদ্ধি বা ধারাবাহিকভাবে হ্রাস না করেই এটি করেছিলেন y0y100

যেহেতু প্রতিটি টিকিটে লিখিত পর্যবেক্ষণগুলি সংখ্যা, তারা সম্ভাব্যতা বিতরণের জন্ম দেয়। বাক্সগুলি সম্পর্কে করা অনুমানগুলি সাধারণত সেই বিতরণগুলির বৈশিষ্ট্যগুলির ক্ষেত্রে অঙ্কিত হয়, যেমন তাদের অবশ্যই গড় থেকে শূন্য হতে হবে, প্রতিসম হতে হবে, একটি "বেল কার্ভ" আকৃতি থাকতে হবে, অসংলগ্ন বা কিছু হোক না কেন।


সত্যিই এটি আছে। আদিম বারো টোন স্কেল যেভাবে সমস্ত পশ্চিমা ধ্রুপদী সংগীতের জন্ম দেয়, অনেকটাই, টিকিটযুক্ত বাক্সগুলির সংগ্রহ একটি সাধারণ ধারণা যা অত্যন্ত সমৃদ্ধ এবং জটিল উপায়ে ব্যবহার করা যেতে পারে। এটি একটি মুদ্রা ফ্লিপ থেকে শুরু করে ভিডিও লাইব্রেরি, ওয়েবসাইটের কথোপকথনের ডেটাবেস, কোয়ান্টাম মেকানিকাল এনসেম্বলস এবং পর্যবেক্ষণ ও রেকর্ড করা যায় এমন অন্য যে কোনও কিছুর মডেল করতে পারে।


3

প্রতিটি সম্ভাব্য ইভেন্টকে সম্ভাব্যতা নির্ধারণ হিসাবে বিতরণের সংজ্ঞাটি বিচ্ছিন্ন বিতরণের জন্য কাজ করে, তবে অবিচ্ছিন্ন বিতরণের জন্য আরও জটিল হয়ে ওঠে, যেখানে প্রকৃত লাইনের কোনও সংখ্যাই ফলাফল হতে পারে। বিতরণ সম্পর্কে কথা বলার সময় আমরা প্রায়শই নির্দিষ্ট পরামিতি যেমন দ্বি-দ্বি বিতরণের দুটি প্যারামিটার বলে মনে করি: প্রথমত, পর্যবেক্ষণের সংখ্যা এবং দ্বিতীয়ত কোনও একক পর্যবেক্ষণের একটি সম্ভাবনা eventπ

সাধারণ প্যারাম্যাট্রিক স্ট্যাটিস্টিকাল মডেলগুলি বর্ণনা করে যে কোনও বিতরণের প্যারামিটারগুলি কীভাবে কিছু বিষয়গুলির উপর নির্ভর করে যেমন একটি উপাদান (একটি ভেরিয়েবল যার পৃথক মান রয়েছে) এবং কোভারিয়েট (অবিচ্ছিন্ন ভেরিয়েবল)। উদাহরণস্বরূপ, যদি কোনও সাধারণ বিতরণে আপনি ধরে নেন যে গড়টি কোনও নির্দিষ্ট সংখ্যার (একটি "ইন্টারসেপ্ট") এবং কিছু সংখ্যার (একটি "রিগ্রেশন সহগ") দ্বারা কোভেরিয়ার মানের গুণমান দ্বারা বর্ণনা করা যায় তবে আপনি এর সাথে লিনিয়ার রিগ্রেশন মডেলটি পাবেন একটি সাধারণ বিতরণ ত্রুটি শব্দ। দ্বিপদী বিতরণের জন্য, একটি সাধারণভাবে ব্যবহৃত মডেল ("লজিস্টিক রিগ্রেশন") ধরে নেওয়া হয় যে কোনও ইভেন্টের সম্ভাব্যতা ( ) এর লগিট একটি রিগ্রেশন সমীকরণ যেমন হিসাবে বর্ণনা করা যেতে পারেππ/(1π)intercept+β1covariate1+। একইভাবে, পোইসন বিতরণের জন্য একটি সাধারণ মডেল হ'ল রেট প্যারামিটারের লোগারিথ ("পোইসন রিগ্রেশন") ধরে নেওয়া।


2
হ্যাঁ, তবে ... মডেলটি কেবলমাত্র পরামিতিগুলি সম্পর্কেই নয়, তবে সমস্যাটির কাঠামো সম্পর্কেও হতে পারে (যেমন প্রব্যাবিলাস্টিক মডেল যা ধরে নেওয়া ডেটা উত্পন্নকরণের প্রক্রিয়ার সাথে সাদৃশ্যপূর্ণ); নন-প্যারামেট্রিক মডেলগুলিও রয়েছে।
টিম

2

সম্ভাব্য বন্টন এলোমেলো পরিমাণে কীভাবে ওঠানামা করে সে সম্পর্কে সমস্ত তথ্য দেয়। অনুশীলনে সাধারণত আমাদের আগ্রহের পরিমাণের সম্পূর্ণ সম্ভাবনা বন্টন হয় না। আমরা না জেনে বা ধরেই না পারি যে আমরা এ সম্পর্কে সব কিছু জানি। উদাহরণস্বরূপ, আমরা ধরে নিতে পারি যে কিছু পরিমাণ সাধারণত বিতরণ করা হয় তবে এর অর্থ এবং তারতম্য সম্পর্কে কিছুই জানে না। তারপরে আমাদের কাছে বিতরণের জন্য বেছে নেওয়া প্রার্থীদের একটি সংগ্রহ রয়েছে; আমাদের উদাহরণস্বরূপ, এটি সমস্ত সম্ভব সাধারণ বিতরণ। বিতরণগুলির এই সংগ্রহটি একটি পরিসংখ্যানের মডেল তৈরি করে। আমরা ডেটা সংগ্রহ করে এবং তারপরে আমাদের পরীক্ষার্থীদের ক্লাসকে সীমাবদ্ধ করে এটি ব্যবহার করি যাতে বাকী সমস্ত প্রার্থী কিছু উপযুক্ত অর্থে ডেটার সাথে সামঞ্জস্য থাকে।


2

একটি মডেল পিডিএফ দ্বারা নির্দিষ্ট করা হয়, তবে এটি পিডিএফ নয়।

সম্ভাব্যতা বিতরণ (পিডিএফ) হ'ল একটি ফাংশন যা সংখ্যাকে সম্ভাব্যতা নির্ধারণ করে এবং এর আউটপুটটি সম্ভাবনার অক্ষগুলির সাথে একমত হতে হয়, যেমন টিম ব্যাখ্যা করেছিলেন

একটি মডেল সম্ভাব্যতা বিতরণ দ্বারা সম্পূর্ণরূপে সংজ্ঞায়িত করা হয় তবে এটি এর চেয়ে বেশি is মুদ্রা টসিং উদাহরণে, আমাদের মডেল হতে পারে "মুদ্রাটি ন্যায্য" "" প্রতিটি নিক্ষেপ স্বাধীন "। এই মডেলটি পিডিএফ দ্বারা নির্দিষ্ট করা হয়েছে যা পি = 0.5 এর সাথে দ্বিপদী om

যাইহোক, কেউ এমন একটি মডেল কল্পনা করতে পারেন যেখানে নিক্ষেপগুলি স্বাধীন নয়, এক্ষেত্রে এটি দ্বিপদী পিডিএফ দ্বারা আর বর্ণিত নয়। তবুও, মডেলটি সমস্ত ইভেন্টের এর যৌথ বিতরণ (একটি পিডিএফ) দ্বারা সুনির্দিষ্ট করা হয়েছে । আনুষ্ঠানিকভাবে বিন্দুটি হ'ল একটি মডেল সর্বদা ইভেন্টগুলির উপর যৌথ বিতরণ দ্বারা নির্দিষ্ট করা হয়।P(x1,x2,x3,...)

মডেল এবং পিডিএফ মধ্যে একটি পার্থক্য হল একটি মডেল একটি পরিসংখ্যান অনুমান হিসাবে ব্যাখ্যা করা যেতে পারে। উদাহরণস্বরূপ, মুদ্রা টসিংয়ে আমরা মুদ্রাটি যেখানে ফর্সা (মডেল = p.5), এবং প্রতিটি নিক্ষিপ্তটি স্বাধীন (দ্বিপদী), এবং এটি আমাদের অনুমান, যা আমরা প্রতিযোগিতামূলক হাইপোথিসিসের বিরুদ্ধে পরীক্ষা করতে চাই, সেই মডেলটি বিবেচনা করতে পারি we ।

আপনার কাছে প্রতিদ্বন্দ্বী মডেলও থাকতে পারে (উদাহরণস্বরূপ আমরা জানি না এবং আমরা কোন সবচেয়ে উপযুক্ত তা গণনা করতে চাই )। পিডিএফ প্রতিযোগিতা করার কথা বলার অর্থ নেই কারণ এগুলি কেবল একটি গাণিতিক বিষয়।pp


আপনি কি আপনার শেষ বাক্যটি বিশদভাবে বলতে পারেন? এটি আমার কাছে ননপ্যারমেট্রিকের পরিসংখ্যানের একটি বড় অংশ বলে মনে হচ্ছে।
ইয়ান

আমি সর্বদা x_i এর পিডিএফ-তে কম সীমাবদ্ধ হিসাবে নন-প্যারাম্যাট্রিক মডেলগুলির ব্যাখ্যা করেছি, তবে এখনও তাদের ব্যবহৃত পরিসংখ্যানগুলির জন্য একটি পিডিএফ প্রয়োজন require উদাহরণস্বরূপ কেন্দাল র‌্যাঙ্কের পারস্পরিক সম্পর্ক পি-ভ্যালু গণনা করার জন্য স্বাভাবিকতা অনুমান করে । তবে এটি হতে পারে যে একটি পাল্টা উদাহরণ রয়েছে। আমি আগ্রহী হবে।
জর্জি লিটাও

যখন আপনি "প্রতিযোগিতামূলক পিডিএফের কথা বললে বুদ্ধিমান হয় না" তখন আপনি কী বলছেন তা আমি বুঝতে পারি না। প্যারাম্যাট্রিক পরিসংখ্যানগুলিতে এমনকি আমরা যা করছি তা হ'ল: আমাদের কাছে একগুচ্ছ পিডিএফ রয়েছে যা আমরা মনে করি যে সমস্যার জন্য কার্যকর হতে পারে, আমরা কিছু ডেটা নিই এবং আমরা ডেটা থেকে এই সিদ্ধান্তে পৌঁছলাম যে আমাদের পিডিএফগুলির কিছু উপসেট আরও ভাল। তারপরে আমরা "আরও ভাল" বলতে কী বোঝাতে চাইছি তা পরিমাপ করি। (এছাড়াও, প্রাথমিক প্রসঙ্গে, আপনার সত্যিকার অর্থে সমস্ত কিছুর জন্য "পিডিএফ" ব্যবহার করা উচিত নয় distribution বিতরণিক দিক থেকে এটি শেষ পর্যন্ত কার্যকর হয় তবে এটি বেশ পরিশীলিত যন্ত্রপাতি ...)
আইয়ান

A model is specified by a PDFআমি একমত নই একাধিক পিডিএফ দ্বারা একটি মডেলও নির্দিষ্ট করা যেতে পারে। এবং কোনও মডেল কোনও পিডিএফ দ্বারা নির্দিষ্ট করা যেতে পারে: এসভিএম বা রিগ্রেশন ট্রি জাতীয় কিছু মনে করুন।
রিকার্ডো ক্রুজ

2

অ্যালান, আপনি একটি খুব গুরুত্বপূর্ণ প্রশ্ন জিজ্ঞাসা করেছেন এবং উপরে কিছু সূক্ষ্ম উত্তর পেয়েছেন। আমি একটি সহজ উত্তর দিতে চাই, এবং উপরের উত্তরগুলি সম্বোধন করে না এমন পার্থক্যের একটি অতিরিক্ত মাত্রাও নির্দেশ করতে চাই। সরলতার জন্য, আমি এখানে যা কিছু বলব তা প্যারাম্যাট্রিক পরিসংখ্যানের মডেলগুলির সাথে সম্পর্কিত ।

প্রথম সব, আপনি একটি ধারণা পেতে পারেন পরিবার জিনিষ আপনি হাই স্কুলে শিখেছি করেছি সঙ্গে আপনার প্রশ্নের সংযোগ করার জন্য সহায়ক। (আমি অবাক হয়েছি যে এই শব্দটি এখনও এই পৃষ্ঠায় প্রকাশিত হয়নি!) আপনি অনেক আগে ওয়্যারগুলির চৌকোটি পরিবার সম্পর্কে জানতে পেরেছিলেন ,বিতরণের পরিবার হিসাবে আপনি একইভাবে একটি প্যারাম্যাট্রিক পরিসংখ্যানের মডেল সম্পর্কে ভাবতে পারেন । আপনি সম্ভবত রসায়ন বা পদার্থবিজ্ঞানের ক্লাসে ল্যাব পরীক্ষা-নিরীক্ষা করেছেন, যেখানে আপনি বা মতো সাধারণ পরিবারের মডেলগুলির পরামিতিগুলি সনাক্ত করার জন্য ডেটা সংগ্রহ করেছিলেন এবং তাদের প্লট করেছিলেন । সর্বোচ্চ স্তরে, একটি পরিসংখ্যানের মডেলের পরামিতিগুলির অনুমান করা খুব বেশি slাল খুঁজে পাওয়ার প্রক্রিয়ার সাথে সাদৃশ্যপূর্ণy = m x + b F = - কে x এম বি কেy=ax2+bx+cy=mx+bF=kxm এবং ইন্টারসেপ্ট , বা বসন্তের ধ্রুবক । আপনি যখন গণিত অধ্যয়ন অব্যাহত রাখবেন, আপনি দেখতে পাবেন বিভিন্ন ধরণের সত্তার 'পরিবার' সর্বত্র পপ আপ।bk

সুতরাং, আপনার প্রশ্নের আমার সংক্ষিপ্ত উত্তর # 1: একটি পরিসংখ্যান মডেল হ'ল বিতরণের পরিবার utions

পরবর্তী বিষয়টি আমি যোগ্যতার সাথে সম্পর্কিত করতে চাই, পরিসংখ্যানগত । জুডিয়া পার্ল তার "কার্যকারণ বিশ্লেষণের সুবর্ণ নিয়ম" [১, p350] এ উল্লেখ করেছেন,

বিশুদ্ধ পরিসংখ্যান পদ্ধতির মাধ্যমে কোনও কার্যকরী দাবি প্রতিষ্ঠিত করা যায় না, তা প্রপেনসিটি স্কোর, রিগ্রেশন, স্ট্র্যাটিফিকেশন বা অন্য কোনও বিতরণ-ভিত্তিক নকশা হোক।

(বর্তমান উদ্দেশ্যে, আমি আপনাকে "বিতরণ-ভিত্তিক," "" ডিজাইনের পরিবর্তে "এবং" মডেল "এর জায়গায়" পরিসংখ্যান "পড়ার জন্য আমন্ত্রণ জানাব) পার্ল যা জানাতে আগ্রহী তা হ'ল আমাদের মডেলগুলিতে কার্যকারণের প্রভাবগুলি বিশ্ব ( উদাহরণস্বরূপ মনে করুন !) অগত্যা বিশুদ্ধ পরিসংখ্যানগত ধারণাগুলির চেয়ে বেশি মূর্ত । সুতরাং, আপনার প্রশ্নটি শিরোনাম হিসাবে --- অর্থাত্, মডেলটির সাথে সংযুক্ত যোগ্যতার পরিসংখ্যান ব্যতীত --- একটি পূর্ণ উত্তরের জন্য আরও উপদেশের প্রয়োজন যা মডেলগুলি সাধারণত পরিসংখ্যান প্রদেশের বাইরে অন্তর্নিহিতভাবে কার্যকরী ধারণা অন্তর্ভুক্ত করে , অর্থাৎ সম্ভাব্যতা বিতরণ সম্পর্কে বিবৃতি ।F=kx

সুতরাং, আপনার প্রশ্নের আমার উত্তর # 2 হ'ল: মডেলগুলি সাধারণত কার্যকরী ধারণা অবলম্বন করে যা বিশুদ্ধরূপে বিতরণের ক্ষেত্রে প্রকাশ করা যায় না।


[1]: মুক্তা, জুডিয়া। কার্যকারিতা: মডেল, যুক্তি এবং অনুমান। ২ য় সংস্করণ। কেমব্রিজ, যুক্তরাজ্য; নিউ ইয়র্ক: কেমব্রিজ ইউনিভার্সিটি প্রেস, ২০০৯। উদ্ধৃত পি সহ §11.3.5 এর লিঙ্ক। 351।


আমার অজ্ঞতা ক্ষমা করুন, তবে আপনি এই শব্দটির অর্থ কী causal? সেখানে অথবা এটি আরো কিছু সূক্ষ্ম অর্থ এটা কেবল ধারণা পড়ুন নেই causalityএবং সম্পর্ক মধ্যে আবদ্ধ causesএবং effects? আপনার উত্তর জন্য ধন্যবাদ, বিটিডব্লিউ।
অ্যালানস্ট্যাক 4'16

কার্যকারণ জ্ঞান হস্তক্ষেপের প্রভাব জড়িত যদি আপনার কার্যকারণ সম্পর্কিত জ্ঞান থাকে তবে আপনি জানেন যে কোনও সিস্টেম আপনার করা কোনও ক্রিয়াকে কীভাবে প্রতিক্রিয়া জানাবে । (সিএফ। সাধারণ বিরত থাকা, "সমিতি কার্যকারণ নয়।") কার্যকারণ জ্ঞান নিছক পরিসংখ্যানের প্রদেশের বাইরে কীভাবে রয়েছে তা উপলব্ধি করার একটি উপায় হল আমি উপরে বর্ণিত হুকের আইন উদাহরণ বিবেচনা করা। কীভাবে একটি বসন্ত ব্যবহৃত হয় তার উপর নির্ভর করে (উদাহরণস্বরূপ, মাছের স্কেলে বনাম বসন্ত-বোঝা খেলনা বন্দুক), বা বিপরীত কারণ হতে পারে । তবুও এখানে কার্যকারিতার জন্য (কারণ এটি একটি প্রতিসম সম্পর্ক)। এক্স এফ = - কে এক্স =FxF=kx=
ডেভিড সি নরিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.