জনসংখ্যার কোনও পরিমাণগত সম্পত্তি কি "প্যারামিটার"?


13

আমি পরিসংখ্যান এবং পরামিতি পদগুলির পার্থক্যের সাথে তুলনামূলকভাবে পরিচিত। নমুনার ডেটাতে কোনও ফাংশন প্রয়োগ করা থেকে প্রাপ্ত মান হিসাবে আমি একটি পরিসংখ্যান দেখতে পাচ্ছি। তবে প্যারামিটারগুলির বেশিরভাগ উদাহরণ প্যারামেট্রিক বিতরণ সংজ্ঞায়নের সাথে সম্পর্কিত। একটি সাধারণ উদাহরণ হ'ল সাধারণ বিতরণকে প্যারামিটারাইজ করার জন্য গড় এবং মান বিচ্যুতি বা রৈখিক প্রতিরোধের পরামিতি করতে সহগ এবং ত্রুটির প্রকরণ।

তবে জনসংখ্যা বিতরণের আরও অনেকগুলি মান রয়েছে যা কম প্রোটোটাইপিকাল (যেমন, ন্যূনতম, সর্বাধিক, একাধিক রিগ্রেশনে আর-বর্গক্ষেত্র, .25 কোয়ান্টাইল, মিডিয়ান, নন-শূন্য সহগ সহ ভবিষ্যতবাণীগুলির সংখ্যা, স্কিউনেস, সংখ্যা .3 এর চেয়ে বড় কোনও মেট্রিক্সের সাথে সম্পর্কিত সম্পর্কিত।) ইত্যাদি।

সুতরাং, আমার প্রশ্নগুলি হ'ল:

  • জনসংখ্যার কোনও পরিমাণগত সম্পত্তিকে কি "প্যারামিটার" লেবেলযুক্ত করা উচিত?
  • যদি হ্যাঁ, তবে কেন?
  • যদি না হয় তবে কোন বৈশিষ্ট্যগুলিকে পরামিতি লেবেল করা উচিত নয়? তাদের কী লেবেল করা উচিত? এবং কেন?

বিভ্রান্তির উপর বিবরণ

অনুমানকারীদের নিয়ে উইকিপিডিয়া নিবন্ধে বলা হয়েছে:

একটি "অনুমানকারী" বা "বিন্দু অনুমান" হ'ল একটি পরিসংখ্যান (যা তথ্যের একটি ফাংশন) যা একটি পরিসংখ্যানের মডেলটিতে অজানা প্যারামিটারের মান নির্ধারণের জন্য ব্যবহৃত হয়।

তবে আমি .25 কোয়ান্টাইল হিসাবে অজানা মানটি সংজ্ঞায়িত করতে পারি এবং আমি সেই অজানাটির জন্য একটি অনুমানকারী বিকাশ করতে পারি। অর্থাত্, জনসংখ্যার সমস্ত পরিমাণগত বৈশিষ্ট্যগুলি একইভাবে পরামিতি নয় যা বলে যে গড় এবং এসডি একটি সাধারণ বন্টনের পরামিতি, তবুও কোনও পরিমাণগত জনসংখ্যার সম্পত্তি অনুমান করা বৈধ legitimate

উত্তর:


15

এই প্রশ্নটি পরিসংখ্যান কী এবং কীভাবে একটি ভাল পরিসংখ্যান বিশ্লেষণ পরিচালনা করতে হবে তার হৃদয়ে যায়। এটি অনেকগুলি বিষয় উত্থাপন করে, কিছু পরিভাষা এবং তত্ত্বের কিছু। তাদের স্পষ্ট করার জন্য, আসুন প্রশ্নটির অন্তর্নিহিত প্রসঙ্গটি লক্ষ্য করে শুরু করা যাক এবং "প্যারামিটার," "সম্পত্তি," এবং "অনুমানকারী" কী পদগুলি সংজ্ঞায়িত করতে সেখান থেকে এগিয়ে যাই। আলোচনায় আসার সাথে সাথে প্রশ্নের বেশ কয়েকটি অংশের উত্তর দেওয়া হয়। চূড়ান্ত সমাপ্তি বিভাগটি মূল ধারণাগুলির সংক্ষিপ্তসার করে।

রাষ্ট্রীয় স্থান

"বিতরণ" এর একটি সাধারণ পরিসংখ্যান ব্যবহার যেমন " সাথে সাধারণ বিতরণ proportion " এর সাধারণ একটি (গুরুতর) ইংরেজির অপব্যবহার, কারণ স্পষ্টতই এটি একটি বিতরণ নয়: এটি এবং চিহ্ন দ্বারা প্যারামিটারাইজড বিতরণের পুরো পরিবার । এর জন্য একটি মানক স্বরলিপি হ'ল "রাষ্ট্রীয় স্থান" , একটি সেটμσΩΩ Ωexp(12(xμ)/σ)2)dxμσΩবিতরণ। (আমি এখানে প্রকাশের স্বার্থে কিছুটা সরলীকরণ করছি এবং যতটা সম্ভব কঠোর থাকা অবস্থায় আমরা পাশাপাশি চলতে চলতে সহজতর করব)) এর ভূমিকাটি আমাদের পরিসংখ্যানগত পদ্ধতির সম্ভাব্য লক্ষ্যগুলি বর্ণনা করা: যখন আমরা কোনও কিছু অনুমান করি তখন আমরা me একটি (বা কখনও কখনও আরও বেশি) উপাদান বাছাই করা ।Ω

কখনও কখনও রাষ্ট্র স্পেস স্পষ্টভাবে হিসাবে, স্থিতিমাপ হয় । এই বর্ণনায় উপরের অর্ধেক সমতলে টিপলস of এর সেট এবং বিতরণের সেটের মধ্যে একটি থেকে একের মধ্যে যোগাযোগ রয়েছে যা আমরা আমাদের ডেটা মডেল করতে ব্যবহার করব। এই জাতীয় প্যারামিটারাইজেশনের একটি মান হ'ল আমরা এখন বিতরণগুলির জন্য একটি সংখ্যক আসল সংখ্যার অর্ডার দিয়ে উল্লেখ করতে পারি ।{ ( μ , σ ) } ΩΩ={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

অন্যান্য ক্ষেত্রে রাষ্ট্রীয় স্পেসগুলি স্পষ্টভাবে প্যারামিটারাইজড হয় না। একটি উদাহরণ হ'ল সমস্ত অবিচ্ছিন্ন অবিচ্ছিন্ন বিতরণের সেট। নীচে, আমরা যে কোনও উপায়ে এই জাতীয় ক্ষেত্রে পর্যাপ্ত প্যারামিটারাইজেশন খুঁজে পাওয়া যায় কিনা সেই প্রশ্নের সমাধান করব।

Parameterizations

সাধারণত, একটি একখান এর একটি সাদৃশ্য (গাণিতিক হয় ফাংশন একটি উপসেট থেকে) (সঙ্গে সসীম) এর । এটি, ডিস্ট্রিবিউশনগুলি লেবেল করতে এটি টিপলসগুলির অর্ডারযুক্ত সেটগুলি ব্যবহার করে। তবে এটি কেবল কোনও চিঠিপত্র নয়: এটি "ভাল আচরণ করা উচিত"। এটি বুঝতে, সমস্ত অবিচ্ছিন্ন বিতরণগুলির সেটটি বিবেচনা করুন যার পিডিএফের সীমাবদ্ধ প্রত্যাশা রয়েছে। এটিকে ব্যাপকভাবে "নন-প্যারাম্যাট্রিক" হিসাবে বিবেচনা করা হবে যে এই সেটটিকে প্যারামিটারাইজ করার কোনও "প্রাকৃতিক" প্রচেষ্টা সত্যিকারের সংখ্যার একটি গণনাযোগ্য ক্রমকে জড়িত করবে (যে কোনও অরথগোনাল ভিত্তিতে সম্প্রসারণ ব্যবহার করে)। তবুও, কারণ এই সেটটির কার্ডিনালিটি রয়েছেR d d Ω d 1 আরΩRddΩd1 , যা reals এর cardinality, সেখানে এই ডিস্ট্রিবিউশন মধ্যে কিছু একের সাথে এক সাদৃশ্য থাকা আবশ্যক । অদ্ভুতভাবে, এটি একক বাস্তব প্যারামিটারের সাথে এটি একটি প্যারামিটারাইজড স্টেট স্পেস হিসাবে দেখায়!R

এই প্যারাডক্সটি সমাধান করে সমাধান করা হয়েছে যে কোনও একক আসল সংখ্যা বিতরণগুলির সাথে "সুন্দর" সম্পর্ক উপভোগ করতে পারে না: আমরা যখন সেই সংখ্যার মান পরিবর্তন করি তখন কিছু ক্ষেত্রে এটির সাথে বন্টন অবশ্যই সামঞ্জস্যপূর্ণ উপায়ে পরিবর্তিত হয়। আমরা এই জাতীয় "প্যাথলজিকাল" প্যারামিটারাইজেশনগুলি অস্বীকার করে তাদের প্যারামিটারগুলির নিকটতম মানের সাথে সম্পর্কিত বিতরণগুলি নিজেরাই একে অপরের "কাছাকাছি" থাকা আবশ্যক। "ক্লোজ" এর উপযুক্ত সংজ্ঞাগুলি আলোচনা করা আমাদের অনেক দূরে নিয়ে যাবে, তবে আমি আশা করি যে এই বিবরণটি প্রমাণ করার জন্য যথেষ্ট যে কেবলমাত্র একটি নির্দিষ্ট বিতরণের নামকরণের চেয়ে প্যারামিটার হওয়ার মতো আরও অনেক কিছুই রয়েছে।

বিতরণ সম্পত্তি

বারবার প্রয়োগের মাধ্যমে আমরা বিতরণের একটি "সম্পত্তি" ভাবতে অভ্যস্ত হয়ে উঠি যেটি আমাদের কাজের ক্ষেত্রে প্রায়শই উপস্থিত হয় যেমন এর প্রত্যাশা, বৈকল্পিকতা ইত্যাদি on "সম্পত্তি" এর সম্ভাব্য সংজ্ঞা হিসাবে এটির সাথে সমস্যাটি হ'ল এটি অত্যন্ত অস্পষ্ট এবং পর্যাপ্ত সাধারণ নয়। (এটি এখানেই অষ্টাদশ শতাব্দীর মাঝামাঝিতে গণিত ছিল, যেখানে "ফাংশনগুলি" অবজেক্টগুলিতে সীমাবদ্ধ প্রক্রিয়া হিসাবে বিবেচিত হত।) পরিবর্তে, "সম্পত্তি" এর একমাত্র বুদ্ধিমান সংজ্ঞা সম্পর্কে যা সর্বদা কাজ করবে তা হ'ল সম্পত্তি হিসাবে চিন্তা করা number প্রতিটি বিতরণের জন্য অনন্যভাবে নির্ধারিত এমন একটি সংখ্যাΩ Ω Ω টি 1 ΩΩ। এর মধ্যে গড়, বৈকল্পিকতা, কোনও মুহুর্ত, মুহুর্তের কোনও বীজগণিত সংমিশ্রণ, কোনও কোয়ান্টাইল এবং আরও অনেক কিছু রয়েছে, যা এমনকী জিনিসগুলিও গণনা করা যায় না। যাইহোক, এটা নেই না যে উপাদানের কিছু কোন অর্থে করা হবে অন্তর্ভুক্ত । উদাহরণস্বরূপ, যদি আপনার সব শিক্ষার্থীর টি ডিস্ট্রিবিউশন নিয়ে গঠিত, তারপর গড় না জন্য একটি বৈধ সম্পত্তি (কারণ কোন গড় আছে)। আসলে কী ধারণ করে তার উপর আমাদের ধারণাগুলি কতটা নির্ভর করে তা আমাদের উপরে আবারও প্রভাবিত করে ।ΩΩΩt1Ω

বৈশিষ্ট্যগুলি সর্বদা পরামিতি হয় না

কোনও সম্পত্তি এমন জটিল ফাংশন হতে পারে যা এটি প্যারামিটার হিসাবে কাজ করবে না। "সাধারণ বিতরণ" এর ক্ষেত্রে বিবেচনা করুন। আমরা জানতে চাইতে পারি যে সত্যিকারের বিতরণের গড়টি যখন নিকটতম পূর্ণসংখ্যার সাথে বৃত্তাকার হয় তখন কি সমান হয়। এটি একটি সম্পত্তি। তবে এটি প্যারামিটার হিসাবে কাজ করবে না।

প্যারামিটারগুলি অগত্যা বৈশিষ্ট্য নয়

প্যারামিটার এবং বিতরণ যখন একে অপরের সাথে যোগাযোগ হয় তবে স্পষ্টতই কোনও পরামিতি এবং সেই বিষয়টির জন্য পরামিতিগুলির কোনও ক্রিয়াকলাপ আমাদের সংজ্ঞা অনুসারে সম্পত্তি। তবে প্যারামিটার এবং বিতরণগুলির মধ্যে একে অপরের সাথে যোগাযোগের প্রয়োজন নেই: কখনও কখনও কয়েকটি বিতরণ প্যারামিটারের দুটি বা আরও স্বতন্ত্রভাবে পৃথক মান দ্বারা বর্ণনা করতে হবে। উদাহরণস্বরূপ, গোলকের পয়েন্টগুলির জন্য একটি অবস্থান প্যারামিটার স্বাভাবিকভাবেই অক্ষাংশ এবং দ্রাঘিমাংশ ব্যবহার করবে। এটি ঠিক আছে - দুটি মেরু ব্যতীত, যা প্রদত্ত অক্ষাংশ এবং কোনও বৈধ দ্রাঘিমাংশের সাথে মিলে যায়। অবস্থান(গোলকের দিকে নির্দেশ করুন) প্রকৃতপক্ষে একটি সম্পত্তি তবে এর দ্রাঘিমাংশ অবশ্যই সম্পত্তি নয়। যদিও বিভিন্ন ডজ রয়েছে (উদাহরণস্বরূপ একটি মেরুটির দ্রাঘিমাংশ শূন্য হিসাবে ঘোষণা করুন), এই সমস্যাটি কোনও সম্পত্তি (যা একটি বিতরণের সাথে স্বতন্ত্রভাবে জড়িত) এবং একটি পরামিতি (যা লেবেলের একটি উপায় ) এর মধ্যে গুরুত্বপূর্ণ ধারণাগত পার্থক্যকে হাইলাইট করে বিতরণ এবং অনন্য হতে পারে)।

পরিসংখ্যান পদ্ধতি

একটি অনুমানের লক্ষ্যকে একটি অনুমান বলা হয় । এটি নিছক একটি সম্পত্তি। পরিসংখ্যানবিদ অনুমানটি নির্বাচন করতে মুক্ত নয় : এটি তার ক্লায়েন্টের প্রদেশ। যখন কেউ আপনার কাছে একটি জনসংখ্যার নমুনা নিয়ে আসে এবং জনসংখ্যার 99 তম পার্সেন্টাইল অনুমান করার জন্য আপনাকে জিজ্ঞাসা করে, আপনি সম্ভবত এর পরিবর্তে গড়টির একটি অনুমান সরবরাহকারীকে ছাড়িয়ে যাবেন! আপনার পরিসংখ্যানবিদ হিসাবে আপনার কাজটি আপনাকে প্রদত্ত অনুমানটি নির্ধারণের জন্য একটি ভাল প্রক্রিয়া সনাক্ত করা । (কখনও কখনও আপনার কাজটি আপনার ক্লায়েন্টকে বোঝানো হয় যে তিনি তার বৈজ্ঞানিক উদ্দেশ্যগুলির জন্য ভুল অনুমানটি নির্বাচন করেছেন, তবে এটি ভিন্ন বিষয় ...)

সংজ্ঞা অনুসারে, কোনও পদ্ধতিটি ডেটা থেকে বেরিয়ে আসার একটি উপায়। পদ্ধতিগুলিতে সাধারণত ডেটা প্রয়োগ করার জন্য সূত্র হিসাবে দেওয়া হয়, যেমন "এগুলি সমস্ত কিছু যুক্ত করুন এবং তাদের গণনা অনুসারে ভাগ করুন।" আক্ষরিক যে কোনও প্রক্রিয়া প্রদত্ত অনুমানের একটি "অনুমানক" হিসাবে উচ্চারিত হতে পারে। উদাহরণস্বরূপ, আমি ঘোষণা করতে পারে যে নমুনা গড় (ক সূত্র ডেটা প্রয়োগ) অনুমান জনসংখ্যা ভ্যারিয়েন্স (জনসংখ্যার একটি সম্পত্তি, অভিমানী আমাদের ক্লায়েন্ট সম্ভব জনগোষ্ঠী সেট সীমাবদ্ধ করেছেন কেবলমাত্র সেই আসলে ভেরিয়ানস আছে অন্তর্ভুক্ত করা) ।Ω

Estimators

অনুমানের সাথে অনুমানের কোনও সুস্পষ্ট সংযোগ থাকতে হবে না। উদাহরণস্বরূপ, আপনি কি নমুনার গড় এবং জনসংখ্যার বৈচিত্রের মধ্যে কোনও সংযোগ দেখতে পাচ্ছেন? আমিও জানিনা কিন্তু তা সত্ত্বেও, নমুনা গড় আসলে জনসংখ্যা ভ্যারিয়েন্সের একটি শালীন মূল্নির্ধারক হয় নির্দিষ্ট জন্য Ω (যেমন সব পইসন ডিস্ট্রিবিউশন সেট হিসাবে)। এখানে বোঝার estimators একটা চাবি এই ব্যবস্থার সবচেয়ে গুরত্বপূর্ণ: তাদের গুণাবলী সম্ভব রাজ্যের সেট উপর নির্ভর করে । তবে এটি এর অংশ মাত্রΩ

একজন দক্ষ পরিসংখ্যানবিদ জানতে চাইবেন যে তারা সুপারিশ করছে যে পদ্ধতিটি বাস্তবে সম্পাদন করবে। আসুন পদ্ধতি "কল " এবং দিন estimand হতে θ । বুদ্ধিমান না যা বন্টন আসলে সত্য এক, সে পদ্ধতি এর পারফরম্যান্সের ভাবা হবে প্রতি সম্ভব বিতরণের জন্য এফ Ω । যেমন একটি প্রদত্ত এফ , এবং যে কোনো সম্ভাব্য পরিণতি দেওয়া গুলি (যে, একটি ডাটা সেট), সে তুলনা করবে টন ( গুলি ) (তার পদ্ধতি অনুমান) এর θ ( এফ ) (জন্য estimand মান এফ )। tθ FΩFst(s)θ(F)Fএই দু'জনের কতটা কাছাকাছি বা দূরে তার কথা বলা তাঁর ক্লায়েন্টের দায়িত্ব। (এটি প্রায়শই একটি "ক্ষতি" ফাংশন দিয়ে করা হয়)) তারপরে তিনি টি ( গুলি ) এবং θ ( এফ ) এর মধ্যে দূরত্বের প্রত্যাশা নিয়ে চিন্তা করতে পারেন । এটিই তার পদ্ধতির ঝুঁকি । কারণ এটা নির্ভর করে এফ ঝুঁকি একটি ফাংশন উপর সংজ্ঞায়িত Ωt(s)θ(F)FΩ

(ভাল) পরিসংখ্যানবিদরা ঝুঁকি তুলনার ভিত্তিতে প্রক্রিয়াগুলির পরামর্শ দেন। উদাহরণস্বরূপ, যে জন্য যে অনুমান , পদ্ধতি ঝুঁকি টি 1 কম কম বা ঝুঁকির সমান টন । তারপরে টি ব্যবহার করার কোনও কারণ নেই : এটি "অগ্রহণযোগ্য"। অন্যথায় এটি "গ্রহণযোগ্য"।FΩt1tt

(একটি "বায়সিয়ান" পরিসংখ্যানবিদ সর্বদা সম্ভাব্য রাজ্যগুলির (সাধারণত ক্লায়েন্ট দ্বারা সরবরাহিত) "পূর্ববর্তী" বিতরণকে গড়ের মাধ্যমে ঝুঁকির তুলনা করতে পারেন A একটি "ফ্রিকোয়ালিস্ট" পরিসংখ্যানবিদ এটি করতে পারেন, যদি পূর্বের ন্যায়সঙ্গতভাবে উপস্থিত থাকে তবে তারা এটি করতে আগ্রহী বেইসিয়ানরা অন্যান্য উপায়ে ঝুঁকি তুলনা করে।)

উপসংহার

আমরা বলতে চাই যে কোন অধিকার আছে যে জন্য গ্রাহ্য হয় θ একটি হল মূল্নির্ধারক এর θtθθ আমরা ব্যবহারিক উদ্দেশ্যে (কারণ গ্রাহ্য পদ্ধতি হার্ড এটি হতে পারে) হবে, মোড় এই বলছে যে কোন গ্রহণযোগ্যভাবে ক্ষুদ্র ঝুঁকি আছে (যখন তুলনা করা হচ্ছে θ ) কার্যকর পদ্ধতি মধ্যে একজন মূল্নির্ধারক হয় θtθθ "গ্রহণযোগ্য" এবং "অনুশীলনযোগ্য" ক্লায়েন্ট দ্বারা নির্ধারিত হয়, অবশ্যই: "গ্রহণযোগ্য" তাদের ঝুঁকি বোঝায় এবং "বাস্তবায়িত" পদ্ধতিটি বাস্তবায়নের ব্যয় (শেষ পর্যন্ত তাদের দ্বারা প্রদত্ত) প্রতিফলিত করে।

Ωt


2
Ω

11

সংজ্ঞা সম্পর্কিত অনেক প্রশ্নের মতোই, উত্তরগুলির অন্তর্নিহিত নীতিগুলি এবং অনুশীলনে শর্তাদি কীভাবে ব্যবহার করা হয় সেগুলি উভয়ই লক্ষ্য করা দরকার, যা প্রায়শই কমপক্ষে কিছুটা আলগা বা বেমানান হতে পারে এমনকি ভালভাবে জানানো ব্যক্তিরাও হতে পারেন এবং আরও অনেক কিছু গুরুত্বপূর্ণভাবে, সম্প্রদায় থেকে সম্প্রদায়ে পরিবর্তনশীল।

একটি সাধারণ নীতি হ'ল একটি পরিসংখ্যান একটি নমুনার সম্পত্তি, এবং একটি পরিচিত ধ্রুবক এবং একটি পরামিতি জনসংখ্যার সাথে সম্পর্কিত সম্পত্তি, এবং তাই একটি অজানা ধ্রুবক। "অনুরূপ" শব্দটি এখানে বেশ স্থিতিস্থাপক হিসাবে বোঝা যায়। ঘটনাচক্রে, স্পষ্টতই এই পার্থক্যটি এবং স্পষ্টতই এই পরিভাষাটি আরএ ফিশার দ্বারা প্রবর্তিত হওয়ার পরে এক শতাব্দীরও কম পুরানো।

কিন্তু

  1. নমুনা এবং জনসংখ্যার একটি সেট আপ আমাদের নিজস্ব সমস্যাগুলি চিহ্নিত করে না। সময় সিরিজ উদাহরণগুলির একটি প্রধান শ্রেণি যেখানে ধারণাগুলি কোনও অন্তর্নিহিত উত্পন্ন প্রক্রিয়াটির পরিবর্তে হয় এবং এর মতো কিছু তাত্পর্যপূর্ণভাবে গভীর এবং আরও সাধারণ ধারণা।

  2. এমন কিছু সেট আপ রয়েছে যাতে পরামিতিগুলি পরিবর্তন হয়। আবার সময় সিরিজ বিশ্লেষণ উদাহরণ দেয়।

  3. এখানে মূল বক্তব্য, আমরা বাস্তবে কোনও জনসংখ্যার সমস্ত সম্পত্তি বা প্রক্রিয়াটিকে পরামিতি হিসাবে ভাবি না। যদি কিছু পদ্ধতি একটি সাধারণ বিতরণের একটি মডেল ধরে নেয় তবে সর্বনিম্ন এবং সর্বোচ্চ পরামিতি নয়। (প্রকৃতপক্ষে, মডেল অনুসারে, সর্বনিম্ন এবং সর্বাধিকটি যেকোন উপায়ে বড় ধরণের নেতিবাচক এবং ধনাত্মক সংখ্যা রয়েছে, এটি আমাদের চিন্তিত করে না should)

আমি বলব যে একবারের জন্য উইকিপিডিয়া এখানে সঠিক দিক নির্দেশ করছে এবং অনুশীলন এবং নীতি উভয়কেই সম্মান করা হয় যদি আমরা বলি যে প্যারামিটারটি আমরা যা অনুমান করি তা হয়

এটি অন্যান্য প্রশ্নগুলির ক্ষেত্রেও সহায়তা করে যা ধাঁধা সৃষ্টি করেছে। উদাহরণস্বরূপ, আমরা যদি 25% ছাঁটাই মানে গণনা করি তবে আমরা কী অনুমান করছি? একটি যুক্তিসঙ্গত উত্তর হ'ল জনসংখ্যার সম্পর্কিত সম্পত্তি, যা ফলস্বরূপ অনুমান পদ্ধতি দ্বারা সংজ্ঞায়িত হয়। একটি পরিভাষা হ'ল কোনও অনুমানকারীর একটি অনুমান থাকে, যা তা অনুমান করে। কোনও সম্পত্তি "সেখানে আছে" (কোনও বিতরণের মোড বলুন) সম্পর্কে কিছু প্লাটোনিক ধারণা দিয়ে শুরু করে এবং কীভাবে এটি যুক্তিযুক্ত তা অনুমান করা যায় তা চিন্তা করে, যেমন উপাত্ত বিশ্লেষণের জন্য ভাল রেসিপিগুলি চিন্তা করা এবং অনুমান হিসাবে বিবেচিত হওয়ার সময় তারা কী বোঝায় thinking

প্রায়শই প্রয়োগিত গণিত বা বিজ্ঞানের ক্ষেত্রে প্যারামিটারের দ্বিগুণ দিক রয়েছে। আমরা প্রায়শই এটিকে সত্যিকারের কিছু হিসাবে আবিষ্কার করি যা আমরা আবিষ্কার করছি, তবে এটি সত্য যে এটি আমাদের প্রক্রিয়াটির মডেল দ্বারা সংজ্ঞায়িত এমন কিছু যা মডেলের প্রসঙ্গে বাইরে এর কোনও অর্থ নেই।

দুটি বেশ ভিন্ন পয়েন্ট:

  1. অনেক বিজ্ঞানী পরিসংখ্যানবিদরা যেভাবে পরিবর্তনশীল ব্যবহার করেন সেভাবে "প্যারামিটার" শব্দটি ব্যবহার করেন। আমার কাছে একজন বৈজ্ঞানিক ব্যক্তিত্ব আছে পাশাপাশি একটি পরিসংখ্যানও রয়েছে এবং আমি এটি দুর্ভাগ্যজনক বলব। চলক এবং বৈশিষ্ট্য ভাল শব্দ।

  2. বৃহত্তর ইংরেজী ব্যবহারে এটি লক্ষণীয়ভাবে সাধারণ যে পরামিতিটির সীমা বা সীমা বোঝানো হয় বলে মনে করা হয় যা "প্যারামিটার" এবং "পেরিমিটার" এর মধ্যে কিছু মূল বিভ্রান্তি থেকে উদ্ভূত হতে পারে।

ভিউ এর প্রাক্কলনের দিকের একটি নোট note

শাস্ত্রীয় অবস্থানটি হ'ল আমরা একটি প্যারামিটার আগে থেকেই সনাক্ত করি এবং তারপরে এটি কীভাবে অনুমান করা যায় তা স্থির করি এবং এটি সংখ্যাগরিষ্ঠ অনুশীলন থেকে যায়, তবে প্রক্রিয়াটিকে বিপরীত করা অবাস্তব নয় এবং কিছু সমস্যার জন্য সহায়ক হতে পারে। আমি এটিকে প্রাক্কলন দর্শন বলি। এটি সাহিত্যে অন্তত 50 বছর ধরে রয়েছে। টুকি (1962, p.60) অনুরোধ করেছে

"অনুমানকারীকে অনুমান হিসাবে বিবেচনা করা যুক্তিসঙ্গত কি তা আবিষ্কার করার জন্য আমাদের কোনও অনুমানকারী দিয়ে শুরু করা এবং যুক্তিসঙ্গত অনুমান কী তা আবিষ্কার করার বিষয়ে আরও বেশি মনোযোগ দিতে হবে।"

অনুরূপ দৃষ্টিভঙ্গিটি বিকেল এবং লেহম্যান (1975) দ্বারা আনুষ্ঠানিকভাবে যথেষ্ট বিশদ ও গভীরতার সাথে এবং অনানুষ্ঠানিকভাবে মোস্টেলার এবং টুকি (1977, পিপি 322-34) দ্বারা যথেষ্ট ন্যায্যতার সাথে ব্যাখ্যা করেছেন।

একটি প্রাথমিক সংস্করণও রয়েছে। অন্তর্নিহিত বিতরণটি প্রতিসাম্য কিনা তা বিবেচনা না করেই (জনগণের) নমুনা মিডিয়ান বা জ্যামিতিক গড় ব্যবহার করে তা বোঝায় না এবং একই শুভেচ্ছাকে (উদাহরণস্বরূপ) নমুনা ছাঁটাইযুক্ত উপায়ে বাড়ানো যেতে পারে, যা তাদের জনসংখ্যার অংশগুলির অনুমান হিসাবে বিবেচিত হয় ।

বিকেল, পিজে এবং ই এল লেহম্যান। 1975. ননপ্যারমেট্রিক মডেলগুলির জন্য বর্ণনামূলক পরিসংখ্যান। ২। অবস্থানপরিসংখ্যানগুলির বার্তা 3: 1045-1069।

মোস্টেলার, এফ। এবং জেডাব্লু টুকি। 1977. ডেটা বিশ্লেষণ এবং রিগ্রেশন। পড়া, এমএ: অ্যাডিসন-ওয়েসলি

টুকি, জেডাব্লু 1962. ডেটা বিশ্লেষণের ভবিষ্যতগাণিতিক পরিসংখ্যানগুলির বার্তা 33: 1-67।


এর বেশিরভাগটি স্ট্যান্ডার্ড স্ট্যাটিস্টিকাল সাহিত্যের সাথে বিশেষত আপনার পরামিতিটির সংজ্ঞার সাথে প্রতিক্রিয়া দেখায়। এটি কোনও অনুমান গণনা করার জন্য কোনও প্রক্রিয়া সন্ধান করার প্রক্রিয়াগুলিকে বিভ্রান্ত করে এবং কী অনুমান করা উচিত তা সনাক্ত করার জন্য এটি উপস্থিত হয় দ্বিতীয়টি - প্রাক্কলনটি বেছে নেওয়া - এটি বিজ্ঞানী বা তদন্তকারী নির্ধারণের জন্য একটি বিষয়। এরপরে প্রাক্কলন বিশেষজ্ঞের দ্বারা প্রাক্কলনটি নির্ধারণের জন্য সম্ভাব্য সমস্ত পদ্ধতির মধ্যে পছন্দসই সম্পত্তি থাকার জন্য নির্বাচিত হয়। প্রযুক্তিগত সমস্যাগুলিও রয়েছে; এটি যথেষ্ট বলার অপেক্ষা রাখে না যে একটি প্যারামিটার একটি স্বেচ্ছাসেবী অনুমানের চেয়ে বেশি সীমাবদ্ধ।
whuber

আমি এই উত্তর আমার উত্তর প্রসারিত করব।
নিক কক্স

1
আমি টুকির সাথে একমত হয়েছি যদিও আপনি এই থ্রেডের আমার উত্তর থেকে ভাবতে পারেন যে আমি তাকে "চ্যালেঞ্জিত" পরিসংখ্যানবিদদের একজন যারা চ্যালেঞ্জ জানায়। সমস্যাটি হ'ল আপনি তাঁর উক্তিটি প্রসঙ্গের বাইরে নিয়ে গেছেন। প্রক্রিয়াগুলির বৈশিষ্ট্যগুলি কীভাবে মূল্যায়ন করবেন সেই প্রশ্নে টুকি বিশেষভাবে সম্বোধন করছেন "যখন তারা অনুমিতভাবে বিকাশ করা হাইপোথিসিগুলি ধারণ করে না।" এটি কোনওভাবেই প্যারামিটার, অনুমানক এবং অনুমানের মতো জিনিসের সংজ্ঞা পরিবর্তন করে না । বিশেষত, একটি পরামিতি এখনও "আমরা যা অনুমান করছি তা নয় "।
whuber

3
চিন্তাভাবনার জন্য এখানে অনেক খাবার food দ্রুত উত্তর হিসাবে: আমার উত্তরটি বোঝানোর উদ্দেশ্যে নয় যে আমরা লিবার্টি হলে যেখানে থাকি সেখানে। আমার দৃষ্টিভঙ্গি হিসাবে টুকি উদ্ধৃতিটির প্রসঙ্গে আমি স্বাগত জানাই, এটি স্বাভাবিক যে প্রচলিত হাইপোথিসিগুলি এতদূর ধরে না যেহেতু সমস্ত মডেলগুলি ডেটার সাথে সঠিকভাবে মেলে না appro দংশন করা থেকে এখনও অবধি, এই ধারাটি বিভিন্ন দৃষ্টিকোণের মানকে নিম্নরেখাঙ্কিত করে। সাধারণভাবে, আমি আরও বিমূর্ত এবং আরও গাণিতিকভাবে পরিশোধিত আনুষ্ঠানিক সংজ্ঞাগুলি উত্পাদন করার চেষ্টা করছি না, যোগ্যতা অর্জন করছি না।
নিক কক্স

6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxiমানও। অন্য কথায়, আমি যখন বুঝতে পারি যে উপরের সমীকরণটি আমার সাথে কাজ করা দরকার তখন আমি এবং এর মানগুলি শিখতেμσ2 যা কিছু জানার দরকার তা আমি জানি । এই মানগুলি পরামিতি । বিশেষত তারা অজানা ধ্রুবক যা বিতরণের আচরণ নিয়ন্ত্রণ করে। সুতরাং, উদাহরণস্বরূপ, যদি আমি মান সাথে সংশ্লিষ্ট মানটি জানতে চাইতাম তবে আমি ( এবং জানার পরে নির্ধারণ করতে পারি যে (বা সেই বিতরণ সম্পর্কে অন্য কিছু) (তবে অন্যভাবে নয়)। উপরের সমীকরণের অধিকারগুলিX25th%μσ2μএবং এমনভাবে হয় যাতে এটি অন্য কোনও মানের জন্য নয়। σ2

তেমনি, যদি আমি কোনও ওএলএস একাধিক রিগ্রেশন মডেল নিয়ে কাজ করতাম, যেখানে ডেটা উত্পন্ন করার প্রক্রিয়াটি ধরে নেওয়া হয়: তারপর, একবার আমি শিখতে (বাস্তবে, অনুমান ) মান , , , এবং , আমি সব কিছু জানতে নেই জানতে । অন্য যে কোনও কিছুই, যেমন এর শর্তাধীন বিতরণের যেখানে , আমি আমার সম্পর্কে জ্ঞানের উপর ভিত্তি করে গণনা করতে
β 0 β 1 β 2 σ 2 25 তম % ওয়াই এক্স = এক্স আই β 0 β 1 β 2 σ 2 β 0 β 1 β 2 σ 2

Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0, , এবং । বিশেষাধিকারের উপরে একাধিক রিগ্রেশন মডেল , , , এবং এমনভাবে যাতে এটি অন্য কোনও মানের জন্য নয়। β1β2σ2β0β1β2σ2

(অবশ্যই এই সমস্তটি ধরে নেওয়া হয় যে জনসংখ্যা বিতরণ বা ডেটা উত্পন্নকরণের প্রক্রিয়া সম্পর্কিত আমার মডেলটি সঠিক। এটি সর্বদা হিসাবে মনে রাখা উচিত যে "সমস্ত মডেল ভুল, তবে কিছু কার্যকর" "- জর্জ বক্স ।)

আপনার প্রশ্নের আরও স্পষ্টভাবে উত্তর দিতে, আমি বলব:

  • না, কোনও পুরানো পরিমাণগতভাবে "প্যারামিটার" লেবেল করা উচিত নয়।
  • N / A
  • "পরামিতি" লেবেল করা উচিত এমন বৈশিষ্ট্যগুলি মডেলের নির্দিষ্টকরণের উপর নির্ভর করে। অন্যান্য পরিমাণগত বৈশিষ্ট্যগুলির জন্য আমার বিশেষ নাম নেই তবে আমি মনে করি তাদের বৈশিষ্ট্য বা বৈশিষ্ট্য বা পরিণতি ইত্যাদি বলা ভাল হবে I

ধন্যবাদ। তবে আপনি সেই সমস্ত জনসংখ্যার মানগুলি বর্ণনা করতে কোন শব্দটি ব্যবহার করেন যা প্যারাম্যাট্রিক মডেল থেকে উত্পন্ন করা যেতে পারে তবে সেই মডেলের প্রতিনিধিত্ব করার জন্য সুবিধাজনক পরামিতিগুলির সেটগুলিতে নেই? অথবা বিকল্পভাবে, এমন একটি ক্ষেত্রে থাকতে পারে, যেখানে আপনি জনসংখ্যার মডেল জানেন না এবং বিশেষত যত্নবান হন না, তবে জনসংখ্যার মডেলের কোনও নির্দিষ্ট-মানক দিকটিতে আগ্রহী।
জেরোমি অ্যাংলিম

আমার কোনও সাধারণত প্রযোজ্য বিশেষ নাম নেই তবে কয়েকটি নির্দিষ্ট মানের জন্য নাম রয়েছে। উদাহরণস্বরূপ, যদি আপনি সত্যিই বিশ্বাস করেন না যে আপনার জনসংখ্যা যে কোনও ভাল পড়াশোনা করা বিতরণের পর্যাপ্ত পরিমাণে রয়েছে, আপনি এটির মাঝারি, কোয়ার্টাইলস, কব্জাগুলি ইত্যাদির দ্বারা এটি চিহ্নিত করার চেষ্টা করতে পারেন
গং - মিনিকা পুনরায় স্থাপন করুন

3
পরামিতিগুলি সম্পর্কে একটি সূক্ষ্ম ইস্যুটি একটি পুরানো কম্পিউটার ট্রিক দ্বারা উদ্ঘাটিত হয়: একটি বাইনারি তৈরি করার জন্য এবং এর বাইনারি (বা দশমিক) উপস্থাপনা নিন এবং সেগুলি (চারটির দল দ্বারা) ইন্টারলিভ করুন (বা দশমিক) সংখ্যা । একথাও ঠিক যে প্রক্রিয়া উলটাকর হল: আপনি পড়তে পারেন প্রথম, পঞ্চম, নবম, ... ইত্যাদি সংখ্যা বন্ধ , ইত্যাদি। অতএব "একবার [আপনি] এর মান শিখলে , [আপনি] জানার মতো সমস্ত কিছুই জানেন।" কিন্তু হয় না একটি বৈধ পরামিতির কারণে আকুঁচিত উপায়ে এটা সম্ভব ডিস্ট্রিবিউশন লেবেলে। σ θ β 0 θ θ θβ0,β1,β2,σθβ0θθθ
whuber

3

এই প্রশ্নের কয়েকটি দুর্দান্ত উত্তর রয়েছে, আমি কেবল ভেবেছিলাম যে আমি একটি আকর্ষণীয় উল্লেখটি সংক্ষিপ্ত করব যা অনুমানকারীদের সম্পর্কে মোটামুটি কঠোর আলোচনা সরবরাহ করে।

অনুমানকারীগুলিতে ভার্চুয়াল পরীক্ষাগারগুলির পৃষ্ঠাটি সংজ্ঞায়িত করে

  • "ফলাফল পরিবর্তনশীল একটি পর্যবেক্ষণযোগ্য ফাংশন" হিসাবে একটি পরিসংখ্যান
  • "প্রযুক্তিগত দিক থেকে, একটি পরামিতি এক্স বিতরণের একটি ফাংশন"θ

একটি বিতরণ একটি ফাংশন ধারণা একটি খুব সাধারণ ধারণা। সুতরাং, উপরে প্রদত্ত প্রতিটি উদাহরণ একটি নির্দিষ্ট বিতরণের একটি ফাংশন হিসাবে দেখা যেতে পারে।

  • মিনিট, মিডিয়ান, 25 তম কোয়ান্টাইল সহ প্রতিটি কোয়ান্টাইল, সর্বোচ্চ একটি বিতরণের কাজ হতে পারে।
  • জঞ্জালতা একটি বিতরণের একটি ফাংশন। যদি সেই জনসংখ্যা বিতরণ স্বাভাবিক হয়, তবে এগুলি শূন্য হবে, তবে এটি এই মানগুলির গণনা থামায় না।
  • একটি নির্দিষ্ট মানের চেয়ে বেশি সংখ্যার পারস্পরিক সম্পর্কের সংখ্যা গণনা করা কোভরিয়েন্স ম্যাট্রিক্সের ফাংশন যা ঘুরেফিরে একটি মাল্টিভারিয়েট বিতরণের একটি ফাংশন।
  • আর-স্কোয়ার্ড বিতরণের একটি ফাংশন।

1
আমি আরও বিস্তৃত উত্তর দেওয়ার একটি কারণ হ'ল "প্যারামিটার" এর এই সংজ্ঞাটি যথেষ্ট ভাল নয়। একটি পাল্টে উদাহরণের জন্য @ গং এর উত্তরে আমার মন্তব্য দেখুন । স্বজ্ঞাতভাবে, প্যারামিটারাইজড ডিস্ট্রিবিউশনের একটি সেট সীমানা সহ একটি সীমাবদ্ধ-মাত্রিক টপোলজিকাল ম্যানিফোল্ড; একটি পরামিতি হ'ল বহুগুণে সংজ্ঞায়িত একটি ক্রমাগত ফাংশন। এটি কেবলমাত্র প্রযুক্তিগত প্রয়োজনের চেয়ে বেশি, কারণ এটি অনুমানের নমুনা বিতরণের সাথে সম্পর্কিত।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.