একটি গণনার মানক ত্রুটি


14

বিরল রোগের মরসুমে আমার কাছে ঘটনার মামলার একটি ডেটাসেট রয়েছে। উদাহরণস্বরূপ, বলুন যে বসন্তে 180 টি ছিল, গ্রীষ্মে 90, শরত্কালে 45 এবং শীতে 210 টি ঘটনা ঘটে। আমি এই সংখ্যার সাথে স্ট্যান্ডার্ড ত্রুটিগুলি সংযুক্ত করা উপযুক্ত কিনা তা নিয়ে আমি লড়াই করছি। গবেষণার লক্ষ্যগুলি এই অর্থে নির্ধারিত যে আমরা ভবিষ্যতে পুনরুক্ত হতে পারে এমন রোগের প্রাদুর্ভাবের একটি মৌসুমী প্যাটার্নের সন্ধান করছি। সুতরাং, এটি স্বজ্ঞাতভাবে অনুভব করে যেমন মোটের সাথে কিছুটা অনিশ্চয়তার সংযুক্তি করা উচিত। তবে আমি নিশ্চিত নই যে এই ক্ষেত্রে কেউ কীভাবে একটি স্ট্যান্ডার্ড ত্রুটি গণনা করবে যেহেতু আমরা উদাহরণ, অর্থ বা অনুপাতের চেয়ে সহজ গণনাগুলির সাথে আচরণ করছি।

শেষ অবধি, উত্তর কি ডেটার ক্ষেত্রে জনসংখ্যার প্রতিনিধিত্ব করে (প্রতিটি ঘটনা যা ঘটেছিল) বা এলোমেলো নমুনার উপর নির্ভর করে? যদি আমার ভুল না হয় তবে জনসংখ্যার পরিসংখ্যানগুলির সাথে সাধারণত স্ট্যান্ডার্ড ত্রুটিগুলি উপস্থাপন করার কোনও অর্থ হয় না, কারণ সেখানে কোনও অনুমান নেই।


গণনাটি হ'ল অস্বাভাবিক অনুপাতে যাতে আপনি স্টেট গণনা করতে পারেন। অনুপাতের ত্রুটি এবং এটিকে কাউন্ট ইউনিটগুলিতে "অস্বাভাবিক" করা উচিত, যদি এটি আপনার পক্ষে বোঝায়। আপনি ঠিক যে সেন্ট। ত্রুটি শুধুমাত্র নমুনার ক্ষেত্রে প্রযোজ্য। জনসংখ্যায় কোনও ত্রুটি নেই।
ttnphns

উত্তর:


14

জনসংখ্যা হ'ল এই রোগের ঝুঁকিতে থাকা সমস্ত লোকের (অনুমানক) সেট; সাধারণত, যা অধ্যয়ন অঞ্চলে বসবাসকারী সমস্ত লোককে (বা কিছু স্পষ্টরূপে চিহ্নিতযোগ্য উপগোষ্ঠী) নিয়ে গঠিত। এই জনসংখ্যাটিকে স্পষ্টভাবে সংজ্ঞায়িত করা গুরুত্বপূর্ণ, কারণ এটি অধ্যয়নের লক্ষ্য এবং ডেটা থেকে তৈরি সমস্ত অনুক্রমের লক্ষ্য।

যখন রোগের কেসগুলি স্বতন্ত্র থাকে (যা রোগের মধ্যে সহজেই মানুষের মধ্যে যোগাযোগ করা হয় না এবং স্থানীয় পরিবেশগত পরিস্থিতির কারণে ঘটে না তখন এটি একটি যুক্তিসঙ্গত হাইপোথিসিস হতে পারে) এবং এগুলি বিরল হয়, তারপরে গণনাগুলি পোয়েসন বিতরণকে ঘনিষ্ঠভাবে অনুসরণ করা উচিত । এই বিতরণের জন্য, এর মানক বিচ্যুতির একটি ভাল অনুমান হ'ল গণনার বর্গমূল

(180,90,45,210)(13.4,9.5,6.7,14.5)ঘটনাচক্রে, aতুতে পর্যবেক্ষণ করা রোগের প্রকৃত সংখ্যা সেই সত্য হারের চেয়ে পৃথক হবে। বর্গমূল সত্য (কিন্তু অজানা!) হার quantifies প্রকরণ পরিমাণ সম্ভবত ঘটতে। কারণ পর্যবেক্ষিত গন্য কর্তব্য সত্য হার পাসে হবে, তাদের বর্গমূল সত্য হারের বর্গমূল জন্য যুক্তিসংগত প্রক্সি হওয়া উচিত। এই প্রক্সিগুলি হ'ল "স্ট্যান্ডার্ড ত্রুটি" বলতে বোঝায়।

1657714.577

9(20,10,5,23)(4.5,3.2,2.2,4.8)9(40,28.5,20,44)

এটি এই সীমিত ডেটা দিয়ে যতদূর যেতে পারে about এই সাধারণ গণনা প্রকাশ করেছে যে:

  • জনসংখ্যার বৈশিষ্ট্য নির্ধারণ করা গুরুত্বপূর্ণ,

  • একটি গণনার বর্গমূল তার মান ত্রুটিটি মূল্যায়নের জন্য একটি সূক্ষ্ম সূচনা পয়েন্ট,

  • রোগের ক্ষেত্রে স্বাধীনতার অভাব প্রতিফলিত করার জন্য বর্গমূলকে কিছুটা গুণ দিয়ে প্রায় (গুণগতভাবে) গুন করতে হবে (এবং এই উপাদানটি প্রায় আকারের রোগের ক্লাস্টারের সাথে সম্পর্কিত হতে পারে),

  • এই গণনাগুলির মধ্যে পার্থক্যটি প্রাথমিকভাবে সময়ের সাথে সাথে রোগের হারের পার্থক্যকে অনিশ্চয়তার চেয়ে প্রতিফলিত করে (অন্তর্নিহিত পোইসনের তীব্রতা সম্পর্কে)।


1
খুব চিন্তাশীল, পুরো উত্তর! অনেক ধন্যবাদ.
অর্ধ-পাস

2

যখন আমি জিজ্ঞাসা করি, "আমি কোন মনোভাবী নই?" আপনি এই চারটি পরিসংখ্যানের গড়টি নিতে পারেন এবং আপনি সেই অর্থটির মানক ত্রুটিটি গণনা করতে পারেন। এই পরিসংখ্যান এবং ফলস্বরূপ আত্মবিশ্বাসের ব্যবধানটি যদি আপনি বিশ্বাস করেন যে আপনি 4 টি মরসুমের 4 টি asonsতুর সমস্ত সেটের প্রতিনিধি হিসাবে যেটিকে আপনি সাধারণীকরণ করতে পারবেন তার আচরণে ন্যায়সঙ্গত বলে বিশ্বাস করেন believed আপনি যে পরিমাণে ন্যায়সঙ্গত, আপনার কাছে থাকা ডেটা জনসংখ্যার একটি এলোমেলো নমুনা হবে। আপনি যে নমুনাটি উল্লেখ করেছেন তাতে স্যাম্পলিংয়ের একটি অতিরিক্ত স্তর আবশ্যক - আপনি এটি ক্লাস্টার স্যাম্পলিং বলতে পারেন, যেখানে প্রতি বছর একটি ক্লাস্টার গঠন করা হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.