আপনার বিতরণ এবং আপনার প্রভাবের আকার সম্পর্কে কিছু ধারণা না থাকলে আপনার কোনও থামার নিয়ম থাকতে পারে না - যা আপনি কোনও পূর্বনির্ধারণ জানেন না।
এছাড়াও হ্যাঁ, আমাদের প্রভাবের আকারের দিকে ফোকাস করা দরকার - এবং কেবলমাত্র পি-মানগুলি বিবেচনা করার জন্য এটি কখনই সঠিক হিসাবে বিবেচিত হয়নি এবং আমরা অবশ্যই টেবিল বা গ্রাফগুলি প্রদর্শন করা উচিত যা এফেক্ট আকারের পরিবর্তে পি-মান বা এফ-মান দেখায়।
Traditionalতিহ্যবাহী পরিসংখ্যান হাইপোথিসিস ইনফেরেন্স টেস্টিংয়ের সাথে সমস্যা রয়েছে (যা কোহেন বলেছেন যে এটির সংক্ষিপ্তসার হিসাবে উপযুক্ত, এবং ফিশার এবং পিয়ারসন উভয়ই যদি তাদের হিংসাত্মক বিরোধী নামগুলিতে করা হচ্ছে দেখেন তবে তারা কবরগুলিতে প্রত্যাবর্তন করবে)।
এন নির্ধারণ করতে, আপনার ইতিমধ্যে একটি লক্ষ্য তাত্পর্য এবং শক্তি প্রান্তিকতা নির্ধারণ করতে হবে, পাশাপাশি বিতরণ সম্পর্কে প্রচুর অনুমান করা এবং বিশেষত আপনাকে যে প্রভাবটি স্থাপন করতে চান তা নির্ধারণ করতে হবে। ইনডোলারিং ঠিক ঠিক যে এটি পয়েন্ট হওয়া উচিত - সর্বনিম্ন প্রভাবের আকারটি কী কার্যকর হবে!
"নতুন পরিসংখ্যান" সম্পর্কিত মানক বিচ্যুতি বা বৈকল্পিক (কারণ আমাদের বন্টন বুঝতে হবে) এর সাথে প্রভাবের আকারগুলি (সংযোজনীয় পার্থক্য হিসাবে উপযুক্ত), এবং মানক বিচ্যুতি বা আত্মবিশ্বাসের অন্তরগুলি (তবে পরবর্তীটি ইতিমধ্যে রয়েছে) দেখানোর পক্ষে পরামর্শ দিচ্ছে পি-ভ্যালুতে লক করা এবং আপনি কোনও দিক বা প্রতিটি উপায়ে বাজি রেখে ভবিষ্যদ্বাণী করছেন কিনা সে সম্পর্কে সিদ্ধান্ত a তবে বৈজ্ঞানিক পূর্বাভাস সহ নির্দিষ্ট চিহ্নের ন্যূনতম প্রভাব নির্ধারণ করা এটিকে স্পষ্ট করে তোলে - যদিও প্রাক-বৈজ্ঞানিক ডিফল্টটি পরীক্ষা এবং ত্রুটি করতে হয় এবং কেবল পার্থক্য সন্ধান করে। তবে আপনি যদি এই পথে চলে যান তবে আপনি স্বাভাবিকতা সম্পর্কে অনুমান করেছেন।
আরেকটি পদ্ধতির বাক্স-প্লটগুলিকে একটি প্যারামিমেট্রিক নন হিসাবে ব্যবহার করা, তবে হুইস্কার এবং আউটলিয়ারদের সম্পর্কে সম্মেলনগুলি ব্যাপকভাবে পরিবর্তিত হয় এবং তারপরেও তারা বিতরণীয় অনুমানের দ্বারা উদ্ভূত হয়।
থামার সমস্যাটি প্রকৃতপক্ষে কোনও পৃথক গবেষককে এন সেট করার বা সেট করার সমস্যা নয়, তবে আমাদের হাজার হাজার গবেষকের একটি গোটা সম্প্রদায় রয়েছে, যেখানে ট্র্যাডিশনীয় 0.05 স্তরের জন্য 1000 এক / আলফার চেয়ে অনেক বেশি। উত্তরটি বর্তমানে মেটা-বিশ্লেষণের সুবিধার্থে সংক্ষিপ্ত পরিসংখ্যান (অর্থ, এসডিডিভি, স্টেডার - বা বক্সপ্লটের সাথে সম্পর্কিত "নন-প্যারাম্যাট্রিক সংস্করণগুলি - মিডিয়ান ইত্যাদি) সরবরাহ করার প্রস্তাব দেওয়া হয়েছে এবং সেগুলি ঘটে কিনা তা সমস্ত পরীক্ষার সমন্বিত ফলাফল উপস্থাপন করার প্রস্তাব দেওয়া হচ্ছে একটি নির্দিষ্ট আলফা স্তরে পৌঁছেছে বা না।
ঘনিষ্ঠভাবে সম্পর্কিত একাধিক পরীক্ষার সমস্যা, যা ঠিক অসুবিধায় ভরপুর এবং যেখানে পরীক্ষাগুলি শক্তি সংরক্ষণের নামে অতিমাত্রায় রাখা হয়, সেখানে ওভার কমপ্লিক্স পদ্ধতিগুলি ফলাফল বিশ্লেষণ করার প্রস্তাব দেওয়া হয়।
আমি মনে করি না যে এটির সাথে এখনও কোনও পাঠ্য বইয়ের অধ্যায় থাকতে পারে, তবে আমরা কী করছি তা আমাদের এখনও কম ধারণা আছে ...
এই মুহুর্তের জন্য, সর্বোত্তম পদ্ধতির সম্ভবত হ'ল সংক্ষিপ্ত পরিসংখ্যান প্রদর্শন করার সাথে মিলিয়ে সমস্যার সবচেয়ে উপযুক্ত প্রথাগত পরিসংখ্যানগুলি ব্যবহার করা চালিয়ে যাওয়া - প্রভাব এবং মান ত্রুটি এবং এন সবচেয়ে গুরুত্বপূর্ণ। আত্মবিশ্বাসের ব্যবধানগুলি মূলত সংশ্লিষ্ট টি-টেস্টের সমতুল্য, তবে নতুন ফলাফলগুলিকে আরও অর্থবহভাবে প্রকাশিতগুলির সাথে তুলনা করার পাশাপাশি পুনরুত্পাদনকে উত্সাহিত করা একটি নীতিশাস্ত্রকে মঞ্জুরি দেয় এবং পুনরায় উত্পাদিত পরীক্ষাগুলি এবং মেটা-বিশ্লেষণ প্রকাশ করে।
তথ্য তাত্ত্বিক বা বায়সীয় পদ্ধতির শর্তাবলী, তারা বিভিন্ন সরঞ্জাম ব্যবহার করে এবং বিভিন্ন অনুমান তৈরি করে, তবে এখনও সমস্ত উত্তর নেই, এবং শেষ পর্যন্ত একই সমস্যার মুখোমুখি হয় বা আরও খারাপ কারণ কারণ বায়েশিয়ান অনুমান একটি নির্দিষ্ট করে তোলার পিছনে পিছনে যায়? উত্তর দিন এবং কেবল প্রমানিত আপত্তিযুক্ত বা অনুপস্থিত প্রুজন যুক্ত করে।
শেষ পর্যন্ত মেশিন লার্নিংয়ের ফলাফলগুলিও এর তাত্পর্য হিসাবে বিবেচনা করা দরকার - প্রায়শই সিআই বা টি-টেস্টের সাথে, প্রায়শই গ্রাফ সহ, আশা করা যায় যে কেবল তুলনা করার পরিবর্তে জুটি করা, এবং বিতরণগুলি মেলে না তখন উপযুক্ত ক্ষতিপূরণ সংস্করণ ব্যবহার করে। এটিতে বুটস্ট্র্যাপিং এবং ক্রস-বৈধতা এবং পক্ষপাত এবং বৈকল্পিকতা সম্পর্কিত বিতর্কও রয়েছে। সর্বোপরি, এর মধ্যে রয়েছে একাধিক সরঞ্জামের বাক্সগুলির মধ্যে একটিতে সমস্ত অ্যালগোরিদমকে পুরোপুরি পরামিতি করে বিকল্প মডেলগুলির অগণিত উত্পাদন ও পরীক্ষা করার প্রবণতা, অবারিত একাধিক পরীক্ষার অনুমতি দেওয়ার জন্য আর্কাইভ করে ডেটাসেটগুলিতে প্রয়োগ করা হয়েছে। সবচেয়ে খারাপ এখনও যথাযথ পদ্ধতির পরিবর্তে মূল্যায়নের জন্য নির্ভুলতা ব্যবহার করে বা আরও খারাপ এফ-পরিমাপ ব্যবহার করে অন্ধকার যুগে রয়েছে।
আমি এই বিষয়গুলিতে কয়েক ডজন কাগজ পড়েছি, তবে পুরোপুরি বিশ্বাসযোগ্য কিছু খুঁজে পেতে ব্যর্থ হয়েছি - নেতিবাচক জরিপ বা মেটা-বিশ্লেষণের কাগজপত্রগুলি ছাড়াও যা ইঙ্গিত দেয় যে বেশিরভাগ গবেষক কোনও "মানদণ্ডের সাথে সম্মতি দিয়ে পরিসংখ্যানকে যথাযথভাবে পরিচালনা ও ব্যাখ্যা করেন না except ", পুরানো বা নতুন। শক্তি, একাধিক পরীক্ষা, আকার পরিবর্তন এবং তাড়াতাড়ি থামানো, স্ট্যান্ডার্ড ত্রুটির ব্যাখ্যা এবং আত্মবিশ্বাসের বিরতি, ... এগুলি কয়েকটি সমস্যা।
দয়া করে আমাকে গুলি করুন - আমি ভুল প্রমাণিত হতে চাই! আমার দৃষ্টিতে প্রচুর স্নানের জল রয়েছে, কিন্তু আমরা এখনও শিশুটিকে পাইনি! এই পর্যায়ে চূড়ান্ত দৃষ্টিভঙ্গি বা নাম-ব্র্যান্ডের কোনও দৃষ্টিভঙ্গিই উত্তর হিসাবে প্রত্যাশিত বলে মনে হচ্ছে না, এবং যে সমস্ত কিছু ফেলে দিতে চায় তারা সম্ভবত শিশুটিকে হারিয়ে ফেলেছে।