আমি সফটওয়্যার তৈরির জন্য পরিসংখ্যান নিয়ে কাজ করছি। পাস / ব্যর্থ এবং অতিবাহিত সময়ের প্রতিটি বিল্ডের জন্য আমার কাছে ডেটা রয়েছে এবং আমরা এই / সপ্তাহের 200 ডলার উত্পন্ন করি।
সাফল্যের হার একত্রিত করা সহজ, আমি বলতে পারি যে 45% কোনও নির্দিষ্ট সপ্তাহ পেরিয়ে গেছে। তবে আমি পাশাপাশি সময় অতিবাহিত করতে চাই এবং আমি নিশ্চিত করতে চাই যে আমি ডেটা খুব খারাপভাবে উপস্থাপন করব না। অনুভূত আমি আরও ভাল পেশাদার জিজ্ঞাসা করব :-)
বলুন আমার 10 টি সময়কাল আছে। তারা পাস এবং ব্যর্থ উভয় ক্ষেত্রে প্রতিনিধিত্ব করে। কিছু বিল্ড তত্ক্ষণাত ব্যর্থ হয় যা সময়কালকে অস্বাভাবিকভাবে সংক্ষিপ্ত করে তোলে। কিছু পরীক্ষার সময় স্তব্ধ হয়ে থাকে এবং অবশেষে সময় শেষ হয়ে যায়, ফলে খুব দীর্ঘ সময়সীমার কারণ হয়। আমরা বিভিন্ন পণ্য তৈরি করি, তাই সফল বিল্ডগুলি 90 সেকেন্ড থেকে 4 ঘন্টার মধ্যে পরিবর্তিত হয়।
আমি এই মত একটি সেট পেতে পারে:
[50, 7812, 3014, 13400, 21011, 155, 60, 8993, 8378, 9100]
আমার প্রথম পদ্ধতির সেটটি বাছাই করে মধ্য-মানটি বাছাইয়ের মধ্যবর্তী সময়টি পাওয়া ছিল, এক্ষেত্রে 78৮১২ (সমান সংখ্যাযুক্ত সেটগুলির জন্য আমি গাণিতিক গড়টির সাথে বিরক্ত করিনি))
দুর্ভাগ্যক্রমে, এটি প্রচুর পরিমাণে বৈচিত্র উত্পন্ন বলে মনে হচ্ছে, যেহেতু আমি কেবল একটি প্রদত্ত মানই বেছে নিই। সুতরাং যদি আমি এই মানটি প্রবণতা করি তবে এটি 5000 বা 10000 সেকেন্ডের মধ্যে বাউন্ড হয়ে যাবে যার উপর নির্ভর করে কোন বিল্ডটি মিডিয়ানে ছিল।
সুতরাং এটি সহজ করার জন্য, আমি আরেকটি পদ্ধতির চেষ্টা করেছিলাম - আউটলিয়ারগুলি সরান এবং তারপরে অবশিষ্ট মানগুলির চেয়ে একটি গড় গণনা করুন। আমি এটিকে টেরিটলে বিভক্ত করার সিদ্ধান্ত নিয়েছি এবং কেবলমাত্র মধ্যবর্তী স্থানে কাজ করব:
[50, 60, 155, 3014, 7812, 8378, 8993, 9100, 13400, 21011] ->
[50, 60, 155], [3014, 7812, 8378, 8993], [9100, 13400, 21011] ->
[3014, 7812, 8378, 8993]
যে কারণে এটি আমার কাছে ভাল বলে মনে হচ্ছে তা দ্বিগুণ:
- আমরা দ্রুত গড়ার বিষয়ে কোনও পদক্ষেপ নিতে চাই না, তারা ইতিমধ্যে ভাল
- দীর্ঘতম বিল্ডগুলি সম্ভবত সময়সীমা-প্ররোচিত এবং সর্বদা থাকবে। সেগুলি সনাক্ত করার জন্য আমাদের অন্যান্য ব্যবস্থা আছে
সুতরাং এটি আমার কাছে মনে হয় যে এটি আমি যে ডেটাটি খুঁজছি তা হ'ল তবে আমি উদ্বিগ্ন যে আমি সত্যকে সরিয়ে দিয়ে মসৃণতা অর্জন করেছি।
এটা কি বিতর্কিত? পদ্ধতিটি কি বুদ্ধিমান?
ধন্যবাদ!