এমন কি পরিসংখ্যানের একটি সেট জমা করা সম্ভব যা প্রচুর পরিমাণে নমুনা বর্ণনা করে যে আমি তখন একটি বক্সপ্লট উত্পাদন করতে পারি?


22

আমি অবিলম্বে যে, আমি একজন অনুশীলন সফ্টওয়্যার ডেভেলপার, না একটি পরিসংখ্যানবিদ নই নির্মল নয়, এবং যে আমার কলেজ পরিসংখ্যান বর্গ একটি ছিল খুব দীর্ঘ সময় আগে ...

এটি বলেছিল, আমি জানতে চাই যে বর্ণনামূলক পরিসংখ্যানগুলির একটি সেট সংগ্রহ করার জন্য যদি এমন কোনও পদ্ধতি রয়েছে যা বাক্সপ্লট তৈরি করতে ব্যবহার করা যেতে পারে, যা পৃথক নমুনাগুলির একটি গুচ্ছ সংরক্ষণ করার প্রয়োজন হয় না?

আমি যা করার চেষ্টা করছি তা হল একটি জটিল মাল্টি-কাতার প্রক্রিয়াটির মধ্যে সারি পরিষেবার সময়ের একটি গ্রাফিকাল সংক্ষিপ্তসার তৈরি করা। আমি অতীতে tnftools নামে একটি প্যাকেজ ব্যবহার করেছি যা বৃহত্তর নমুনাগুলি সংগ্রহ করার অনুমতি দেয় এবং তারপরে প্রতিক্রিয়া সময় এবং বহিরাগতদের একটি দুর্দান্ত গ্রাফে পোস্ট-প্রসেস করা যায় ... তবে tnftools আমার বর্তমান প্ল্যাটফর্মের জন্য উপলভ্য নয়।

প্রক্রিয়াটি চলার সাথে সাথে আমি "ফ্লাইতে" বর্ণনামূলক পরিসংখ্যানগুলির একটি সেট সংগ্রহ করতে এবং তারপরে চাহিদার বিশ্লেষণের জন্য ডেটা বের করতে সক্ষম হতে চাই। তবে আমি কেবল প্রক্রিয়াটির নমুনাগুলি সংগ্রহ করতে পারি না কারণ মেমরি / আইও এটির সাথে জড়িত থাকার ফলে সিস্টেমের কার্যকারিতাটিতে অগ্রহণযোগ্য প্রভাব পড়ে।


ক্যালিন:> আপনার অর্থ কি মিডিয়ান এবং কোয়ার্টাইলের মতো সংক্ষিপ্তসার পরিসংখ্যান গণনা করার জন্য 'উড়ে' পদ্ধতিটি বিদ্যমান কিনা? আপনি যদি এটি চান তবে আমি তাদের কাগজগুলির বিবরণে লিঙ্কগুলি দিতে পারি। এই পদ্ধতিগুলির দক্ষ জিএনইউ বাস্তবায়ন হিসাবে আপনি যে প্ল্যাটফর্মগুলিতে কাজ করছেন সে সম্পর্কে আপনি আরও বিশদ জানাতে পারেন সম্ভবত
ইউজার 603

@ কেওয়াওয়াক: হ্যাঁ, আমি যা খুঁজছি তা মনে হচ্ছে। আমি এই লিঙ্কগুলি ব্যাপকভাবে প্রশংসা করব। :-) আমি ম্যাক ওএস এক্সে কাজ করছি… পোস্ট-প্রসেসিং ডেটার জন্য আমি আর ব্যবহার করতে পারি, তবে সাধারণ কারণে আমার কোম্পানির পণ্যের সাথে জিপিএল কোডটি লিঙ্ক করতে পারি না।
Kaelin Colclasure

উত্তর:


27

'ফ্লাই অন' বক্সপ্লটের জন্য আপনার 'ফ্লাইতে' মিনি / সর্বোচ্চ (তুচ্ছ) পাশাপাশি 'ফ্লাইতে' কোয়ার্টাইলস (0.25,0.5 = মিডিয়ান এবং 0.75) প্রয়োজন হবে।

অনলাইন গণমাধ্যমের জন্য অনলাইন (বা 'ফ্লাইতে') অ্যালগরিদম সমস্যাটিতে সম্প্রতি প্রচুর কাজ চলছে।

সাম্প্রতিক এক বিকাশ হ'ল বিনমেডিয়ান । পার্শ্ব-কিক হিসাবে, এটি কুইক সিলেক্ট (যা অনলাইন বা একক পাস নয়) এর চেয়েও খারাপ খারাপ জটিলতা উপভোগ করে ।

আপনি এখানে অনলাইনে সম্পর্কিত কাগজ পাশাপাশি সি এবং ফরটারান কোডটি সন্ধান করতে পারেন । আপনাকে লেখকদের সাথে লাইসেন্সিংয়ের বিশদটি পরীক্ষা করতে হবে।

চতুর্ভুজগুলির জন্য আপনার একটি একক পাসের অ্যালগরিদমও প্রয়োজন হবে, যার জন্য আপনি উপরের পদ্ধতির এবং মধ্যবর্তীদের ক্ষেত্রে চতুর্ভুজগুলির নিম্নলিখিত পুনরাবৃত্ত বৈশিষ্ট্যটি ব্যবহার করতে পারেন:

প্রশ্নঃ0.75(এক্স)প্রশ্নঃ0.5(এক্সআমি:এক্সআমি>প্রশ্নঃ0.5(এক্স))

এবং

প্রশ্নঃ0.25(এক্স)প্রশ্নঃ0.5(এক্সআমি:এক্সআমি<প্রশ্নঃ0.5(এক্স))

অর্থাত্ 25 (75) শতাংশ চৌম্বকটি সেই পর্যবেক্ষণগুলির মধ্যকের খুব কাছাকাছি যা মধ্যযুগীর চেয়ে ছোট (বৃহত্তর)।

সংযোজন:

কোয়ান্টাইল গণনা করার জন্য বহু পুরানো বহু পাসের পদ্ধতি রয়েছে। একটি জনপ্রিয় পদ্ধতি হ'ল প্রবাহ থেকে এলোমেলোভাবে নির্বাচিত পর্যবেক্ষণগুলির একটি নির্ধারিত আকারের জলাধার বজায় রাখা / আপডেট করা এবং এই জলাধারটিতে পুনরাবৃত্তভাবে কোয়ান্টাইলগুলি গণনা করুন ( এই পর্যালোচনাটি দেখুন)। এই (এবং সম্পর্কিত) পদ্ধতির উপরোক্ত প্রস্তাবিত প্রস্তাবটিকে ছাড়িয়ে যায়।


1
+1 ডান; আমি এখনও হিস্টোগ্রাম থেকে সান্নিধ্য তৈরি করার অন্ধকার যুগে ছিলাম।

আমি কি সঠিকভাবে বুঝতে পেরেছি যে মিডিয়ানদের কাছ থেকে কোয়ার্টাইলের এই জাতীয় পুনরাবৃত্ত সংজ্ঞাটি যদি নির্লিপ্তভাবে প্রয়োগ করা হয় তবে দুটি পাসের প্রয়োজন? আপনি কি একক পাস অ্যালগরিদম সম্পর্কে সচেতন?
কোয়ার্টজ

@ কোয়ার্টজ: না, একটি সিঙ্গল পাস করবে: আপনার দুটি, একক পাস, মিডিয়ান গণনা চলমান।
ব্যবহারকারী 60

2

শুধু মধ্যস্থতাকারী সন্ধানের পরিবর্তে, একটি অ্যালগরিদম রয়েছে যা অনুমানিত হিস্টোগ্রামটি সরাসরি বজায় রাখে: " স্টোর অবজারভেশন ছাড়াই কোয়ান্টাইলস এবং হিস্টোগ্রামগুলির ডায়নামিক গণনা জন্য পি-স্কয়ার অ্যালগোরিদম "। এটি সম্ভবত আরও কার্যকর হবে যে আপনি চান প্রতিটি কোয়ান্টাইলের জন্য বার বার বিন্নিং।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.