একটি টেবিলে রাখার জন্য উল্লেখযোগ্য চিত্রের সংখ্যা?


13

উল্লেখযোগ্য পরিসংখ্যান প্রকাশের জন্য এখানে কি একটি সুপ্রতিষ্ঠিত নিয়ম রয়েছে?

এখানে কয়েকটি নির্দিষ্ট উদাহরণ / প্রশ্ন রয়েছে:

  • তাত্পর্যের সহগের সাথে উল্লেখযোগ্য ব্যক্তির সংখ্যা সম্পর্কিত কোনও উপায় আছে কি? উদাহরণস্বরূপ, যদি অনুমানটি 12.3 হয় এবং সিভি 50% হয়, তার অর্থ কি '.3' দ্বারা প্রতিনিধিত্ব করা তথ্য শূন্যের কাছে পৌঁছায়?

  • যদি একটি আত্মবিশ্বাসের ব্যবধানে প্রস্থের ক্রমগুলির বিস্তৃতি থাকে তবে তাদের কাছে এখনও একই পরিমাণে উল্লেখযোগ্য পরিসংখ্যান থাকা উচিত, যেমন:

    12.3 (1.2, 123.4) বনাম 12 (1.2, 120)

  • ত্রুটি অনুমানের ক্ষেত্রে উল্লেখযোগ্য পরিসংখ্যানের সংখ্যাটি কি কোনও উপায়ে উল্লেখযোগ্য ব্যক্তির সংখ্যার তুলনায় একই বা কম হওয়া উচিত?


আপনি যদি পারেন তবে কোনও টেবিল ব্যবহার করবেন না :) একটি গ্রাফিক হ'ল আইএমও, প্রায় সর্বদা একটি টেবিলের চেয়ে পড়তে সহজ (তিনি স্পষ্টভাবে ব্যতিক্রম হন যদি আপনার সংখ্যা না থাকে তবে)। জার্নাল এবং তাদের পর্যালোচকরা সবসময় একমত হন না, দুর্ভাগ্যক্রমে ....
জেএমএস

3
@ জেএমএস গুড পয়েন্ট, তবে টেবিলগুলি বিভিন্ন ধরণের (অবিচ্ছিন্ন, নামমাত্র এবং নিয়মিত) ভেরিয়েবলের সাথে পরিসংখ্যান ইউনিটের বিশদ বৈশিষ্ট্যগুলির সংক্ষিপ্ত বিবরণ (ফ্যাক্টর ইন্টারেস্টের দ্বারা ক্রস-শ্রেণিবদ্ধ, যেমন ক্লিনিকাল ডায়াগনোসিস বা যাই হোক না কেন), এবং অন্যান্য ফলাফলের সংক্ষিপ্তসার জন্য দরকারী প্রতি সে স্ট্যাটিস্টিকাল মডেলিং থেকে (কনফিউশন ম্যাট্রিক্স, রিগ্রেশন কোফ ইত্যাদি) যা ফিগারগুলির সাথে খাপ খায় না (বা আপনি যদি রেজি। কোফ। ডটচার্ট হিসাবে জেলমানের দৃষ্টিভঙ্গির জন্য গ্যালম্যানের পদ্ধতির কথা ভাবেন না তবে সর্বদা নয়)। আমাদের দু'জনের দরকার; প্রশ্নটি হল আমাদের কখন একটি সারণী, আইএমওর পরিবর্তে চিত্রের প্রয়োজন হয়।
chl

@chi মেলা আমি প্রায় সবসময় বলেছিলাম :)। বড় এন-ওয়ে টেবিলের মতো জিনিসগুলি (সম্পূর্ণ) গ্রাফিকভাবে পুনরুত্পাদন করা অসম্ভব। এটি ফোরামের উপর নির্ভর করে যা আমি বলব। টেবিলগুলির সম্পূর্ণ, নিশ্চিত হওয়ার সুবিধা রয়েছে তবে আপনার পাঠক আসলে কী এই সমস্ত অতিরিক্ত তথ্য শোষণ করে ? যদি কোনও গ্রাফে ফিট করার জন্য অনেকগুলি পরামিতি থাকে তবে আমি যুক্তি দিই যে প্রায়শই কোনও টেবিলটি কমপক্ষে পড়া বেশ কঠিন। তবে আমি মনে করি প্রজননযোগ্যতা ব্যতীত অন্য কিছু না হলে সম্পূর্ণ ফলাফল অ্যাক্সেসযোগ্য (অনলাইন, পরিশিষ্ট, ইত্যাদি) হওয়া উচিত। সেক্ষেত্রে আমি যদিও ডেটা ও কোড চাইতাম! ঘুরছে ওটি, দুঃখিত ..
জেএমএস

এছাড়াও আমি মনে করি রিগ্রেশন সহগ এবং বিভ্রান্তি (পারস্পরিক সম্পর্ক, কোভেরিয়েন্স, ...) ম্যাট্রিকগুলি সাধারণত গ্রাফিকাল ডিসপ্লে, ডটপ্লট বা পূর্বের এবং হিটম্যাপস বা পরবর্তীগুলির জন্য গ্রাফের জন্য আরও উপযুক্ত।
জেএমএস

@ জেএমএস আমি আপনার বক্তব্যের সাথে একমত, তবে এক্ষেত্রে চিত্রের সীমা রয়েছে, অন্য কয়েকটি ক্ষেত্রে ফিগার চার্জ রয়েছে। এছাড়াও, এই ক্ষেত্রে যদি পাঠকরা টেবিলের দিকে নজর রাখেন এবং উপস্থাপিত পরিসংখ্যানগুলিতে মনোনিবেশ করেন তবে তারা কোনও মূর্খ চিত্রটির বিন্দুটি বের করার চেষ্টা করতে সময় নষ্ট করবেন না। তবে আমি পুনরুত্পাদনযোগ্যতার পুরোপুরি সমর্থন করি এবং আমি যখন এটিতে থাকি তখন আমি সংযুক্ত কোডটিতে টেবিলটির দৃশ্যায়ন যোগ করতে পারি।
ডেভিড লেবাউর

উত্তর:


19

আমি সন্দেহ করি একটি সার্বজনীন নিয়ম আছে তাই আমি কোনও ব্যবস্থা তৈরি করতে যাচ্ছি না। আমি এই চিন্তাভাবনাগুলি এবং তাদের পিছনে কারণগুলি ভাগ করতে পারি:

  • সংক্ষিপ্তসারগুলি যখন ডেটাগুলি নিজেরাই প্রতিফলিত করে - সর্বোচ্চ, মিনিট, অর্ডার পরিসংখ্যান ইত্যাদি - - প্রথম স্থানে ডেটা রেকর্ড করতে ব্যবহৃত একই পরিমাণে উল্লেখযোগ্য পরিসংখ্যান ব্যবহার করুন। এটি ডেটাটির যথার্থতার বিষয়ে ডকুমেন্ট জুড়ে একটি সামঞ্জস্যপূর্ণ প্রতিনিধিত্ব করে।

  • যখন সংক্ষিপ্তসারগুলিতে ডেটার তুলনায় উচ্চতর নির্ভুলতা থাকে, তখন মানগুলি এমনভাবে লিখুন যা সেই অতিরিক্ত নির্ভুলতা প্রতিফলিত করে । উদাহরণস্বরূপ, মানগুলির একটি গড়ের পৃথক মানগুলির যথার্থতা গুণ রয়েছে: মোটামুটিভাবে, জন্য একটি অতিরিক্ত তাত্পর্যপূর্ণ চিত্র অন্তর্ভুক্ত করুন , ইত্যাদির জন্য দুটি two (এটি অবশ্যই লগ -10 স্কেলে গোলাকার, স্পষ্টতই।)n 3n3030<n300n3n3030<n300

    উল্লেখ করুন যে সিভি এই বিষয়ে দরকারী তথ্য সরবরাহ করে না

    - কিছু প্রাক্কলন দুর্দান্ত নির্ভুলতা সঙ্গে প্রাপ্ত করা যেতে পারে। অন্য কিছু মেলাতে তাদের গোল করতে হবে না। উদাহরণস্বরূপ, ১,০০,০০০ পূর্ণসংখ্যার গড় ০.০০০০১১ এর মানগত ত্রুটির সাথে ১০.৯77। হতে পারে। আমার তিনটি দশমিক স্থানে (এবং 4-5 সিগ ডুমুর) গড় লেখার সিদ্ধান্তটি এসই এর দৈর্ঘ্যের ক্রমের ভিত্তিতে ছিল, যা নির্দেশ করে যে শেষ অঙ্কটি আংশিকভাবে নির্ভরযোগ্য। এসই থেকে তিনটি সিগ ডুমুর (পাঁচ দশমিক স্থান) লেখার সিদ্ধান্তটি আরও নির্বিচারে: দুটি সিগ ডুমুর কাজ করবে; এক সম্ভবত না; চারটি সিগ ডুমুর কাজ করবে এবং 4-5 সিগ ডুমুরের সাথে সামঞ্জস্য থাকবে; অধিক চার সিগ ডুমুর overkill হবে। (ডেটা চতুর্থ মুহুর্তের ক্ষেত্রে কেউ নিজেই এসই এর স্ট্যান্ডার্ড ত্রুটিটি অনুমান করতে পারে এবং উপযুক্ত পরিমাণটি গোল করার জন্য এটি ব্যবহার করতে পারে, তবে আমাদের বেশিরভাগই এ জাতীয় সমস্যায় যায় না ...)

  • পাঠককে সংকেত দিন যখন আপনি পর্যাপ্ত বৃত্তাকার করছেনবিশেষত করার সময় সতর্ক থাকুন প্রতিবেদন পরিসংখ্যানগত পরীক্ষা নিজেই আলোচনা করছে । কারণ হ'ল লোকেরা নিজের কাজগুলি তাদের নিজস্ব গণনা পরীক্ষা করতে ব্যবহার করতে পারে। কখনও কখনও এমনকি সামান্য পার্থক্য একটি ত্রুটি প্রকাশ করতে পারে। আপনি সমস্যা সৃষ্টি করতে চান না কারণ আপনি 123 থেকে 120 এর মতো গোল করেছেন এবং অন্য কেউ কাজটি পরীক্ষা করছেন, 123 পেয়েছেন এবং সন্দেহ করেছেন যে আপনার একজনের ভুল হয়েছে।

  • ধারাবাহিক হতে হবে । আপনি কিছু পাঠককে হারাতে পারেন যদি আপনি এক পর্যায়ে 123 হিসাবে কোনও মান তালিকাভুক্ত করেন এবং পরে এটি 120 হিসাবে উল্লেখ করেন।

  • হাস্যকর হবেন না । (উদাহরণস্বরূপ, যখন ডেটাতে কেবল দুটি সিগ ডুমুর থাকে তখন 15 সিগ ডুমুরের পরিসংখ্যানগত ফলাফল দেয় এমন প্রতিবেদনগুলির মুখোমুখি হলে আমি স্বয়ংক্রিয়ভাবে অযোগ্যতার সন্দেহ করি))


2
আমার খুব বড় +1 কারণ এটি সত্যিই অনেক ভাল পরামর্শ। একই শিরাতে আমি শিক্ষার্থীদের কাছে এটি দেখাতে চাই যে জরিপ (বা ভোট) থেকে সংগ্রহ করা ডেটা সংখ্যার সাথে% হিসাবে নমুনা আকার বিবেচনা না করে অনেক দশমিকের সংক্ষিপ্ত করা অর্থহীন (যা স্ট্যান্ডার্ড ত্রুটির প্রভাব ফেলে)।
chl

0

আমি 12 (1.2, 123.4) পরামর্শ দেব। .3 ছাড়ুন কারণ এটি প্রায় অর্থহীন, তবে অনেক লোক যখন দেখেন (1.2, 120) ধরে নেবেন যে 120 সালে শেষ '0' তাৎপর্যপূর্ণ।


আপনি যদি সিআই-তে তাদের দেখাতে সম্মত হন তবে আগ্রহের পরিসংখ্যানের জন্য দশমিক বাদ দেওয়ার পরামর্শ আপনি কেন দিয়েছেন (যেমন, এটি যদি 12 এর অর্থহীন হয় তবে কেন এটি 123.4 এর অর্থ দেয়)?
chl

@ সিএইচএল: এটি বেশি অর্থবোধ করে না, তবে এটি বাদ দেওয়া বিভ্রান্তিকর হতে পারে। আমি যদি 123.4 এ রাখি তবে আপনার মতো কেউ অতিরিক্ত অঙ্কগুলি দেখতে পাবে এবং কেবল সেগুলি উপেক্ষা করবে, কোনও ক্ষতি হয়নি। আমি যদি 120 টি রাখি, তবে অনেক পাঠক এটি 3 ডিজিটের কাছে সঠিক বলে মনে করবেন - খারাপ।
এভিবি

আপনি কেন 123 এর পরিবর্তে 123.4 সুপারিশ করেন তা এখনও পরিষ্কার নয় (উদাহরণে কেন বাদ পড়ুন .3 তবে না .4)
ডেভিড লেবাউর ২
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.