ক্ষুদ্র


62

কিছু পরীক্ষার জন্য R, সেখানে একটি নিম্ন সীমা এর গণনার । আমি নিশ্চিত নই কেন এটি এই নম্বর, যদি এর কোনও ভাল কারণ থাকে বা এটি যদি স্বেচ্ছাচারিতা হয়। অন্যান্য প্রচুর পরিসংখ্যান প্যাকেজগুলি কেবলমাত্র যায় , তাই এটি নির্ভুলতার অনেক বেশি স্তর। কিন্তু আমি রিপোর্ট অনেকগুলি কাগজপত্র দেখিনি বা ।2.2210-160.0001পি<2.2210-16পি=2.2210-16

এই গণনা করা মানটির প্রতিবেদন করা কি সাধারণ / সেরা অনুশীলন বা অন্য কিছু (যেমন p < 0.000000000000001) জানানো আরও সাধারণ ?


যদি আপনি এই জাতীয় ছোট পি-মান পান এবং প্রকৃত পি-মান গণনা করতে চান তবে আপনি এই ফাংশনটি এক্সেল = টিডিআইএসটি (টি, ডিএফ, 2) এ ব্যবহার করতে পারেন আপনার 'টি' এবং ডিএফ এর মান যুক্ত করুন এবং আপনি আসলটি পাবেন পি-মান টা

7
@Tahzeeb আছে কোন কারণে এক্সেল আরও ভালো অনুমান তারপর ফিরে আসবে আর ..? আমি যতদূর জানি, এটি অনেক কম সুনির্দিষ্ট।
টিম

...But I haven't seen too many papers reporting p<2.22⋅10−16....কয়েকটি জিডাব্লুএএস কাগজপত্র দেখুন , এখানে অনেকগুলি কাগজপত্র রয়েছে যা শত শত লোকের জন্য মূল্যবান ফলাফল দেখায়, যেমন: প্রোস্টেট ক্যান্সার কেএলকে অঞ্চল, পি = 9x10 ^ -186।
zx8754

1
এখানে whuber এর উত্তরও দেখুন: stats.stackexchange.com/questions/11812
অ্যামিবা বলেছেন মোনিকা

উত্তর:


87

এটির জন্য একটি ভাল কারণ আছে।

এর মাধ্যমে মানটি পাওয়া যাবে noquote(unlist(format(.Machine)))

           double.eps        double.neg.eps           double.xmin 
         2.220446e-16          1.110223e-16         2.225074e-308 
          double.xmax           double.base         double.digits 
        1.797693e+308                     2                    53 
      double.rounding          double.guard     double.ulp.digits 
                    5                     0                   -52 
double.neg.ulp.digits       double.exponent        double.min.exp 
                  -53                    11                 -1022 
       double.max.exp           integer.max           sizeof.long 
                 1024            2147483647                     4 
      sizeof.longlong     sizeof.longdouble        sizeof.pointer 
                    8                    12                     4 

আপনি যদি সহায়তাটি দেখুন, ( ?".Machine"):

double.eps  

the smallest positive floating-point number x such that 1 + x != 1. It equals 
double.base ^ ulp.digits if either double.base is 2 or double.rounding is 0; 
otherwise, it is (double.base ^ double.ulp.digits) / 2. Normally 2.220446e-16.

এটি মূলত একটি মান যার নীচে আপনি বেশ আত্মবিশ্বাসী হতে পারেন মানটি খুব সংখ্যাসূচকভাবে অর্থহীন হবে - যে কোনও ছোট মান সম্ভবত আমরা যে গণনাটি চেষ্টা করার চেষ্টা করছিলাম তার সঠিক গণনা হতে পারে না। (নির্দিষ্ট পদ্ধতি দ্বারা কোন গুণাগুণ করা হয়েছিল তার উপর নির্ভর করে কিছুটা সংখ্যাসূচক বিশ্লেষণ অধ্যয়ন করার পরে, সংখ্যাটির অর্থহীনতা এর উপরে একটি সুষ্ঠুভাবে আসার একটা ভাল সম্ভাবনা রয়েছে))

তবে পরিসংখ্যানগত অর্থ অনেক আগেই হারিয়ে যাবে। নোট করুন যে পি-মানগুলি অনুমানের উপর নির্ভর করে এবং আপনি যে চূড়ান্ত লেজের দিকে আরও বেশি যান সেখানে সত্যিকারের পি-মান (আমরা যে নামমাত্র মানটি গণনা করি তার চেয়ে বেশি) ভুল অনুমানগুলি দ্বারা প্রভাবিত হবে, কিছু ক্ষেত্রে এমনকি তারা যখন 'কিছুটা ভুল। যেহেতু অনুমানগুলি কেবল সমস্ত সঠিকভাবে সন্তুষ্ট হয় না, পি-মানগুলিকে বিস্মিত করা যথাযথভাবে সঠিক হতে পারে (আপেক্ষিক নির্ভুলতার ক্ষেত্রে, সম্ভবত কেবলমাত্র একটি পরিমিত ভগ্নাংশ দ্বারা), তবে অত্যন্ত ক্ষুদ্র পি-মানগুলি অনেকগুলি আদেশের বাইরে থাকতে পারে মাত্রা।

কোনটি বলতে গেলে স্বাভাবিক অনুশীলন (আপনি বলে থাকেন এমন "<0.0001" এর মতো কিছু প্যাকেজগুলিতে প্রচলিত, বা যাপ তার উত্তরে উল্লেখ করেছেন যে এপিএ নিয়ম) সম্ভবত বোধগম্য অনুশীলন থেকে এতটা দূরে নয়, তবে বিষয়গুলি সম্পর্কে আনুমানিক বিন্দু ' এটি খুব খুব ছোট ' বলার বাইরে অর্থ হারিয়ে ফেলবেন অবশ্যই পরিস্থিতির উপর নির্ভর করে ইচ্ছামত অনেকটা ভিন্ন হয়।

আমি সাধারণ নিয়মের প্রস্তাব দিতে পারছি না কেন এটিই একটি কারণ - এমন কোনও নিয়ম হতে পারে না যা এমনকি সকল পরিস্থিতিতে প্রত্যেকেই দূরবর্তীভাবে উপযুক্ত - পরিস্থিতিটি কিছুটা পরিবর্তন করুন এবং বিস্তৃত ধূসর রেখা পরিবর্তনটিকে কিছুটা অর্থবহ থেকে তুলনামূলকভাবে চিহ্নিত করে অর্থহীন পরিবর্তন হবে, কখনও কখনও দীর্ঘ পথ দিয়ে।

আপনি (যেমন এটি একটি রিগ্রেশন আছে, সঙ্গে সঠিক অবস্থার বিষয়ে যথেষ্ট তথ্য উল্লেখ হলে এই অনেক nonlinearity, যে এই স্বাধীন পরিবর্তনশীল তারতম্য পরিমাণ, এই ধরনের এবং ত্রুটি মেয়াদে নির্ভরতা পরিমাণ, যে ধরনের এবং heteroskedasticity পরিমাণ, ত্রুটি বিতরণের এই আকার), আমি আপনাকে নামমাত্র পি-মানগুলির সাথে তুলনা করার জন্য 'সত্য' পি-মানগুলি অনুকরণ করতে পারি, যাতে আপনি দেখতে পান যে নামমাত্র মানটির কোনও অর্থ বহন করার জন্য এগুলি খুব আলাদা ছিল।

তবে এটি আমাদের দ্বিতীয় কারণের দিকে নিয়ে যায় - এমনকি যদি আপনি সত্যিকারের পি-মানগুলি অনুকরণের জন্য পর্যাপ্ত তথ্য নির্দিষ্ট করে থাকেন - তবে আমি এখনও সেই পরিস্থিতিতে এমনকি দায়বদ্ধতার সাথে কোনও কাট-অফ বলতে পারি না।

আপনি যা প্রতিবেদন করছেন তা মানুষের পছন্দ - আপনার এবং আপনার দর্শকের উপর নির্ভর করে। কল্পনা করুন আপনি আমাকে অবস্থার বিষয়ে যথেষ্ট আমাকে ঠিক করার জন্য যে, আমি একজন নামমাত্র লাইনে আঁকা চেয়েছিলেন এর 10 - 6পি10-6

ভাল এবং ভাল, আমরা ভাবতে পারি - আপনার নিজস্ব পছন্দসই কাজটি বাদে (আপনার কাছে যা সঠিক মনে হচ্ছে, আপনি যদি কোনও নির্দিষ্ট সেট হিসাবে অনুমান করেন তখন স্ট্যাটাস প্যাকেজগুলির দ্বারা প্রদত্ত নামমাত্র পি-মান এবং সিমুলেশন থেকে প্রাপ্ত ফলাফলগুলির মধ্যে পার্থক্যটি কি আপনি দেখতে পান? অনুমানের ব্যর্থতা) এটি এ রেখে দিতে পারে এবং আপনি যে জার্নালটি জমা দিতে চান তার সম্পাদকদের তাদের কম্বল বিধি 10 - 4 এ কেটে দিতে পারে , যখন পরের জার্নালটি এটি 10 - 3 এবং পরবর্তী কোনও সাধারণ নিয়ম নাও থাকতে পারে এবং আপনি যে নির্দিষ্ট সম্পাদকটি পেয়েছিলেন সেটার চেয়ে কম মানও আমি গ্রহণ করতে পারি ... তবে রেফারির মধ্যে একটির পরে নির্দিষ্ট কাটা কাটা থাকতে পারে!10-510-410-3

তাদের পছন্দের কাজগুলি এবং নিয়মগুলির জ্ঞানের অভাবে এবং আপনার নিজস্ব উপযোগিতা সম্পর্কে জ্ঞানের অনুপস্থিতিতে আমি কীভাবে পদক্ষেপ নেওয়ার কোনও সাধারণ পছন্দকে দায়বদ্ধতার সাথে পরামর্শ করব?

আমি কমপক্ষে আপনাকে বিভিন্ন ধরণের জিনিস বলতে পারি যা আমি করি (এবং আমি এটি আপনার পক্ষে মোটামুটি পছন্দ বলে মনে করি না):

কয়েকটি পরিস্থিতিতে রয়েছে (পি-মানগুলি সিমুলেট করার বাইরে) যা আমি এপি থেকে চেয়ে কম করব (আমি প্যাকেজটির দ্বারা উল্লিখিত মানটি উল্লেখ করতে বা উল্লেখ করতে পারি না, তবে আমি এগুলি ব্যতীত অন্য কিছু করব না) এটি খুব ছোট ছিল, আমি সাধারণত সঠিক সংখ্যার অর্থহীনতার উপর জোর দিয়ে থাকি)। কখনও কখনও আমি 10 - 5 থেকে 10 - 4 অঞ্চলে কোথাও একটি মান নিই এবং বলি যে পি এর চেয়ে অনেক কম ছিল। উপলক্ষে আমি আসলে উপরে বর্ণিত হিসাবে করব - অনুমানের বিভিন্ন লঙ্ঘনের ক্ষেত্রে পি-মান কতটা সংবেদনশীল তা দেখার জন্য কিছু সিমুলেশনগুলি সম্পাদন করুন, বিশেষত যদি একটি নির্দিষ্ট ধরণের লঙ্ঘনের বিষয়ে আমি উদ্বিগ্ন।10-610-510-4

এটি অবশ্যই কোনও পছন্দকে অবহিত করতে সহায়ক - তবে আমি সিমুলেশনের ফলাফলগুলি নিয়ে কাট-অফ-মান বেছে নিতে অন্যকে তাদের নিজের পছন্দ করার সুযোগ করে দেওয়ার বিষয়ে আলোচনা করার সম্ভাবনা বোধ করি।

সিমুলেশনটির বিকল্প হ'ল এমন কিছু পদ্ধতি যা তাত্পর্যপূর্ণ বিভিন্ন সম্ভাব্য ব্যর্থতার তুলনায় আরও দৃ rob় হয় সেগুলি দেখুন এবং দেখুন যে পি-মানটির সাথে কতটা পার্থক্য রয়েছে। তাদের পি-মানগুলিও বিশেষ অর্থবহ হবে না তবে তারা কমপক্ষে কতটা প্রভাব ফেলতে পারে তার কিছুটা ধারণা দেয়। কিছু যদি নামমাত্রের থেকে খুব আলাদা হয় তবে এটি আরও একটি ধারণা দেয় যা এর প্রভাব তদন্ত করার জন্য অনুমানের লঙ্ঘন করে। এমনকি যদি আপনি এই বিকল্পগুলির কোনওটিরও প্রতিবেদন না করেন তবে এটি আপনার ছোট পি-মানটি কতটা অর্থবহ তা একটি আরও ভাল চিত্র দেয়।

* দ্রষ্টব্য যে এখানে আমাদের সত্যিকারের এমন কোনও প্রক্রিয়া দরকার নেই যা কিছু অনুমানের গুরুতর লঙ্ঘনের জন্য দৃ are়; যেগুলি প্রাসঙ্গিক অনুমানের তুলনামূলকভাবে হালকা বিচ্যুতি দ্বারা কম প্রভাবিত হয় তাদের এই অনুশীলনের জন্য ভাল হওয়া উচিত।

আমি বলব যে আপনি / যখন আপনি এই জাতীয় সিমুলেশনগুলি করতে এসেছেন এমনকি বেশ হালকা লঙ্ঘনের পরেও, কিছু ক্ষেত্রে এটি অবাক করা যায় যে এমনকি ছোট-ছোট-পি-মানগুলি কী ভুল হতে পারে। আমি ব্যক্তিগতভাবে কোনও পি-ভ্যালুটি যেভাবে ব্যবহার করতে পারি তার নির্দিষ্ট কাট-অফগুলি স্থানান্তরিত করার চেয়ে ব্যক্তিগতভাবে ব্যাখ্যা করার উপায়টি আরও পরিবর্তন করতে পেরেছে।

একটি জার্নালে সত্য অনুমানের পরীক্ষার ফলাফল জমা দেওয়ার সময়, তাদের কোনও বিধি আছে কিনা তা জানার চেষ্টা করি। যদি তারা তা না করে তবে আমি নিজেকে খুশি করার প্রবণতা রাখি এবং তারপরে রেফারিরা অভিযোগ করার জন্য অপেক্ষা করুন।


11
আমি বিশেষত স্ট্যাটিস্টিকাল অর্থ সম্পর্কে মন্তব্যটি অনেক আগেই হারিয়ে যেতে পছন্দ করি ।
usεr11852

দুর্দান্ত উত্তর! আমি এর সমস্ত বিশদ প্রশংসা করি, কেন আর এই সংখ্যাটি দেয় তা পরিষ্কার করে দেয়। তবে এটি কী রিপোর্ট করবেন সে প্রশ্নের সত্যই উত্তর দেয় না।
পল

1
আমি বরং এটিকে অনুভব করেছি যে আমি বিষয়টি নির্দিষ্ট করেছিলাম, এই অর্থে যে আমি ব্যাখ্যা দিয়েছিলাম যে এটি নির্দিষ্ট পরামর্শ দেওয়ার জন্য কেন দায়বদ্ধ নয়। মনে রাখবেন যে "<0.0001" জাতীয় কিছু প্যাকেজগুলির মধ্যে সাধারণ ব্যবহারের মতো কেন এমন কিছু রিপোর্ট করা আমাদের বোধগম্য তা নিয়ে আমি আলোচনা করি। আমি নির্দিষ্ট সংখ্যার প্রস্তাব না দেওয়ার বেশ কয়েকটি কারণ রয়েছে - যা আমি প্রথম দিয়েছি। আমি সেই কারণে এবং একটি সম্পাদনায় দ্বিতীয়টি প্রসারিত করব।
Glen_b

পল, আমি আরও কিছু উল্লেখযোগ্য আলোচনা যোগ করেছেন।
Glen_b

2
হ্যাঁ, আপনার কিছু করার দরকার আছে; আমার আরও বিস্তৃত ভাষ্যটির মূল বক্তব্যটি ছিল তা বোঝানো যে আপনার কী করা উচিত তা আমি আপনাকে বলতে পারি না, আমি কেবল আপনার পছন্দের বিষয়গুলিতেই আলোচনা করতে পারি। আমি আশা করি আমি এটি করেছি, তবে আমি যদি সম্ভব হয় তবে যে কোনও সমস্যা আরও পরিষ্কার করার চেষ্টা করে খুশি।
Glen_b

27

সাধারণ অনুশীলনটি কী তা আপনার গবেষণার ক্ষেত্রের উপর নির্ভর করে। আমেরিকান সাইকোলজিকাল অ্যাসোসিয়েশনের (এপিএ) ম্যানুয়াল, যা সর্বাধিক ব্যবহৃত ব্যবহৃত উদ্ধৃতি শৈলীর মধ্যে একটি, বলা হয়েছে (পৃষ্ঠা ১৩৯, 6th ষ্ঠ সংস্করণ):

পি <0.001 এর চেয়ে ছোট কোনও মান ব্যবহার করবেন না


8
যদিও আমি সাধারণত এটিই উল্লেখ করি (+1), পিএনএএস-এ ভ্যালেন জনসনের সাম্প্রতিক সুপারিশের ভিত্তিতে, এক দশমিক জায়গায় কেউ এই সুপারিশটি সংশোধন করতে হবে কিনা তা আমি নিশ্চিত নই : "0.005 কে তাত্পর্যপূর্ণ ডিফল্ট স্তর তৈরি করুন [ ...]। পি মানগুলির সাথে 0.001 এর চেয়ে কম মানের অত্যন্ত গুরুত্বপূর্ণ পরীক্ষার ফলাফলকে যুক্ত করুন ""
হেনরিক 14

3
ভাল উত্তর. আমার ক্ষেত্রে কোনও স্টাইল গাইড নেই এবং আসল মান নেই, কমপক্ষে পি-মানগুলির জন্য নয়। আমি আন্তঃশৃঙ্খলামূলক কাজ করি তবে আমার ধারণা কম্পিউটার বিজ্ঞান এবং এইচসিআই এর জন্য ক্ষেত্র হবে। আমি মনে করি যে এপিএ শৈলীটি সেখানে লেখকরা ঘুরে দাঁড়াবে, যেহেতু পদ্ধতিগুলি সাধারণত জ্ঞানীয় মনো বা অন্য ক্ষেত্রগুলি থেকে নেওয়া হয় যা এপিএ দ্বারা আবৃত হয়।
পল

10
5σপি<10-6

1
5σzpp0.0001zপি

@ অ্যামিবা হ্যাঁ, আমি মনে করি আপনি ঠিক বলেছেন।
Glen_b

14

জেনোমিক্স এবং প্রক্রিয়া পর্যবেক্ষণের মতো খুব বেশি পরিমাণে ডেটাযুক্ত ক্ষেত্রগুলিতে এই জাতীয় চরম প-মানগুলি প্রায়শই ঘটে। এই ক্ষেত্রে, কখনও কখনও এটি -লগ 10 (পি-মান) হিসাবে প্রতিবেদন করা হয়। উদাহরণস্বরূপ, প্রকৃতি থেকে এই চিত্রটি দেখুন , যেখানে পি-মানগুলি 1e-26 এ নেমে যায়।

-লগ 10 (পি-মান) আমি জেএমপিতে কাজ করি এমন পরিসংখ্যানবিদদের দ্বারা "লগ ওয়ার্থ" নামে পরিচিত


21
পিpp

8
@ বেনবোলকার প্রকৃতপক্ষে, "আপনার ডেটাতে এনএসএ নিয়ে টেম্পারড" এর চেয়ে কম সম্ভাবনা রয়েছে এমন কি, "মহাজাগতিক রশ্মি আপনার ডেটাতে বেশ কয়েকটি গুরুত্বপূর্ণ বিট উল্টিয়েছিল" এর মতো ইভেন্টগুলিও সম্ভাবনার চেয়ে অনেক বেশি সম্ভাবনা রয়েছে।
Glen_b

6
পি<10-100ρ0.9এন~500

8
পি=2.2×10-226

9
@amoeba ওভার স্লেট স্টার কোডেক্স মন্তব্য বিভাগে, ড্যানিয়েল ওয়েলস নোট যে science.sciencemag.org/content/363/6425/eaau1043 3.6e-2382 একটি পি-মান রিপোর্ট ( "একটি টাইপো না, দুই হাজার ", ড্যানিয়েল বলেছেন ), যা আপনাকে বেশ ব্যবধানে পরাজিত করে!
মার্ক আমেরিকা

-3

আর-তে "<2e-16" এর অর্থ আক্ষরিক <2e-16 নয়, তবে এর পরিবর্তে এর অর্থ হল মানটি এত ছোট যে আর এটি রেকর্ড করতে বা প্রদর্শন করতে পারে না।

রিগ্রেশন পরীক্ষায়, আমি প্রায়শই 4.940656e-324 এর চেয়ে কম পি পাই, যখন এটি "<2e-16" আউটপুট করে, এটি একটি সংখ্যাও 4.940656e-324 এর চেয়ে ছোট


কোন সংখ্যাটি " 4.940656e-324 এর চেয়েও ছোট "?
সোভেন হোহেনস্টেইন

8
আপনার আর্টে "", "<2e-16" এর অর্থ আক্ষরিক অর্থে <2e-16 "নয়। আর প্রদর্শন করা যখন <2e-16, মান হয় চেয়ে ছোট 2e-16আক্ষরিক।
সোভেন হোহেনস্টেইন

আমি যা বলেছিলাম তা ভুল বুঝেছিলে। যখন আর "<2e-16" বলেছিলেন, পি-মানটি 2e-16 এর চেয়ে ছোট, তবে এর অর্থ এই নয় যে 2-16 এর চেয়ে ছোট পি-মানটি "<2e-16" হিসাবে প্রদর্শিত হবে। আমি যেমনটি দেখিয়েছি, আর [৪.৯৪০6566 -৩২৪, ২ ই -১]] এর মধ্যে যে কোনও সংখ্যার এলএম সারসংক্ষেপ পি-মানটি প্রদর্শন করতে সমস্যা নেই, যখন বাম সীমানাটি 2 ^ -1074। সুতরাং আমি ধরে নিচ্ছি, কেবল যখন পি-মানটি 2 ^ -1074 এর চেয়ে ছোট হবে, তখন আর বলবে পি-মানটি একটি ছোট ব-দ্বীপের মানের চেয়ে ছোট। এটি ঠিক ঘটে যে আর এই ডেল্টা মানটি 2e-16 হিসাবে প্রদর্শন করবে। সুতরাং আমার অনুমান "<2e-16" আসলে পি-মানগুলিতে "<2 ^ -1074" এর অর্থ
ব্যবহারকারী 3590816

6
তবে আপনার অনুমানটি ভুল: এটিই @ স্যভেন আপনাকে জানানোর চেষ্টা করছে। format.pvalহিসাবে হিসাবে সহায়তা দেখুন বা সহজভাবে এটি চেষ্টা করে দেখুন format.pval(1e-16)
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.