দু'জন স্বতন্ত্র অনুপাতের শক্তি বিশ্লেষণে কীভাবে একজন থামার নিয়ম বিকাশ করতে পারে?


18

আমি এ / বি টেস্টিং সিস্টেমে কাজ করা একটি সফটওয়্যার বিকাশকারী। আমার কোনও শক্ত পরিসংখ্যানের পটভূমি নেই তবে গত কয়েকমাস ধরে জ্ঞান বাছাই করছি।

একটি সাধারণ পরীক্ষার দৃশ্যে কোনও ওয়েবসাইটের দুটি URL টি তুলনা করা জড়িত। একজন দর্শনার্থী পরিদর্শন করেন LANDING_URLএবং তারপরে এলোমেলোভাবে হয় হয় হয় URL_CONTROLবা অন্যটিতে প্রেরণ করা হয় URL_EXPERIMENTAL। একজন দর্শনার্থী একটি নমুনা গঠন করে, এবং যখন দর্শক সেই সাইটে কিছু পছন্দসই কর্ম সম্পাদন করেন তখন একটি বিজয় শর্ত অর্জন করা হয়। এটি রূপান্তর গঠন করে এবং রূপান্তর হারের হার হ'ল রূপান্তর হার (সাধারণত শতাংশ হিসাবে প্রকাশিত হয়)। প্রদত্ত ইউআরএলটির জন্য একটি সাধারণ রূপান্তর হার 0.01% থেকে 0.08% এর রাজত্বের মধ্যে কিছু। নতুন ইউআরএল কীভাবে পুরানো ইউআরএলগুলির তুলনায় তুলনা করে তা নির্ধারণ করার জন্য আমরা পরীক্ষা চালাই। তাহলে URL_EXPERIMENTALসুখ্যাতি দেখানো URL_CONTROL, আমরা প্রতিস্থাপন URL_CONTROLসঙ্গে URL_EXPERIMENTAL

আমরা সাধারণ অনুমান পরীক্ষা করার কৌশলগুলি ব্যবহার করে একটি সিস্টেম তৈরি করেছি। আমি এই সিস্টেমটি বিকাশ করতে এখানে অন্য ক্রসভ্যালিটেড প্রশ্নের উত্তরগুলি ব্যবহার করেছি ।

নিম্নলিখিত হিসাবে একটি পরীক্ষা সেট আপ করা হয়:

  • রূপান্তরের হার অনুমান CRE_CONTROLএর URL_CONTROLঐতিহাসিক তথ্য ব্যবহার করে গণনা করা হয়।
  • পছন্দসই লক্ষ্য রূপান্তরের হার CRE_EXPERIMENTALএর URL_EXPERIMENTALসেট।
  • 0.95 এর তাত্পর্যপূর্ণ স্তরটি সাধারণত ব্যবহৃত হয়।
  • 0.8 এর শক্তি সাধারণত ব্যবহৃত হয়।

একসাথে, এই সমস্ত মানগুলি পছন্দসই নমুনার আকার গণনা করতে ব্যবহৃত হয়। আমি power.prop.testএই নমুনা আকার পেতে আর ফাংশন ব্যবহার করছি ।

সমস্ত নমুনা সংগ্রহ না করা পর্যন্ত একটি পরীক্ষা চলবে। এই মুহুর্তে, আত্মবিশ্বাসের জন্য অন্তর অন্তর্ভূক্ত হয় CR_CONTROLএবং CR_EXPERIMENTALগণনা করা হয়। যদি তারা ওভারল্যাপ না করে, তবে বিজয়ীকে 0.95 এর তাত্পর্যপূর্ণ স্তর এবং 0.8 এর শক্তি দিয়ে ঘোষণা করা যেতে পারে।

আমাদের পরীক্ষার ব্যবহারকারীদের দুটি প্রধান উদ্বেগ রয়েছে, যদিও:

১. যদি, পরীক্ষার সময় কোনও পর্যায়ে, পরিষ্কার বিজয়ী দেখানোর জন্য পর্যাপ্ত নমুনা সংগ্রহ করা হয়, তবে পরীক্ষা বন্ধ করা যাবে না?

২. পরীক্ষা শেষে যদি কোনও বিজয়ী ঘোষিত না হয়, তবে আমরা কী বিজয়ীর সন্ধানের জন্য পর্যাপ্ত নমুনা সংগ্রহ করতে পারি কিনা তা পরীক্ষা চালানোর জন্য আরও দীর্ঘ সময় চালাতে পারি?

এটি লক্ষ করা উচিত যে প্রচুর বাণিজ্যিক সরঞ্জাম বিদ্যমান রয়েছে যা তাদের ব্যবহারকারীদের আমাদের নিজস্ব ব্যবহারকারীদের যা ইচ্ছা তা করতে দেয়। আমি পড়েছি যে উপরেরগুলির সাথে অনেকগুলি ত্রুটি রয়েছে, তবে আমি একটি থামানো নিয়মের ধারণাও পেয়েছি এবং আমাদের নিজস্ব সিস্টেমে এই জাতীয় নিয়ম ব্যবহারের সম্ভাবনাটি অনুসন্ধান করতে চাই।

এখানে আমরা দুটি বিষয় বিবেচনা করতে চাই:

1. ব্যবহার করে power.prop.test, বর্তমান পরিমাপক রূপান্তর হারকে বর্তমানের নমুনার সংখ্যার সাথে তুলনা করুন এবং বিজয়ী ঘোষণার জন্য পর্যাপ্ত নমুনা সংগ্রহ করা হয়েছে কিনা তা দেখুন।

উদাহরণ: আমাদের সিস্টেমে নিম্নলিখিত আচরণ বিদ্যমান কিনা তা দেখার জন্য একটি পরীক্ষা করা হয়েছে:

  • CRE_CONTROL: 0.1
  • CRE_EXPERIMENTAL: 0.1 * 1.3
  • এই পরামিতিগুলির সাথে, নমুনার আকার N1774।

যাইহোক, পরীক্ষার অগ্রগতি হিসাবে এবং 325 নমুনায় পৌঁছেছে, CRM_CONTROL(নিয়ন্ত্রণের জন্য পরিমাপিত রূপান্তর হার) 0.08 এবং CRM_EXPERIMENTAL0.15। power.prop.testএই রূপান্তর হারে চালিত হয় এবং Nএটি 325 পাওয়া যায় CRM_EXPERIMENTAL। বিজয়ী হিসাবে ঘোষণার জন্য প্রয়োজনীয় নমুনার সংখ্যাটি ঠিক ! এই মুহুর্তে এটি আমাদের আশা যে পরীক্ষাটি শেষ হতে পারে। একইভাবে, যদি পরীক্ষাটি 1774 টি নমুনায় পৌঁছায় তবে কোনও বিজয়ী পাওয়া যায় নি তবে এটি 2122 নমুনায় পৌঁছে যা CRM_CONTROL0.1 এবং CRM_EXPERIMENTAL0.128 এর ফলাফলের পক্ষে যথেষ্ট যেখানে ফলাফল বিজয়ী হিসাবে ঘোষণা করা যেতে পারে।

একটি সম্পর্কিত প্রশ্নে ব্যবহারকারীরা পরামর্শ দিয়েছিলেন যে প্রারম্ভিক স্টপগুলিতে কম নমুনা থাকা এবং অনুমানের পক্ষপাতের ঝুঁকির কারণে এবং টাইপ 1 এবং টাইপ II ত্রুটির সংখ্যা বৃদ্ধি পাওয়ার কারণে এই ধরনের পরীক্ষা কম বিশ্বাসযোগ্য । এই বিরতি নিয়ম কাজ করার কোন উপায় আছে? এটি আমাদের পছন্দের পদ্ধতির কারণ এটি আমাদের জন্য প্রোগ্রামিংয়ের সময় কম করে। সম্ভবত এই স্টপিং নিয়মটি এমন এক ধরণের সংখ্যক স্কোর বা স্কোর প্রদানের মাধ্যমে কাজ করতে পারে যা পরীক্ষার বিশ্বাসযোগ্যতা পরিমাপ করে তা কি তাড়াতাড়ি বন্ধ করা উচিত?

২. ক্রমিক বিশ্লেষণ বা এসপিআরটি ব্যবহার করে ।

পরীক্ষার এই পদ্ধতিগুলি ঠিক আমাদের নিজেদের মধ্যে যে পরিস্থিতিটি খুঁজে পেয়েছে তার জন্যই ডিজাইন করা হয়েছে: কীভাবে আমাদের ব্যবহারকারীরা পরীক্ষা শুরু করতে এবং এমনভাবে শেষ করতে পারেন যাতে তারা পরীক্ষায় অতিরিক্ত সময় নষ্ট না করে? হয় খুব দীর্ঘ পরীক্ষা চালানো হয়, বা বিভিন্ন পরামিতি দিয়ে পরীক্ষা শুরু করতে হয়।

উপরোক্ত দুটি পদ্ধতির মধ্যে আমি এসপিআরটিকে সমর্থন করি কারণ গণিতটি আমার পক্ষে উপলব্ধি করা কিছুটা সহজ এবং কারণ দেখে মনে হচ্ছে এটি প্রোগ্রাম করা আরও সহজ হতে পারে। তবে এই প্রসঙ্গে সম্ভাব্যতা ফাংশনটি কীভাবে ব্যবহার করবেন তা আমি বুঝতে পারি না । যদি কেউ কীভাবে সম্ভাবনা-অনুপাতের গণনা করার সম্ভাবনা-অনুপাতের সংখ্যক যোগফলের উদাহরণ তৈরি করতে পারে এবং এমন একটি পরিস্থিতি চিত্রিত উদাহরণের মধ্য দিয়ে চালিয়ে যেতে পারে যখন কেউ পর্যবেক্ষণ অব্যাহত রাখবে, যখন কেউ নাল অনুমান এবং বিকল্প অনুমানকে গ্রহণ করবে, এটি আমাদের এসপিআরটি যাওয়ার সঠিক উপায় কিনা তা নির্ধারণে সহায়তা করবে।


2
আমি আপনার ভুডু অবলম্বন না প্রশংসা। আপনি যখন কোনও সরঞ্জাম ব্যবহার করছেন এবং আপনি এটি ঠিক কী করছেন বা এটি কীভাবে কাজ করে তা ঠিক বুঝতে পারবেন না, তবে আপনি সরঞ্জামটির ফলাফল ব্যাখ্যা করার জন্য উপযুক্ত নন। যখন কোনও বিশ্লেষণ কোনও ব্যবসায়ের সিদ্ধান্ত নিয়ে আসে এবং আপনি ফলাফল এবং সময় এবং অর্থ রাখেন, আপনি যদি ডেটার উত্স বোঝার জন্য সময় নেন তবে এটি মালিকানা দেখায়। এটি এমন এক ধরণের কঠোর পরিশ্রম যা আপনাকে "পশুর মধ্যে" থাকার পরিবর্তে আরও বেশি সুযোগ দেয়।
এনগ্রিস্টুডেন্ট - মনিকা

উত্তর:


7

এটি একটি আকর্ষণীয় সমস্যা এবং সম্পর্কিত কৌশলগুলির মধ্যে প্রচুর অ্যাপ্লিকেশন রয়েছে। তাদের প্রায়শই "অন্তর্বর্তী পর্যবেক্ষণ" কৌশল বা "অনুক্রমিক পরীক্ষামূলক নকশা" (উইকিপিডিয়া নিবন্ধ, যা আপনি সংযুক্ত করেছেন, দুর্ভাগ্যক্রমে কিছুটা বিচ্ছিন্ন) বলা হয়, তবে এ সম্পর্কে আরও কয়েকটি উপায় রয়েছে। আমি মনে করি @ ইউজার ২647564৪ এ ভুল বলতে গিয়েছে যে এই বিশ্লেষণগুলি অবশ্যই বায়েশিয়ান হতে হবে - অন্তর্বর্তী পর্যবেক্ষণের জন্য অবশ্যই অবশ্যই ঘন ঘন পদ্ধতি রয়েছে।

আপনার প্রথম পদ্ধতির অন্তর্বর্তী পর্যবেক্ষণের মূল পদ্ধতির মধ্যে একটির অনুরূপ, যাকে 'কার্টেলমেন্ট' বলা হয় ধারণাটি খুব সহজ: একবার পরীক্ষার ফলাফল অনিবার্য হয়ে উঠলে আপনার ডেটা সংগ্রহ বন্ধ করা উচিত। আপনি 100 একটি সংগ্রহ পেয়েছেন ধরুন এবং / অথবা এবং তুমি জানো কিনা তা একটি প্রক্রিয়া করে উত্পন্ন করা হয়েছিল নির্বাচন একটি চাই বা র্যান্ডম প্রতিটি সময় (এ অর্থাত, এই ক্ষেত্রে, আপনি একই ধরণের কমপক্ষে 58 টি আইটেম গণনা করার সাথে সাথে আপনার থামানো উচিত; বাকী আইটেমগুলি গণনা করার পরে সেই বিন্দুর পরে তাত্পর্যটি পরিবর্তন হবে না নম্বরটি পাওয়া থেকে আসে , যেখানেএকজনগুলিবিগুলিএকজনবিপি(একজন)=পি(বি)=0.558এক্স যেমন যে 1-এফ(এক্স;100;0.5)<αএফ হ'ল সংশ্লেষীয় দ্বি-দ্বি বিতরণ।

অনুরূপ যুক্তি আপনাকে অন্যান্য পরীক্ষার জন্য "অনিবার্যতা পয়েন্ট" সন্ধান করতে দেয় যেখানে:

  1. মোট নমুনার আকার * স্থির, এবং
  2. প্রতিটি পর্যবেক্ষণ নমুনাতে একটি সীমাবদ্ধ পরিমাণ অবদান রাখে।

এটি সম্ভবত আপনার কার্যকর করা সহজ হবে - অফলাইনে থামার মানদণ্ড গণনা করুন এবং তারপরে এটি কেবল আপনার সাইটের কোডে প্লাগ করুন - তবে ফলাফলটি অনিবার্য না হলেই আপনি পরীক্ষাটি শেষ করতে ইচ্ছুক হলে আপনি প্রায়শই আরও ভাল করতে পারেন can , তবে এটির পরিবর্তনের খুব সম্ভাবনাও নেই।

একে স্টোকাস্টিক কার্টেলমেন্ট বলে । উদাহরণস্বরূপ, ধরুন, উপরের উদাহরণে, আমরা 57 এবং 2 এস দেখেছি । আমরা পুরোপুরি আত্মবিশ্বাসী বোধ করতে পারি, যদি একেবারে নিশ্চিত না হয় তবে 100 এর বাক্সে কমপক্ষে আরও এ রয়েছে এবং তাই আমরা থামতে পারি। ক্রিস্টোফার জেনিসন এবং ব্রুস টার্নবুলের এই পর্যালোচনা , বিভাগ 4 এ স্টোকাস্টিক কার্টাইলমেন্টের মাধ্যমে কাজ করে ; তাদের দীর্ঘতর বইও রয়েছে ; আপনি গুগল বইয়ের মাধ্যমে 10 অধ্যায়ে উঁকি দিতে পারেন। ডেরাইভেশন ছাড়াও বইয়ের এমন কিছু সূত্র রয়েছে যেখানে আপনি অন্তর্বর্তীকালীন পরীক্ষার ফলাফলগুলিতে কমবেশি প্লাগ করতে পারেন।একজনবিএকজন

এছাড়াও অন্যান্য অনেকগুলি পন্থা রয়েছে। গ্রুপ অনুক্রমিক পদ্ধতিগুলি এমন পরিস্থিতিতে তৈরি করা হয়েছে যেখানে আপনি কয়েকটি নির্দিষ্ট সংখ্যক বিষয় অর্জন করতে সক্ষম হতে পারবেন না এবং বিষয়গুলি পরিবর্তনশীল হারে কার্যকর হবে। আপনার সাইটের ট্র্যাফিকের উপর নির্ভর করে আপনি এটি সন্ধান করতে বা নাও পেতে পারেন।

CRAN এর চারপাশে বেশ কয়েকটি মোটামুটি R প্যাকেজগুলি ভেসে বেড়াচ্ছে, যদি এটিই আপনি আপনার বিশ্লেষণের জন্য ব্যবহার করছেন। শুরু করার জন্য একটি ভাল জায়গাটি আসলে ক্লিনিকাল ট্রায়ালস টাস্ক ভিউ হতে পারে , যেহেতু এই কাজটির বেশিরভাগ অংশ সেই ক্ষেত্র থেকে বেরিয়ে এসেছে।


[*] কেবলমাত্র কিছু বন্ধুত্বপূর্ণ পরামর্শ: খুব বড় সংখ্যক ডেটা পয়েন্ট থেকে গণনা করা তাত্পর্যপূর্ণ মূল্যবোধগুলি দেখার সময় সাবধান হন be আপনি আরো এবং আরো তথ্য সংগ্রহের হিসাবে, আপনি হবে অবশেষে একটি উল্লেখযোগ্য ফলাফল খুঁজে, কিন্তু এর প্রভাব জাভাস্ক্রিপ্টে গার্বেজ ছোট হতে পারে। উদাহরণস্বরূপ, আপনি যদি পুরো গ্রহকে জিজ্ঞাসা করেন যে তারা এ বা বি পছন্দ করে তবে আপনি সম্ভবত 50:50 বিভক্ত হওয়ার সম্ভাবনা খুব কমই, তবে বিভাজনটি যদি 50.001: 49.999 হয় তবে এটি সম্ভবত আপনার পণ্যটির পুনরায় রচনা করার পক্ষে উপযুক্ত নয়। এফেক্ট সাইজের (অর্থাত্ রূপান্তর হারের পার্থক্য )ও পরীক্ষা করে দেখুন!


1
আপনার ব্যবহারকারীদের উদ্বেগ স্পষ্টভাবে মোকাবেলা করতে: হ্যাঁ, আপনি অবশ্যই বিশ্লেষণের তাড়াতাড়ি শেষ করতে পারেন। ক্লিনিকাল ট্রায়ালগুলির জন্য এটি সর্বদা ঘটে - ড্রাগটি হ'ল এটির মারাত্মক সাফল্য যে তাদের কার্যকারিতার জন্য তাদের যথেষ্ট পরিমাণ ডেটা রয়েছে এবং নিয়ন্ত্রণ গ্রুপে আটকে থাকা লোকদের এটি দিতে চায় (বা সম্ভবত, ড্রাগটি বিশাল আবদ্ধ / জিনিস খারাপ করা)। তবে, পরীক্ষাটি বাড়ানো আরও বিতর্কিত - একাধিক "চেহারা "গুলির জন্য সংশোধন করার পদ্ধতি রয়েছে তবে আপনি সর্বাধিক এন ঠিক করার আগেই আরও ভাল হন - আপনি সর্বদা তাড়াতাড়ি থামতে পারেন!
ম্যাট ক্রাউস

2
এর জন্য ধন্যবাদ, আমি এই পরীক্ষা বন্ধ হওয়ার সাথে পুরোপুরি একমত, যদি পরীক্ষাটি অনিবার্য হয়, যা সত্যই অর্থবোধ করে! সেই সাথে 'যদি এটি সত্যিই অসম্ভব হয় তবে থামছে' আমি সন্দেহ করব যে একজন আসল ঘনত্ববাদী রাজি হবে। এটা বলে কি কম কিছু না: আরে, 95%? আমি বলব 93% এছাড়াও ভাল! আমি বলতে চাইছি 90% আত্মবিশ্বাসের সাথে সন্তুষ্ট থাকাও ভাল হবে, তবে ডেটা দেখার আগে ঘন ঘন বিশেষজ্ঞ হিসাবে!
সেবাস্তিয়াননিউবাউর

1
আমি কোনও খিলান-ঘনঘনবাদী নই, না আমি টিভিতে একটিও খেলি না, তবে আমার মনে হয় আপনি এখনও প্রথম দিকে থামার নিয়মের একটি যুক্তিসঙ্গত ঘনঘনবাদী ব্যাখ্যা রাখতে পারেন - যদি আমি এই পরীক্ষাটি 100 বার চালাতাম, তবে আমি কতবার পেলাম আমি যদি এখন সম্পূর্ণরূপে ছুটে যাই তবে আমি এখন বনাম থামিয়ে দিলে আলাদা উত্তর? আমি যে পর্যালোচনাটি সংযুক্ত করেছি তাতে উল্লেখ করা হয়েছে যে এটি সেই দুর্দান্ত মামলার মধ্যে একটি যেখানে একই সাথে যদিও বয়েশিয়ান এবং ফ্রিকোয়ালিস্টদের সন্তুষ্ট করা সম্ভব ...
ম্যাট ক্রাউজ

α

1
@ রাসেলএস.পিয়ার্স: আমি মনে করি এটি নির্ভর করে। স্পষ্টতই, কার্টেলমেন্টটি করবে না, তবে কিছু অন্যান্য পদ্ধতি তা করে। উদাহরণস্বরূপ ও'ব্রেইন এবং ফ্লেমিং পরীক্ষা আরও ডেটা ব্যবহার করতে পারে তবে এর আগে তাও প্রত্যাখ্যান করতে পারে এবং পোককের পরীক্ষা আরও বেশি। এটি স্পষ্টতই নির্দিষ্টকরণের উপর নির্ভর করে: উপরে লিঙ্কযুক্ত বইটির কিছু যুক্তিসঙ্গত মানগুলির সাথে উদাহরণ রয়েছে (প্রভাবের আকার: 0.25, আলফা = 0.05, শক্তি = 0.9, 5 চেহারা)। স্থির এন সংস্করণ প্রত্যাখ্যান করতে 170 বিষয় প্রয়োজন; ওবিএফ সংস্করণটির সর্বাধিক ১৮০ টি প্রয়োজন, এবং পোককের সর্বাধিক ২০৫ টি দরকার, তবে সাবজেক্টের প্রত্যাশিত সংখ্যা যথাক্রমে ১৩০ এবং ১১7।
ম্যাট ক্রাউস

1

আপনি তাড়াতাড়ি থামতে পারেন, তবে আপনি যদি করেন তবে আপনার পি-মানগুলি সহজে ব্যাখ্যা করা যায় না। যদি আপনি আপনার পি-মানটির ব্যাখ্যাটি বিবেচনা করেন না, তবে আপনার প্রথম দুটি প্রশ্নের উত্তর যেভাবে 'না' তা গুরুত্বপূর্ণ নয় (খুব বেশি)। আপনার ক্লায়েন্টটি বাস্তববাদী বলে মনে হচ্ছে, সুতরাং পি-ভ্যালুটির সত্যিকারের ব্যাখ্যা সম্ভবত আপনার যত্ন নেওয়া কোনও সূক্ষ্ম বিন্দু নয়।

আপনার প্রস্তাবিত দ্বিতীয় পদ্ধতির সাথে আমি কথা বলতে পারব না।

যাইহোক, প্রথম পদ্ধতির দৃ ground় ভিত্তিতে নয়। দ্বি-দ্বি বিতরণের সাধারণ অনুমানগুলি কম অনুপাতের জন্য বৈধ নয় (যা পদ্ধতিটি পাওয়ার.প্রপ.টাস্ট ব্যবহারগুলি, তার ক্ষমতার শাস্ত্রীয় বইতে কোহেন ব্যবহৃত পদ্ধতি)। তদুপরি, আমি যতদূর অবগত, দ্বি-নমুনা অনুপাত পরীক্ষার জন্য কোনও বদ্ধ ফর্ম শক্তি বিশ্লেষণ সমাধান নেই (সিএফ । সাধারণ আনুমানিকতা ব্যবহার না করেই কীভাবে একটি দ্বি-গ্রুপ দ্বিপদী শক্তি বিশ্লেষণ সম্পাদন করা যায়? )। অনুপাতের আস্থা অন্তরগুলি প্রায় কাছাকাছি করার আরও ভাল পদ্ধতি রয়েছে (সিএফ। প্যাকেজ বিনোম))। আংশিক সমাধান হিসাবে আপনি নন-ওভারল্যাপিং আত্মবিশ্বাসের ব্যবধানগুলি ব্যবহার করতে পারেন ... তবে এটি পি-মান অনুমান করার মতো নয় এবং এইভাবে সরাসরি বিদ্যুতের পথ সরবরাহ করে না। আমি আশা করি কারও কারও কাছে একটি সুন্দর বদ্ধ ফর্ম সমাধান রয়েছে যা তারা আমাদের বাকিদের সাথে ভাগ করে নেবে। যদি আমি কোনওটিতে হোঁচট খায় তবে আমি উপরের রেফারেন্সিত প্রশ্নটি আপডেট করব। শুভকামনা।

সম্পাদনা: আমি যখন এটি সম্পর্কে চিন্তা করছি, আমাকে এক মুহুর্তের জন্য এখানে সম্পূর্ণ ব্যবহারিক বলি। আপনার ক্লায়েন্টরা এই পরীক্ষাটি শেষ হতে চায় যখন তারা নিশ্চিত হয় যে পরীক্ষামূলক সাইটটি নিয়ন্ত্রণ সাইটের চেয়ে আরও ভাল কাজ করছে। আপনি একটি শালীন নমুনা পাওয়ার পরে, আপনি যদি কোনও সিদ্ধান্ত নিতে প্রস্তুত না হন, কেবল আপনার বিজয়ী নির্ধারণের অনুপাতটি যে কোনও পক্ষেই 'বিজয়ী' এর সাথে সামঞ্জস্য করতে শুরু করুন। যদি এটি কেবল একটি ব্লিপ হয় তবে গড়ের দিকে রিগ্রেশনটি পিছলে যাবে, আপনি কম নির্দিষ্ট হয়ে উঠবেন এবং অনুপাতটি সহজ করবেন। আপনি যখন যুক্তিসঙ্গতভাবে নিশ্চিত হন, এটিকে কলটি হিসাবে কল করুন এবং বিজয়ী হিসাবে ঘোষণা করুন। সর্বোত্তম পদ্ধতির মধ্যে সম্ভবত বায়েশিয়ান আপডেট হওয়া জড়িত, তবে আপনাকে নির্দেশ দেওয়ার জন্য আমার মাথার উপরের অংশটি সম্পর্কে আমি যথেষ্ট পরিমাণে জানি না। তবে আমি আপনাকে আশ্বস্ত করতে পারি যে এটি সময়ে সময়ে স্বজ্ঞাত হিসাবে মনে হলেও গণিত নিজেই এতটা কঠিন নয় hard


0

আপনার কাছে যে প্রশ্নগুলি রয়েছে তা হল স্ট্যাটিস্টিকাল টেস্টে উত্থাপিত সাধারণ প্রশ্ন questions সেখানে পরিসংখ্যানের দুটি 'স্বাদ' রয়েছে, ঘন ঘন ঘনবাদী এবং বায়সিয়ান। আপনার উভয় প্রশ্নের ঘন ঘন উত্তর এটি সহজ:

  • কোন
  • না, আপনি তাড়াতাড়ি থামতে পারবেন না
  • না, আপনি আর কিছুক্ষণ পরিমাপ করতে পারবেন না

একবার আপনি আপনার সেটআপটি সংজ্ঞায়িত করার পরে, আপনি এমনকি ডেটা (অন্ধ বিশ্লেষণ) দেখার জন্যও অনুমোদিত নন। ঘনঘনবাদী দৃষ্টিকোণ থেকে, কাছাকাছি উপায় নেই, প্রতারণার কোনও কৌশল নেই! (সম্পাদনা: অবশ্যই এটি করার চেষ্টা রয়েছে, এবং সঠিকভাবে ব্যবহার করা হলে এগুলিও কাজ করবে, তবে তাদের বেশিরভাগ পক্ষপাতিত্ব পরিচয় করিয়ে দেওয়ার জন্য পরিচিত))

তবে এখানে বেয়েশিয়ান দৃষ্টিভঙ্গি রয়েছে, যা একেবারেই আলাদা। বয়েসিয়ান পদ্ধতির ঘন ঘনত্বে একটি অতিরিক্ত ইনপুট, পূর্ব-সম্ভাবনার সম্ভাবনা বিতরণের বিপরীতে প্রয়োজন। আমরা এটিকে পূর্বের জ্ঞান বা কুসংস্কারও বলতে পারি। এটি থাকার পরে, আমরা আমাদের জ্ঞানকে এ-পোস্টেরিয়েরিয়ায় আপডেট করতে ডেটা / পরিমাপটি ব্যবহার করতে পারি। মুল বক্তব্যটি হ'ল, আমরা ডেটা ব্যবহার করতে পারি এবং আরও অনেকগুলি, আমরা পরিমাপের প্রতিটি মধ্যবর্তী পয়েন্টে ডেটা ব্যবহার করতে পারি। প্রতিটি আপডেটে, সর্বশেষ পোস্টটি আমাদের নতুন পূর্ব এবং আমরা এটি আমাদের আপ টু ডেট জ্ঞানের সাথে একটি নতুন পরিমাপের সাথে আপডেট করতে পারি। কোনও তাড়াতাড়ি থামার সমস্যা নেই!

আমি দেখেছি একটি টক আপনি সমস্যার মত খুবই অনুরূপ আলোচনা এবং আমি উপরে বর্ণিত: http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JoAnnAlvarez/BayesianAdaptivePres.pdf

তবে এর পাশেই, আপনি কি সত্যই নিশ্চিত যে আপনার এটির আদৌ প্রয়োজন? দেখে মনে হচ্ছে কোনও অনুরোধটি কোথায় লিঙ্ক করবেন তা সিদ্ধান্ত নিয়ে আপনার কিছু সিস্টেম চলছে। এর জন্য আপনাকে প্রমাণ করার দরকার নেই যে অনুমানের পরীক্ষার সাথে আপনার সিদ্ধান্তগুলি পরিসংখ্যানগত দিক থেকে সঠিক। আপনি কি কখনও কোক কিনেছেন, কারণ আপনি 95% সম্ভাব্যতার সাথে পেপসি 'ঠিক' এখন বাদ দিতে পারেন? একটি হাইপোথিসিস বাদ দিয়ে নয়, যা কেবল ভাল এটি গ্রহণ করা যথেষ্ট। এটি একটি তুচ্ছ আলগোরিদিম হবে: A এর হারের অনিশ্চয়তা গণনা করুন, বি এর আনসারেন্টিটি গণনা করুন উভয় হারের পার্থক্য নিন এবং পার্থক্যের অনিশ্চয়তা বিভক্ত করুন। ফলাফল সিগমার মধ্যে পার্থক্যটির তাৎপর্যের মতো কিছু। তারপরে কেবলমাত্র সমস্ত লিঙ্কগুলি নিয়ে যান যেখানে দুটি বা তিনটি সিগমার পার্থক্য রয়েছে। অপূর্ণতা


1
আমি মনে করি আপনার প্রথম চারটি অনুচ্ছেদে কিছুটা লাল রঙের হারিং - অন্তর্বর্তী পর্যবেক্ষণের জন্য ঘন ঘন অভিভাবক রয়েছে। এটি সত্য যে (বেয়েসিয়ান) উত্তরোত্তর আপডেটগুলি এটিকে নিজের জন্য খুব সুন্দরভাবে ধার দেয় তবে আপনি এই সমস্যাটি অনেকগুলি উপায়ে ফ্রেম করতে পারেন। স্লাইডগুলির পয়েন্টারের জন্য ধন্যবাদ!
ম্যাট ক্রাউস

যাইহোক +1 - বায়েশিয়ান পদ্ধতির সম্ভবত এখানে যে কোনও ঘনঘনবাদী ফিক্সের চেয়ে পরিষ্কার headed
রাসেলপিয়ার্স

2
হ্যাঁ, এই আছে ... মেম ... বায়েশিয়ান পদ্ধতিগুলি কোনও জটিলতা ছাড়াই অবিরাম ডেটা দেখে। তবে সামগ্রিক টাইপ আই ত্রুটির হার আসলে নিয়ন্ত্রণ করা হয় না (কেন হবে?) এবং অনেকগুলি "চেহারা" পরে এটি নির্বিচারে বড় হতে পারে। আপনি এটি যথাযথ পূর্বের সাথে সঞ্চার করতে পারেন, বা আপনি যুক্তি দিতে পারেন যে টাইপ আই ত্রুটি নিয়ন্ত্রণ করা লম্পট, তবে এটি এমন নয় যে সমস্ত বায়েশিয়ান কৌশল একটি চঞ্চল।
ম্যাট ক্রাউস

0

সম্ভবত কিছু পদ্ধতি সেখানে ব্যবহার করা যেতে পারে

  • Pocock
  • ও'ব্রায়েন এবং ফ্লেমিং
  • Peto

এটি ফলাফলের উপর ভিত্তি করে পি কাটফাকে সামঞ্জস্য করবে এবং ডেটা সংগ্রহ বন্ধ করতে এবং সংস্থানসমূহ এবং সময়কে অর্থনৈতিকভাবে সহায়তা করবে।

হয়তো অন্যান্য কাজ এখানে যুক্ত করা যেতে পারে।


আপনি কি আপনার বুলেট পয়েন্টের জন্য লিঙ্ক বা আরও তথ্য সরবরাহ করতে পারেন?
এন্টোইন

আমার কাছে সেই নিবন্ধগুলি নেই কারণ আমি একটি পর্যালোচনা নিবন্ধ ব্যবহার করেছি যা এগুলি উদ্ধৃত করছে, আমার অর্থ পদ্ধতির দিকগুলি আলাদা তবে আমি আপনাকে চিকিত্সা ক্ষেত্রে পরিচালনা করতে পারেন এমন নিবন্ধটি সুপারিশ করতে পারি: ক্লিনিকাল ট্রায়ালগুলিতে অভিযোজিত নমুনার আকার পরিবর্তন: ছোট থেকে শুরু করুন আরো জিজ্ঞাস কর? ক্রিস্টোফার জেনিসোনা * † এবং ব্রুসডাব্লু। টার্নবুলব
হ্যাপিম্যান 20
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.