যদি আমি সঠিকভাবে গণনা করি, লজিস্টিক রিগ্রেশন টি-টেস্টের মতো একই ক্ষমতাযুক্ত। এটি দেখতে, এর লগ সম্ভাবনাটি লিখুন এবং তার হেসিয়ান এর প্রত্যাশাটিকে তার বিশ্বব্যাপী সর্বোচ্চ (এটির নেতিবাচক এমএল সমাধানের ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স অনুমান করে) গণনা করুন। সাধারণ লজিস্টিক প্যারামিটারাইজেশন নিয়ে বিরক্ত করবেন না: প্রশ্নে দু'টি সম্ভাব্যতার সাথে এটিকে পরামিতি করা সহজ। বিবরণটি কীভাবে আপনি লজিস্টিক রিগ্রেশন সহগের তাত্পর্যটি পরীক্ষা করেন তার উপর নির্ভর করবে (বেশ কয়েকটি পদ্ধতি রয়েছে)।
এই পরীক্ষাগুলির অনুরূপ ক্ষমতাগুলি খুব আশ্চর্যজনক হওয়া উচিত নয়, কারণ এমএল অনুমানের জন্য চি-বর্গ তত্ত্বটি লগের সম্ভাবনার একটি সাধারণ অনুমানের উপর ভিত্তি করে এবং টি-টেস্ট অনুপাতের বিতরণে একটি সাধারণ অনুমানের উপর ভিত্তি করে। বিষয়টির জটিলতাটি হ'ল উভয় পদ্ধতিই দুটি অনুপাতের একই অনুমান করে এবং উভয় অনুমানের ক্ষেত্রে একই স্ট্যান্ডার্ড ত্রুটি রয়েছে।
একটি বাস্তব বিশ্লেষণ আরও বিশ্বাসযোগ্য হতে পারে। আসুন একটি নির্দিষ্ট গোষ্ঠীতে (এ বা বি) মানগুলির জন্য কিছু সাধারণ পরিভাষা গ্রহণ করি:
- হল 1 এর সম্ভাব্যতা।পি
- প্রতিটি অঙ্কনের আকারের আকার।এন
- অঙ্কনের সেটের সংখ্যা।মি
- হ'ল ডেটার পরিমাণ।এন= মি এন
- (থেকে সমান 0 বা 1 ) এর মান ঞ তম মধ্যে ফলাফলের আমি তম স্বপক্ষে সেট।টআমি জে01jthith
- বেশী মোট সংখ্যা হয় আমি তম স্বপক্ষে সেট।kiith
- এর মোট সংখ্যা।ট
লজিস্টিক রিগ্রেশন মূলত এমএল অনুমানক । এটির লগারিদম দ্বারা প্রদত্তপি
লগ( এল ) = কে লগ(p)+(N−k)log(1−p).
প্যারামিটার এর সাথে সম্পর্কিত এর ডেরাইভেটিভগুলিp
∂log(L)∂p=kp−N−k1−p and
−∂2log(L)∂p2=kp2+N−k(1−p)2।
প্রথম শূন্য উৎপাদনের এমএল অনুমান সেট পি = ট / এন এবং প্লাগিং দ্বিতীয় মত প্রকাশের পারস্পরিক মধ্যে ভ্যারিয়েন্স উৎপাদ পি ( 1 - পি ) / এন , যা মান ত্রুটি বর্গ হয়।পি^= কে / এনপি^( 1 - পি^) / এন
টি পরিসংখ্যাত তথ্য স্বপক্ষে সেট দ্বারা গ্রুপকৃত উপর ভিত্তি করে estimators থেকে প্রাপ্ত হবে; যথা, অর্থের পার্থক্য হিসাবে (গ্রুপ এ থেকে একটি এবং দ্বিতীয় গ্রুপ বি থেকে) এই পার্থক্যের স্ট্যান্ডার্ড ত্রুটি দ্বারা বিভক্ত, যা মাধ্যমের মানক বিচ্যুতি থেকে প্রাপ্ত। তারপরে একটি নির্দিষ্ট গোষ্ঠীর জন্য গড় এবং মানক বিচ্যুতিটি দেখি। গড় সমান , যা এমএল মূল্নির্ধারক অভিন্ন পি । প্রশ্নে স্ট্যান্ডার্ড বিচ্যুতি হ'ল ড্রয়ের মানেটির প্রমিত বিচ্যুতি; এটি হ'ল, এটি k i / n এর সেটটির মানক বিচ্যুতি । এখানে বিষয়টির জটিলতা রয়েছে, তাই আসুন কিছু সম্ভাবনাগুলি ঘুরে দেখি।কে / এনপি^টআমি/ এন
মনে করুন ডেটা একেবারে আঁকায় ভাগ করা হয়নি: এটি হ'ল এবং মি = এন । ট আমি ড্র মাধ্যম। তাদের নমুনা ভ্যারিয়েন্স সমান এন / ( এন - 1 ) বার পি ( 1 - পি ) । এটি থেকে এটি অনুসরণ করে যে স্ট্যান্ডার্ড ত্রুটিটি L এর একটি ফ্যাক্টর বাদে এমএল স্ট্যান্ডার্ড ত্রুটির সাথে সমান √n = 1মি = এনটআমিএন/ (এন- 1 )পি^( 1 - পি^) , যা মূলত1যখনএন=1800 হয়। অতএব - এই ক্ষুদ্রতম পার্থক্য বাদে - লজিস্টিক রিগ্রেশন ভিত্তিক কোনও পরীক্ষা একটি টেস্টের মতো হবে এবং আমরা মূলত একই শক্তি অর্জন করব।এন/ (এন- 1 )---------√1এন= 1800
যখন ডেটাগুলি শ্রেণিবদ্ধ করা হয়, তখন এর (সত্য) প্রকরণটি পি ( 1 - পি ) / এন এর সমান হয় কারণ পরিসংখ্যান k আমি এন বার্নোল্লি ( পি ) ভেরিয়েবলের যোগফলকে প্রতিনিধিত্ব করে , প্রতিটি ভেরিয়েন্ট পি ( 1 - পি) সহ ) । সুতরাং এই মানগুলির মিটার গড়ের প্রত্যাশিত মান ত্রুটি হল পি ( 1 - পি ) / এন / মি = এর বর্গমূলটআমি/ এনপি ( 1 - পি ) / এনটআমিএনপিপি ( 1 - পি )মি , ঠিক আগের মতো।পি ( 1 - পি ) / এন / এম = পি ( 1 - পি ) / এন
সংখ্যা 2 ইঙ্গিত পরীক্ষা শক্তি কিভাবে স্বপক্ষে ভাগ করা হয় (যে সঙ্গে কেমন, সঙ্গে appreciably পরিবর্তিত হতে করা উচিত নয় এবং এন সাপেক্ষে বৈচিত্রময় মিটার ঢ = এন নমুনা সমন্বয় থেকে একটি মোটামুটি ছোট প্রভাব থেকে), পৃথক্ সম্ভবত বৈকল্পিকতা (যদি আপনি এতটা নির্বোধ না হন তবে প্রতিটি দলের মধ্যে অঙ্কের কয়েকটি সেট ব্যবহার করতে পারেন)মিএনm n = N
এম = 900 , এন = 1 (মূলত লজিস্টিক রিগ্রেশন) জড়িত থেকে পি = 0.74 (10,000 পুনরাবৃত্তিগুলির সাথে) এর সাথে তুলনা করার সীমাবদ্ধ সিমুলেশন ; মি = এন = 30 ; এবং এম = 2 , এন = 450 (স্যাম্পল ভেরিয়েন্স অ্যাডজাস্টমেন্ট সর্বাধিক করে তোলা) এটি সহ্য করে: শক্তি ( α = 0.05 এপি = 0.70পি = 0.74মি = 900 , এন = 1মি = এন = 30মি = 2 , এন = 450। = 0.05, প্রথম দিকের ক্ষেত্রে একতরফা) ০.০৯ এবং তৃতীয় ক্ষেত্রে, যেখানে সমন্বয় ফ্যাক্টর একটি উপাদান পরিবর্তন করে (এখন 1798 বা 58 এর পরিবর্তে স্বাধীনতার মাত্র দুটি ডিগ্রি রয়েছে), এটি 0.36 এ নেমে আসে। থেকে পি = 0.52 এর সাথে তুলনা করা অন্য একটি পরীক্ষা যথাক্রমে 0.22, 0.21 এবং 0.15 এর শক্তি দেয়: আবার, আমরা ড্রগুলিতে (= লজিস্টিক রিগ্রেশন) কোনও গ্রুপিং থেকে 30 টি গ্রুপে বিভক্ত হওয়ার থেকে সামান্য ড্রপ পর্যবেক্ষণ করি এবং যথেষ্ট ড্রপ ডাউন মাত্র দুটি গ্রুপ।পি = 0.50পি = 0.52
এই বিশ্লেষণের নৈতিকতা হ'ল :
- আপনি হারান অনেক যখন আপনি আপনার পার্টিশন না সংখ্যক ডেটা মান মি "আকর্ষণ" অপেক্ষাকৃত ছোট ছোট দলের।এনমি
- আপনি অল্প সংখ্যক গোষ্ঠী ব্যবহার করে প্রশংসনীয় শক্তি হারাতে পারেন ( ছোট, এন - প্রতিটি গ্রুপে ডেটা পরিমাণ - বড় largeমিএন
- আপনার ডেটা মানগুলিকে একেবারে "ড্র" তে গ্রুপিং না করা সেরা । কেবল তাদের যেমন রয়েছে তেমনি বিশ্লেষণ করুন (লজিস্টিক রিগ্রেশন এবং টি-টেস্টিং সহ কোনও যুক্তিসঙ্গত পরীক্ষা ব্যবহার করে)।এন