আংশিক জোড়যুক্ত এবং আংশিকভাবে আনকিয়ারড ডেটার জন্য টি-পরীক্ষা


28

একজন তদন্তকারী বেশ কয়েকটি ডেটাসেটের সম্মিলিত বিশ্লেষণ উত্পাদন করতে চান। কিছু ডেটাসেটে এ এবং বি চিকিত্সার জন্য জোড় করা পর্যবেক্ষণ রয়েছে আবার অন্যগুলিতে অপ্রাপ্ত এ এবং / বা বি ডেটা রয়েছে। আমি এই জাতীয় আংশিক জোড়যুক্ত ডেটার জন্য টি-টেস্টের অভিযোজন বা সম্ভাবনা অনুপাতের পরীক্ষার জন্য একটি রেফারেন্স খুঁজছি। আমি (এখনকার জন্য) সমান বৈচিত্র্য সহ স্বাভাবিকতা ধরে নিতে ইচ্ছুক এবং জনসংখ্যার অর্থ হ'ল প্রতিটি অধ্যয়নের জন্য (এবং একইভাবে বি) সমান for


2
হাই ফ্র্যাঙ্ক মডেলিং অনুমানগুলি আরও স্পষ্ট করে তুলতে এটি সহায়ক হবে। সাধারণত যখন আমি জোড় করা ডিজাইনগুলির কথা ভাবি, তখন আমি নীচেরগুলির মধ্যে একটি সম্পর্কে চিন্তা করি (i) স্থির অলক্ষণীয় ইউনিট-স্তর প্রভাবগুলি অপসারণের চেষ্টা করা, (ii) পরীক্ষামূলক ইউনিটগুলিতে একটি এলোমেলো প্রভাবের পরিবর্তনশীলতা হ্রাস করা, বা (iii) অস্বাভাবিকতার জন্য সামঞ্জস্য করা জোড়াগুলির মধ্যে পার্থক্য নিয়ে প্রতিক্রিয়াটি, এভাবে আরও ভাল অনুমান করা। বিশেষত, আমি সঙ্গে সঙ্গে মিলিত জোড়গুলিতে কোনও উপকার দেখতে পাচ্ছি না যদি নালীর নীচে অনুমান করা হয় যে পর্যবেক্ষণগুলি সমস্ত আইডি স্বাভাবিক।
কার্ডিনাল

4
কার্ডিনাল, আমি আসলে প্রচুর ডেটা পেয়েছি যা দেখতে এটির মতো দেখাচ্ছে। আমরা সম্পূর্ণ জোড়যুক্ত ডেটা সংগ্রহ করার চেষ্টা করছিলাম, তবে প্রযুক্তিগত সমস্যা বা দুর্ভাগ্যের কারণে, এ বা বি এর অধীনে কিছু নমুনার পরিমাপ কখনও কখনও নষ্ট হয়ে যায়। দুটি সুস্পষ্ট - তবে অসন্তুষ্ট - সমাধানগুলি হ'ল 1) সমস্ত অসম্পূর্ণ জুটি ফেলে দিন এবং একটি জোড় করা টি-টেস্ট করুন, বা 2) জুটিটিকে উপেক্ষা করুন এবং সমস্ত ডেটা জুড়ে একটি অযৌক্তিক টি-টেস্ট করুন। আমি মনে করি যে পোস্টারটি যেখানে জুটি আছে সেখানে সুবিধা অর্জনের জন্য একটি উপায় জিজ্ঞাসা করছে (আপনার কারণের জন্য # 1 এবং # 2), অপ্রাপ্ত, ডেটা পয়েন্টগুলি থেকে তিনি যা কিছু পারেন তা উদ্ধার করার সময়।
ম্যাট ক্রাউস

2
আমি সব মতামত প্রশংসা করি। ম্যাচড জোড়ার ক্ষেত্রে দুটি এবং এ উভয়ের অধীনে পরীক্ষা করা হয়েছিল এই জুড়িটি উত্তোলনের এক উপায় হ'ল এ এবং বি এর মধ্যকার পার্থক্যের জন্য বুটস্ট্র্যাপ ননপ্যারমেট্রিক পার্সেন্টাইল কনফিডেন্স ইন্টারভাল ব্যবহার করা, এটি ক্লাস্টার বুটস্ট্র্যাপ ব্যবহারের সাথে জড়িত থাকবে, প্রতিস্থাপনের সাথে নমুনা তৈরি করে বিষয়। এমন কোনও বিষয় যা যুক্ত করা ডেটা নেই সেগুলির একটি পর্যবেক্ষণ একটি রেসামলে রাখা বা মুছে ফেলা হবে এবং জোড়াযুক্ত ডেটাতে দুটি রেকর্ড রাখা বা মুছে ফেলা হবে। এটি জুটির সম্মান দেখায় বলে মনে হয় তবে একটি অনুমানের সংজ্ঞা দেওয়া দরকার এবং আমরা অনুকূলতা সম্পর্কে জানি না।
ফ্র্যাঙ্ক হ্যারেল

1
বায়েশিয়ান পদ্ধতির প্রয়োগ করা সহজ।
স্টাফেন লরেন্ট

2
হানি এম সামাভি এবং রবার্ট ভোগেল, প্রয়োগকৃত পরিসংখ্যান জার্নাল (২০১৩): আংশিকভাবে সম্পর্কযুক্ত ( জোড়যুক্ত
সুরেশ

উত্তর:


6

গুও এবং ইউয়ান একটি বিকল্প পদ্ধতির পরামর্শ দেয় যা সামাভি এবং ভোগেলের পুলযুক্ত টি-টেস্ট থেকে উত্সাহিত সর্বোত্তম পুলড টি-টেস্ট বলে।

রেফারেন্সের লিঙ্ক: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.865.734&rep=rep1&type=pdf

এই পরিস্থিতির জন্য একাধিক বিকল্প সহ দুর্দান্ত পড়া।

মন্তব্য করতে নতুন তাই দয়া করে আমাকে অন্য কিছু যুক্ত করার প্রয়োজন হলে আমাকে জানান।


8

ঠিক আছে, আপনি যদি জোড় ছাড়ানো এবং জোড় (যা সাধারণত ভাল চুক্তি আরও ছোট হবে) এর বিভিন্নতাগুলি জানতেন, তবে গ্রুপগুলির মধ্যে পার্থক্যের দুটি অনুমানের সর্বোত্তম ওজন হ'ল ব্যক্তির বৈচিত্রের বিপরীতে আনুপাতিক আনুপাতিক অর্থ পার্থক্য অনুমান।

[সম্পাদনা: দেখা যাচ্ছে যে যখন বৈকল্পগুলি অনুমান করা হয়, তখন এটিকে গ্রেবিল-ডিল অনুমানক বলে। এটিতে বেশ কয়েকটি কাগজপত্র রয়েছে। এখানে একটি]

ভেরিয়েন্সটি অনুমান করার প্রয়োজনীয়তা কিছুটা অসুবিধা সৃষ্টি করে (ভেরিয়েন্স অনুমানের ফলাফল অনুপাত এফ, এবং আমি মনে করি ফলাফলের ওজনগুলির একটি বিটা বিতরণ রয়েছে, এবং ফলস্বরূপ পরিসংখ্যান একধরণের জটিল) তবে আপনি যেহেতু বুটস্ট্র্যাপিং বিবেচনা করছেন, তাই এটি হতে পারে উদ্বেগ কম।

একটি বিকল্প সম্ভাবনা যা কিছুটা দিক থেকে ভাল হতে পারে (বা স্বাভাবিকের তুলনায় কমপক্ষে আরও কিছুটা শক্তিশালী, যেহেতু আমরা বৈকল্পিক অনুপাতের সাথে খেলছি) স্বাভাবিকভাবে দক্ষতার খুব কম ক্ষতি হ'ল শিফট অফের সম্মিলিত অনুমান করা জোড়যুক্ত এবং অযৌক্তিক র‌্যাঙ্ক পরীক্ষা - প্রতিটি ক্ষেত্রে জোড় ক্রস-নমুনা পার্থক্যগুলির মধ্যবর্তীদের এবং জোড়-গড়-গড়-জুটি-পার্থক্যের মধ্যমদের জোড়যুক্ত ক্ষেত্রে জোড়ের ক্ষেত্রে একজোড়া হজস-লেহম্যান অনুমান। আবার, উভয়ের নূন্যতম বৈকল্পিক ওজনযুক্ত রৈখিক সংমিশ্রণটি বৈকল্পিকগুলির বিপরীতে সমানুপাতিক ওজনের সাথে হবে। সেক্ষেত্রে আমি সম্ভবত বুটস্ট্র্যাপের পরিবর্তে কোনও ক্রম (/ র্যান্ডমাইজেশন) এর দিকে ঝুঁকতাম - তবে আপনি কীভাবে নিজের বুটস্ট্র্যাপ প্রয়োগ করেন তার উপর নির্ভর করে তারা একই জায়গায় শেষ করতে পারে।

উভয় ক্ষেত্রেই আপনি নিজের বৈকল্পিকগুলি শক্তিশালী করতে / আপনার বৈকল্পিক অনুপাতকে সঙ্কুচিত করতে চাইতে পারেন। ওজনের জন্য ডান বলপার্কে প্রবেশ করা ভাল, তবে আপনি এটিকে সামান্য শক্তিশালী করে স্বাভাবিকের খুব কম দক্ষতা হারাবেন। ---

কিছু অতিরিক্ত চিন্তা আমার মাথায় আগে পরিষ্কারভাবে সাজানো হয়নি:

এই সমস্যাটির বহেরেস-ফিশার সমস্যার সাথে আলাদা আলাদা মিল রয়েছে তবে এটি আরও শক্ত।

আমরা যদি ওজন সংশোধন, আমরা পারে শুধু একটি ওয়েলশ-Satterthwaite টাইপ পড়তা মধ্যে অংশ; সমস্যার কাঠামো একই রকম।

আমাদের সমস্যাটি হ'ল আমরা ওজনকে সর্বোত্তম করতে চাই, যার কার্যকরভাবে বোঝা ওজন স্থির হয় না - এবং প্রকৃতপক্ষে পরিসংখ্যানকে সর্বাধিকতর করতে ঝোঁক দেয় (কমপক্ষে প্রায় বৃহত নমুনায় প্রায় আরও বেশি, যেহেতু ওজনের কোনও সেট একই পরিমাণ নির্ধারণ করে এলোমেলো পরিমাণে সংখ্যক, এবং আমরা ডিনোমিনেটরকে হ্রাস করার চেষ্টা করছি; দুজন স্বতন্ত্র নয়)।

এটি, আমি প্রত্যাশা করি, চি-বর্গের আনুমানিকতা আরও খারাপ করে দেবে এবং প্রায় অবশ্যই আরও একটি অনুমানের ডিএফকে প্রভাবিত করবে।

[যদি এই সমস্যার করা সম্ভব হয়, এছাড়াও আছে শুধু পারে আউট একটি চলতি নিয়ম যে বলতে হবে 'আপনি প্রায় হিসাবে ভাল যদি আপনি শুধুমাত্র এই অন্যান্য সেট অধীনে বিজোড় পরিস্থিতিতে এই সেট অধীনে শুধুমাত্র যুক্ত করা ডেটা ব্যবহার করতে পারি না হতে চালু শর্তাবলী এবং বাকি ক্ষেত্রে, এই স্থির ওজন-পরিকল্পনাটি সাধারণত 'অনুকূলের খুব কাছাকাছি থাকে - তবে আমি সেই সুযোগের অপেক্ষায় আমার নিঃশ্বাস ত্যাগ করব না। এই জাতীয় সিদ্ধান্তের নিয়ম প্রতিটি ক্ষেত্রে সত্যই তাত্পর্য নিয়ে সন্দেহাতীতভাবে প্রভাব ফেলবে, তবে যদি সেই প্রভাব এত বড় না হয়, তবে থাম্বের এ জাতীয় নিয়মটি লোকেদের বিদ্যমান উত্তরাধিকারী সফ্টওয়্যার ব্যবহারের জন্য একটি সহজ উপায় দিত, তাই এটি আকাঙ্ক্ষিত হতে পারে এইরকম পরিস্থিতিতে ব্যবহারকারীদের জন্য সেই জাতীয় কোনও শনাক্ত করার চেষ্টা করুন]]

---

সম্পাদনা করুন: স্বরে নোট করুন - ফিরে আসার দরকার আছে এবং 'ওভারল্যাপিং নমুনা' পরীক্ষাগুলির কাজের বিশদ পূরণ করতে হবে, বিশেষত ওভারল্যাপিং নমুনা টি-টেস্টগুলি

---

আমার কাছে এটি ঘটে যে একটি এলোমেলোকরণ পরীক্ষার ঠিকঠাক কাজ করা উচিত -

  • যেখানে ডেটা যুক্ত করা হয় আপনি এলোমেলোভাবে জোড়ের মধ্যে গ্রুপ লেবেলগুলিকে অনুমতি দিন

  • যেখানে ডেটা অপরিশোধিত তবে সাধারণ বিতরণ (নালীর নীচে) ধরে নেওয়া হয়েছে, আপনি গ্রুপের কার্যভারগুলি অনুমোদন করুন

  • w1=1/(1+v1v2)


(অনেক পরে যুক্ত)

সম্ভবত প্রাসঙ্গিক কাগজ:

ডেরিক, বি, রুশ বি, টোহর, ডি, এবং হোয়াইট, পি। (2017),
"দুটি নমুনার জন্য তুলনামূলক তুলনামূলক পরীক্ষার পরিসংখ্যান যা জোড়া এবং স্বতন্ত্র পর্যবেক্ষণ উভয়ই অন্তর্ভুক্ত করে"
আধুনিক প্রয়োগিত পরিসংখ্যান পদ্ধতি জার্নাল , মে , ভলিউম 16, নং 1, 137-157।
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm


1
+1 টি। আপনার উত্তরের শেষ অংশ সম্পর্কে আমার একটি প্রশ্ন আছে। অনুমানের পরীক্ষার জন্য আপনি কী পরিমাণ বৈকল্পিক অনুমান (যেমন কোন ওজন) ব্যবহার করবেন - প্রকৃত নমুনার উপর ভিত্তি করে প্রকৃত গণনা করা, বা আপনি সেই অনুমানের তথ্যের ভিত্তিতে প্রতিটি অনুচ্ছেদের জন্য ওজন গণনা করবেন?
অ্যামিবা বলছেন মনিকা পুনরায়

অ্যামিবা সঠিকভাবে হিসাবের নমুনা-ভিত্তিক প্রকৃতির জন্য অ্যাকাউন্ট করতে যা আপনি এটি নির্দিষ্ট ক্রমের ভিত্তিতে ভিত্তি করে যাচ্ছেন।
গ্লেন_বি -রিনস্টেট মনিকা

@ আমেবা আমার সমস্যার তুলনায় অন্য কয়েকটি পদ্ধতির সাথে এটি তুলনা করা উচিত।
গ্লেন_বি -রিনস্টেট মনিকা

1
যাইহোক, আমি এই থ্রেডটি পেরিয়ে এসেছি কারণ কেউ নিম্নলিখিত তথ্য নিয়ে আমার কাছে এসেছিলেন: জোড়যুক্ত ডেটা সহ দুটি বিষয় এবং অনির্দিষ্ট ডেটাযুক্ত দুটি বিষয় (যেমন গ্রুপ এ-তে 3 পরিমাপ, গ্রুপ বিতে 3 পরিমাপ, এই 6 মানগুলির 2+ এর মধ্যে 2+ 2 টি জোড় করা আছে এবং বাকীটি আনকৃত হয়)। এক্ষেত্রে অযৌক্তিক শিফ্ট অনুমানের বৈচিত্রটি অনুমান করার পক্ষে এটি পর্যাপ্ত তথ্য নয়, তাই আমি জুটি বাঁধতে এবং একটি অপরিশোধিত পরীক্ষা করা ছাড়া আর কিছু প্রস্তাব দিতে পারিনি ... তবে এটি অবশ্যই বেশ চরম পরিস্থিতি।
অ্যামিবা বলছেন মনিকাকে

6

এখানে কিছু চিন্তা। আমি মূলত গ্রেগ স্নো উপসংহারে পৌঁছে যাই যে এই সমস্যার বেহরেন্স-ফিশার সমস্যার সাথে আলাদা আলাদা মিল রয়েছে । হ্যান্ডউইভ এড়ানোর জন্য আমি প্রথমে কিছু স্বীকৃতি প্রবর্তন করি এবং অনুমানগুলি আনুষ্ঠানিকভাবে প্রবর্তন করি।

  • nxipAxipBi=1,,n
  • nAnBxiAi=1,,nAxiBi=1,,nB
  • প্রতিটি পর্যবেক্ষণ হ'ল রোগীর প্রভাব এবং চিকিত্সা প্রভাবের যোগফল। সংশ্লিষ্ট র্যান্ডম ভেরিয়েবলগুলি

    • XipA=Pi+TiAXipB=Pi+TiB
    • XiA=Qi+UiAXiB=Ri+ViB

    Pi,Qi,RiN(0,σP2)Tiτ,Uiτ,ViτN(μτ,σ2)τ=A,B

    • μA=μB

Xi=XipAXipBXiN(μAμB,2σ2)

XinXiAnAXiBnB

  • XN(μAμB,2nσ2)
  • XAN(μA,1nA(σP2+σ2))
  • XBN(μB,1nB(σP2+σ2))

পরবর্তী প্রাকৃতিক পদক্ষেপ বিবেচনা করা হয়

  • Y=X+XAXBN(2(μAμB),2nσ2+(1nA+1nB)(σP2+σ2))

σ2n1σP2+σ2nA1nB1(1nA+1nB)(σP2+σ2)nA+nB2Y

এই মুহুর্তে আমার ধারণা, আপনার সমস্যার সমাধান পাওয়ার জন্য বেহরেন্স ফিশার সমস্যার প্রস্তাবিত যে কোনও সমাধান প্লাগ-ইন করতে পারে।


1
আমি সূত্রে কয়েকটি টাইপস স্থির করেছি। দয়া করে চেক করুন!
কেজিটিল বি হলওয়ার্সন

5

আমার প্রথম চিন্তাটি একটি মিশ্র প্রভাবগুলির মডেল ছিল, তবে এটি ইতিমধ্যে আলোচনা করা হয়েছে তাই আমি এ বিষয়ে আর বলব না।

আমার অন্যান্য চিন্তাভাবনাটি হ'ল যদি তাত্ত্বিকভাবে সম্ভব হত যে আপনি সমস্ত বিষয়গুলির জুড়িযুক্ত ডেটা পরিমাপ করতে পারতেন তবে ব্যয়, ত্রুটি বা অন্য কোনও কারণে আপনার কাছে সমস্ত জুড়ি নেই, তবে আপনি আনকিয়ারড সাবজেক্টের জন্য অমীমাংসিত প্রভাবটি চিকিত্সা করতে পারবেন ইএম অ্যালগরিদম বা একাধিক অনুদানের মতো ডেটা এবং ব্যবহারের সরঞ্জাম হিসাবে (এলোমেলোভাবে অনুপস্থিতি যদি বিষয়টিকে কেবল 1 চিকিত্সার অধীনে পরিমাপ না করা হয় তবে তাদের পরিণতি অন্যান্য চিকিত্সার অধীনে কী হবে তা সম্পর্কিত না হলে যুক্তিসঙ্গত বলে মনে হয়)।

সর্বাধিক সম্ভাব্যতা (কেবলমাত্র বিষয় অনুসারে উপলব্ধ তথ্যের উপর ভিত্তি করে তৈরি সম্ভাবনা সহ) ব্যবহার করে ডেটাতে দ্বিঘাতের স্বাভাবিক মাপসই করা আরও সহজ হতে পারে, তারপরে বন্টনকে সমান বনাম বিভিন্ন উপায়ে তুলনা করার একটি সম্ভাবনা অনুপাত পরীক্ষা করুন।

আমার তত্ত্বের ক্লাসগুলির পরে এটি অনেক দীর্ঘ হয়েছে, সুতরাং আমি জানি না যে এগুলি কীভাবে অনুকূলতার সাথে তুলনা করে।


1
ধন্যবাদ গ্রেগ আমি কাস্টমাইজড সর্বাধিক সম্ভাবনার পদ্ধতির দিকে ঝুঁকছি।
ফ্র্যাঙ্ক হ্যারেল

4

এলোমেলো প্রভাব হিসাবে রোগীর সাথে মিশ্র মডেলিংয়ের উপায় হতে পারে। মিশ্র মডেলিংয়ের সাথে জুটিযুক্ত ক্ষেত্রে পারস্পরিক সম্পর্কের কাঠামো এবং আন-পেয়ার ক্ষেত্রে আংশিক মিসিংয়ের জন্য দায়বদ্ধ হতে পারে।


2
যেহেতু পৃথকভাবে বিশ্লেষণ করা হয় তখন ডেটাসেটগুলির মধ্যে যে কোনও একটি এলোমেলো প্রভাব ব্যবহার করতে নেতৃত্ব দেয় না, তাই আমি এখানে এলোমেলো প্রভাবগুলি কেন সহায়ক তা দেখছি না। তবে প্রতিটি বিষয়কে তার নিজস্ব সম্পর্কযুক্ত কাঠামো তৈরি করার অনুমতি দেওয়ার জন্য সাধারণ ন্যূনতম স্কোয়ারগুলি ব্যবহার করা সম্ভব হতে পারে। আনকৃত পর্যবেক্ষণগুলির সাথে পারস্পরিক সম্পর্ক শূন্য থাকবে। সম্পর্কে চিন্তাভাবনা মূল্যবান। ধন্যবাদ।
ফ্র্যাঙ্ক হ্যারেল

হ্যাঁ, আপনি ঠিক বলেছেন, পৃথকভাবে ব্যবহার করা হলে ডেটাসেটগুলির জন্য মিশ্র মডেলিংয়ের প্রয়োজন হবে না। তবে আপনি যদি সেগুলিকে একটি একক ডেটাশেটে সংযুক্ত করেন তবে আপনি জোড় করা ডেটাতে পারস্পরিক সম্পর্ককে সংযুক্ত করার জন্য পদ্ধতির ব্যবহার করতে পারেন এবং একই সাথে শূন্য সম্পর্কের উল্লেখ করে অযৌক্তিক ডেটা ব্যবহার করতে পারেন।
psj

1
হ্যাঁ; আমার পয়েন্ট একটি মিশ্র মডেল আপনি সহজেই লিস্ট স্কোয়ার সাধারণ (ব্যবহার যেমন আর এর ব্যবহার বিষয় নানারকম পারস্পরিক সম্পর্ক গঠন নির্দিষ্ট করতে পারেন হিসাবে একটি Overkill হতে পারে যে ছিল glsফাংশন nlme4প্যাকেজ।
ফ্রাঙ্ক Harrell

3

হানি এম সামাভি এবং রবার্ট ভোগেল প্রস্তাবিত একটি পদ্ধতিতে (প্রয়োগকৃত পরিসংখ্যান জার্নাল, 2013) টি টি-স্কোরকে স্বতন্ত্র এবং নির্ভরশীল নমুনাগুলির সাথে এমনভাবে যুক্ত করা যায় যাতে নতুন টি স্কোর সমান হয়

To=γ(μYμXSx2/nX+Sy2/nY)+(1γ)μDSD2/nD

Dγγ


1
T0
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.