কীভাবে পরীক্ষা / প্রমাণ উপাত্ত শূন্য হয়?


9

আমার একটি সমস্যা হয়েছে যা আমি মনে করি সহজ হওয়া উচিত তবে এটি সঠিকভাবে বের করতে পারি না। আমি বীজ পরাগায়নের দিকে তাকিয়ে আছি, আমার কাছে গাছগুলি (n = 36) ক্লাস্টারে ফুল রয়েছে, আমি প্রতিটি উদ্ভিদ থেকে 3 টি ফুলের ক্লাস্টার এবং প্রতিটি ক্লাস্টার থেকে 6 টি বীজ শুকানো (প্রতিটি উদ্ভিদ থেকে মোট 18 টি বীজ শুক) নমুনা করি। একটি পোডে প্রায় 0 থেকে 4 টি বীজ পরাগায়িত হতে পারে। সুতরাং, উপাত্ত একটি উপরের সীমা সহ গণনা করা হয়। আমি খুঁজে পেয়েছি গড়ে ~ 10% বীজ পরাগায়িত হয় তবে কোনও প্রদত্ত উদ্ভিদে 1 থেকে 30% এর মধ্যে যে কোনও জায়গায় ছড়িয়ে পড়ে, তাই ছড়িয়ে পড়া তথ্যের উপরে এবং অবশ্যই, 3 টি উদ্ভিদে 4 টি অনুপস্থিত গুচ্ছ প্রতিলিপি রয়েছে, সুতরাং নিখুঁতভাবে প্রতিসম নয় ।

আমি যে প্রশ্নটি জিজ্ঞাসা করছি তা হল এই ডেটা এই ধারণাকে সমর্থন করে যে এই উদ্ভিদটি বীজ সংক্রমণের জন্য পরাগরেণকদের প্রয়োজন।

আমি দেখতে পাচ্ছি যে কোনও পোদে বীজের সংখ্যার জন্য বিতরণ দেখে মনে হচ্ছে যে এখানে আরও 0 টি পরাগযুক্ত বীজ শুঁটি রয়েছে (16 এর মধ্যে 6-9 পোড) এবং আরও 3 এবং 4 পরাগযুক্ত বীজ শুক (প্রতিটিের জন্য 2-4) হবে জনসংখ্যার বীজগুলি কেবল এলোমেলোভাবে পরাগরেজনিত হলে আশা করা যায়। মূলত, আমি মনে করি এটি শূন্য স্ফীত তথ্যের জন্য সর্বোত্তম উদাহরণ, প্রথমে কোনও পোকা ফুলটি একেবারে দেখতে পায় না বা হয় না (একটি শূন্য জেনারেটর) এবং যদি এটি হয়, তবে অন্য বন্টনে 0-4 বীজকে পরাগায়িত করে। বিকল্প অনুমানটি হ'ল উদ্ভিদটি আংশিকভাবে স্বনির্ভর হয় এবং এরপরে আশা করা যায় যে প্রতিটি বীজ পরাগায়িত হওয়ার একই সম্ভাবনা থাকবে (এই তথ্যটি প্রায় 0.1 টি সম্ভাবনার প্রস্তাব দেয়, যার অর্থ একই পোদে দুটি বীজের জন্য 0.01 সুযোগ ইত্যাদি) ।

তবে আমি কেবল ডেটাটি এক বা অন্য বিতরণে সবচেয়ে ভাল ফিট করে তা প্রমাণ করতে চাই, আসলে ডেটাতে কোনও জিপ বা জিনব না করে। আমি মনে করি আমি যে কোনও পদ্ধতি ব্যবহার করি না কেন পরাগযুক্ত বীজের প্রকৃত সংখ্যা এবং প্রতিটি উদ্ভিদে নমুনাযুক্ত শুঁটির সংখ্যা বিবেচনা করা উচিত। আমি যে সর্বোত্তম জিনিসটি সামনে এলাম তা হ'ল কিছু ধরণের বুট স্ট্র্যাপ জিনিস যেখানে আমি এলোমেলোভাবে একটি নির্দিষ্ট উদ্ভিদের জন্য পরাগযুক্ত বীজের সংখ্যা নির্ধারিত বীজের শ্যাডের সংখ্যার মধ্যে নির্ধারণ করি, এটি 10,000 বার করুন এবং দেখুন এটি কতটা সম্ভব প্রদত্ত উদ্ভিদের জন্য পরীক্ষামূলক তথ্য সেই এলোমেলো বিতরণ থেকে বেরিয়ে এসেছিল।

আমি কেবল অনুভব করছি যে এ সম্পর্কে এমন কিছু আছে যা ব্রুট ফোর্স বুটস্ট্র্যাপিংয়ের চেয়ে অনেক সহজ হওয়া উচিত তবে চিন্তাভাবনা ও অনুসন্ধানের কয়েক দিন পরে আমি ছেড়ে দিচ্ছি। আমি কেবল পইসন বিতরণের সাথে তুলনা করতে পারি না কারণ এটি উপরের আবদ্ধ, এটি দ্বিপদী নয় কারণ আমার কোনওভাবে 1 ম প্রত্যাশিত বিতরণ উত্পন্ন করতে হবে। কোন চিন্তা? এবং আমি সেখানে আর পরামর্শ দিচ্ছি (বিশেষত কীভাবে সবচেয়ে সুন্দরভাবে এন বলগুলির 10,000 টি এলোমেলো বিতরণ 16 টি বাক্সে তৈরি করতে হবে যাতে প্রতিটি সর্বাধিক 4 বল থাকতে পারে) সর্বাধিক স্বাগত হবে।

9/07/2012 যুক্ত হয়েছে প্রথমে, সমস্ত আগ্রহ এবং সহায়তার জন্য আপনাকে সকলকে ধন্যবাদ। উত্তরগুলি পড়ার ফলে আমার প্রশ্নটিকে কিছুটা উচ্চারণ করতে ভাবতে বাধ্য করা হয়েছে। আমি যা বলছি তা হ'ল আমার একটি অনুমান আছে (যা আমি বর্তমানে নাল হিসাবে ভাবছি) যে বীজগুলি এলোমেলোভাবে পোঁদগুলিতে পরাগ হয় এবং আমার বিকল্প অনুমানটি হ'ল কমপক্ষে 1 টি পরাগযুক্ত বীজযুক্ত একটি বীজ শুকানোর সম্ভাবনা বেশি এলোমেলো প্রক্রিয়া দ্বারা প্রত্যাশার চেয়ে বহু পরাগযুক্ত বীজ রয়েছে। আমি কী বলছি তা বোঝাতে উদাহরণ হিসাবে আমি তিনটি গাছের আসল তথ্য সরবরাহ করেছি। প্রথম কলামটি হ'ল একটি শুঁকিতে পরাগবদ্ধ বীজের সংখ্যা, দ্বিতীয় কলামটি সেই বীজ গণনা সহ শুঁকের ফ্রিকোয়েন্সি।

উদ্ভিদ 1 (মোট 3 বীজ: 4% পরাগায়ন)

num.seeds :: pod.freq

0 :: 16

1 :: 1

2 :: 1

3 :: 0

4 :: 0

উদ্ভিদ 2 (মোট 19 বীজ: 26% পরাগায়ন)

num.seeds :: pod.freq

0 :: 12

1 :: 1

2 :: 1

3 :: 0

4 :: 4

গাছ 3 (মোট 16 বীজ: 22% পরাগায়ন)

num.seeds :: pod.freq

0 :: 9

1 :: 4

2 :: 3

3 :: 2

4 :: 0

উদ্ভিদ # 1 এ, 18 টি শিংগুলিতে মাত্র 3 টি বীজ পরাগায়িত হয়েছিল, একটি পোদে একটি বীজ ছিল এবং একটি পোদে দুটি বীজ ছিল। এলোমেলোভাবে শিংগুলিতে একটি করে বীজ যুক্ত করার প্রক্রিয়া সম্পর্কে চিন্তাভাবনা করে, প্রথম দুটি বীজ প্রত্যেকে তাদের নিজস্ব পোদে যায় তবে তৃতীয় বীজের জন্য, শিংগুলিতে 6 টি দাগ পাওয়া যায় যা ইতিমধ্যে একটি বীজ আছে তবে 16 টি শিংগুলিতে 64 দাগ রয়েছে কোনও বীজ নেই, সুতরাং এখানে 2 টি বীজের সাথে একটি পডের সর্বোচ্চ সম্ভাবনা 6/64 = 0.094। এটি কিছুটা কম, তবে চূড়ান্ত নয়, তাই আমি বলতে পারি যে এই উদ্ভিদটি সমস্ত বীজ জুড়ে এলোমেলো পরাগের কল্পনাটি মাপসই করে যা। 4% পরাগায়নের সম্ভাবনা রয়েছে। তবে উদ্ভিদ 2 আমার কাছে আরও চরম দেখায়, 4 টি শুকনো সম্পূর্ণ পরাগরেটে, এখনও 12 টি শুঁক না দিয়ে। আমি সরাসরি এই বিতরণের অসুবিধাগুলি কীভাবে গণনা করব তা সম্পর্কে নিশ্চিতভাবে নিশ্চিত নই (সুতরাং আমার বুটস্ট্র্যাপ ধারণা) তবে আমি অনুমান করতে পারি যে এই বন্টনটির প্রতিকূলতা এলোমেলোভাবে ঘটবে যদি প্রতিটি বীজের কাছে পরাগতার সম্ভাবনা 25% থাকে তবে তা খুব কম থাকে। উদ্ভিদ # 3 আমার আসলেই কোন ধারণা নেই, আমি মনে করি যে এলোমেলো বিতরণের জন্য আশা করা উচিত তার চেয়ে বেশি 0 এবং 3 রয়েছে তবে আমার অন্ত্রের অনুভূতি হ'ল উদ্ভিদ # 2 এর বিতরণের চেয়ে এই সংখ্যার বীজের জন্য এই বিতরণ অনেক বেশি সম্ভাবনা রয়েছে, এবং এটি অসম্ভব নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই। আমি মনে করি যে এলোমেলো বিতরণের জন্য একের চেয়ে বেশি 0 এবং 3 এর আশা করা উচিত তবে আমার অন্ত্র অনুভূতিটি হ'ল এই সংখ্যক বীজের জন্য এই বন্টন উদ্ভিদ # 2 এর বিতরণের চেয়ে অনেক বেশি সম্ভাবনাযুক্ত এবং এটি অসম্ভাব্যও নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই। আমি মনে করি যে এলোমেলো বিতরণের জন্য একের চেয়ে বেশি 0 এবং 3 এর আশা করা উচিত তবে আমার অন্ত্র অনুভূতিটি হ'ল এই সংখ্যক বীজের জন্য এই বন্টন উদ্ভিদ # 2 এর বিতরণের চেয়ে অনেক বেশি সম্ভাবনাযুক্ত এবং এটি অসম্ভাব্যও নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই।

পরিশেষে আমি একটি বিবৃতি লিখতে চাইছি যেমন: "বীজ শিংগুলিতে পরাগরেণিত বীজগুলির বিতরণ উপযুক্ত হয় (বা ফিট করে না) এমন অনুমান যে উদ্ভিদগুলি কেবল আংশিকভাবে স্ব সামঞ্জস্যপূর্ণ নয়, তবে বীজ সংক্রমণের জন্য পরাগরেণকের পরিদর্শন প্রয়োজন। (পরিসংখ্যান পরীক্ষার ফলাফল)। এটি সত্যই আমার সামনের দিকে তাকানোর বিভাগের অংশ, যেখানে আমি কী কী পরীক্ষা নিরীক্ষা করব তা নিয়ে কথা বলছি, তাই আমি এটির জন্য একটি জিনিস বা অন্যটি হতে মরিয়া হই না, তবে সম্ভব হলে আমি নিজের জন্যও জানতে চাই। আমি এই ডেটা দিয়ে যা করার চেষ্টা করছি তা যদি না করতে পারি তবে আমি এটিও জানতে চাই!

আমি প্রথমে বরং একটি বিস্তৃত প্রশ্ন জিজ্ঞাসা করেছি, যেহেতু আমি জানতে আগ্রহী যে ডেটা প্রথম স্থানে শূন্য স্ফীত মডেলে যেতে হবে কিনা তা দেখাতে কোনও ভাল পরীক্ষা আছে কিনা। আমি যে উদাহরণগুলি দেখেছি তার সবগুলিই বলে মনে হচ্ছে - "দেখুন, এখানে প্রচুর শূন্য রয়েছে এবং এর পক্ষে যুক্তিসঙ্গত ব্যাখ্যা রয়েছে, সুতরাং আসুন একটি শূন্য স্ফীত মডেল ব্যবহার করি"। এই ফোরামটিতে আমি এখনই এটি করছি, তবে আমার শেষ অধ্যায়ে আমার একটি অভিজ্ঞতা ছিল যেখানে আমি গণনার উপাত্তের জন্য পোইসন গ্লাম ব্যবহার করেছি এবং আমার এক তত্ত্বাবধায়ক বলেছিলেন, "না, গ্ল্যামস খুব জটিল এবং অপ্রয়োজনীয়, এই ডেটাটি হওয়া উচিত একটি কন্টিনজেন্সি টেবিলের মধ্যে যান "এবং তারপরে আমাকে তাদের ব্যয়বহুল পরিসংখ্যান প্যাকেজ দ্বারা উত্পন্ন বিশাল আকস্মিক টেবিলের একটি ডেটা ডাম্প প্রেরণ করে যা আমার সমস্ত কারণের জন্য একই ধরণের মান দেয় + তিনটি উল্লেখযোগ্য সংখ্যায় মিথস্ক্রিয়া !! সুতরাং, আমি পরিসংখ্যানগুলি পরিষ্কার এবং সরল রাখার চেষ্টা করছি, এবং নিশ্চিত করুন যে আমি আমার পছন্দগুলি দৃ rob়রূপে ডিফেন্ড করার জন্য তাদের যথেষ্ট বুঝতে পেরেছি, যা আমি মনে করি না যে আমি এই মুহূর্তে শূন্য স্ফীত মডেলের জন্য করতে পারি। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। যা আমি মনে করি না আমি এখনই শূন্য স্ফীত মডেলের জন্য করতে পারি for চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। যা আমি মনে করি না আমি এখনই শূন্য স্ফীত মডেলের জন্য করতে পারি for চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত।

তবে আমি আমার প্রাথমিক প্রশ্ন থেকে খুব বেশি বিভ্রান্ত করতে চাই না, আমি কীভাবে নির্ধারণ করতে পারি যে আমার তথ্যটি এলোমেলো বিতরণ থেকে প্রত্যাশার চেয়ে সত্যই বেশি শূন্য হয় কিনা? আমার ক্ষেত্রে এটির উত্তরটি আমার কাছে সত্যিকারের আগ্রহের বিষয়, মডেলটির ন্যায্যতা বোনাস হওয়ার পক্ষে সম্ভাব্য উপকার সহ।

আপনার সমস্ত সময় এবং সাহায্যের জন্য আবার ধন্যবাদ!

চিয়ার্স, বিডাব্লুজিআইএ


আপনি কেন শূন্য স্ফীত দ্বিপদী মডেল ফিট করতে চান না?
এতিরেতু

"আংশিক সেল্ফিং" হাইপোথিসিসটি কি "পরাগায়ণকারী" হাইপোথিসিসের সাথে একচেটিয়া? যদি তা হয় তবে আপনার দ্বিতীয় মডেলটি কেবল সম্ভাব্যতা পি এবং আকার = 4 সহ একটি দ্বিপদী মডেল হবে would
এটিরেটু -

উত্তর:


5

এটি আমার কাছে তুলনামূলকভাবে সরল (ননলাইনার) মিশ্র মডেলের মতো মনে হয়। আপনার কাছে উদ্ভিদের অভ্যন্তরীন গুচ্ছগুলিতে বীজের শড রয়েছে এবং আপনি প্রতিটি পর্যায়ে এলোমেলো প্রভাব সহ একটি দ্বিপদী মডেল ফিট করতে পারেন:

    library(lme4)
    binre <- lmer( pollinated ~ 1 + (1|plant) + (1|cluster), data = my.data, family = binomial)

বা যদি আপনার কাছে থাকে তবে তাদের সাথে করুন। যদি ফুলগুলি স্ব-পরাগায়িত হয়, তবে গাছপালা নিজেরাই কতটা व्यवहार्य তা প্রাকৃতিক পরিবর্তনশীলতার কারণে আপনি কিছু হালকা প্রভাব দেখতে পাবেন। তবে যদি প্রতিক্রিয়ার বেশিরভাগ পরিবর্তনশীলতা ক্লাস্টার ভেরিয়েবিলিটি বলে চালিত হয় তবে আপনার কাছে পোকামাকড় দ্বারা পরাগতার আরও দৃ evidence় প্রমাণ হবে যা কেবলমাত্র একটি উদ্ভিদে কেবল নির্বাচিত ক্লাস্টারগুলিতে যেতে পারে। আদর্শভাবে, আপনি গাউসির চেয়ে এলোমেলো প্রভাবগুলির নন-প্যারাম্যাট্রিক বিতরণ করতে চান: কোনও পোকামাকড় দেখা না পাওয়ার জন্য শূন্যের একটি পয়েন্ট ভর, এবং ইতিবাচক মূল্যে একটি বিন্দু ভর - এটি মূলত মিশ্রণ মডেল মাইকেল চেরনিকের সম্পর্কে ভেবেছিলেন। আপনি এটি জিএলএলএম স্টাটা প্যাকেজের সাথে মানিয়ে নিতে পারেন, আর যদি এটি সম্ভব না হত তবে আমি অবাক হব

সম্ভবত একটি পরিষ্কার পরীক্ষার জন্য, আপনি গাছপালা ভিতরে রাখতে চান, বা কমপক্ষে কোনও পোকামাকড় অ্যাক্সেস সহ এমন কোনও স্থানে থাকতে পারেন এবং দেখুন যে কতগুলি বীজ পরাগায়িত হবে। এটি সম্ভবত আপনার সমস্ত প্রশ্নের উত্তর আরও পদ্ধতিগতভাবে কঠোর উপায়ে দেবে।


আমি এটি চেষ্টা করতে যাচ্ছি, আমি মনে করি এটি নিজের জন্য আমার নিজের প্রশ্নের জবাব দিতে সহায়তা করবে, তবে কীভাবে এটি অন্যকে বোঝাতে পারবে তা নিশ্চিত নয়। আপনি দ্বিতীয় অংশে স্পট করছেন, আমি কীভাবে এই ডেটা ভবিষ্যতে আরও নির্দেশিত পরীক্ষা-নিরীক্ষা করে তা ভেবে দেখার চেষ্টা করছি।
বিডব্লুজিআইএ

1

আমার কাছে মনে হচ্ছে এটি প্রতিটি পৃথক পোকামাকড়ের জন্য একটি মিশ্রণ বিতরণ। সম্ভাব্যতার সাথে p পোকা সম্ভাব্যতা -1-p দিয়ে জমি জমি করে এবং এটি 0 থেকে 4 বীজ বিতরণ করে। তবে আপনার যদি উদ্ভিদের পোকামাকড় জমি থাকে বা না থাকে সে সম্পর্কে আপনার কাছে কোনও তথ্য নেই তবে আপনি 0 পাওয়ার দুটি উপায় আলাদা করতে পারবেন না p p3, p4) যেখানে পাই হ'ল i বীজের সম্ভাবনা হ'ল পোকামাকড় পরাগবন্ধগুলি প 1 + পি 2 + পি 3 + পি 4 = 1 সীমাবদ্ধ করে। মডেলের পাঁচটি অজানা p, p1, p2, p3, p4 প্রতি i এর জন্য সীমাবদ্ধতা 0 = 0 রয়েছে। পর্যাপ্ত ডেটা সহ আপনার এই পরামিতিগুলি সম্ভবত সীমাবদ্ধ সর্বাধিক সম্ভাবনার পদ্ধতির ব্যবহার করে অনুমান করতে সক্ষম হওয়া উচিত।


আমি সম্মত, তবে প্রশ্নটি সেই মডেলের সাথে মানানসই নয়, তবে দুটি পৃথক জৈবিক অনুমানের অধীনে পূর্বাভাস বন্টন তৈরি করা। হতে পারে উত্তরটি একটি জেডআইবি এবং "কিছু অন্যান্য মডেল" মাপসই যা স্বার্থক অনুমানের সাথে মেলে এবং সেগুলি তুলনা করে।
এটিরেটু -

@atiretoo মডেলটি আপনাকে পরাগিত বীজের সংখ্যার জন্য অনুমানের বিতরণ সরবরাহ করে না যে আপনি আপনার অনুমানযুক্ত বিতরণের সাথে তুলনা করতে পারেন?
মাইকেল আর চেরনিক

সম্মত হন - যদি আপনার কাছে দুটি অনুমানের জন্য সঠিক মডেল থাকে।
এটিরেটু -

1

এটি আপনার প্রশ্নের শেষ অংশের উত্তর, কীভাবে আপনি পরাগরেণু হাইপোথিসিসের জন্য চান তা কীভাবে ডেটা তৈরি করতে পারে:

n = 16
max = 4
p1 = 0.1
p2 = 0.9
Y1 = rbinom(10000*n,1,p1)
Y2 = matrix(Y1*rbinom(10000*n,4,p2),ncol=16)

আপনি rzibinom()প্যাকেজ ভিজিএএম এও ব্যবহার করতে পারেন । যদিও আপনি এটি দিয়ে কী করতে চান তা আমি নিশ্চিত নই। আপনার কাছে দুটি ফ্রি প্যারামিটার, পি 1 এবং পি 2 রয়েছে, এটি অনুমান করার দরকার। ডেটা থেকে তাদের অনুমানের জন্য শূন্য স্ফীত দ্বিপদী মডেল ব্যবহার করবেন না কেন?

আপনার প্যাকেজ ভিজিএএমের দিকে নজর দেওয়া উচিত, যা অন্যদের মধ্যে জেডআইবি মডেলগুলির সাথে ফিট করে। প্রকৃতপক্ষে, আপনি ভিজিএএম ফাংশন থেকে জেডআইবির জন্য প্রত্যাশিত বিতরণ পেতে পারেন dzibinom(), যা আপনি যদি পরিদর্শন এবং পরাগরেণনের পরামিতিগুলি জানেন তবে আপনার পর্যবেক্ষণের বিতরণটির সাথে তুলনা করতে ব্যবহার করতে পারেন। আবার, আপনার সত্যই জেডআইবি মডেলের ফিট করা উচিত।

যদি আপনার আংশিক স্বাবলম্বী অনুমান পোকার পরাগায়নের একচেটিয়া হয়, তবে প্রত্যাশিত বিতরণটি দ্বিপদী হয় এবং আপনি একটি দ্বিপদী পারিবারিক গ্ল্যামের সাথে পরামিতিগুলি বা এলোমেলো প্রভাব হিসাবে উদ্ভিদ আইডির সাথে একটি গ্ল্যামম অনুমান করতে পারেন। তবে, যদি তারা আংশিক স্ব এবং পোকামাকড় পরাগায়ণ করতে পারে তবে আপনার দুটি দ্বি-দ্বি বিতরণের মিশ্রণের প্রয়োজন হবে। সেক্ষেত্রে আমি ওপেনবিউজিএস বা জেজিএস ব্যবহার করে এমসিসিএম ব্যবহার করে মডেলটি ফিট করতে পারি investigate

আপনার ডেটাতে দুটি মডেল ফিট হয়ে গেলে আপনি কোনটি আরও ভাল ফিট করে তা দেখতে মডেলগুলির সাথে তুলনা করুন, এআইসি বা বিআইসি বা আপনার পছন্দের কোনও মেট্রিক ব্যবহার করুন।


এতিরেটুর জন্য ধন্যবাদ, তবে এই কোডটি চালানো এলোমেলো সংখ্যক বীজ বজায় রাখার পাশাপাশি একটি এলোমেলো বিতরণ বলে মনে হয়। আমি ভাবছিলাম যে আমি চেয়েছিলাম বীজের নুবার সংশোধন করা উচিত (19 বীজ বলুন, নীচে দেখুন) এবং তারপরে দেখুন যে সঠিক নুবারের জন্য প্রদত্ত বন্টন কতটা সম্ভব ছিল
বিডব্লুজিআইএ

ওপস, খুব শীঘ্রই পোস্টটি হিট করুন এবং আমি আমার প্রশ্নের সাথে কিছু তথ্য যুক্ত করার সাথে সাথে "উপরে দেখুন" বোঝাতে চাইছি। আমি মডেলদের তুলনা করতে এআইসি ব্যবহার সম্পর্কে আপনার মন্তব্য সম্পর্কে আগ্রহী, আমি কি বিভিন্ন বিতরণের সাথে মডেলগুলিতে (একই প্রতিক্রিয়ার ভেরিয়েবল সহ) পারি? আমি ভেবেছিলাম এআইসির তুলনা কেবল তখনই বৈধ ছিল যখন আপনি কোনও মডেলটিতে শর্তাদি যুক্ত / বাদ দেন তবে একই ডিস্ট্রিবিউশন পরিবারের সাথে নির্দিষ্ট করা হয়?
বিডব্লিউজিআইএ

নাহ, এটি পিছনের নির্বাচনের চেয়ে এআইসির মূল সুবিধা। যতক্ষণ তথ্য একই থাকে আপনি এআইসিকে বিভিন্ন মডেলের মধ্যে নেস্টেড না করেও তুলনা করতে পারেন। আপনার সাবধানতা অবলম্বন করতে হবে যে সফ্টওয়্যারটি ধ্রুবকগুলি না রেখে সম্ভাবনার গণনা করছে তবে একক ফাংশনের মধ্যে আপনি অনায়াসিত মডেলগুলিকে সহজেই তুলনা করতে পারেন।
আতিরেতু -
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.