আমার একটি সমস্যা হয়েছে যা আমি মনে করি সহজ হওয়া উচিত তবে এটি সঠিকভাবে বের করতে পারি না। আমি বীজ পরাগায়নের দিকে তাকিয়ে আছি, আমার কাছে গাছগুলি (n = 36) ক্লাস্টারে ফুল রয়েছে, আমি প্রতিটি উদ্ভিদ থেকে 3 টি ফুলের ক্লাস্টার এবং প্রতিটি ক্লাস্টার থেকে 6 টি বীজ শুকানো (প্রতিটি উদ্ভিদ থেকে মোট 18 টি বীজ শুক) নমুনা করি। একটি পোডে প্রায় 0 থেকে 4 টি বীজ পরাগায়িত হতে পারে। সুতরাং, উপাত্ত একটি উপরের সীমা সহ গণনা করা হয়। আমি খুঁজে পেয়েছি গড়ে ~ 10% বীজ পরাগায়িত হয় তবে কোনও প্রদত্ত উদ্ভিদে 1 থেকে 30% এর মধ্যে যে কোনও জায়গায় ছড়িয়ে পড়ে, তাই ছড়িয়ে পড়া তথ্যের উপরে এবং অবশ্যই, 3 টি উদ্ভিদে 4 টি অনুপস্থিত গুচ্ছ প্রতিলিপি রয়েছে, সুতরাং নিখুঁতভাবে প্রতিসম নয় ।
আমি যে প্রশ্নটি জিজ্ঞাসা করছি তা হল এই ডেটা এই ধারণাকে সমর্থন করে যে এই উদ্ভিদটি বীজ সংক্রমণের জন্য পরাগরেণকদের প্রয়োজন।
আমি দেখতে পাচ্ছি যে কোনও পোদে বীজের সংখ্যার জন্য বিতরণ দেখে মনে হচ্ছে যে এখানে আরও 0 টি পরাগযুক্ত বীজ শুঁটি রয়েছে (16 এর মধ্যে 6-9 পোড) এবং আরও 3 এবং 4 পরাগযুক্ত বীজ শুক (প্রতিটিের জন্য 2-4) হবে জনসংখ্যার বীজগুলি কেবল এলোমেলোভাবে পরাগরেজনিত হলে আশা করা যায়। মূলত, আমি মনে করি এটি শূন্য স্ফীত তথ্যের জন্য সর্বোত্তম উদাহরণ, প্রথমে কোনও পোকা ফুলটি একেবারে দেখতে পায় না বা হয় না (একটি শূন্য জেনারেটর) এবং যদি এটি হয়, তবে অন্য বন্টনে 0-4 বীজকে পরাগায়িত করে। বিকল্প অনুমানটি হ'ল উদ্ভিদটি আংশিকভাবে স্বনির্ভর হয় এবং এরপরে আশা করা যায় যে প্রতিটি বীজ পরাগায়িত হওয়ার একই সম্ভাবনা থাকবে (এই তথ্যটি প্রায় 0.1 টি সম্ভাবনার প্রস্তাব দেয়, যার অর্থ একই পোদে দুটি বীজের জন্য 0.01 সুযোগ ইত্যাদি) ।
তবে আমি কেবল ডেটাটি এক বা অন্য বিতরণে সবচেয়ে ভাল ফিট করে তা প্রমাণ করতে চাই, আসলে ডেটাতে কোনও জিপ বা জিনব না করে। আমি মনে করি আমি যে কোনও পদ্ধতি ব্যবহার করি না কেন পরাগযুক্ত বীজের প্রকৃত সংখ্যা এবং প্রতিটি উদ্ভিদে নমুনাযুক্ত শুঁটির সংখ্যা বিবেচনা করা উচিত। আমি যে সর্বোত্তম জিনিসটি সামনে এলাম তা হ'ল কিছু ধরণের বুট স্ট্র্যাপ জিনিস যেখানে আমি এলোমেলোভাবে একটি নির্দিষ্ট উদ্ভিদের জন্য পরাগযুক্ত বীজের সংখ্যা নির্ধারিত বীজের শ্যাডের সংখ্যার মধ্যে নির্ধারণ করি, এটি 10,000 বার করুন এবং দেখুন এটি কতটা সম্ভব প্রদত্ত উদ্ভিদের জন্য পরীক্ষামূলক তথ্য সেই এলোমেলো বিতরণ থেকে বেরিয়ে এসেছিল।
আমি কেবল অনুভব করছি যে এ সম্পর্কে এমন কিছু আছে যা ব্রুট ফোর্স বুটস্ট্র্যাপিংয়ের চেয়ে অনেক সহজ হওয়া উচিত তবে চিন্তাভাবনা ও অনুসন্ধানের কয়েক দিন পরে আমি ছেড়ে দিচ্ছি। আমি কেবল পইসন বিতরণের সাথে তুলনা করতে পারি না কারণ এটি উপরের আবদ্ধ, এটি দ্বিপদী নয় কারণ আমার কোনওভাবে 1 ম প্রত্যাশিত বিতরণ উত্পন্ন করতে হবে। কোন চিন্তা? এবং আমি সেখানে আর পরামর্শ দিচ্ছি (বিশেষত কীভাবে সবচেয়ে সুন্দরভাবে এন বলগুলির 10,000 টি এলোমেলো বিতরণ 16 টি বাক্সে তৈরি করতে হবে যাতে প্রতিটি সর্বাধিক 4 বল থাকতে পারে) সর্বাধিক স্বাগত হবে।
9/07/2012 যুক্ত হয়েছে প্রথমে, সমস্ত আগ্রহ এবং সহায়তার জন্য আপনাকে সকলকে ধন্যবাদ। উত্তরগুলি পড়ার ফলে আমার প্রশ্নটিকে কিছুটা উচ্চারণ করতে ভাবতে বাধ্য করা হয়েছে। আমি যা বলছি তা হ'ল আমার একটি অনুমান আছে (যা আমি বর্তমানে নাল হিসাবে ভাবছি) যে বীজগুলি এলোমেলোভাবে পোঁদগুলিতে পরাগ হয় এবং আমার বিকল্প অনুমানটি হ'ল কমপক্ষে 1 টি পরাগযুক্ত বীজযুক্ত একটি বীজ শুকানোর সম্ভাবনা বেশি এলোমেলো প্রক্রিয়া দ্বারা প্রত্যাশার চেয়ে বহু পরাগযুক্ত বীজ রয়েছে। আমি কী বলছি তা বোঝাতে উদাহরণ হিসাবে আমি তিনটি গাছের আসল তথ্য সরবরাহ করেছি। প্রথম কলামটি হ'ল একটি শুঁকিতে পরাগবদ্ধ বীজের সংখ্যা, দ্বিতীয় কলামটি সেই বীজ গণনা সহ শুঁকের ফ্রিকোয়েন্সি।
উদ্ভিদ 1 (মোট 3 বীজ: 4% পরাগায়ন)
num.seeds :: pod.freq
0 :: 16
1 :: 1
2 :: 1
3 :: 0
4 :: 0
উদ্ভিদ 2 (মোট 19 বীজ: 26% পরাগায়ন)
num.seeds :: pod.freq
0 :: 12
1 :: 1
2 :: 1
3 :: 0
4 :: 4
গাছ 3 (মোট 16 বীজ: 22% পরাগায়ন)
num.seeds :: pod.freq
0 :: 9
1 :: 4
2 :: 3
3 :: 2
4 :: 0
উদ্ভিদ # 1 এ, 18 টি শিংগুলিতে মাত্র 3 টি বীজ পরাগায়িত হয়েছিল, একটি পোদে একটি বীজ ছিল এবং একটি পোদে দুটি বীজ ছিল। এলোমেলোভাবে শিংগুলিতে একটি করে বীজ যুক্ত করার প্রক্রিয়া সম্পর্কে চিন্তাভাবনা করে, প্রথম দুটি বীজ প্রত্যেকে তাদের নিজস্ব পোদে যায় তবে তৃতীয় বীজের জন্য, শিংগুলিতে 6 টি দাগ পাওয়া যায় যা ইতিমধ্যে একটি বীজ আছে তবে 16 টি শিংগুলিতে 64 দাগ রয়েছে কোনও বীজ নেই, সুতরাং এখানে 2 টি বীজের সাথে একটি পডের সর্বোচ্চ সম্ভাবনা 6/64 = 0.094। এটি কিছুটা কম, তবে চূড়ান্ত নয়, তাই আমি বলতে পারি যে এই উদ্ভিদটি সমস্ত বীজ জুড়ে এলোমেলো পরাগের কল্পনাটি মাপসই করে যা। 4% পরাগায়নের সম্ভাবনা রয়েছে। তবে উদ্ভিদ 2 আমার কাছে আরও চরম দেখায়, 4 টি শুকনো সম্পূর্ণ পরাগরেটে, এখনও 12 টি শুঁক না দিয়ে। আমি সরাসরি এই বিতরণের অসুবিধাগুলি কীভাবে গণনা করব তা সম্পর্কে নিশ্চিতভাবে নিশ্চিত নই (সুতরাং আমার বুটস্ট্র্যাপ ধারণা) তবে আমি অনুমান করতে পারি যে এই বন্টনটির প্রতিকূলতা এলোমেলোভাবে ঘটবে যদি প্রতিটি বীজের কাছে পরাগতার সম্ভাবনা 25% থাকে তবে তা খুব কম থাকে। উদ্ভিদ # 3 আমার আসলেই কোন ধারণা নেই, আমি মনে করি যে এলোমেলো বিতরণের জন্য আশা করা উচিত তার চেয়ে বেশি 0 এবং 3 রয়েছে তবে আমার অন্ত্রের অনুভূতি হ'ল উদ্ভিদ # 2 এর বিতরণের চেয়ে এই সংখ্যার বীজের জন্য এই বিতরণ অনেক বেশি সম্ভাবনা রয়েছে, এবং এটি অসম্ভব নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই। আমি মনে করি যে এলোমেলো বিতরণের জন্য একের চেয়ে বেশি 0 এবং 3 এর আশা করা উচিত তবে আমার অন্ত্র অনুভূতিটি হ'ল এই সংখ্যক বীজের জন্য এই বন্টন উদ্ভিদ # 2 এর বিতরণের চেয়ে অনেক বেশি সম্ভাবনাযুক্ত এবং এটি অসম্ভাব্যও নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই। আমি মনে করি যে এলোমেলো বিতরণের জন্য একের চেয়ে বেশি 0 এবং 3 এর আশা করা উচিত তবে আমার অন্ত্র অনুভূতিটি হ'ল এই সংখ্যক বীজের জন্য এই বন্টন উদ্ভিদ # 2 এর বিতরণের চেয়ে অনেক বেশি সম্ভাবনাযুক্ত এবং এটি অসম্ভাব্যও নাও হতে পারে। তবে স্পষ্টতই আমি নিশ্চিতভাবে এবং সমস্ত উদ্ভিদ জুড়ে জানতে চাই।
পরিশেষে আমি একটি বিবৃতি লিখতে চাইছি যেমন: "বীজ শিংগুলিতে পরাগরেণিত বীজগুলির বিতরণ উপযুক্ত হয় (বা ফিট করে না) এমন অনুমান যে উদ্ভিদগুলি কেবল আংশিকভাবে স্ব সামঞ্জস্যপূর্ণ নয়, তবে বীজ সংক্রমণের জন্য পরাগরেণকের পরিদর্শন প্রয়োজন। (পরিসংখ্যান পরীক্ষার ফলাফল)। এটি সত্যই আমার সামনের দিকে তাকানোর বিভাগের অংশ, যেখানে আমি কী কী পরীক্ষা নিরীক্ষা করব তা নিয়ে কথা বলছি, তাই আমি এটির জন্য একটি জিনিস বা অন্যটি হতে মরিয়া হই না, তবে সম্ভব হলে আমি নিজের জন্যও জানতে চাই। আমি এই ডেটা দিয়ে যা করার চেষ্টা করছি তা যদি না করতে পারি তবে আমি এটিও জানতে চাই!
আমি প্রথমে বরং একটি বিস্তৃত প্রশ্ন জিজ্ঞাসা করেছি, যেহেতু আমি জানতে আগ্রহী যে ডেটা প্রথম স্থানে শূন্য স্ফীত মডেলে যেতে হবে কিনা তা দেখাতে কোনও ভাল পরীক্ষা আছে কিনা। আমি যে উদাহরণগুলি দেখেছি তার সবগুলিই বলে মনে হচ্ছে - "দেখুন, এখানে প্রচুর শূন্য রয়েছে এবং এর পক্ষে যুক্তিসঙ্গত ব্যাখ্যা রয়েছে, সুতরাং আসুন একটি শূন্য স্ফীত মডেল ব্যবহার করি"। এই ফোরামটিতে আমি এখনই এটি করছি, তবে আমার শেষ অধ্যায়ে আমার একটি অভিজ্ঞতা ছিল যেখানে আমি গণনার উপাত্তের জন্য পোইসন গ্লাম ব্যবহার করেছি এবং আমার এক তত্ত্বাবধায়ক বলেছিলেন, "না, গ্ল্যামস খুব জটিল এবং অপ্রয়োজনীয়, এই ডেটাটি হওয়া উচিত একটি কন্টিনজেন্সি টেবিলের মধ্যে যান "এবং তারপরে আমাকে তাদের ব্যয়বহুল পরিসংখ্যান প্যাকেজ দ্বারা উত্পন্ন বিশাল আকস্মিক টেবিলের একটি ডেটা ডাম্প প্রেরণ করে যা আমার সমস্ত কারণের জন্য একই ধরণের মান দেয় + তিনটি উল্লেখযোগ্য সংখ্যায় মিথস্ক্রিয়া !! সুতরাং, আমি পরিসংখ্যানগুলি পরিষ্কার এবং সরল রাখার চেষ্টা করছি, এবং নিশ্চিত করুন যে আমি আমার পছন্দগুলি দৃ rob়রূপে ডিফেন্ড করার জন্য তাদের যথেষ্ট বুঝতে পেরেছি, যা আমি মনে করি না যে আমি এই মুহূর্তে শূন্য স্ফীত মডেলের জন্য করতে পারি। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। যা আমি মনে করি না আমি এখনই শূন্য স্ফীত মডেলের জন্য করতে পারি for চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। যা আমি মনে করি না আমি এখনই শূন্য স্ফীত মডেলের জন্য করতে পারি for চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত। চিকিত্সার তুলনা করতে এবং আমার প্রধান পরীক্ষামূলক প্রশ্নের উত্তর দেওয়ার জন্য উপরের তথ্যগুলির জন্য আমি একটি কাসিবিনোমিয়াল (সম্পূর্ণ উদ্ভিদের জন্য পেসুডোরপ্লিকাইটন থেকে মুক্তি পেতে) এবং একটি মিশ্র মডেল ব্যবহার করেছি, তবে আমি একই কাজটি করে যাব বলে মনে হচ্ছে, তবে আমিও যাচ্ছি এটি কতটা ভাল পারফর্ম করে তা দেখতে, আজ রাতে জেডআইএনবির সাথে চারপাশে খেলুন। আমি ভাবছি যদি আমি স্পষ্টভাবে প্রমাণ করতে পারি যে এই ডেটাটি প্রথমে দৃ strongly়ভাবে ক্লাস্টার করা হয়েছে (বা শূন্য স্ফীত), তবে এরপরের জন্য একটি ভাল জৈবিক কারণ সরবরাহ করুন, পরবর্তীকালে আমি একটি জিআইএনবি বের করার চেয়ে আরও ভাল সেট আপ করব to কেবল একজনকে একটি ক্যাসিবিনোমিয়াল / মিশ্র মডেলের সাথে তুলনা করুন এবং যুক্তি দিন কারণ এটি আরও ভাল ফলাফল দেয়, এটাই আমার ব্যবহার করা উচিত।
তবে আমি আমার প্রাথমিক প্রশ্ন থেকে খুব বেশি বিভ্রান্ত করতে চাই না, আমি কীভাবে নির্ধারণ করতে পারি যে আমার তথ্যটি এলোমেলো বিতরণ থেকে প্রত্যাশার চেয়ে সত্যই বেশি শূন্য হয় কিনা? আমার ক্ষেত্রে এটির উত্তরটি আমার কাছে সত্যিকারের আগ্রহের বিষয়, মডেলটির ন্যায্যতা বোনাস হওয়ার পক্ষে সম্ভাব্য উপকার সহ।
আপনার সমস্ত সময় এবং সাহায্যের জন্য আবার ধন্যবাদ!
চিয়ার্স, বিডাব্লুজিআইএ