এই উত্তরটি আমার জ্ঞানের উপর ভিত্তি করে নয় বরং বলকার এট আল এর উদ্ধৃতি দিয়েছে। (২০০৯) ট্রেন্ডস ইন ইকোলজি অ্যান্ড ইভোলিউশন জার্নালে একটি প্রভাবশালী কাগজে লিখেছিলেন । নিবন্ধটি যেহেতু উন্মুক্ত অ্যাক্সেস নয় (যদিও এটি গুগল পন্ডিতের কাছে অনুসন্ধান করা সফল হতে পারে, তাই আমি ভেবেছিলাম যে গুরুত্বপূর্ণ প্যাসেজগুলি প্রশ্নের অংশগুলির সমাধানের জন্য সহায়ক হতে পারে So তাই আবার, আমি নিজের সাথে এলাম না তবে আমি মনে করি এটি জিএলএমএমগুলিতে (ইনক্লুডিং ডায়াগোনস্টিকস) সর্বাধিক সরল এগিয়ে এবং সহজভাবে লেখার স্টাইল বোঝার পক্ষে উপস্থাপন করে। যদি কোনও কারণেই এই উত্তরটি যে কোনও কারণে উপযুক্ত না হয় তবে আমি কেবল এটি মুছে ফেলব Th যে জিনিসগুলি আমি খুঁজে পাই ডায়াগনস্টিকস সম্পর্কিত প্রশ্নগুলির ক্ষেত্রে কার্যকরভাবে হাইলাইট করা হয়েছেসাহসী ।
পৃষ্ঠা 127:
অস্বাভাবিক তথ্যের মুখোমুখি গবেষকরা প্রায়শই শর্টকাটগুলি ব্যবহার করে যেমন স্বাভাবিকতা এবং বৈকল্পিকতার এককতা অর্জনের জন্য ডেটা ট্রান্সফর্ম করা, ননপ্যারমেট্রিক টেস্ট ব্যবহার করে বা ভারসাম্য নকশার জন্য অস্বাভাবিকতাকে ক্লাসিকাল এএনওওএর দৃust়তার উপর নির্ভর করে [15] তারা এলোমেলো প্রভাবগুলি পুরোপুরি উপেক্ষা করতে পারে (এইভাবে সিউডোরপ্লিকেশন করা) বা তাদেরকে স্থির কারণ হিসাবে বিবেচনা করা [16]। তবে, এই জাতীয় শর্টকাটগুলি ব্যর্থ হতে পারে (উদাহরণস্বরূপ অনেক শূন্য মান সহ গণ্য ডেটা রূপান্তর দ্বারা সাধারণ করা যায় না)। এমনকি তারা সফল হওয়ার পরেও তারা পরিসংখ্যানগত অনুমানগুলি লঙ্ঘন করতে পারে (এমনকি ননপ্যারমেট্রিক টেস্টগুলি অনুমানগুলি তৈরি করে, যেমন গোষ্ঠীগুলির মধ্যে বৈচিত্রের একজাতীয়তা) বা অনুমানের সুযোগকে সীমাবদ্ধ করে (কোনও ব্যক্তি নতুন গ্রুপগুলিতে স্থির প্রভাবগুলির অনুমানকে বহির্ভূত করতে পারে না)। শাস্ত্রীয় পরিসংখ্যান কাঠামোগুলিতে তাদের ডেটা জুতো ছড়িয়ে দেওয়ার পরিবর্তে, গবেষকদের তাদের তথ্যের সাথে মেলে এমন পরিসংখ্যানিক পদ্ধতির ব্যবহার করা উচিত। জেনারালাইজড লিনিয়ার মিক্সড মডেল (জিএলএমএমস) দুটি পরিসংখ্যান কাঠামোর বৈশিষ্ট্যগুলিকে একত্রিত করে যা বাস্তু এবং বিবর্তনে ব্যাপকভাবে ব্যবহৃত হয়, লিনিয়ার মিশ্রিত মডেল (যা র্যান্ডম এফেক্টগুলি অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং ক্ষতিকারক পরিবার ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে [যেমন স্বাভাবিক, পোইসন বা দ্বিপদী] বিতরণ)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে। লিনিয়ার মিশ্রিত মডেল (যা এলোমেলো প্রভাবগুলিকে অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং তাত্পর্যমূলক পরিবার [যেমন সাধারণ, পোইসন বা দ্বিপদী] বিতরণ ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে। লিনিয়ার মিশ্রিত মডেল (যা এলোমেলো প্রভাবগুলিকে অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং তাত্পর্যমূলক পরিবার [যেমন সাধারণ, পোইসন বা দ্বিপদী] বিতরণ ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে।
পৃষ্ঠা 129, বক্স 1:
অবশিষ্টাংশ overdispersion নির্দেশিত , তাই আমরা একটি আপাতদৃষ্টিতে পইসন মডেল সাথে ডেটা refitted। বৃহত আনুমানিক স্কেল প্যারামিটার (10.8) সত্ত্বেও, অনুসন্ধানের গ্রাফগুলি ব্যক্তি, জিনোটাইপস বা জনসংখ্যার পর্যায়ে বিদেশিদের কোনও প্রমাণ পায়নি। আমরা আধা-এআইসি (কিউএআইসি) ব্যবহার করেছি, এলোমেলো প্রভাবগুলির জন্য এক ডিগ্রি স্বাধীনতা [49], এলোমেলো প্রভাবের জন্য এবং তারপরে স্থির-প্রভাব মডেল নির্বাচনের জন্য ব্যবহার করেছি।
পৃষ্ঠা 133, বাক্স 4:
এখানে আমরা একটি পূর্ণ (সবচেয়ে জটিল) মডেল তৈরির জন্য একটি সাধারণ কাঠামোর রূপরেখা দিই, জিএলএমএম বিশ্লেষণের প্রথম ধাপ। এই প্রক্রিয়াটি অনুসরণ করে, পরে প্যারামিটারগুলি মূল্যায়ন করতে এবং মূল পাঠ্যতে এবং চিত্র 1 এ বর্ণিত সাব-মডেলগুলি তুলনা করতে পারে।
স্থির (চিকিত্সা বা covariates) এবং এলোমেলো প্রভাব (পরীক্ষামূলক, স্থানিক বা টেম্পোরাল ব্লক, ব্যক্তি, ইত্যাদি) নির্দিষ্ট করুন। শুধুমাত্র গুরুত্বপূর্ণ ইন্টারঅ্যাকশন অন্তর্ভুক্ত করুন। থাম্বের নিয়মের ভিত্তিতে মডেলটিকে জটিলতার সম্ভাব্য স্তরের অগ্রাধিকারকে সীমাবদ্ধ করুন (> এলোমেলো প্রভাবের ভিত্তিতে>> 5-6 এলোমেলো-প্রভাব স্তর এবং> চিকিত্সা স্তরের প্রতি 10-20 নমুনা বা পরীক্ষামূলক ইউনিট) এবং প্রাপ্ত পর্যাপ্ত নমুনা আকারের জ্ঞান পূর্ববর্তী অধ্যয়ন [,৪,65৫]।
একটি ত্রুটি বিতরণ এবং লিঙ্ক ফাংশন চয়ন করুন (যেমন গণনা ডেটার জন্য পোইসন বিতরণ এবং লগ লিঙ্ক, অনুপাতের ডেটার জন্য দ্বিপদী বিতরণ এবং লগিট লিঙ্ক)।
গ্রাফিকাল চেকিং : ডেটাগুলির রূপগুলি (লিঙ্ক ফাংশন দ্বারা রূপান্তরিত) বিভাগগুলিতে সমজাতীয় হয়? রূপান্তরিত ডেটা লিনিয়ারের প্রতিক্রিয়া কি অবিচ্ছিন্ন পূর্বাভাসীদের প্রতি শ্রদ্ধাশীল? আউটরিয়ার ব্যক্তি বা দল আছে? গোষ্ঠীগুলির মধ্যে বিতরণগুলি কি অনুমান করা বিতরণের সাথে মেলে?
সম্পূর্ণ (পোল্ড) ডেটা সেট এবং এলোমেলো উপাদানগুলির প্রতিটি স্তরের মধ্যে স্থির-কার্যকর জিএলএম উভয়ই ফিট করুন [28,50]। আনুমানিক প্যারামিটারগুলি প্রায় গ্রুপগুলিতে প্রায় বিতরণ করা উচিত (গ্রুপ-স্তরের প্যারামিটারগুলিতে বড় অনিশ্চয়তা থাকতে পারে, বিশেষত ছোট নমুনা আকারের গ্রুপগুলির জন্য)। প্রয়োজনীয় হিসাবে মডেল সামঞ্জস্য করুন (উদা লিঙ্ক ফাংশন পরিবর্তন বা covariates যোগ করুন)।
পুরো জিএলএমএম ফিট করুন। অপর্যাপ্ত কম্পিউটারের মেমরি বা খুব ধীর: মডেলের জটিলতা হ্রাস করুন। যদি ডেটাটির উপসেটটিতে অনুমান সফল হয়, তবে আরও দক্ষ অনুমানের অ্যালগরিদম চেষ্টা করুন (উদাহরণস্বরূপ যদি উপযুক্ত হয় তবে পিকিউএল)। রূপান্তর করতে ব্যর্থতা (সতর্কতা বা ত্রুটি): মডেল জটিলতা হ্রাস করুন বা অপ্টিমাইজেশন সেটিংস পরিবর্তন করুন (ফলাফলগুলি উত্তরগুলি বোধগম্য করে তা নিশ্চিত করুন)। অন্যান্য অনুমানের অ্যালগরিদম ব্যবহার করে দেখুন। জিরো ভেরিয়েন্স উপাদান বা এককতা (সতর্কতা বা ত্রুটি): মডেলটি সঠিকভাবে সংজ্ঞায়িত এবং সনাক্তযোগ্য (যেমন সমস্ত উপাদান তাত্ত্বিকভাবে অনুমান করা যায়) তা পরীক্ষা করে দেখুন। মডেল জটিলতা হ্রাস করুন। মডেলটিতে অতিরিক্ত সংযোজন (অতিরিক্ত কোভারিয়েটস, বা এলোমেলো প্রভাবের জন্য নতুন গোষ্ঠীকরণ) সমস্যাগুলি হ্রাস করতে পারে, যেহেতু অবিচ্ছিন্ন কোভেরিয়ट्सকে তাদের গড় বিয়োগ করে কেন্দ্র করবে [50] প্রয়োজনে সম্পূর্ণ মডেল থেকে এলোমেলো প্রভাবগুলি মুছুন, ড্রপিং (i) স্বল্প জড়িত জৈবিক আগ্রহের শর্তাবলী, (ii) খুব স্বল্প অনুমানযুক্ত বৈকল্পিক এবং / অথবা বৃহত্তর অনিশ্চয়তা, বা (iii) মিথস্ক্রিয় শর্তাদি terms (রূপান্তর ত্রুটি বা শূন্য রূপগুলি অপর্যাপ্ত ডেটা নির্দেশ করতে পারে))
χ2
ওষুধের মূল্যায়ন করার জন্য অবশিষ্ট প্লটগুলি ব্যবহার করা উচিত এবং রূপান্তরিত রূপগুলি বিভাগে সমজাতীয় হওয়া উচিত। নিবন্ধের কোথাও উল্লেখ করা হয়নি যে অবশিষ্টাংশগুলি সাধারণত বিতরণ করার কথা।
আমি মনে করি যে বিরোধী বক্তব্য থাকার কারণটি জিএলএমএমগুলি (পৃষ্ঠা 127-128) প্রতিফলিত করে ...
... এমনকি পরিসংখ্যানবিদদের জন্য এমনকি অবাক করা ব্যবহার করা চ্যালেঞ্জ। যদিও বেশ কয়েকটি সফ্টওয়্যার প্যাকেজ জিএলএমএমগুলি পরিচালনা করতে পারে (টেবিল 1), কিছু বাস্তুবিদ এবং বিবর্তনীয় জীববিজ্ঞানী বিকল্পগুলির সীমা বা সম্ভাব্য সমস্যাগুলি সম্পর্কে অবগত আছেন। গুগল স্কলার দ্বারা প্রাপ্ত 2005 সাল থেকে বাস্তুশাস্ত্র এবং বিবর্তনের কাগজপত্র পর্যালোচনা করে, 537 জিএলএমএম বিশ্লেষণের মধ্যে 311 (58%) কোনও উপায়ে অনুপযুক্তভাবে এই সরঞ্জামগুলি ব্যবহার করেছে (অনলাইন পরিপূরক সামগ্রী দেখুন)।
এবং এখানে ডায়গনিস্টিক সহ GLMMs ব্যবহার কয়েক পরিপূর্ণ কাজ উদাহরণ।
আমি বুঝতে পারি যে এই উত্তরটি একটি মন্তব্যের মতো এবং এটির মতো আচরণ করা উচিত। তবে মন্তব্য বিভাগটি আমাকে এত দীর্ঘ মন্তব্য যোগ করার অনুমতি দেয় না। এছাড়াও যেহেতু আমি বিশ্বাস করি যে এই কাগজটি এই আলোচনার জন্য মূল্যবান (তবে দুর্ভাগ্যক্রমে পে-ওয়াল পিছনে), তাই আমি ভেবেছিলাম যে এখানে গুরুত্বপূর্ণ প্যাসেজগুলি উদ্ধৃত করা কার্যকর হবে।
উদ্ধৃত কাগজপত্র:
[১৫] - জিপি কুইন, এমজে কেফ (২০০২): জীববিজ্ঞানীদের জন্য পরীক্ষামূলক ডিজাইন এবং ডেটা বিশ্লেষণ, কেমব্রিজ বিশ্ববিদ্যালয় প্রেস University
[১]] - এমজে ক্রোলি (২০০২): স্ট্যাটিস্টিকাল কম্পিউটিং: এস-প্লাস, জন উইলি অ্যান্ড সন্স ব্যবহার করে ডেটা বিশ্লেষণের একটি ভূমিকা।
[২৮] - জেসি পিনহিরো, ডিএম বেটস (2000): এস এবং এস-প্লাস, স্প্রঞ্জারে মিশ্র-প্রভাবগুলির মডেল।
[49] - এফ। বৌদা, এস। ব্লানচার্ড (2005): মিশ্র-প্রভাবগুলির মডেলগুলির শর্তসাপেক্ষে আকাইকে তথ্য। বায়োমেট্রিকা, 92, পিপি 351–370।
[৫০] - এ। গেলম্যান, জে হিল (২০০)): রিগ্রেশন অ্যান্ড মাল্টিলেভেল / হায়ারার্কিকাল মডেলস, কেমব্রিজ ইউনিভার্সিটি প্রেস ব্যবহার করে ডেটা বিশ্লেষণ।
[]৪] - এনজে গোটেল্লি, এএম এলিসন (২০০৪): পরিবেশগত পরিসংখ্যানের এক প্রাইমার, সিনোয়ার অ্যাসোসিয়েটস।
[65] - এফজে হ্যারেল (2001): রিগ্রেশন মডেলিং কৌশলগুলি, স্প্রঞ্জার।
[] 66] - জে কে লিন্ডসে (1997): জেনারাইজড লিনিয়ার মডেলগুলি প্রয়োগ করছেন, স্প্রিংগার ger
[] 67] - ডাব্লু। ভেনেবলস, বিডি রিপলি (২০০২): এস, স্প্রিংজার সহ আধুনিক প্রয়োগিত পরিসংখ্যান।
glm.diag.plots
এটি জ্যাকনিফিড ডিভিলেন্স অবশিষ্টাংশের জন্য (আমি সন্দেহ করি যে পার্থক্য গুরুত্বপূর্ণ)। এছাড়াও, আমি আপনার গণনা তথ্য আছে সংগ্রহ ; আপনি যে সত্য উপর দৃষ্টি নিবদ্ধ করতে চাইতে পারেন। উদাহরণস্বরূপ, গণনাগুলি হেটেরোসেসটেস্টিক বলে মনে করা হয় (কিছুটা অর্থে)। গণনা প্রতিরোধের জন্য ডায়াগনস্টিক প্লটগুলি আপনার জন্য সহায়ক হওয়া উচিত (যদিও এটি মিক্সড এফেক্টস দিকটি দেখায় না)।