সাধারণ রৈখিক (মিশ্র) মডেলগুলির জন্য নির্ণয় (বিশেষত অবশিষ্টাংশ)


25

আমি বর্তমানে কঠিন গণনা ডেটার (নির্ভরশীল ভেরিয়েবল) সঠিক মডেল সন্ধানের সাথে লড়াই করছি। আমি বিভিন্ন ধরণের মডেল (মিশ্রিত প্রভাবগুলির মডেলগুলি আমার ধরণের ডেটার জন্য প্রয়োজনীয়) যেমন lmerএবং lme4(লগ রূপান্তর সহ) পাশাপাশি গৌসিয়ান বা নেতিবাচক দ্বিপদী হিসাবে বিভিন্ন পরিবারের সাথে রৈখিক মিশ্রিত প্রভাব মডেলগুলি চেষ্টা করেছি tried

তবে ফলস্বরূপ ফিটগুলি কীভাবে সঠিকভাবে নির্ণয় করা যায় সে সম্পর্কে আমি বেশ অনিশ্চিত। ওয়েবে আমি সেই বিষয়টিতে প্রচুর ভিন্ন মতামত পেয়েছি। আমি মনে করি লিনিয়ার (মিশ্র) রিগ্রেশন সম্পর্কিত ডায়াগনস্টিকগুলি বেশ সোজা-এগিয়ে রয়েছে। আপনি এগিয়ে যেতে পারেন এবং অবশিষ্টাংশের (স্বাভাবিকতা) বিশ্লেষণের পাশাপাশি অবশিষ্টাংশের তুলনায় উপযুক্ত মানগুলি প্লট করে হেটেরোসেসটাস্টিকটি অধ্যয়ন করতে পারেন।

তবে সাধারণ সংস্করণটির জন্য আপনি কীভাবে এটি সঠিকভাবে করবেন? আসুন আপাতত একটি নেতিবাচক দ্বিপদী (মিশ্র) রিগ্রেশনকে কেন্দ্র করি। আমি এখানে অবশিষ্টাংশ সম্পর্কে যথেষ্ট বিরোধী বক্তব্য দেখেছি:

  1. ইন সাধারণ রৈখিক মডেল স্বাভাবিক জন্য অবশিষ্টাংশ চেক করা হচ্ছে এটি প্রথম উত্তর যে প্লেইন অবশিষ্টাংশ সাধারণত একটি GLM জন্য বিতরণ করা হয় নির্দিষ্ট করা হয়; আমি মনে করি এটি পরিষ্কার। যাইহোক, তবে এটি চিহ্নিত করা হয়েছে যে পিয়ারসন এবং ডিভ্যান্সের অবশিষ্টাংশগুলিও সাধারণ হওয়ার কথা নয়। তবুও, দ্বিতীয় উত্তরে বলা হয়েছে যে ডিভ্যান্সের অবশিষ্টাংশগুলি সাধারণত বিতরণ করা উচিত (একটি রেফারেন্সের সাথে মিলিত)।

  2. যদিও ডিভ্যান্সের অবশিষ্টাংশগুলি সাধারণত বিতরণ করা উচিত ? Glm.diag.plots (আর এর bootপ্যাকেজ থেকে) এর জন্য ডকুমেন্টেশনে ইঙ্গিত দেওয়া হয় ।

  3. ইন এই ব্লগ পোস্টে , লেখক প্রথম আমি কি অনুমান সেই স্বাভাবিকত্বের কারণটি চর্চিত একটি বিশেষ দ্রষ্টব্য মিশ্র-প্রতিক্রিয়া রিগ্রেশন মডেল জন্য পিয়ারসন অবশিষ্টাংশ হয়। যেমনটি প্রত্যাশিত (আমার সৎ মতামত অনুসারে) অবশিষ্টাংশগুলি স্বাভাবিক হিসাবে দেখায় নি এবং লেখক এই মডেলটিকে একটি খারাপ ফিট হিসাবে ধরে নিয়েছেন। তবে মন্তব্যে যেমন বলা হয়েছে, অবশিষ্টগুলি একটি নেতিবাচক দ্বিপদী বিতরণ অনুযায়ী বিতরণ করা উচিত। আমার মতে, এটি সত্যের নিকটে আসে কারণ জিএলএমের অবশিষ্টাংশের সাধারণের তুলনায় অন্য বিতরণ থাকতে পারে। এটা কি সঠিক? হিটারোসিসেস্টাস্টিটির মতো জিনিসগুলি এখানে কীভাবে পরীক্ষা করবেন?

  4. বেন অ্যান্ড ইয়োহাই (2004) -র শেষ পয়েন্টটি (আনুমানিক বিতরণের পরিমাণের তুলনায় অবশিষ্ট প্লট করা) জোর দেওয়া হয়েছে । বর্তমানে, এটি আমার পক্ষে যাওয়ার উপায় বলে মনে হচ্ছে।

সংক্ষেপে: আপনি কীভাবে সঠিকভাবে অবশিষ্টাংশের উপর দৃষ্টি নিবদ্ধ রেখে জেনারেলাইজড লিনিয়ার (মিশ্রিত) রিগ্রেশন মডেলগুলি ফিট করে?


1
জিএলএমগুলির অবশিষ্টাংশগুলি সাধারণভাবে হয় না (সিএফ এখানে ) তবে লক্ষ্য করুন যে জিএলএমগুলির জন্য প্রচুর পরিমাণে অবশিষ্টাংশ রয়েছে। উদাহরণস্বরূপ, glm.diag.plotsএটি জ্যাকনিফিড ডিভিলেন্স অবশিষ্টাংশের জন্য (আমি সন্দেহ করি যে পার্থক্য গুরুত্বপূর্ণ)। এছাড়াও, আমি আপনার গণনা তথ্য আছে সংগ্রহ ; আপনি যে সত্য উপর দৃষ্টি নিবদ্ধ করতে চাইতে পারেন। উদাহরণস্বরূপ, গণনাগুলি হেটেরোসেসটেস্টিক বলে মনে করা হয় (কিছুটা অর্থে)। গণনা প্রতিরোধের জন্য ডায়াগনস্টিক প্লটগুলি আপনার জন্য সহায়ক হওয়া উচিত (যদিও এটি মিক্সড এফেক্টস দিকটি দেখায় না)।
গং - মনিকা পুনরায় স্থাপন করুন

আপনার উল্লিখিত পোস্টের সাথে আমি পরিচিত। যাইহোক, একটি বিবৃতিও রয়েছে যা প্রস্তাব দেয় যে (বিচ্যুতি) অবশিষ্টাংশগুলি স্বাভাবিক হওয়া উচিত "আমরা খুব বড় অবশিষ্টাংশ এবং সাধারণ থেকে বিচ্যুততার অবশিষ্টাংশের যথেষ্ট পরিমাণে বিচ্যুতি দেখি (সকলেই পোয়েসনের বিরুদ্ধে কথা বলছি)"।
fsociversity

উত্তর:


18

এই উত্তরটি আমার জ্ঞানের উপর ভিত্তি করে নয় বরং বলকার এট আল এর উদ্ধৃতি দিয়েছে। (২০০৯) ট্রেন্ডস ইন ইকোলজি অ্যান্ড ইভোলিউশন জার্নালে একটি প্রভাবশালী কাগজে লিখেছিলেন । নিবন্ধটি যেহেতু উন্মুক্ত অ্যাক্সেস নয় (যদিও এটি গুগল পন্ডিতের কাছে অনুসন্ধান করা সফল হতে পারে, তাই আমি ভেবেছিলাম যে গুরুত্বপূর্ণ প্যাসেজগুলি প্রশ্নের অংশগুলির সমাধানের জন্য সহায়ক হতে পারে So তাই আবার, আমি নিজের সাথে এলাম না তবে আমি মনে করি এটি জিএলএমএমগুলিতে (ইনক্লুডিং ডায়াগোনস্টিকস) সর্বাধিক সরল এগিয়ে এবং সহজভাবে লেখার স্টাইল বোঝার পক্ষে উপস্থাপন করে। যদি কোনও কারণেই এই উত্তরটি যে কোনও কারণে উপযুক্ত না হয় তবে আমি কেবল এটি মুছে ফেলব Th যে জিনিসগুলি আমি খুঁজে পাই ডায়াগনস্টিকস সম্পর্কিত প্রশ্নগুলির ক্ষেত্রে কার্যকরভাবে হাইলাইট করা হয়েছেসাহসী

পৃষ্ঠা 127:

অস্বাভাবিক তথ্যের মুখোমুখি গবেষকরা প্রায়শই শর্টকাটগুলি ব্যবহার করে যেমন স্বাভাবিকতা এবং বৈকল্পিকতার এককতা অর্জনের জন্য ডেটা ট্রান্সফর্ম করা, ননপ্যারমেট্রিক টেস্ট ব্যবহার করে বা ভারসাম্য নকশার জন্য অস্বাভাবিকতাকে ক্লাসিকাল এএনওওএর দৃust়তার উপর নির্ভর করে [15] তারা এলোমেলো প্রভাবগুলি পুরোপুরি উপেক্ষা করতে পারে (এইভাবে সিউডোরপ্লিকেশন করা) বা তাদেরকে স্থির কারণ হিসাবে বিবেচনা করা [16]। তবে, এই জাতীয় শর্টকাটগুলি ব্যর্থ হতে পারে (উদাহরণস্বরূপ অনেক শূন্য মান সহ গণ্য ডেটা রূপান্তর দ্বারা সাধারণ করা যায় না)। এমনকি তারা সফল হওয়ার পরেও তারা পরিসংখ্যানগত অনুমানগুলি লঙ্ঘন করতে পারে (এমনকি ননপ্যারমেট্রিক টেস্টগুলি অনুমানগুলি তৈরি করে, যেমন গোষ্ঠীগুলির মধ্যে বৈচিত্রের একজাতীয়তা) বা অনুমানের সুযোগকে সীমাবদ্ধ করে (কোনও ব্যক্তি নতুন গ্রুপগুলিতে স্থির প্রভাবগুলির অনুমানকে বহির্ভূত করতে পারে না)। শাস্ত্রীয় পরিসংখ্যান কাঠামোগুলিতে তাদের ডেটা জুতো ছড়িয়ে দেওয়ার পরিবর্তে, গবেষকদের তাদের তথ্যের সাথে মেলে এমন পরিসংখ্যানিক পদ্ধতির ব্যবহার করা উচিত। জেনারালাইজড লিনিয়ার মিক্সড মডেল (জিএলএমএমস) দুটি পরিসংখ্যান কাঠামোর বৈশিষ্ট্যগুলিকে একত্রিত করে যা বাস্তু এবং বিবর্তনে ব্যাপকভাবে ব্যবহৃত হয়, লিনিয়ার মিশ্রিত মডেল (যা র্যান্ডম এফেক্টগুলি অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং ক্ষতিকারক পরিবার ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে [যেমন স্বাভাবিক, পোইসন বা দ্বিপদী] বিতরণ)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে। লিনিয়ার মিশ্রিত মডেল (যা এলোমেলো প্রভাবগুলিকে অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং তাত্পর্যমূলক পরিবার [যেমন সাধারণ, পোইসন বা দ্বিপদী] বিতরণ ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে। লিনিয়ার মিশ্রিত মডেল (যা এলোমেলো প্রভাবগুলিকে অন্তর্ভুক্ত করে) এবং সাধারণ রৈখিক মডেল (যা লিঙ্ক ফাংশন এবং তাত্পর্যমূলক পরিবার [যেমন সাধারণ, পোইসন বা দ্বিপদী] বিতরণ ব্যবহার করে অস্বাভাবিক ডেটা পরিচালনা করে)। এলোমেলো প্রভাবগুলির সাথে জড়িত অস্বাভাবিক তথ্য বিশ্লেষণের জন্য জিএলএমএমস হ'ল সেরা হাতিয়ার: নীতিগতভাবে সকলকেই করতে হয়, এলোমেলো প্রভাবগুলির একটি বিতরণ, লিঙ্ক ফাংশন এবং কাঠামো নির্দিষ্ট করে।

পৃষ্ঠা 129, বক্স 1:

অবশিষ্টাংশ overdispersion নির্দেশিত , তাই আমরা একটি আপাতদৃষ্টিতে পইসন মডেল সাথে ডেটা refitted। বৃহত আনুমানিক স্কেল প্যারামিটার (10.8) সত্ত্বেও, অনুসন্ধানের গ্রাফগুলি ব্যক্তি, জিনোটাইপস বা জনসংখ্যার পর্যায়ে বিদেশিদের কোনও প্রমাণ পায়নি। আমরা আধা-এআইসি (কিউএআইসি) ব্যবহার করেছি, এলোমেলো প্রভাবগুলির জন্য এক ডিগ্রি স্বাধীনতা [49], এলোমেলো প্রভাবের জন্য এবং তারপরে স্থির-প্রভাব মডেল নির্বাচনের জন্য ব্যবহার করেছি।

পৃষ্ঠা 133, বাক্স 4:

এখানে আমরা একটি পূর্ণ (সবচেয়ে জটিল) মডেল তৈরির জন্য একটি সাধারণ কাঠামোর রূপরেখা দিই, জিএলএমএম বিশ্লেষণের প্রথম ধাপ। এই প্রক্রিয়াটি অনুসরণ করে, পরে প্যারামিটারগুলি মূল্যায়ন করতে এবং মূল পাঠ্যতে এবং চিত্র 1 এ বর্ণিত সাব-মডেলগুলি তুলনা করতে পারে।

  1. স্থির (চিকিত্সা বা covariates) এবং এলোমেলো প্রভাব (পরীক্ষামূলক, স্থানিক বা টেম্পোরাল ব্লক, ব্যক্তি, ইত্যাদি) নির্দিষ্ট করুন। শুধুমাত্র গুরুত্বপূর্ণ ইন্টারঅ্যাকশন অন্তর্ভুক্ত করুন। থাম্বের নিয়মের ভিত্তিতে মডেলটিকে জটিলতার সম্ভাব্য স্তরের অগ্রাধিকারকে সীমাবদ্ধ করুন (> এলোমেলো প্রভাবের ভিত্তিতে>> 5-6 এলোমেলো-প্রভাব স্তর এবং> চিকিত্সা স্তরের প্রতি 10-20 নমুনা বা পরীক্ষামূলক ইউনিট) এবং প্রাপ্ত পর্যাপ্ত নমুনা আকারের জ্ঞান পূর্ববর্তী অধ্যয়ন [,৪,65৫]।

  2. একটি ত্রুটি বিতরণ এবং লিঙ্ক ফাংশন চয়ন করুন (যেমন গণনা ডেটার জন্য পোইসন বিতরণ এবং লগ লিঙ্ক, অনুপাতের ডেটার জন্য দ্বিপদী বিতরণ এবং লগিট লিঙ্ক)।

  3. গ্রাফিকাল চেকিং : ডেটাগুলির রূপগুলি (লিঙ্ক ফাংশন দ্বারা রূপান্তরিত) বিভাগগুলিতে সমজাতীয় হয়? রূপান্তরিত ডেটা লিনিয়ারের প্রতিক্রিয়া কি অবিচ্ছিন্ন পূর্বাভাসীদের প্রতি শ্রদ্ধাশীল? আউটরিয়ার ব্যক্তি বা দল আছে? গোষ্ঠীগুলির মধ্যে বিতরণগুলি কি অনুমান করা বিতরণের সাথে মেলে?

  4. সম্পূর্ণ (পোল্ড) ডেটা সেট এবং এলোমেলো উপাদানগুলির প্রতিটি স্তরের মধ্যে স্থির-কার্যকর জিএলএম উভয়ই ফিট করুন [28,50]। আনুমানিক প্যারামিটারগুলি প্রায় গ্রুপগুলিতে প্রায় বিতরণ করা উচিত (গ্রুপ-স্তরের প্যারামিটারগুলিতে বড় অনিশ্চয়তা থাকতে পারে, বিশেষত ছোট নমুনা আকারের গ্রুপগুলির জন্য)। প্রয়োজনীয় হিসাবে মডেল সামঞ্জস্য করুন (উদা লিঙ্ক ফাংশন পরিবর্তন বা covariates যোগ করুন)।

  5. পুরো জিএলএমএম ফিট করুন। অপর্যাপ্ত কম্পিউটারের মেমরি বা খুব ধীর: মডেলের জটিলতা হ্রাস করুন। যদি ডেটাটির উপসেটটিতে অনুমান সফল হয়, তবে আরও দক্ষ অনুমানের অ্যালগরিদম চেষ্টা করুন (উদাহরণস্বরূপ যদি উপযুক্ত হয় তবে পিকিউএল)। রূপান্তর করতে ব্যর্থতা (সতর্কতা বা ত্রুটি): মডেল জটিলতা হ্রাস করুন বা অপ্টিমাইজেশন সেটিংস পরিবর্তন করুন (ফলাফলগুলি উত্তরগুলি বোধগম্য করে তা নিশ্চিত করুন)। অন্যান্য অনুমানের অ্যালগরিদম ব্যবহার করে দেখুন। জিরো ভেরিয়েন্স উপাদান বা এককতা (সতর্কতা বা ত্রুটি): মডেলটি সঠিকভাবে সংজ্ঞায়িত এবং সনাক্তযোগ্য (যেমন সমস্ত উপাদান তাত্ত্বিকভাবে অনুমান করা যায়) তা পরীক্ষা করে দেখুন। মডেল জটিলতা হ্রাস করুন। মডেলটিতে অতিরিক্ত সংযোজন (অতিরিক্ত কোভারিয়েটস, বা এলোমেলো প্রভাবের জন্য নতুন গোষ্ঠীকরণ) সমস্যাগুলি হ্রাস করতে পারে, যেহেতু অবিচ্ছিন্ন কোভেরিয়ट्सকে তাদের গড় বিয়োগ করে কেন্দ্র করবে [50] প্রয়োজনে সম্পূর্ণ মডেল থেকে এলোমেলো প্রভাবগুলি মুছুন, ড্রপিং (i) স্বল্প জড়িত জৈবিক আগ্রহের শর্তাবলী, (ii) খুব স্বল্প অনুমানযুক্ত বৈকল্পিক এবং / অথবা বৃহত্তর অনিশ্চয়তা, বা (iii) মিথস্ক্রিয় শর্তাদি terms (রূপান্তর ত্রুটি বা শূন্য রূপগুলি অপর্যাপ্ত ডেটা নির্দেশ করতে পারে))

  6. χ2

ওষুধের মূল্যায়ন করার জন্য অবশিষ্ট প্লটগুলি ব্যবহার করা উচিত এবং রূপান্তরিত রূপগুলি বিভাগে সমজাতীয় হওয়া উচিত। নিবন্ধের কোথাও উল্লেখ করা হয়নি যে অবশিষ্টাংশগুলি সাধারণত বিতরণ করার কথা।

আমি মনে করি যে বিরোধী বক্তব্য থাকার কারণটি জিএলএমএমগুলি (পৃষ্ঠা 127-128) প্রতিফলিত করে ...

... এমনকি পরিসংখ্যানবিদদের জন্য এমনকি অবাক করা ব্যবহার করা চ্যালেঞ্জ। যদিও বেশ কয়েকটি সফ্টওয়্যার প্যাকেজ জিএলএমএমগুলি পরিচালনা করতে পারে (টেবিল 1), কিছু বাস্তুবিদ এবং বিবর্তনীয় জীববিজ্ঞানী বিকল্পগুলির সীমা বা সম্ভাব্য সমস্যাগুলি সম্পর্কে অবগত আছেন। গুগল স্কলার দ্বারা প্রাপ্ত 2005 সাল থেকে বাস্তুশাস্ত্র এবং বিবর্তনের কাগজপত্র পর্যালোচনা করে, 537 জিএলএমএম বিশ্লেষণের মধ্যে 311 (58%) কোনও উপায়ে অনুপযুক্তভাবে এই সরঞ্জামগুলি ব্যবহার করেছে (অনলাইন পরিপূরক সামগ্রী দেখুন)।

এবং এখানে ডায়গনিস্টিক সহ GLMMs ব্যবহার কয়েক পরিপূর্ণ কাজ উদাহরণ।

আমি বুঝতে পারি যে এই উত্তরটি একটি মন্তব্যের মতো এবং এটির মতো আচরণ করা উচিত। তবে মন্তব্য বিভাগটি আমাকে এত দীর্ঘ মন্তব্য যোগ করার অনুমতি দেয় না। এছাড়াও যেহেতু আমি বিশ্বাস করি যে এই কাগজটি এই আলোচনার জন্য মূল্যবান (তবে দুর্ভাগ্যক্রমে পে-ওয়াল পিছনে), তাই আমি ভেবেছিলাম যে এখানে গুরুত্বপূর্ণ প্যাসেজগুলি উদ্ধৃত করা কার্যকর হবে।

উদ্ধৃত কাগজপত্র:

[১৫] - জিপি কুইন, এমজে কেফ (২০০২): জীববিজ্ঞানীদের জন্য পরীক্ষামূলক ডিজাইন এবং ডেটা বিশ্লেষণ, কেমব্রিজ বিশ্ববিদ্যালয় প্রেস University

[১]] - এমজে ক্রোলি (২০০২): স্ট্যাটিস্টিকাল কম্পিউটিং: এস-প্লাস, জন উইলি অ্যান্ড সন্স ব্যবহার করে ডেটা বিশ্লেষণের একটি ভূমিকা।

[২৮] - জেসি পিনহিরো, ডিএম বেটস (2000): এস এবং এস-প্লাস, স্প্রঞ্জারে মিশ্র-প্রভাবগুলির মডেল।

[49] - এফ। বৌদা, এস। ব্লানচার্ড (2005): মিশ্র-প্রভাবগুলির মডেলগুলির শর্তসাপেক্ষে আকাইকে তথ্য। বায়োমেট্রিকা, 92, পিপি 351–370।

[৫০] - এ। গেলম্যান, জে হিল (২০০)): রিগ্রেশন অ্যান্ড মাল্টিলেভেল / হায়ারার্কিকাল মডেলস, কেমব্রিজ ইউনিভার্সিটি প্রেস ব্যবহার করে ডেটা বিশ্লেষণ।

[]৪] - এনজে গোটেল্লি, এএম এলিসন (২০০৪): পরিবেশগত পরিসংখ্যানের এক প্রাইমার, সিনোয়ার অ্যাসোসিয়েটস।

[65] - এফজে হ্যারেল (2001): রিগ্রেশন মডেলিং কৌশলগুলি, স্প্রঞ্জার।

[] 66] - জে কে লিন্ডসে (1997): জেনারাইজড লিনিয়ার মডেলগুলি প্রয়োগ করছেন, স্প্রিংগার ger

[] 67] - ডাব্লু। ভেনেবলস, বিডি রিপলি (২০০২): এস, স্প্রিংজার সহ আধুনিক প্রয়োগিত পরিসংখ্যান।


ধন্যবাদ, এটি সত্যই সহায়ক, আমি বলকারের কোডিং উদাহরণগুলি সম্পর্কে জানতাম, তবে প্রকৃত কাগজটি কোনওভাবেই নয়। যদিও আমি এখনও আশ্চর্য হই তা কীভাবে গ্রাফিকাল চেকিং হাজার হাজার গোষ্ঠী সহ খুব বড় আকারের ডেটাতে প্রযোজ্য। কয়েকটি মডেল (যেমন একটি হিসাবে) আপনার মডেলগুলি কীভাবে সঠিকভাবে পরীক্ষা করতে হয় সে সম্পর্কে কিছু নির্দেশিকা দেওয়ার চেষ্টা করে যা কেবলমাত্র খুব ছোট-স্কেলের ডেটাতে প্রযোজ্য। তারপরে, গ্রুপগুলি বেছে নেওয়া এবং কিছু কল্পনা করা খুব সহজ। আমি সত্যিই ভাবি যে কেউ যদি ভবিষ্যতে আরও জটিল উদাহরণ দিয়ে যায় তবে একটি ভাল বৈজ্ঞানিক অবদান করা যেতে পারে।
fsociversity

1
আমি আনন্দিত যে এটি দরকারী ছিল! আমি মনে করি উপস্থাপিত উদাহরণগুলি ইতিমধ্যে বেশ জটিল (কমপক্ষে আমার কাছে)। আমি অনুমান করি যে বড় সমস্যাটি হ'ল বৃহত্তর ডেটাসেট এবং আরও জটিল মডেলগুলি পাঠ্যতে উল্লিখিত হিসাবে গণ্যরূপে অপরিবর্তনীয় হয়ে উঠতে পারে: "[...] এমএল অনুমানের জন্য, এলোমেলো প্রভাবগুলির সমস্ত সম্ভাব্য মানের চেয়ে সম্ভাবনা একীভূত করতে হবে। জিএলএমএমসের জন্য এই গণনাটি সবচেয়ে ধীর এবং সবচেয়ে খারাপ (উদাহরণস্বরূপ প্রচুর সংখ্যক এলোমেলো প্রভাবের জন্য) গণনাযোগ্যভাবে অক্ষম। " যদিও আমি আশ্চর্যজনক মনে করি এবং কী মনে রাখা উচিত তা হ'ল আমরা সক্রিয় গবেষণার অধীনে এমন সরঞ্জামগুলি ব্যবহার করছি!
স্টিফান

9

এটি একটি পুরানো প্রশ্ন, তবে আমি ভেবেছিলাম যে ওপি দ্বারা প্রস্তাবিত বিকল্প 4 যোগ করার জন্য এটি দরকারী হবে এখন DHARMA আর প্যাকেজে উপলব্ধ (সিআরএএন থেকে উপলব্ধ, এখানে দেখুন) )।

প্যাকেজটি গ্রহণযোগ্য উত্তরের প্রস্তাবিত ভিজ্যুয়াল অবশিষ্টাংশগুলি অনেক বেশি নির্ভরযোগ্য / সহজ করে তোলে।

প্যাকেজ বিবরণ থেকে:

ডিএইচআরএমএ প্যাকেজটি উপযুক্ত সাধারণ রৈখিক রৈখিক মিশ্র মডেলগুলি থেকে সহজেই ব্যাখ্যাযোগ্য স্কেলযুক্ত অবশিষ্টাংশ তৈরি করতে সিমুলেশন-ভিত্তিক পদ্ধতির ব্যবহার করে। বর্তমানে সমর্থিত সমস্ত 'মেরমড' ক্লাসগুলি 'lme4' ('লিমারমড', 'গ্লমারমড'), 'গ্ল্যাম' ('এমএসএস' থেকে 'নেগবিন' সহ, তবে অর্ধ-বিতরণ বাদে) এবং 'এলএম' মডেল ক্লাস রয়েছে। বিকল্পভাবে, বাহ্যিকভাবে তৈরি সিমুলেশনগুলি, যেমন 'জেজিএস', 'স্ট্যান', বা 'বাজিএস' এর মতো বায়েশিয়ান সফ্টওয়্যার থেকে পরবর্তী ভবিষ্যদ্বাণীমূলক সিমুলেশনগুলিও প্রক্রিয়া করা যায়। ফলস্বরূপ অবশিষ্টাংশগুলি 0 এবং 1 এর মধ্যে মানগুলিতে মানীকৃত হয় এবং লিনিয়ার রিগ্রেশন থেকে অবশিষ্টাংশ হিসাবে স্বজ্ঞাতভাবে ব্যাখ্যা করা যায়। প্যাকেজটি টিপিক্যাল মডেলটির অপব্যবহারের সমস্যাটির জন্য বেশ কয়েকটি প্লট এবং পরীক্ষার ফাংশন সরবরাহ করে,


1
এই থ্রেডে খুব ভাল সংযোজন!
স্টেফান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.