এটি স্ট্যাক এক্সচেঞ্জে আমার প্রথম পোস্ট, তবে আমি এটি বেশ কিছুদিন ধরে একটি উত্স হিসাবে ব্যবহার করে আসছি, আমি উপযুক্ত ফর্ম্যাটটি ব্যবহার করার এবং যথাযথ সম্পাদনা করার জন্য যথাসাধ্য চেষ্টা করব। এছাড়াও, এটি একটি বহুমাত্রিক প্রশ্ন। আমি নিশ্চিত ছিলাম না যে আমাকে প্রশ্নটি বেশ কয়েকটি ভিন্ন পোস্টে বা কেবল একটিতে ভাগ করা উচিত। যেহেতু প্রশ্নগুলি একই পাঠ্যের এক বিভাগের থেকে আমি ভেবেছিলাম এটি একটি প্রশ্ন হিসাবে পোস্ট করা আরও প্রাসঙ্গিক হবে।
আমি মাস্টার্স থিসিসের জন্য একটি বৃহত স্তন্যপায়ী প্রজাতির বাসস্থান ব্যবহার নিয়ে গবেষণা করছি। এই প্রকল্পের লক্ষ্য হ'ল বন পরিচালকদের (যারা সম্ভবত পরিসংখ্যানবিদ নয়) তারা এই প্রজাতির বিষয়ে যে জমিগুলি পরিচালনা করেন তাদের আবাসের মানের মূল্যায়ন করার জন্য একটি বাস্তব কাঠামো সরবরাহ করা। এই প্রাণীটি তুলনামূলক অধরা, একটি আবাস বিশেষজ্ঞ, এবং সাধারণত প্রত্যন্ত অঞ্চলে অবস্থিত। প্রজাতিগুলির বিতরণ, বিশেষত মৌসুমী সম্পর্কিত তুলনামূলকভাবে অল্প অধ্যয়ন করা হয়েছে। এক বছরের জন্য বেশ কয়েকটি প্রাণীর জিপিএস কলার লাগানো ছিল। প্রতিটি প্রাণীর জিপিএস কলার ডেটা থেকে এলোমেলোভাবে একশত অবস্থান (50 গ্রীষ্ম এবং 50 শীতকালীন) নির্বাচন করা হয়েছিল। তদতিরিক্ত, 50 টি পয়েন্ট প্রতিটি প্রাণীর হোম রেঞ্জের মধ্যে "উপলব্ধ" বা "ছদ্ম-অনুপস্থিতি" অবস্থান হিসাবে এলোমেলোভাবে উত্পন্ন হয়েছিল।
প্রতিটি অবস্থানের জন্য, বেশ কয়েকটি আবাসস্থল ভেরিয়েবল ক্ষেত্রের মধ্যে নমুনাযুক্ত হয়েছিল (গাছের ব্যাস, অনুভূমিক আবরণ, মোটা উচু ধ্বংসাবশেষ ইত্যাদি) এবং বেশ কয়েকটি জিআইএসের মাধ্যমে দূরবর্তীভাবে নমুনা তৈরি করা হয়েছিল (উচ্চতা, রাস্তা থেকে দূরত্ব, অসঙ্গততা ইত্যাদি)। ভেরিয়েবলগুলি 7 টি স্তরযুক্ত 1 শ্রেণীবদ্ধ ভেরিয়েবল বাদে বেশিরভাগ ক্ষেত্রে অবিচ্ছিন্ন থাকে।
আমার লক্ষ্য হ'ল সংস্থান ব্যবহারের অপেক্ষাকৃত সম্ভাব্যতার মডেল করার জন্য রিসেশন মডেলিংটি রিসোর্স সিলেকশন ফাংশনগুলি (আরএসএফ) তৈরি করতে ব্যবহার করা। আমি প্রাণীদের (ডিজাইনের ধরণ I) জনসংখ্যার পাশাপাশি প্রতিটি পৃথক প্রাণী (নকশার ধরণ III) এর জন্য একটি মৌসুমী (শীত এবং গ্রীষ্ম) আরএসএফ তৈরি করতে চাই।
আমি পরিসংখ্যান বিশ্লেষণ সম্পাদন করতে আর ব্যবহার করছি।
আমি যে প্রাথমিক পাঠটি ব্যবহার করছি তা হ'ল ...
- "হোসমার, ডিডাব্লু, লেমেশো, এস।, এবং স্টারডাইভ্যান্ট, আরএক্স 2013. প্রয়োগিত লজিস্টিক রিগ্রেশন। উইলি, চিসেস্টার"।
হোসমার এট আল এর বেশিরভাগ উদাহরণ। স্টাটা ব্যবহার করুন, আমি আর এর সাথে রেফারেন্সের জন্য নিম্নলিখিত 2 টি পাঠ্যও ব্যবহার করছি ।
- "ক্রাওলি, এমজে 2005. পরিসংখ্যান: আর জে উইলি, চিচেস্টার, ওয়েস্ট সাসেক্স, ইংল্যান্ড ব্যবহার করে একটি ভূমিকা"।
- "উদ্ভিদ, আরই 2012. আর। সিআরসি প্রেস, লন্ডন, জিবিআর ব্যবহার করে বাস্তুশাস্ত্র এবং কৃষিক্ষেত্রে স্থানিক ডেটা বিশ্লেষণ।"
আমি বর্তমানে হোসমার এট আল এর চতুর্থ অধ্যায়টির পদক্ষেপগুলি অনুসরণ করছি । "Covariates এর উদ্দেশ্যমূলক নির্বাচন" এর জন্য এবং প্রক্রিয়াটি সম্পর্কে কয়েকটি প্রশ্ন রয়েছে। আমার প্রশ্নগুলিতে সহায়তা করার জন্য আমি নীচের পাঠ্যের প্রথম কয়েকটি পদক্ষেপের রূপরেখা দিয়েছি।
- পদক্ষেপ 1: প্রতিটি স্বতন্ত্র ভেরিয়েবলের একটি অবিভাজ্য বিশ্লেষণ (আমি একটি অবিচ্ছেদ্য লজিস্টিক রিগ্রেশন ব্যবহার করেছি)। যেকোন পরিবর্তনশীল যার অবিভাজ্য পরীক্ষার পি-মান 0.25 এর চেয়ে কম থাকে প্রথম মাল্টিভারিয়াল মডেলটিতে অন্তর্ভুক্ত করা উচিত।
- পদক্ষেপ 2: পদক্ষেপ 1 এ অন্তর্ভুক্তির জন্য চিহ্নিত এবং প্রতিটি কোভারিয়েটের গুরুত্বটি মূল্যায়নের জন্য তার ওয়াল্ড পরিসংখ্যানের পি-মানটি ব্যবহার করে সমস্ত কোভারিয়েটযুক্ত একটি মাল্টিভেয়ারযোগ্য মডেল ফিট করুন। প্রচলিত তাত্পর্যপূর্ণ পর্যায়ে অবদান রাখে না এমন ভেরিয়েবলগুলি মুছে ফেলা উচিত এবং একটি নতুন মডেল ফিট। নতুন, আরও ছোট মডেলের সাথে আংশিক সম্ভাবনা অনুপাতের পরীক্ষাটি ব্যবহার করে পুরানো, বৃহত্তর মডেলের সাথে তুলনা করা উচিত।
- পদক্ষেপ 3: ছোট মডেলের আনুমানিক সহগের মানগুলি বড় মডেল থেকে তাদের নিজ নিজ মানের সাথে তুলনা করুন। যে কোনও পরিবর্তনশীল যার সহগ মাত্রায় প্রচ্ছন্নভাবে পরিবর্তিত হয়েছে তাকে আবার মডেলের সাথে যুক্ত করা উচিত কারণ এটি মডেলটিতে থাকা ভেরিয়েবলগুলির প্রভাবের প্রয়োজনীয় সমন্বয় প্রদানের অর্থে গুরুত্বপূর্ণ। 2 এবং 3 পদক্ষেপের মধ্য দিয়ে চক্রটি উপস্থিত না হওয়া অবধি অবধি গুরুত্বপূর্ণ সমস্ত পরিবর্তনশীলগুলিকে মডেলের অন্তর্ভুক্ত করা হয়েছে এবং বাদ দেওয়াগুলি চিকিত্সা এবং / অথবা পরিসংখ্যানগতভাবে গুরুত্বহীন। হোসমার এট আল। সহগের পরিমাণের পরিবর্তনের পরিমাপ হিসাবে " ডেল্টা-বিটা-হ্যাট-শতাংশ " ব্যবহার করুন । তারা 20% এর ডেল্টা-বিটা-হ্যাট-শতাংশ হিসাবে উল্লেখযোগ্য পরিবর্তন প্রস্তাব করে suggest হোসমার এট আল। ডেল্টা-বিটা-হ্যাট-শতাংশ হিসাবে হিসাবে সংজ্ঞায়িত করুন। যেখানে ছোট মডেলের সহগ এবং and the বৃহত্তর মডেলের সহগ fficient
- পদক্ষেপ 4: একবারে একবারে একবারে পদক্ষেপ 3 এর শেষে প্রাপ্ত মডেলটিতে প্রথম ধাপে নির্বাচিত নয় এমন প্রতিটি ভেরিয়েবল যুক্ত করুন এবং ওয়াল্ড স্ট্যাটিস্টিক পি-মান বা আংশিক সম্ভাবনা অনুপাত পরীক্ষার মাধ্যমে এটির তাত্পর্য পরীক্ষা করুন যদি এটি শ্রেণিবদ্ধ হয় 2 টিরও বেশি স্তরের সাথে পরিবর্তনশীল। এই পদক্ষেপটি ভেরিয়েবলগুলি সনাক্ত করার জন্য অতীব গুরুত্বপূর্ণ যা তারা নিজেরাই ফলাফলের সাথে উল্লেখযোগ্যভাবে সম্পর্কিত নয় তবে অন্যান্য ভেরিয়েবলের উপস্থিতিতে গুরুত্বপূর্ণ অবদান রাখে। আমরা পদক্ষেপ 4 এর শেষে মডেলটিকে প্রাথমিক প্রধান প্রভাবগুলির মডেল হিসাবে উল্লেখ করি ।
- পদক্ষেপ 5-7: আমি এই পর্যায়ে অগ্রসর হই নি তাই আমি এই পদক্ষেপগুলি আপাতত ছেড়ে দেব, বা অন্য কোনও প্রশ্নের জন্য সেগুলি সংরক্ষণ করব।
আমার প্রশ্নগুলো:
- পদক্ষেপ 2 এ, traditionalতিহ্যগত তাত্পর্যপূর্ণ স্তরের হিসাবে <<0.05 এর মতো বড় কিছু <0.05 এর একটি পি-মান হিসাবে কী উপযুক্ত হবে?
- ২ য় ধাপে, আমি আংশিক সম্ভাবনা পরীক্ষার জন্য আমি যে আর কোডটি ব্যবহার করছি তা সঠিক এবং আমি নিশ্চিত করতে চাই যে আমি ফলাফলগুলি সঠিকভাবে ব্যাখ্যা করছি। এখানে আমি যা করছি তা এখানে…
anova(smallmodel,largemodel,test='Chisq')
পি-মানটি যদি তাৎপর্যপূর্ণ হয় (<0.05) আমি পরিবর্তনশীলটিকে আবার মডেলটিতে যুক্ত করব, যদি তা তুচ্ছ হয় তবে আমি মুছে ফেলার সাথে এগিয়ে যাই? - ৩ য় ধাপে, আমার ব-দ্বীপ-বিটা-হ্যাট-শতাংশ সম্পর্কিত একটি প্রশ্ন রয়েছে এবং কখন বাদ দেওয়া পরিবর্তনশীলটি মডেলটিতে যুক্ত করা উপযুক্ত appropriate উদাহরণস্বরূপ, আমি মডেল থেকে একটি ভেরিয়েবল বাদ রাখি এবং এটি > 20% দ্বারা আলাদা ভেরিয়েবলের জন্য পরিবর্তন করে। যাইহোক, এ> 20% পরিবর্তনের সঙ্গে পরিবর্তনশীল Δ বিটা % যেমন যদি এটা ধাপ 2 আগামী কয়েক চক্র মডেল থেকে বাদ দেওয়া হবে এবং 3. আমি কিভাবে উভয় ভেরিয়েবল একটি সংকল্প করতে পারেন তুচ্ছ এবং সৌন্দর্য মনে করা হয় মডেল থেকে অন্তর্ভুক্ত করা উচিত বা বাদ দেওয়া উচিত? যেহেতু আমি প্রথমে সর্বনিম্ন উল্লেখযোগ্য ভেরিয়েবলগুলি মুছে ফেলা করে একবারে 1 টি ভেরিয়েবল বাদ দিয়ে এগিয়ে চলেছি, তাই আমি ভেরিয়েবলটিকে অর্ডার থেকে বাদ দিতে দ্বিধা বোধ করছি।
100*((smallmodel$coef[2]-largemodel$coef[2])/largemodel$coef[2])