হোস্টার এট আল ব্যবহার করে মডেল বিল্ডিং এবং নির্বাচন। 2013. আর এ প্রয়োগযুক্ত লজিস্টিক রিগ্রেশন


17

এটি স্ট্যাক এক্সচেঞ্জে আমার প্রথম পোস্ট, তবে আমি এটি বেশ কিছুদিন ধরে একটি উত্স হিসাবে ব্যবহার করে আসছি, আমি উপযুক্ত ফর্ম্যাটটি ব্যবহার করার এবং যথাযথ সম্পাদনা করার জন্য যথাসাধ্য চেষ্টা করব। এছাড়াও, এটি একটি বহুমাত্রিক প্রশ্ন। আমি নিশ্চিত ছিলাম না যে আমাকে প্রশ্নটি বেশ কয়েকটি ভিন্ন পোস্টে বা কেবল একটিতে ভাগ করা উচিত। যেহেতু প্রশ্নগুলি একই পাঠ্যের এক বিভাগের থেকে আমি ভেবেছিলাম এটি একটি প্রশ্ন হিসাবে পোস্ট করা আরও প্রাসঙ্গিক হবে।

আমি মাস্টার্স থিসিসের জন্য একটি বৃহত স্তন্যপায়ী প্রজাতির বাসস্থান ব্যবহার নিয়ে গবেষণা করছি। এই প্রকল্পের লক্ষ্য হ'ল বন পরিচালকদের (যারা সম্ভবত পরিসংখ্যানবিদ নয়) তারা এই প্রজাতির বিষয়ে যে জমিগুলি পরিচালনা করেন তাদের আবাসের মানের মূল্যায়ন করার জন্য একটি বাস্তব কাঠামো সরবরাহ করা। এই প্রাণীটি তুলনামূলক অধরা, একটি আবাস বিশেষজ্ঞ, এবং সাধারণত প্রত্যন্ত অঞ্চলে অবস্থিত। প্রজাতিগুলির বিতরণ, বিশেষত মৌসুমী সম্পর্কিত তুলনামূলকভাবে অল্প অধ্যয়ন করা হয়েছে। এক বছরের জন্য বেশ কয়েকটি প্রাণীর জিপিএস কলার লাগানো ছিল। প্রতিটি প্রাণীর জিপিএস কলার ডেটা থেকে এলোমেলোভাবে একশত অবস্থান (50 গ্রীষ্ম এবং 50 শীতকালীন) নির্বাচন করা হয়েছিল। তদতিরিক্ত, 50 টি পয়েন্ট প্রতিটি প্রাণীর হোম রেঞ্জের মধ্যে "উপলব্ধ" বা "ছদ্ম-অনুপস্থিতি" অবস্থান হিসাবে এলোমেলোভাবে উত্পন্ন হয়েছিল।

প্রতিটি অবস্থানের জন্য, বেশ কয়েকটি আবাসস্থল ভেরিয়েবল ক্ষেত্রের মধ্যে নমুনাযুক্ত হয়েছিল (গাছের ব্যাস, অনুভূমিক আবরণ, মোটা উচু ধ্বংসাবশেষ ইত্যাদি) এবং বেশ কয়েকটি জিআইএসের মাধ্যমে দূরবর্তীভাবে নমুনা তৈরি করা হয়েছিল (উচ্চতা, রাস্তা থেকে দূরত্ব, অসঙ্গততা ইত্যাদি)। ভেরিয়েবলগুলি 7 টি স্তরযুক্ত 1 শ্রেণীবদ্ধ ভেরিয়েবল বাদে বেশিরভাগ ক্ষেত্রে অবিচ্ছিন্ন থাকে।

আমার লক্ষ্য হ'ল সংস্থান ব্যবহারের অপেক্ষাকৃত সম্ভাব্যতার মডেল করার জন্য রিসেশন মডেলিংটি রিসোর্স সিলেকশন ফাংশনগুলি (আরএসএফ) তৈরি করতে ব্যবহার করা। আমি প্রাণীদের (ডিজাইনের ধরণ I) জনসংখ্যার পাশাপাশি প্রতিটি পৃথক প্রাণী (নকশার ধরণ III) এর জন্য একটি মৌসুমী (শীত এবং গ্রীষ্ম) আরএসএফ তৈরি করতে চাই।

আমি পরিসংখ্যান বিশ্লেষণ সম্পাদন করতে আর ব্যবহার করছি।

আমি যে প্রাথমিক পাঠটি ব্যবহার করছি তা হ'ল ...

  • "হোসমার, ডিডাব্লু, লেমেশো, এস।, এবং স্টারডাইভ্যান্ট, আরএক্স 2013. প্রয়োগিত লজিস্টিক রিগ্রেশন। উইলি, চিসেস্টার"।

হোসমার এট আল এর বেশিরভাগ উদাহরণ। স্টাটা ব্যবহার করুন, আমি আর এর সাথে রেফারেন্সের জন্য নিম্নলিখিত 2 টি পাঠ্যও ব্যবহার করছি

  • "ক্রাওলি, এমজে 2005. পরিসংখ্যান: আর জে উইলি, চিচেস্টার, ওয়েস্ট সাসেক্স, ইংল্যান্ড ব্যবহার করে একটি ভূমিকা"।
  • "উদ্ভিদ, আরই 2012. আর। সিআরসি প্রেস, লন্ডন, জিবিআর ব্যবহার করে বাস্তুশাস্ত্র এবং কৃষিক্ষেত্রে স্থানিক ডেটা বিশ্লেষণ।"

আমি বর্তমানে হোসমার এট আল এর চতুর্থ অধ্যায়টির পদক্ষেপগুলি অনুসরণ করছি "Covariates এর উদ্দেশ্যমূলক নির্বাচন" এর জন্য এবং প্রক্রিয়াটি সম্পর্কে কয়েকটি প্রশ্ন রয়েছে। আমার প্রশ্নগুলিতে সহায়তা করার জন্য আমি নীচের পাঠ্যের প্রথম কয়েকটি পদক্ষেপের রূপরেখা দিয়েছি।

  1. পদক্ষেপ 1: প্রতিটি স্বতন্ত্র ভেরিয়েবলের একটি অবিভাজ্য বিশ্লেষণ (আমি একটি অবিচ্ছেদ্য লজিস্টিক রিগ্রেশন ব্যবহার করেছি)। যেকোন পরিবর্তনশীল যার অবিভাজ্য পরীক্ষার পি-মান 0.25 এর চেয়ে কম থাকে প্রথম মাল্টিভারিয়াল মডেলটিতে অন্তর্ভুক্ত করা উচিত।
  2. পদক্ষেপ 2: পদক্ষেপ 1 এ অন্তর্ভুক্তির জন্য চিহ্নিত এবং প্রতিটি কোভারিয়েটের গুরুত্বটি মূল্যায়নের জন্য তার ওয়াল্ড পরিসংখ্যানের পি-মানটি ব্যবহার করে সমস্ত কোভারিয়েটযুক্ত একটি মাল্টিভেয়ারযোগ্য মডেল ফিট করুন। প্রচলিত তাত্পর্যপূর্ণ পর্যায়ে অবদান রাখে না এমন ভেরিয়েবলগুলি মুছে ফেলা উচিত এবং একটি নতুন মডেল ফিট। নতুন, আরও ছোট মডেলের সাথে আংশিক সম্ভাবনা অনুপাতের পরীক্ষাটি ব্যবহার করে পুরানো, বৃহত্তর মডেলের সাথে তুলনা করা উচিত।
  3. পদক্ষেপ 3: ছোট মডেলের আনুমানিক সহগের মানগুলি বড় মডেল থেকে তাদের নিজ নিজ মানের সাথে তুলনা করুন। যে কোনও পরিবর্তনশীল যার সহগ মাত্রায় প্রচ্ছন্নভাবে পরিবর্তিত হয়েছে তাকে আবার মডেলের সাথে যুক্ত করা উচিত কারণ এটি মডেলটিতে থাকা ভেরিয়েবলগুলির প্রভাবের প্রয়োজনীয় সমন্বয় প্রদানের অর্থে গুরুত্বপূর্ণ। 2 এবং 3 পদক্ষেপের মধ্য দিয়ে চক্রটি উপস্থিত না হওয়া অবধি অবধি গুরুত্বপূর্ণ সমস্ত পরিবর্তনশীলগুলিকে মডেলের অন্তর্ভুক্ত করা হয়েছে এবং বাদ দেওয়াগুলি চিকিত্সা এবং / অথবা পরিসংখ্যানগতভাবে গুরুত্বহীন। হোসমার এট আল। সহগের পরিমাণের পরিবর্তনের পরিমাপ হিসাবে " ডেল্টা-বিটা-হ্যাট-শতাংশ " ব্যবহার করুন । তারা 20% এর ডেল্টা-বিটা-হ্যাট-শতাংশ হিসাবে উল্লেখযোগ্য পরিবর্তন প্রস্তাব করে suggest হোসমার এট আল। ডেল্টা-বিটা-হ্যাট-শতাংশ হিসাবে হিসাবে সংজ্ঞায়িত করুনΔβ^%=100θ^1β^1β^1। যেখানে ছোট মডেলের সহগ এবং and the বৃহত্তর মডেলের সহগ fficientθ^1β^1
  4. পদক্ষেপ 4: একবারে একবারে একবারে পদক্ষেপ 3 এর শেষে প্রাপ্ত মডেলটিতে প্রথম ধাপে নির্বাচিত নয় এমন প্রতিটি ভেরিয়েবল যুক্ত করুন এবং ওয়াল্ড স্ট্যাটিস্টিক পি-মান বা আংশিক সম্ভাবনা অনুপাত পরীক্ষার মাধ্যমে এটির তাত্পর্য পরীক্ষা করুন যদি এটি শ্রেণিবদ্ধ হয় 2 টিরও বেশি স্তরের সাথে পরিবর্তনশীল। এই পদক্ষেপটি ভেরিয়েবলগুলি সনাক্ত করার জন্য অতীব গুরুত্বপূর্ণ যা তারা নিজেরাই ফলাফলের সাথে উল্লেখযোগ্যভাবে সম্পর্কিত নয় তবে অন্যান্য ভেরিয়েবলের উপস্থিতিতে গুরুত্বপূর্ণ অবদান রাখে। আমরা পদক্ষেপ 4 এর শেষে মডেলটিকে প্রাথমিক প্রধান প্রভাবগুলির মডেল হিসাবে উল্লেখ করি
  5. পদক্ষেপ 5-7: আমি এই পর্যায়ে অগ্রসর হই নি তাই আমি এই পদক্ষেপগুলি আপাতত ছেড়ে দেব, বা অন্য কোনও প্রশ্নের জন্য সেগুলি সংরক্ষণ করব।

আমার প্রশ্নগুলো:

  1. পদক্ষেপ 2 এ, traditionalতিহ্যগত তাত্পর্যপূর্ণ স্তরের হিসাবে <<0.05 এর মতো বড় কিছু <0.05 এর একটি পি-মান হিসাবে কী উপযুক্ত হবে?
  2. ২ য় ধাপে, আমি আংশিক সম্ভাবনা পরীক্ষার জন্য আমি যে আর কোডটি ব্যবহার করছি তা সঠিক এবং আমি নিশ্চিত করতে চাই যে আমি ফলাফলগুলি সঠিকভাবে ব্যাখ্যা করছি। এখানে আমি যা করছি তা এখানে… anova(smallmodel,largemodel,test='Chisq')পি-মানটি যদি তাৎপর্যপূর্ণ হয় (<0.05) আমি পরিবর্তনশীলটিকে আবার মডেলটিতে যুক্ত করব, যদি তা তুচ্ছ হয় তবে আমি মুছে ফেলার সাথে এগিয়ে যাই?
  3. ৩ য় ধাপে, আমার ব-দ্বীপ-বিটা-হ্যাট-শতাংশ সম্পর্কিত একটি প্রশ্ন রয়েছে এবং কখন বাদ দেওয়া পরিবর্তনশীলটি মডেলটিতে যুক্ত করা উপযুক্ত appropriate উদাহরণস্বরূপ, আমি মডেল থেকে একটি ভেরিয়েবল বাদ রাখি এবং এটি > 20% দ্বারা আলাদা ভেরিয়েবলের জন্য পরিবর্তন করে। যাইহোক, এ> 20% পরিবর্তনের সঙ্গে পরিবর্তনশীল Δ বিটা % যেমন যদি এটা ধাপ 2 আগামী কয়েক চক্র মডেল থেকে বাদ দেওয়া হবে এবং 3. আমি কিভাবে উভয় ভেরিয়েবল একটি সংকল্প করতে পারেন তুচ্ছ এবং সৌন্দর্য মনে করা হয় মডেল থেকে অন্তর্ভুক্ত করা উচিত বা বাদ দেওয়া উচিত? যেহেতু আমি প্রথমে সর্বনিম্ন উল্লেখযোগ্য ভেরিয়েবলগুলি মুছে ফেলা করে একবারে 1 টি ভেরিয়েবল বাদ দিয়ে এগিয়ে চলেছি, তাই আমি ভেরিয়েবলটিকে অর্ডার থেকে বাদ দিতে দ্বিধা বোধ করছি।Δβ^%Δβ^%
  4. Δβ^%

    100*((smallmodel$coef[2]-largemodel$coef[2])/largemodel$coef[2])


কৌতূহলের বাইরে আপনি যে প্রজাতিটি পড়াচ্ছেন তা কী?
পূর্বাভাসকারী

উত্তর:


23

Pβ


3
হ্যাঁ, ডোমেন জ্ঞান + সরলতার প্রতি অবিশ্বাসের একটি স্বাস্থ্যকর ডোজ, উদাহরণস্বরূপ, ধারাবাহিকতা পরিবর্তনশীল আপনার পূর্ববর্তী ডেটারেখা প্রদর্শন না করে অবিরত পরিবর্তনশীলকে রৈখিকভাবে কাজ করবেন না ass
ফ্রাঙ্ক হ্যারেল

6
ওপি তার তৃতীয় সংস্করণে মূলধারার পাঠ্যটি উদ্ধৃত করছে এমন লেখকদের সাথে যারা এই ক্ষেত্রে দুর্দান্ত অবদান রেখেছে। প্রশ্নে তৈরি অন্যান্য পয়েন্টগুলি অন্যান্য প্রভাবশালী গ্রন্থগুলিতে (অ্যাগ্রেস্তি, গেলম্যান) আলোচনা করা হয়েছে। আমি এটিকে এ কারণে এনেছি যে আমি এই কৌশলটির সাথে একমত নই, বরং এই কৌশলগুলি সাম্প্রতিক, মূলধারার পাঠ্যগুলিতে সম্মানিত পরিসংখ্যানবিদদের দ্বারা পরামর্শ দেওয়া হয়েছে বলে মনে রাখবেন। সংক্ষেপে: যদিও এর বিপরীতে প্রচুর সাহিত্যের পরামর্শ দেওয়া হলেও এটি পরিসংখ্যানবাদী সম্প্রদায় প্রত্যাখ্যান করে বলে মনে হয় না।
জুলাইথ

2
এটি আমার নম্র মতামতটিতে বেশ বিপথগামী। কিছু পাঠ্যে কৌশলগুলি এত কঠোরভাবে ঠেলেছে যা কখনই যাচাই করা যায় নি । যেসব লেখক সিমুলেশনকে বিশ্বাস করে না তারা বিজ্ঞাপন হিসাবে কাজ না করে এমন পদ্ধতি ব্যবহারের পক্ষে তাদের পক্ষে ঝুঁকির মধ্যে পড়ে।
ফ্র্যাঙ্ক হ্যারেল

2
হ্যা আমি জানি. আমি প্রায়শই আপনার পাঠ্য এবং কাগজপত্রগুলি উল্লেখ করি এবং এর উত্সগুলির মধ্যে একটিতে আমি আমার সিদ্ধান্তে পৌঁছাতে ব্যবহার করেছি উপরের কৌশলটির সাথে একমত নই। আমি কেবল প্রয়োগ করা ব্যবহারকারীর দ্বিধা প্রকাশ করছি। আমরা সব কিছু পরীক্ষা করতে পারি না। আমরা আপনার মত বিশেষজ্ঞদের উপর নির্ভর করি।
জুলাইথ

3
@ জিএনজি: এফএইচ সিমুলেশনকে বোঝানোর একটি উপায় হিসাবে উল্লেখ করছে যে আদর্শ অ্যাপ্লিকেশনগুলিতে মডেল নির্বাচনের এই পদ্ধতির আসলে যা করা উচিত বলে মনে করা হয় (সম্ভবত আপনার মডেলের পূর্বাভাসের যথার্থতা উন্নত করতে)। আপনার (চমকপ্রদ) প্রশ্নগুলি তার পরিবর্তে স্বেচ্ছাচারিত, অ্যাডহক, প্রকৃতি হাইলাইট করে - "traditionalতিহ্যবাহী" পর্যায়ে একটি অনির্দিষ্ট সংখ্যক পরীক্ষার উপর তাত্পর্যপূর্ণ অন্তর্ভুক্তির ভিত্তিতে কোনও কিছুর অপ্টিমাইজেশনের গ্যারান্টি দেওয়ার জন্য তত্ত্ব দ্বারা প্রদর্শিত হতে পারে না।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

5

পি হিসাবে পরিসংখ্যান ব্যবহার করে পরিবর্তনীয় নির্বাচনের জন্য নির্দিষ্ট পদ্ধতিগুলি, ক্লাসিক পাঠ্য হোসমার এট আল-তে স্টেপওয়াইজ রিগ্রেশনকে কোনও মূল্যে এড়ানো উচিত।

সম্প্রতি আমি একটি নিবন্ধ যে পূর্বাভাস এনটাইটেল "আন্তর্জাতিক জার্নালে প্রকাশিত হয় উপর পদস্খলিত ভবিষ্যদ্বাণীর ইল্যুশনস এবং commentory" দ্বারা এই নিবন্ধটি উপর কিথ Ord । আমি এই উভয় নিবন্ধকেই অত্যন্ত সুপারিশ করব কারণ তারা স্পষ্টভাবে দেখায় যে রিগ্রেশন পরিসংখ্যান ব্যবহার করা প্রায়শই বিভ্রান্তিকর হয়। ফোলউইং হ'ল কীথ অর্ডের নিবন্ধের একটি স্ক্রিনশট যা অনুকরণের মাধ্যমে দেখায় যে চলক নির্বাচনের জন্য ধাপে ওয়াইজ রিগ্রেশন (পি স্ট্যাটিস্টিক ব্যবহার করে) কেন খারাপ।

এখানে চিত্র বর্ণনা লিখুন

স্কট আর্মস্ট্রংয়ের আরেকটি দুর্দান্ত নিবন্ধ যা জার্নালের একই সংখ্যায় প্রকাশিত হয়েছে তা দেখায় যে কেস স্টাডির সাথে অ পরীক্ষামূলক তথ্যের উপর রিগ্রেশন বিশ্লেষণ ব্যবহারের ক্ষেত্রে কেন খুব সতর্ক হওয়া উচিত। যখনই আমি এই নিবন্ধগুলি পড়েছি তখনই আমি অ-পরীক্ষামূলক তথ্যগুলিতে কার্যকারণ সূচনাগুলি আঁকতে রিগ্রেশন বিশ্লেষণ ব্যবহার করা এড়িয়ে চলেছি। একজন চিকিত্সক হিসাবে, আমি আশা করি আমি এই কয়েক বছরের মতো নিবন্ধগুলি পড়তে পারি যা আমাকে খারাপ সিদ্ধান্ত গ্রহণ এবং ব্যয়বহুল ভুলগুলি এড়াতে বাঁচিয়ে দিত।

আপনার নির্দিষ্ট সমস্যা সম্পর্কে, আমি মনে করি না যে আপনার ক্ষেত্রে এলোমেলোভাবে পরীক্ষা-নিরীক্ষা করা সম্ভব, তাই আমি আপনাকে প্রস্তাব দেব যে আপনি ভেরিয়েবলগুলি নির্বাচন করতে ক্রস বৈধতা ব্যবহার করুন। ভেরিয়েবলগুলি নির্বাচন করতে আপনি কীভাবে ভবিষ্যদ্বাণীমূলক নির্ভুলতা ব্যবহার করবেন তার একটি নিখরচায় উদাহরণ এই নিখরচায় অনলাইন বইয়ে পাওয়া যায় । এটি অন্যান্য অনেকগুলি পরিবর্তনযোগ্য বিক্রয় পদ্ধতিও রয়েছে তবে আমি বৈধতা পেরিয়ে যাওয়ার ক্ষেত্রে সীমাবদ্ধ রাখি।

আমি ব্যক্তিগতভাবে আর্মস্ট্রংয়ের উক্তিটি পছন্দ করি "কোথাও আমি এই ধারণার মুখোমুখি হয়েছি যে পরিসংখ্যানগুলি যোগাযোগকে সহায়তা করবে বলে মনে হয়েছিল। জটিল রিগ্রেশন পদ্ধতি এবং ডায়াগনস্টিকের পরিসংখ্যানের ঝাঁক আমাদের অন্য দিকে নিয়ে গেছে"

নীচে আমার নিজস্ব মতামত দেওয়া হয়। আমি কোনও পরিসংখ্যানবিদ নই।

  • জীববিজ্ঞানী হিসাবে আমি মনে করি আপনি এই বিষয়টির প্রশংসা করবেন। প্রকৃতি অত্যন্ত জটিল, লজিস্টিক ফাংশন ধরে এবং ভেরিয়েবলের মধ্যে কোনও মিথস্ক্রিয়া প্রকৃতিতে ঘটে না। তদতিরিক্ত, লজিস্টিক রিগ্রেশন নিম্নলিখিত অনুমান রয়েছে :

  • সত্য শর্তসাপেক্ষ সম্ভাবনাগুলি স্বাধীন ভেরিয়েবলগুলির একটি লজিস্টিক ফাংশন।

  • কোনও গুরুত্বপূর্ণ ভেরিয়েবল বাদ দেওয়া হয় না। কোনও বহিরাগত ভেরিয়েবল অন্তর্ভুক্ত নয়।

  • স্বাধীন ভেরিয়েবলগুলি ত্রুটি ছাড়াই পরিমাপ করা হয়।
  • পর্যবেক্ষণগুলি স্বাধীন।
  • স্বাধীন ভেরিয়েবলগুলি একে অপরের লিনিয়ার সংমিশ্রণ নয়।

এই ধরণের বিশ্লেষণের জন্য লজিস্টিক রিগ্রেশনের বিকল্প হিসাবে আমি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন ট্রি (কার্ট (আর)) এর পরামর্শ দেব কারণ এটি অনুমান মুক্ত:

  1. প্যারামিমেট্রিক / ডেটা চালিত / আপনার আউটপুট সম্ভাব্যতা লজিস্টিক ফাংশন অনুসরণ করে এমন কোনও অনুমান নেই।
  2. অরৈখিক
  3. জটিল পরিবর্তনশীল মিথস্ক্রিয়া অনুমতি দেয়।
  4. বন ব্যবস্থাপকগণের মতো অ-পরিসংখ্যানবিদরা অত্যন্ত প্রশংসনীয় ভিজ্যুয়াল গাছ সরবরাহ করে।
  5. সহজে অনুপস্থিত মানগুলি পরিচালনা করে।
  6. কার্ট ব্যবহারের জন্য কোনও পরিসংখ্যানবিদ হওয়ার দরকার নেই !!
  7. ক্রস বৈধতা ব্যবহার করে স্বয়ংক্রিয়ভাবে ভেরিয়েবল নির্বাচন করে।

কার্ট সালফোর্ড সিস্টেমগুলির একটি ট্রেডমার্ক। কার্টের ভূমিকা এবং ইতিহাসের জন্য এই ভিডিওটি দেখুন । একই ওয়েবসাইটে কার্ট - লজিস্টিক রিগ্রেশন হাইব্রিডের মতো অন্যান্য ভিডিও রয়েছে। আমি এটি পরীক্ষা করে দেখতে হবে। আর-তে একটি ওপেন সোর্স ইনম্প্যান্টেশনকে গাছ বলা হয় , এবং আর-তে আরও অনেকগুলি প্যাকেজ পাওয়া যায় যেমন আমি সময় পাই তবে আমি কর্ট ব্যবহার করে হোমসের লেখায় প্রথম উদাহরণটি পোস্ট করব। আপনি যদি লজিস্টিক রিগ্রেশন ব্যবহারের জন্য জোর দিয়ে থাকেন তবে আমি কমপক্ষে ভেরিয়েবলগুলি নির্বাচন করতে এবং তারপরে লজিস্টিক রিগ্রেশন প্রয়োগ করতে কার্টের মতো পদ্ধতি ব্যবহার করব।

পূর্বোক্ত সুবিধার কারণে আমি ব্যক্তিগতভাবে লজিস্টিক রিগ্রেশনের চেয়ে কার্টকে প্রাধান্য দিই। তবে তবুও, আমি লজিস্টিক রিগ্রেশন এবং কার্ট বা কার্ট-লজিস্টক রিগ্রেশন হাইব্রিড উভয়ই চেষ্টা করব এবং দেখুন যা আরও ভাল ভবিষ্যদ্বাণীমূলক নির্ভুলতা দেয় এবং আরও গুরুত্বপূর্ণভাবে আরও ভাল ব্যাখ্যা করতে পারে এবং এমন একটিটি বেছে নেবে যা আপনি মনে করেন যে ডেটা আরও স্পষ্টভাবে "যোগাযোগ" করবে।

এছাড়াও, বড় পরিসংখ্যান জার্নালগুলি দ্বারা এফওয়াইআই কার্টকে প্রত্যাখ্যান করা হয়েছিল এবং শেষ পর্যন্ত কার্টের উদ্ভাবকরা একটি মনোগ্রাফ নিয়ে বেরিয়ে এসেছিল। কার্ট আধুনিক এবং অত্যন্ত সফল মেশিন লার্নিং অ্যালগরিদমে যেমন র‌্যান্ডম ফরেস্ট (আর), গ্রেডিয়েন্ট বুস্টিং মেশিনস (জিবিএম), মাল্টিভারিয়ট অ্যাডাপটিভ রিগ্রেশন স্প্লাইনের সকলের জন্ম হয়েছিল। র্যান্ডম ফরেস্ট এবং জিবিএম কার্টের চেয়ে বেশি নির্ভুল তবে কার্টের চেয়ে কম ব্যাখ্যামূলক (ব্ল্যাক বক্সের মতো)।

আশা করি এটি সহায়ক। আপনি যদি এই পোস্টে দরকারী মনে করেন?


8
ওয়াই

3
এই উত্তরটি সাধারণ মন্তব্যগুলি থেকে লাফিয়ে যায়, যার মধ্যে অনেকগুলি আমার পক্ষে অন্তত বিতর্কিত বলে মনে হয়, পছন্দ করার পদ্ধতি হিসাবে কার্টের একটি অত্যন্ত নির্দিষ্ট এবং বরং ব্যক্তিগত অনুমোদনের কাছে। আপনি নিজের মতামতের অধিকারী হবেন, অন্যরা যেমন আপত্তি জানাতে পারে তেমন অধিকারী হবে। আমার পরামর্শ হ'ল আপনি নিজের উত্তরের দ্বিগুণ স্বাদটিকে আরও পরিষ্কার করে ফ্ল্যাগ করুন।
নিক কক্স

2
লজিস্টিক রিগ্রেশন একটি সাধারণ রৈখিক মডেল, তবে অন্যথায় এটি প্রাকৃতিকভাবে ননলাইনার মডেল হিসাবে (যথাযথভাবে এটি যথাক্রমে লাইন বা সমতুল্য নয়, লাইন বা সমতুল্য নয়, এমনভাবে বিবেচনা করা হয়) যেটি যথাযথভাবে উপযোগী হিসাবে এটি যথাযথভাবে প্রেরণাদায়ক বাইনারি প্রতিক্রিয়া। এখানে জীববিজ্ঞানের আবেদনটি দ্বিগুণ; বাইনারি প্রতিক্রিয়াগুলির জন্য historতিহাসিকভাবে লজিস্টিক মডেলগুলি জীববিজ্ঞানে লজিস্টিক বর্ধনের জন্য মডেল দ্বারা অনুপ্রাণিত হয়েছিল (উদাহরণস্বরূপ জনসংখ্যা)!
নিক কক্স

দ্য সোয়ার এট আল। কাগজ, আর্মস্ট্রং কাগজ, এবং মন্তব্যগুলি সবই খুব ভাল। আমি এই সপ্তাহান্তে তাদের উপর পড়ছি। তাদের পরামর্শ দেওয়ার জন্য আপনাকে ধন্যবাদ। পরিসংখ্যানবিদ না হয়ে লজিস্টিক রিগ্রেশন-এর উপরে CART ব্যবহারের বিষয়ে আমি মন্তব্য করতে পারি না। তবে আপনার উত্তরটি খুব ভাল লেখা, সহায়ক এবং অন্তর্দৃষ্টিযুক্ত মন্তব্য পেয়েছে। আমি কার্ট, ম্যাকসেন্ট এবং মজাদার রিগ্রেশন ট্রি জাতীয় মেশিন শেখার পদ্ধতিগুলি পড়ছি এবং তাদের অন্তর্দৃষ্টি পেতে আমার কমিটির সাথে তাদের নিয়ে আলোচনা করার পরিকল্পনা করছি। যখন আমি কিছু ফ্রি সময় পাই, কার্টের ভিডিওটিও আকর্ষণীয় হওয়া উচিত।
জিএনজি

3
একটি হাসির সাথে আমি মনে করি আমরা রৈখিক মডেলগুলির বিষয়ে আপনার মন্তব্যগুলি উল্টে দিতে পারি এবং ধারণা থেকে মুক্ত হওয়া বা এমনকী ধারণা-আলো হওয়া থেকে দূরে জোর দিয়ে বলতে পারি, কার্ট অনুমান করে যে বাস্তবতা গাছের মতো (অন্য কি?)। আপনি যদি ভাবেন যে প্রকৃতি একটি স্বাচ্ছন্দ্যে বিবিধ ধারাবাহিকতা আপনার বিপরীত দিকে চালিত করা উচিত।
নিক কক্স

3

আমি মনে করি আপনি উপস্থিতি / পটভূমি পদ্ধতির সাথে প্রজাতির উপস্থিতি সম্পর্কে পূর্বাভাস দেওয়ার চেষ্টা করছেন, যা ইকোলজি এবং বিবর্তন পদ্ধতি, বাস্তুশাস্ত্র ইত্যাদির মতো জার্নালগুলিতে ভালভাবে নথিভুক্ত রয়েছে সম্ভবত আর প্যাকেজ ডেমোটি আপনার সমস্যার জন্য কার্যকর। এটিতে একটি সুন্দর চিত্র রয়েছে। ডেমো বা অন্যান্য অনুরূপ প্যাকেজ ব্যবহার করা সমস্যার প্রতি আপনার দৃষ্টিভঙ্গি পরিবর্তন করার জন্য বোঝায়, তবে আমি বিশ্বাস করি এটি একবার দেখার জন্য এটি মূল্যবান।


2
আপনাকে কেবলমাত্র কোনও মডেল নির্দিষ্ট করা থেকে বিরত রাখে? মডেলটিতে কী হওয়া উচিত তা নিয়ে কেন বিরাট অনিশ্চয়তা? জিএলএম ব্যবহার করে মডেল নির্বাচনের প্রয়োজনীয়তা কেন?
ফ্র্যাঙ্ক হ্যারেল

1
আমি ভয় করি আপনি কিছু ধারণা মিশ্রিত করছেন। (1) বাস্তবে সর্বাধিক উপস্থিতি / পটভূমি ডেটা বা উপস্থিতি / সিউডো-অনুপস্থিত ডেটা data সুতরাং, সর্বাধিক উপস্থিতি কেবলমাত্র ডেটা ব্যবহার করে এবং ল্যান্ডস্কেপ থেকে কিছু পয়েন্ট যুক্ত করে, এটি, পটভূমি / সিউডো-অনুপস্থিতি। সুতরাং, এটি আপনার ক্ষেত্রে ব্যবহার করা যেতে পারে। (২) জিএলএম 'সত্য' অনুপস্থিতিতে ব্যবহার করার জন্য ডিজাইন করা হয়েছিল। তবে, জিএলএম উপস্থিতি / সিউডো-অনুপস্থিতি ডেটার জন্য মানিয়ে নেওয়া হয়েছে। (3) ডেমো প্যাকেজটি কেবলমাত্র নয় কেবল বর্ধিত রিগ্রেশন ট্রি সরবরাহ করে। আপনি জিএলএমকেও ফিট করতে পারেন, কেবল প্যাকেজের একটি ভিগনেট অনুসরণ করুন (সেখানে 2 আছে)।
হুগো

1
আপনার প্রশ্নটি ভবিষ্যদ্বাণীকারী হিসাবে কোন পরিবর্তনশীলকে অন্তর্ভুক্ত করা উচিত সে সম্পর্কে যদি এই প্রশ্নাগুলি একবার দেখুন: শেপার্ড 2013. জলবায়ু পরিবর্তনশীল নির্বাচন কীভাবে প্রজাতি বিতরণের পূর্বাভাসকে প্রভাবিত করে? নিউজিল্যান্ডে তিনটি নতুন আগাছার কেস স্টাডি আগাছা গবেষণা; হ্যারিস, ইত্যাদি। 2013. হতে হবে না হতে হবে? পরিবর্তনশীল নির্বাচন ভবিষ্যতের জলবায়ুতে হুমকী প্রজাতির প্রত্যাশিত ভাগ্য পরিবর্তন করতে পারে। Ecol। Manag। Restor।
হুগো

2
ভেরিয়েবল নির্বাচনের কৌশলগুলি কোনওভাবে ওভারফিটিংকে হ্রাস করতে পারে এমন চিন্তাভাবনাটি আশ্চর্য। মডেলটি হ্রাস করা থেকে ভেরিয়েবলের আপাত সঞ্চয় করা সম্পূর্ণরূপে একটি মায়া হয় যখন ডেটা হ্রাস থেকে আসে themselves
ফ্র্যাঙ্ক হ্যারেল

1
@ জিএনজি: "মডেলটিতে সমস্ত পরিবর্তনশীল রেখে যাওয়ার বিষয়ে আমার অনিশ্চয়তা কোলাইনারিটি এবং অতিরিক্ত-ফিটিং সম্পর্কে যা শিখিয়েছি তা থেকেই আসে" - আপনার মডেলটিতে কি উচ্চতর প্রান্তিক ভবিষ্যদ্বাণী রয়েছে? হয় আপনার মডেল ওভার ঝুলানো?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.