প্রশ্ন ট্যাগ «feature-selection»

আরও মডেলিংয়ে ব্যবহারের জন্য বৈশিষ্ট্যের একটি উপসেট নির্বাচন করার পদ্ধতি এবং নীতি

5
নিয়মিতকরণ অ্যালগরিদম ব্যবহার করার সময় আমাদের কী এখনও বৈশিষ্ট্য নির্বাচন করা দরকার?
পরিসংখ্যান শেখার অ্যালগরিদম চালানোর আগে বৈশিষ্ট্য নির্বাচন পদ্ধতিগুলি (এলোমেলো বন বৈশিষ্ট্য গুরুত্বের মান বা ইউনিভারিয়েট বৈশিষ্ট্য নির্বাচন পদ্ধতি ইত্যাদি) ব্যবহার করার জন্য আমার একটি প্রশ্ন রয়েছে। আমরা ওভারফিটিং এড়াতে জানি যে আমরা ওজন ভেক্টরগুলিতে নিয়মিতকরণ জরিমানা প্রবর্তন করতে পারি। সুতরাং আমি যদি লিনিয়ার রিগ্রেশন করতে চাই, তবে আমি এল 2 …

2
তাৎপর্য পরীক্ষা বা ক্রস বৈধতা?
পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবলগুলি নির্বাচনের জন্য দুটি সাধারণ পন্থা হ'ল তাত্পর্য পরীক্ষা এবং ক্রস বৈধতা। প্রতিটি সমস্যার সমাধান করার জন্য কী চেষ্টা করে এবং আমি কখন অন্যটির চেয়ে বেশি পছন্দ করব?

2
লাসো পরিবর্তনশীল নির্বাচনের পরে ওএলএস করতে কীভাবে বোঝায়?
সম্প্রতি আমি আবিষ্কার করেছি যে প্রয়োগকৃত একনোমেট্রিক্স সাহিত্যে, বৈশিষ্ট্য নির্বাচনের সমস্যাগুলি মোকাবেলা করার সময়, নির্বাচিত ভেরিয়েবলগুলি ব্যবহার করে ওএলএস রিগ্রেশন অনুসরণ করার পরে ল্যাসো সম্পাদন করা অস্বাভাবিক কিছু নয়। আমি ভাবছিলাম যে কীভাবে আমরা এই জাতীয় পদ্ধতির বৈধতা অর্জন করতে পারি? এটি কি বাদ দেওয়া ভেরিয়েবলের মতো ঝামেলা সৃষ্টি করবে? …

1
এই লাসো প্লট (গ্ল্যামনেট) থেকে কী উপসংহার নেওয়া উচিত
ডিভিডি হিসাবে ডিভিটি mtcarsসেট করে ডেভিড আলফা (১, সুতরাং লাসো) সহ গ্ল্যামনেটের প্লটটি mpgভবিষ্যদ্বাণী ভেরিয়েবল হিসাবে অন্য হিসাবে সেট করা হয় । glmnet(as.matrix(mtcars[-1]), mtcars[,1]) আমরা কি বিভিন্ন ভেরিয়েবল সংক্রান্ত এই চক্রান্ত থেকে এই উপসংহারে আসতে পারি, বিশেষ করে am, cylএবং wt(লাল, কালো এবং হালকা নীল লাইন)? একটি প্রতিবেদন প্রকাশের জন্য …

2
লজিস্টিক রিগ্রেশন মধ্যে শ্রেণিবদ্ধ ভবিষ্যদ্বাণী এর তাৎপর্য
লজিস্টিক রিগ্রেশনে শ্রেণিবদ্ধ ভেরিয়েবলের জন্য z মানগুলি ব্যাখ্যা করতে আমার সমস্যা হচ্ছে। নীচের উদাহরণে আমার 3 শ্রেণি সহ একটি স্পষ্টতাল পরিবর্তনশীল আছে এবং z মান অনুসারে, CLASS2 প্রাসঙ্গিক হতে পারে অন্যগুলি না থাকলে। তবে এখন এর অর্থ কী? যে আমি অন্য ক্লাস এক একীকরণ করতে পারি? পুরো পরিবর্তনটি ভাল ভবিষ্যদ্বাণীকারী …

1
"বৈশিষ্ট্য স্থান" কি?
"ফিচার স্পেস" এর সংজ্ঞা কী? উদাহরণস্বরূপ, এসভিএমগুলি পড়ার সময় আমি "বৈশিষ্ট্য স্পেসে ম্যাপিং" সম্পর্কে পড়ি। কার্ট সম্পর্কে পড়ার সময়, আমি "বৈশিষ্ট্য স্পেসে বিভাজন" সম্পর্কে পড়ি। আমি বুঝতে পারছি কী চলছে, বিশেষত কার্টের জন্য, তবে আমি মনে করি যে এখানে কিছু সংজ্ঞা রয়েছে যা আমি মিস করেছি। "বৈশিষ্ট্য স্পেস" এর একটি …

2
লাসো কি ধাপে ধাপে রিগ্রেশন একই সমস্যায় ভুগছে?
ধাপে ধাপে অ্যালগরিদমিক পরিবর্তনশীল-নির্বাচন পদ্ধতিগুলি এমন মডেলগুলির জন্য বাছাই করে যা প্রতিরোধের মডেলগুলিতে প্রতিটি অনুমানকে কমবেশি বিবেচনা করে ( s এস এবং তাদের এসই, পি- ভ্যালু, এফ পরিসংখ্যান ইত্যাদি), এবং সত্য ভবিষ্যদ্বাণীকারীদের বাদ দিতে পারে যুক্তিসঙ্গতভাবে পরিপক্ক সিমুলেশন সাহিত্য অনুসারে ভুয়া ভবিষ্যদ্বাণীদের অন্তর্ভুক্ত করুন।ββ\beta ভেরিয়েবল নির্বাচন করার জন্য লাসো কি …

2
গতি, পিসিএ, লাসো, ইলাস্টিক নেট এর গণনা ব্যয়
আমি Hastie এট আল হিসাবে পৃথক হিসাবে লিনিয়ার রিগ্রেশন জন্য তিনটি পদ্ধতির পদ্ধতির গণনা জটিলতা / অনুমান গতির তুলনা করার চেষ্টা করছি। "পরিসংখ্যান শিক্ষার উপাদানসমূহ" (২ য় সংস্করণ), অধ্যায় 3: সাবসেট নির্বাচন সঙ্কুচিত পদ্ধতি প্রাপ্ত ইনপুট দিকনির্দেশগুলি ব্যবহারের পদ্ধতিগুলি (পিসিআর, পিএলএস) তুলনাটি খুব রুক্ষ হতে পারে, কিছু ধারণা দেওয়ার জন্য। …

1
মডেল নির্বাচনের প্যারাডক্স (এআইসি, বিআইসি, ব্যাখ্যা বা ভবিষ্যদ্বাণী করতে?)
গ্যালিট শমুয়েলের "ব্যাখ্যা করতে বা ভবিষ্যদ্বাণী করার জন্য" (২০১০) পড়ে আমি একটি স্পষ্ট দ্বন্দ্ব দেখে আশ্চর্য হয়েছি। তিনটি প্রাঙ্গণ রয়েছে, এআইসি - বনাম বিআইসি-ভিত্তিক মডেল পছন্দ (পৃষ্ঠা 300 এর শেষ - পি 301 এর শুরু): সহজ কথায় বলতে গেলে, এআইসিকে ভবিষ্যদ্বাণী করার উদ্দেশ্যে তৈরি একটি মডেল বাছাই করার জন্য ব্যবহার …

4
চিত্রের রেজোলিউশনের ভিত্তিতে বৈশিষ্ট্যগুলির সংখ্যা গণনা কিভাবে করবেন?
শুধু নিউরাল Netowrks এর অ্যান্ড্রু এনজি এর অ রৈখিক প্রস্তাব আচ্ছাদিত, এবং আমরা নির্ধারণের জন্য একটি মাল্টিপল চয়েস প্রশ্ন ছিল বৈশিষ্ট্য সংখ্যা রেজল্যুশন একটি চিত্রের জন্য 100x100 এর grescale তীব্রতাকে। এবং উত্তর ছিল 5 মিলিয়ন, x55510710710^7 তবে এর আগে 50 x 50 পিক্সেলের জন্য, ধূসর স্কেল চিত্র। বৈশিষ্ট্য সংখ্যা 50x50 …

5
Cv.glmnet ফলাফলগুলিতে ভেরিয়েবলিটি
আমি cv.glmnetভবিষ্যদ্বাণীকারীদের খুঁজতে ব্যবহার করছি । আমি যে সেটআপটি ব্যবহার করি তা নিম্নরূপ: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] নিশ্চিত ফলাফল গঠনকর আমি হয় set.seed(1)। ফলাফল অত্যন্ত পরিবর্তনশীল। ফলাফলগুলি কতটা পরিবর্তনশীল তা দেখতে আমি একই কোডটি 100 চালিয়েছি। 98/100 রান একটি নির্দিষ্ট ভবিষ্যদ্বাণী সর্বদা নির্বাচিত ছিল (কখনও কখনও কেবল এটি নিজস্ব); …

3
মাল্টিক্লাস শ্রেণিবদ্ধকারী নির্মাণ করা কি বেশ কয়েকটি বাইনারিগুলির চেয়ে ভাল?
আমার বিভাগগুলিতে ইউআরএল শ্রেণীবদ্ধ করা দরকার। বলুন আমার 15 টি বিভাগ রয়েছে যা আমি প্রতি URL টি শূন্য করার পরিকল্পনা করছি। 15-ওয়ে শ্রেণিবদ্ধ কি আরও ভাল? যেখানে আমার কাছে 15 টি লেবেল রয়েছে এবং প্রতিটি ডেটা পয়েন্টের জন্য বৈশিষ্ট্য উত্পন্ন করে। অথবা ১৫ টি বাইনারি শ্রেণিবদ্ধকারী গড়ে তুলুন, বলুন: সিনেমা …

5
লজিস্টিক রিগ্রেশন জন্য কোন বৈশিষ্ট্যগুলি সবচেয়ে গুরুত্বপূর্ণ ছিল তা বোঝা
আমি একটি লজিস্টিক রিগ্রেশন শ্রেণিবদ্ধ তৈরি করেছি যা আমার ডেটাতে খুব সঠিক very এটি এত ভাল কেন কাজ করছে তা এখন আমি আরও ভাল করে বুঝতে চাই। বিশেষত, আমি কোন বৈশিষ্ট্যগুলি সর্বাধিক অবদান রাখছি (কোন বৈশিষ্ট্যগুলি সর্বাধিক গুরুত্বপূর্ণ) র‌্যাঙ্ক করতে চাই এবং আদর্শভাবে, প্রতিটি বৈশিষ্ট্য সামগ্রিক মডেলের (বা এই শিরাতে …

3
পরিবর্তনশীল নির্বাচনের জন্য লাসো ব্যবহারের পরে অনুমান ference
আমি তুলনামূলকভাবে কম মাত্রিক সেটিং (এন >> পি) এ বৈশিষ্ট্য নির্বাচনের জন্য লাসো ব্যবহার করছি। লাসোর একটি মডেল ফিট করার পরে, আমি কোনও জরিমানা ছাড়াই কোনও মডেল ফিট করতে ননজারো সহগ সহ কোভেরিয়েটগুলি ব্যবহার করতে চাই। আমি এটি করছি কারণ আমি নিরপেক্ষ অনুমান করতে চাই যা লাসো আমাকে দিতে পারে …

1
এলোমেলো বনে, আরও বড়% IncMSE আরও ভাল বা খারাপ?
একবার আমি আর-এ একটি (রিগ্রেশন) এলোমেলো বন মডেল তৈরি করেছি, কলটি rf$importanceআমাকে প্রতিটি পূর্বাভাসক চলকের জন্য দুটি পদক্ষেপ সরবরাহ করে %IncMSEএবং IncNodePurity। ছোট %IncMSEমূল্যবোধের সাথে পূর্বাভাসকারী ভেরিয়েবলগুলি %IncMSEকী বড় মূল্যবোধের সাথে ভবিষ্যদ্বাণীকারী ভেরিয়েবলের চেয়ে গুরুত্বপূর্ণ ? কীভাবে IncNodePurity?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.