প্রশ্ন ট্যাগ «feature-selection»

আরও মডেলিংয়ে ব্যবহারের জন্য বৈশিষ্ট্যের একটি উপসেট নির্বাচন করার পদ্ধতি এবং নীতি

2
পি-মানের উপর ভিত্তি করে বৈশিষ্ট্যগুলি নির্বাচন করা কি ভুল?
বৈশিষ্ট্যগুলি কীভাবে নির্বাচন করবেন সে সম্পর্কে বেশ কয়েকটি পোস্ট রয়েছে। পদ্ধতির একটি টি-পরিসংখ্যানের ভিত্তিতে বৈশিষ্ট্যটির গুরুত্ব বর্ণনা করে। আর মধ্যে স্ট্যান্ডার্ডযুক্ত বৈশিষ্ট্য varImp(model)সহ রৈখিক মডেলটিতে প্রয়োগ করা প্রতিটি মডেলের প্যারামিটারের জন্য টি-স্ট্যাটিস্টিকের নিখুঁত মান ব্যবহৃত হয়। সুতরাং, মূলত আমরা এর টি-পরিসংখ্যানের উপর ভিত্তি করে একটি বৈশিষ্ট্য চয়ন করি, যার অর্থ …

1
পরিবর্তনশীল নির্বাচন বনাম মডেল নির্বাচন
সুতরাং আমি বুঝতে পারি যে চলক নির্বাচনটি মডেল নির্বাচনের একটি অংশ। তবে মডেল নির্বাচনটি আসলে কী নিয়ে গঠিত? এটি কি নীচের চেয়ে বেশি: 1) আপনার মডেল জন্য একটি বিতরণ চয়ন করুন 2) ব্যাখ্যামূলক ভেরিয়েবল চয়ন করুন,? আমি এটি জিজ্ঞাসা করছি কারণ আমি বার্নহাম এবং অ্যান্ডারসন: এআইসি বনাম বিআইসির একটি নিবন্ধটি …

5
টার্ম ফ্রিকোয়েন্সি / বিপরীত নথির ফ্রিকোয়েন্সি (টিএফ / আইডিএফ): ওজন
আমার কাছে একটি ডেটাসেট রয়েছে যা 1000 টি নথি এবং এতে উপস্থিত সমস্ত শব্দকে উপস্থাপন করে। সুতরাং সারিগুলি নথির প্রতিনিধিত্ব করে এবং কলামগুলি শব্দের প্রতিনিধিত্ব করে। সুতরাং উদাহরণস্বরূপ, কক্ষে মান বার শব্দ ঘোরা নথিতে দেখা দেয় । এখন, tf / idf পদ্ধতি ব্যবহার করে শব্দের 'ওজন' খুঁজে বের করতে হবে, …

5
আর এর মধ্যে বৈশিষ্ট্য নির্বাচন প্যাকেজগুলি, যা উভয়ই রিগ্রেশন এবং শ্রেণিবিন্যাস করে
লক । এই প্রশ্নটি এবং এর উত্তরগুলি লক করা আছে কারণ প্রশ্নটি অফ-টপিক তবে historicalতিহাসিক তাত্পর্যপূর্ণ। এটি বর্তমানে নতুন উত্তর বা মিথস্ক্রিয়া গ্রহণ করছে না। আমি আর এর সাথে খুব নতুন I আমি এখনই মেশিন লার্নিং শিখছি। খুব দুঃখিত, যদি এই প্রশ্নটি খুব প্রাথমিক মনে হয়। আমি আর-তে একটি ভাল …

2
বৈশিষ্ট্য সংখ্যা বৃদ্ধি কেন কর্মক্ষমতা হ্রাস করে?
বৈশিষ্ট্যের সংখ্যা বাড়ানো কেন কর্মক্ষমতা হ্রাস করতে পারে সে সম্পর্কে আমি একটি অন্তর্দৃষ্টি লাভ করার চেষ্টা করছি। আমি বর্তমানে একটি এলডিএ শ্রেণিবদ্ধ ব্যবহার করছি যা নির্দিষ্ট বৈশিষ্ট্যগুলির মধ্যে দ্বিচারিতভাবে আরও ভাল পারফর্ম করে তবে আরও বৈশিষ্ট্যগুলি দেখার সময় আরও খারাপ। আমার শ্রেণিবদ্ধকরণ নির্ভুলতা একটি স্তরযুক্ত 10-ভাঁজ এক্সভাল ব্যবহার করে সম্পাদিত …

6
কোন বৈশিষ্ট্যগুলি বেশি গুরুত্বপূর্ণ তা অনুমান করার জন্য কোন মেশিন লার্নিং অ্যালগরিদমগুলি ভাল?
আমার কাছে ন্যূনতম সংখ্যক বৈশিষ্ট্য রয়েছে যা পরিবর্তিত হয় না এবং কয়েকটি অতিরিক্ত বৈশিষ্ট্য যা পরিবর্তন করতে পারে এবং ফলাফলের উপর তার বড় প্রভাব ফেলতে পারে। আমার ডেটা-সেটটি দেখতে এমন দেখাচ্ছে: বৈশিষ্ট্যগুলি হ'ল এ, বি, সি (সর্বদা উপস্থিত) এবং ডি, ই, এফ, জি, এইচ (কখনও কখনও উপস্থিত) A = 10, …

1
আরআর-তে স্বাধীনতা ডিগ্রিআরসিআরসি মিশ্রিত এবং lme / lmer এর মধ্যে পার্থক্য
দ্রষ্টব্য: এই প্রশ্নটি পুনরায় পোস্ট করা হয়েছে, কারণ আমার আগের প্রশ্নটি আইনি কারণে মুছে ফেলা হয়েছিল। আর- lmeএর nlmeপ্যাকেজ থেকে ফাংশনটির সাথে এসএএস থেকে প্রসকে মিক্সেড তুলনা করার সময় , আমি কিছু বরং বিভ্রান্তিকর পার্থক্যের উপর হোঁচট খেয়েছি। আরও সুনির্দিষ্টভাবে বলা যায় যে বিভিন্ন পরীক্ষায় স্বাধীনতার ডিগ্রিগুলির মধ্যে পার্থক্য রয়েছে …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
আপনি কীভাবে কোনও রিগ্রেশন মডেলটিতে ভেরিয়েবল নির্বাচন করেন?
পরিবর্তনশীল নির্বাচনের traditionalতিহ্যগত পদ্ধতির মধ্যে এমন পরিবর্তনশীলগুলি সন্ধান করা যা একটি নতুন প্রতিক্রিয়া পূর্বাভাস দেওয়ার ক্ষেত্রে সর্বাধিক অবদান রাখে। সম্প্রতি আমি এর বিকল্পটি শিখেছি। মডেলিং ভেরিয়েবলগুলিতে যা কোনও চিকিত্সার প্রভাব নির্ধারণ করে - যেমন কোনও ফার্মাসিউটিক্যালের ক্লিনিকাল ট্রায়ালে - ভেরিয়েবলকে গুণগতভাবে ইন্টারঅ্যাক্ট করতে বলা হয়চিকিত্সা সহ যদি অন্যান্য জিনিস স্থির …

2
ডোমেন-অজোনস্টিক ফিচার ইঞ্জিনিয়ারিং যা অর্থগত অর্থ ধরে রাখে?
ফিচার ইঞ্জিনিয়ারিং প্রায়শই মেশিন লার্নিংয়ের একটি গুরুত্বপূর্ণ উপাদান (এটি ২০১০ সালের কেডিডি কাপ জয়ের জন্য বেশি ব্যবহৃত হয়েছিল )। তবে, আমি দেখতে পাই যে বেশিরভাগ বৈশিষ্ট্য ইঞ্জিনিয়ারিং কৌশলগুলি অন্তর্নিহিত বৈশিষ্ট্যগুলির কোনও স্বজ্ঞাত অর্থ বা ধ্বংস করুন একটি নির্দিষ্ট ডোমেন বা এমনকি বিশেষ ধরণের বৈশিষ্ট্যগুলির জন্য খুব নির্দিষ্ট। প্রাক্তনটির একটি সর্বোত্তম …

5
ক্লাস্টার বিশ্লেষণের জন্য পরিবর্তনীয় নির্বাচন করতে আমি পিসিএ ব্যবহার করতে পারি?
গুচ্ছ বিশ্লেষণ পরিচালনা করতে আমাকে ভেরিয়েবলের সংখ্যা হ্রাস করতে হবে। আমার ভেরিয়েবলগুলি দৃ corre়ভাবে সম্পর্কিত, তাই আমি একটি ফ্যাক্টর বিশ্লেষণ পিসিএ (মূল উপাদান বিশ্লেষণ) করার চিন্তা করলাম । তবে, আমি যদি ফলাফল প্রাপ্ত স্কোরগুলি ব্যবহার করি তবে আমার ক্লাস্টারগুলি বেশ সঠিক নয় (সাহিত্যের পূর্ববর্তী শ্রেণিবিন্যাসের তুলনায়)। প্রশ্ন: প্রতিটি উপাদান / …

4
লাসো মডেলটিতে ইটারেটিভলি রিয়েইটেড লেস্ট স্কোয়ারস (আইআরএলএস) পদ্ধতিটি কীভাবে প্রয়োগ করবেন?
আমি IRLS অ্যালগরিদম ব্যবহার করে একটি লজিস্টিক রিগ্রেশন প্রোগ্রাম করেছি । সঠিক বৈশিষ্ট্যগুলি স্বয়ংক্রিয়ভাবে নির্বাচন করার জন্য আমি একটি লাসো শাস্তি প্রয়োগ করতে চাই । প্রতিটি পুনরাবৃত্তিতে নিম্নলিখিতগুলি সমাধান করা হয়: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} আসুন একটি অ-নেতিবাচক আসল সংখ্যা । দ্য এলিমেন্টস এর পরামর্শ অনুসারে আমি ইন্টারসেপ্টটিকে শাস্তি দিচ্ছি না । …

4
বৈশিষ্ট্য নির্বাচনের জন্য লসো অস্থির হওয়ার কারণ কী?
সংক্ষিপ্ত , একটি উপপাদ্য গ্যারান্টি রয়েছে যে এর একটি অনন্য স্পারস দ্রবণ সি রয়েছে (আরও তথ্যের জন্য পরিশিষ্ট দেখুন)।argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc ccc লসোর জন্য কি একই রকম উপপাদ্য রয়েছে? যদি এই ধরনের উপপাদ্য থাকে তবে এটি কেবল লাসোর স্থিতিশীলতার …

2
কেন রিজ রিগ্রেশন লাসোর চেয়ে আরও ভাল ব্যাখ্যা প্রদান করতে পারে না?
রিজ রিগ্রেশন এবং লাসো সম্পর্কে আমার ইতিমধ্যে একটি ধারণা রয়েছে। লাসোর জন্য, এল 1 পেনাল্টি শব্দটি একটি বিচ্ছিন্ন সহগ ভেক্টর এনে দেবে, যা বৈশিষ্ট্য নির্বাচন পদ্ধতি হিসাবে দেখা যেতে পারে। তবে লাসোর জন্য কিছু সীমাবদ্ধতা রয়েছে। যদি বৈশিষ্ট্যগুলির উচ্চ সম্পর্ক থাকে তবে লাসো কেবল তাদের মধ্যে একটি নির্বাচন করবে। তদ্ব্যতীত, …

2
এলোমেলো বনের জন্য ক্যারেটের সাথে বৈশিষ্ট্য নির্বাচন এবং প্যারামিটারের সুর
কয়েক হাজার বৈশিষ্ট্যযুক্ত আমার কাছে ডেটা রয়েছে এবং আমি তথ্যবিরোধীগুলি অপসারণ করতে পুনরাবৃত্ত বৈশিষ্ট্য নির্বাচন (আরএফই) করতে চাই। আমি ক্যারেট এবং আরএফই দিয়ে এটি করি। যাইহোক, আমি ভাবতে শুরু করেছিলাম, যদি আমি সেরা রিগ্রেশন ফিট ফিট করতে চাই (উদাহরণস্বরূপ এলোমেলো বন), আমি কখন পরামিতি টিউনিং করব (আরএফের mtryজন্য)? এটি, যেমন …

1
রৈখিক ফাংশন আনুমানিকের সাথে কীভাবে মান-কিউ-মানগুলিতে ফিট করা যায়
শক্তিবৃদ্ধি শেখার ক্ষেত্রে লিনিয়ার ফাংশন আনুমানিকতা প্রায়শই ব্যবহৃত হয় যখন বড় বড় রাষ্ট্রের স্পেস থাকে। (যখন সারণীগুলি অনিবার্য হয়ে উঠবে তখন)) লিনিয়ার ফাংশন আনুমানিকের সাথে Q−প্রশ্নঃ-Q- মানটির ফর্মটি দিয়েছিল Q(s,a)=w1f1(s,a)+w2f2(s,a)+⋯,প্রশ্নঃ(গুলি,একটি)=W1চ1(গুলি,একটি)+ +W2চ2(গুলি,একটি)+ +⋯,Q(s,a) = w_1 f_1(s,a) + w_2 f_2(s,a) + \cdots, যেখানে wiWআমিw_i ওজন, এবং fifif_i বৈশিষ্ট্য। বৈশিষ্ট্যগুলি ব্যবহারকারী দ্বারা পূর্বনির্ধারিত …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.