প্রশ্ন ট্যাগ «feature-selection»

আরও মডেলিংয়ে ব্যবহারের জন্য বৈশিষ্ট্যের একটি উপসেট নির্বাচন করার পদ্ধতি এবং নীতি

1
সিদ্ধান্ত গাছের পরিবর্তনশীল (বৈশিষ্ট্য) স্কেলিং এবং ভেরিয়েবল (বৈশিষ্ট্য) নরমালাইজেশন (টিউনিং) কোন বাস্তবায়নের প্রয়োজন?
অনেক মেশিন লার্নিং অ্যালগরিদমগুলিতে, বৈশিষ্ট্য স্কেলিং (ওরফে ভেরিয়েবল স্কেলিং, নরমালাইজেশন) একটি সাধারণ পূর্ববর্তী পদক্ষেপ উইকিপিডিয়া - বৈশিষ্ট্য স্কেলিং - এই প্রশ্নটি নিকটে প্রশ্ন # 41704 - কীভাবে এবং কেন বৈশিষ্ট্য স্কেলিং কাজ করে? সিদ্ধান্ত গাছ সম্পর্কিত ক্ষেত্রে আমার দুটি প্রশ্ন রয়েছে: বৈশিষ্ট্য স্কেলিং প্রয়োজন হয় এমন কোন সিদ্ধান্ত ট্রি বাস্তবায়ন …

3
বৈশিষ্ট্য নির্বাচন শুধুমাত্র প্রশিক্ষণ ডেটা (বা সমস্ত ডেটা) এ সঞ্চালিত করা উচিত?
শুধুমাত্র প্রশিক্ষণ ডেটা (বা সমস্ত ডেটা) এ বৈশিষ্ট্য নির্বাচন করা উচিত? আমি গায়ুন (2003) এবং সিংহি এবং লিউ (2006) এর মতো কিছু আলোচনা এবং কাগজপত্র পেরিয়েছি , তবে সঠিক উত্তর সম্পর্কে এখনও নিশ্চিত নই। আমার পরীক্ষার সেটআপটি নিম্নরূপ: ডেটাসেট: 50-স্বাস্থ্যকর নিয়ন্ত্রণ এবং 50-রোগীদের (সিসিএ 200 বৈশিষ্ট্য যা রোগের পূর্বাভাসের সাথে …

1
ল্যান্সো কীভাবে কলিনের পূর্বাভাসকারীদের মধ্যে নির্বাচন করেন?
আমি একটি স্বজ্ঞাত উত্তরের সন্ধান করছি কেন একটি জিএলএম লাসো মডেল অত্যন্ত সংযুক্তদের একটি গ্রুপের মধ্যে থেকে একটি নির্দিষ্ট ভবিষ্যদ্বাণীকে নির্বাচন করে এবং কেন এটি সর্বোত্তম উপসেট বৈশিষ্ট্য নির্বাচন করে তা এত আলাদাভাবে করে। তিবশিরানী ১৯৯।-এর চিত্র ২-এ দেখানো লাসোর জ্যামিতি থেকে আমি বিশ্বাস করতে পরিচালিত করেছি যে লাসো আরও …

3
মতলব মধ্যে পারস্পরিক তথ্য ব্যবহার করে বৈশিষ্ট্য নির্বাচন
আমি এই বক্তৃতা নোটগুলিতে বর্ণিত (5 পৃষ্ঠায়) বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে পারস্পরিক তথ্যের ধারণাটি প্রয়োগ করার চেষ্টা করছি । আমার প্ল্যাটফর্মটি মতলব। অনুপ্রেরণামূলক তথ্য থেকে পারস্পরিক তথ্য গণনা করার সময় একটি সমস্যা আমি দেখতে পাই যে সংখ্যাটি সর্বদা উপরের দিকে পক্ষপাতদুষ্ট থাকে। মতলব সেন্ট্রিয়ায় এমআই গণনা করতে আমি প্রায় 3 ~ …

1
খুব বড় সময়-সিরিজের ডেটাসেটগুলির সাথে ডিল করা
আমার একটি খুব বড় ডেটাসেট অ্যাক্সেস রয়েছে। চারটি জেনারগুলির মধ্যে একটির থেকে সংগীত অংশগুলি শোনার লোকদের এমইজি রেকর্ডিং থেকে ডেটা । তথ্য নিম্নরূপ: 6 বিষয় 3 পরীক্ষামূলক পুনরাবৃত্তি (যুগ) যুগে যুগে 120 ট্রায়াল 275 মেগা চ্যানেল থেকে 500Hz (= 4000 নমুনা) এ পরীক্ষার জন্য 8 সেকেন্ডের ডেটা সুতরাং এখানে প্রতিটি …

4
আর-তে ভেরিয়েবল / বৈশিষ্ট্য নির্বাচন করতে ক্রস বৈধতা ব্যবহার করার কোনও উপায় আছে কি?
আমার প্রায় 70 টি ভেরিয়েবলের সাথে একটি ডেটা সেট রয়েছে যা আমি কাটাতে চাই। আমি যা দেখতে চাইছি তা হল নিম্নলিখিত ফ্যাশনে সবচেয়ে দরকারী ভেরিয়েবলগুলি খুঁজে পেতে সিভি ব্যবহার করা। 1) এলোমেলোভাবে 20 ভেরিয়েবল নির্বাচন করুন। 2) সবচেয়ে গুরুত্বপূর্ণ ভেরিয়েবল চয়ন করতে stepwise/ LASSO/ lars/ ইত্যাদি ব্যবহার করুন । 3) …

4
ডায়াবেটিসের এসভিএম শ্রেণিবিন্যাস উন্নত করা
আমি ডায়াবেটিসের পূর্বাভাস দেওয়ার জন্য এসভিএম ব্যবহার করছি। আমি এই উদ্দেশ্যে বিআরএফএসএস ডেটা সেট ব্যবহার করছি । ডেটা সেটটিতে মাত্রা রয়েছে এবং এটি স্কিউড হয়। টার্গেট ভেরিয়েবলের s এর শতাংশ while যখন এর মধ্যে বাকি । ।11 % 89 %432607 × 136432607×136432607 \times 136Y১১ %11%11\%N89 %89%89\% আমি শুধু ব্যবহার করছি …

2
ননপ্যারমেট্রিক রিগ্রেশনের জন্য বৈশিষ্ট্য নির্বাচনের সেরা পদ্ধতি
এখানে একটি নবাগত প্রশ্ন। আমি বর্তমানে আর-তে এনপি প্যাকেজটি ব্যবহার করে একটি ননপ্যারমেট্রিক রিগ্রেশন করছি I আমার features টি বৈশিষ্ট্য রয়েছে এবং একটি ব্রুট ফোর্স পদ্ধতির ব্যবহার করে আমি সেরাটি চিহ্নিত করেছি But তবে, শীঘ্রই আমার কাছে আরও 7 টিরও বেশি বৈশিষ্ট্য থাকবে! আমার প্রশ্নটি হ'ল ননপ্যারমেট্রিক রিগ্রেশনের জন্য বৈশিষ্ট্য …

1
বৈশিষ্ট্যগুলির অপ্রয়োজনীয় পরিমাণকে কীভাবে মাপব?
আমার কাছে তিনটি বৈশিষ্ট্য রয়েছে যা আমি শ্রেণিবদ্ধকরণ সমস্যা সমাধানের জন্য ব্যবহার করি। মূলত, এই বৈশিষ্ট্যগুলি বুলিয়ান মানগুলি উত্পাদন করে, তাই আমি ইতিবাচক এবং নেতিবাচক শ্রেণিবিন্যাসের সেটগুলি কতটা ওভারল্যাপ করে তা দেখে তাদের অপ্রয়োজনীয়তার মূল্যায়ন করতে পারি। পরিবর্তে প্রকৃত মান (স্কোর) উত্পাদন করার জন্য আমি এখন বৈশিষ্ট্যগুলি প্রসারিত করেছি এবং …

3
বায়েশিয়ান মডেল নির্বাচন এবং বিশ্বাসযোগ্য ব্যবধান
আমার কাছে তিনটি ভেরিয়েবল সহ একটি ডেটাসেট রয়েছে, যেখানে সমস্ত ভেরিয়েবলগুলি পরিমাণগত হয়। একে , এবং বলি । আমি এমসিএমসির মাধ্যমে বায়েশীয় দৃষ্টিভঙ্গিতে একটি রিগ্রেশন মডেল ফিট করছিyYyx1এক্স1x_1x2এক্স2x_2rjags আমি একটি অনুসন্ধানী বিশ্লেষণ করেছি এবং এর স্ক্র্যাটারপ্লট সুপারিশ করে যে একটি চতুর্ভুজ শব্দটি ব্যবহার করা উচিত। তারপরে আমি দুটি মডেল লাগিয়েছিy×x2Y×এক্স2y\times …

3
সাইকিট শিখার সাথে বৈশিষ্ট্য নির্বাচনের পরে ফিল্টারযুক্ত বৈশিষ্ট্যগুলি চিহ্নিত করা
পাইথনে বৈশিষ্ট্য নির্বাচনের পদ্ধতির জন্য আমার কোডটি এখানে : from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) তবে নতুন এক্স (নির্ভরশীল ভেরিয়েবল - এক্স_নিউ) পাওয়ার পরে, আমি কীভাবে জানব যে …

2
চলক গুরুত্ব এলোমেলোভাবে নেতিবাচক মান
আমি নিজেকে জিজ্ঞাসা করছি যে কোনও রিগ্রেশন প্রসঙ্গে negativeণাত্মক ভেরিয়েবল গুরুত্ব মান ("% IncMSE") সহ সেই ভেরিয়েবলগুলি সরিয়ে ফেলা ভাল ধারণা কিনা। এবং যদি এটি আমাকে আরও ভাল ভবিষ্যদ্বাণী দেয়? আপনি কি মনে করেন?

3
লজিস্টিক রিগ্রেশন মডেলের সঠিক উপায়ে কীভাবে भविष्यवाणी করা যায়
তাই আমি মডেলিংয়ের বিষয়ে কিছু বই (বা তাদের কিছু অংশ) পড়ছি (অন্যদের মধ্যে এফ। হ্যারেলের "রিগ্রেশন মডেলিং কৌশলগুলি), যেহেতু আমার বর্তমান পরিস্থিতি এখন বাইনারি প্রতিক্রিয়া তথ্যের উপর ভিত্তি করে একটি লজিস্টিক মডেল করা দরকার। আমার ডেটা সেটে আমার ধারাবাহিক, শ্রেণিবদ্ধ এবং বাইনারি ডেটা (ভবিষ্যদ্বাণী) উভয়ই রয়েছে। মূলত আমার কাছে এখনই …

3
গভীর শিক্ষণ ব্যবহার করে বৈশিষ্ট্য নির্বাচন?
আমি গভীর মডেল ব্যবহার করে প্রতিটি ইনপুট বৈশিষ্ট্যের গুরুত্ব গণনা করতে চাই। তবে আমি গভীর শিখন - গভীর বৈশিষ্ট্য নির্বাচন ব্যবহার করে বৈশিষ্ট্য নির্বাচন সম্পর্কে একটি মাত্র কাগজ পেয়েছি । এগুলি প্রথম লুকানো স্তরের আগে সরাসরি প্রতিটি বৈশিষ্ট্যের সাথে সংযুক্ত নোডের একটি স্তর sertোকায়। শুনেছি গভীর বিশ্বাস নেটওয়ার্ক (ডিবিএন) এই …

2
ক্রস-বৈধকরণের আগে নিরীক্ষণ করা বৈশিষ্ট্য নির্বাচন করা কি আসলেই ভাল?
ইন পরিসংখ্যান শেখার উপাদানসমূহ , আমি নিম্নোক্ত বিবৃতি পেয়েছি: একটি যোগ্যতা রয়েছে: নমুনাগুলি বাদ দেওয়ার আগে প্রাথমিক আপত্তিহীন স্ক্রিনিং পদক্ষেপগুলি করা যেতে পারে। উদাহরণস্বরূপ, আমরা ক্রস-বৈধকরণ শুরু করার আগে, 50 টি সমস্ত নমুনা জুড়ে সর্বাধিক বৈকল্পিক সহ 1000 ভবিষ্যদ্বাণীকে নির্বাচন করতে পারি। যেহেতু এই ফিল্টারিংয়ে শ্রেণিবদ্ধ লেবেল জড়িত না তাই …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.