প্রশ্ন ট্যাগ «feature-scaling»

বৈশিষ্ট্য স্কেলিং এমন একটি ডেটা প্রাক প্রক্রিয়াজাতকরণ পদক্ষেপ যেখানে ভেরিয়েবলের মানগুলির পরিসীমা মানিক করা হয়। অনেক মেশিন লার্নিং অ্যালগরিদমের জন্য ডেটাসেটের মানককরণ একটি সাধারণ প্রয়োজন। জনপ্রিয় বৈশিষ্ট্য স্কেলিংয়ের ধরণগুলির মধ্যে রয়েছে শূন্য গড় এবং একক বৈচিত্রের জন্য ডেটা স্কেলিং এবং প্রদত্ত সর্বনিম্ন এবং সর্বোচ্চ মানের মধ্যে ডেটা স্কেল করা।

3
ইনপুট ডেটাতে বৈশিষ্ট্যটির রূপান্তর
আমি এই ওটিটিও কেগল চ্যালেঞ্জের সমাধান সম্পর্কে পড়ছিলাম এবং প্রথম স্থানের সমাধানটি ইনপুট ডেটা এক্সের জন্য বেশ কয়েকটি রূপান্তর ব্যবহার করেছে বলে মনে হচ্ছে, উদাহরণস্বরূপ লগ (এক্স + 1), স্কয়ার্ট (এক্স + 3/8), ইত্যাদি কি আছে? বিভিন্ন শ্রেণিবদ্ধে কোন ধরণের রূপান্তরগুলি প্রয়োগ করতে হবে সে সম্পর্কে সাধারণ নির্দেশিকা? আমি গড়-ভেরি …

3
চক্রীয় অর্ডিনাল বৈশিষ্ট্যগুলিকে রূপান্তর করার একটি ভাল উপায় কী?
আমার বৈশিষ্ট্য হিসাবে আমি 'ঘন্টা' ক্ষেত্রটি করছি, তবে এটি একটি চক্রীয় মান নেয়। '23' এবং '0' ঘন্টা এর মতো তথ্য সংরক্ষণের জন্য আমি কীভাবে বৈশিষ্ট্যটির রূপান্তর করতে পারি close একটি উপায় যা আমি ভাবতে পারি তা হ'ল রূপান্তর করা: min(h, 23-h) Input: [0 1 2 3 4 5 6 7 …

1
একটি উত্তপ্ত ভেক্টর যদি সংখ্যাগত গুণাবলী দিয়ে মাপানো হয়
শ্রেণিবদ্ধ এবং সংখ্যাসূচক বৈশিষ্ট্যের সংমিশ্রণের ক্ষেত্রে, আমি সাধারণত শ্রেণীবদ্ধ বৈশিষ্ট্যগুলিকে একটি গরম ভেক্টরে রূপান্তর করি। আমার প্রশ্ন হ'ল আমি কি সেই ভেক্টরগুলিকে যেমন রেখেছি এবং মানীয়করণ / নরমালাইজেশনের মাধ্যমে সংখ্যার গুণাবলীকে স্কেল করব, অথবা আমি সংখ্যার গুণাবলী সহ একটি উত্তপ্ত ভেক্টরকে স্কেল করব?

1
দ্রাঘিমাংশ / অক্ষাংশ বৈশিষ্ট্য [বন্ধ] ব্যবহার করার উপায়
বন্ধ । এই প্রশ্নের বিশদ বা স্পষ্টতা দরকার । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? বিশদ যুক্ত করুন এবং এই পোস্টটি সম্পাদনা করে সমস্যাটি পরিষ্কার করুন । 3 বছর আগে বন্ধ । আমি 25 টি বৈশিষ্ট্য সহ একটি কল্পিত ডেটাসেটে কাজ করছি। বৈশিষ্ট্যগুলির মধ্যে দুটি …

3
কেন আমরা স্কিউড ডেটাগুলিকে একটি সাধারণ বিতরণে রূপান্তর করি
আমি কাগল ( হাউস মূল্য সম্পর্কিত হিউম্যান অ্যানালগের কার্নেল: অ্যাডভান্স রিগ্রেশন টেকনিকস ) এর আবাসন মূল্য প্রতিযোগিতার একটি সমাধানের মধ্য দিয়ে যাচ্ছিলাম এবং এই অংশটি পেরিয়ে এসেছি: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import skew …

4
0 থেকে 1 পর্যন্ত সীমাবদ্ধ স্বাক্ষরের পূর্ণসংখ্যার অ্যারে কীভাবে স্কেল করবেন?
আমি কোনও বৈশিষ্ট্য সেটটিতে নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য মস্তিষ্ক ব্যবহার করছি যা ইতিবাচক এবং নেতিবাচক মান উভয়ই অন্তর্ভুক্ত করে। তবে মস্তিষ্কের 0 থেকে 1 এর মধ্যে ইনপুট মানগুলির প্রয়োজন my আমার ডেটা স্বাভাবিক করার সর্বোত্তম উপায় কোনটি?

2
বৈশিষ্ট্য স্কেলিংয়ের ফলাফল
আমি বর্তমানে এসভিএম ব্যবহার করছি এবং [0,1] এর সীমার মধ্যে আমার প্রশিক্ষণ বৈশিষ্ট্যগুলি স্কেলিং করছি। আমি প্রথমে আমার প্রশিক্ষণের সেটটিকে ফিট করি / রূপান্তর করি এবং তারপরে আমার পরীক্ষার সেটে একই রূপান্তরটি প্রয়োগ করি। উদাহরণ স্বরূপ: ### Configure transformation and apply to training set min_max_scaler = MinMaxScaler(feature_range=(0, 1)) X_train = …

2
লিনিয়ার রিগ্রেশন এবং ডেটা স্কেলিং
নিম্নলিখিত প্লটটি লিনিয়ার রিগ্রেশন সহ প্রাপ্ত সহগগুলি দেখায় ( mpgলক্ষ্য পরিবর্তনশীল হিসাবে এবং অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারী হিসাবে)। এমটিকার্স ডেটাসেটের জন্য ( এখানে এবং এখানে ) উভয়ই ডেটা স্কেলিং ছাড়াই: আমি এই ফলাফলগুলি কীভাবে ব্যাখ্যা করব? ভেরিয়েবলগুলি hpএবং dispকেবলমাত্র ডেটা মাপা হলে তা উল্লেখযোগ্য। হয় amএবং qsecসমানভাবে গুরুত্বপূর্ণ বা amবেশী গুরুত্বপূর্ণ …

3
জিরো মিন এবং ইউনিট ভেরিয়েন্স
আমি ডেটা স্কেলিং এবং বিশেষত মানক পদ্ধতিটি অধ্যয়ন করছি। আমি এর পিছনে গণিতটি বুঝতে পেরেছি, তবে বৈশিষ্ট্যগুলি শূন্য এবং গড়ের একক বৈকল্পিকতা দেওয়া কেন গুরুত্বপূর্ণ তা আমার কাছে স্পষ্ট নয়। তুমি কি আমাকে ব্যাখ্যা করতে পারবে ?
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.