এমন কোনও পদ্ধতি আছে যা মাত্রা হ্রাসের বিপরীত?


9

আমি মেশিন লার্নিংয়ের ক্ষেত্রে নতুন, তবে সিগন্যাল প্রসেসিংয়ে আমার অংশটি করেছি। যদি এই প্রশ্নটি ভুলভাবে লেখা হয়েছে তবে দয়া করে আমাকে জানান।

আমার কাছে দ্বিমাত্রিক ডেটা রয়েছে যা কমপক্ষে তিনটি ভেরিয়েবল দ্বারা সংজ্ঞায়িত করা হয়েছে, একটি অত্যন্ত অ-রৈখিক মডেল উপায় যেমন সিমুলেট করা খুব জটিল।

পিসিএ এবং আইসিএ (পাইথন লাইব্রেরি সাইকিট-শিখুন) এর মতো পদ্ধতি ব্যবহার করে ডেটা থেকে দুটি প্রধান উপাদান বের করার ক্ষেত্রে আমার বিভিন্ন স্তরের সাফল্য ছিল, তবে মনে হয় এই পদ্ধতিটি (বা কমপক্ষে, পদ্ধতিগুলির এই বাস্তবায়ন) সীমাবদ্ধ ডেটা যেমন মাত্রা আছে হিসাবে অনেক উপাদান আহরণ, উদাহরণস্বরূপ, 2D পয়েন্ট মেঘ থেকে 2 উপাদান।

ডেটা প্লট করার সময়, প্রশিক্ষিত চোখের কাছে এটি স্পষ্ট যে তিনটি পৃথক লিনিয়ার প্রবণতা রয়েছে, তিনটি বর্ণ রেখা নির্দেশাবলী দেখায়।

ডেটা প্লট

পিসিএ ব্যবহার করার সময়, প্রধান উপাদানটি বর্ণ রেখাগুলির একটিতে প্রান্তিক হয়, এবং অন্যটি 90 at এ থাকে, যেমনটি প্রত্যাশিত হয়। আইসিএ ব্যবহার করার সময়, প্রথম উপাদানটি নীল রেখার সাথে একত্রিত হয়, এবং দ্বিতীয়টি লাল এবং সবুজ রঙের মাঝে কোথাও থাকে। আমি এমন একটি সরঞ্জাম খুঁজছি যা আমার সংকেতটিতে তিনটি উপাদানই পুনরুত্পাদন করতে পারে।

সম্পাদনা, অতিরিক্ত তথ্য: আমি এখানে একটি বড় ধাপের বিমানের একটি ছোট উপসেটে কাজ করছি। এই ছোট উপসেটটিতে প্রতিটি ইনপুট ভেরিয়েবলগুলি সমতলে একটি রৈখিক পরিবর্তন আনতে পারে তবে এই পরিবর্তনের দিক এবং প্রশস্ততা অ-রৈখিক এবং আমি ঠিক কোথায় বড় বিমানটিতে কাজ করছি তার উপর নির্ভর করে। কিছু জায়গায়, দুটি ভেরিয়েবল হ্রাস পেতে পারে: তারা একই দিকে পরিবর্তনের উত্পাদন করে। উদাহরণস্বরূপ, বলুন যে মডেলটি এক্স, ওয়াই এবং জেড এর উপর নির্ভর করে। ভেরিয়েবল এক্সের পরিবর্তন নীল রেখার সাথে একটি প্রকরণ আনবে; Y সবুজ রেখা বরাবর একটি পার্থক্যের কারণ; জেড, লাল একটি বরাবর।


3
যদি আমি সঠিকভাবে বুঝতে পারি তবে আপনি যে ধারণার সন্ধান করছেন সেটি এম্বেড করছে । দেখুন কার্নেল পদ্ধতি , এবং কার্নেল পিসিএ বিশেষ করে।
এমের

1
আমি এটি সম্পর্কে নিশ্চিত নই, সুতরাং আমি এটি উত্তর হিসাবে পোস্ট করছি না। নিউরাল নেটওয়ার্ক ধরণের মডেলটিতে আপনি লুকানো স্তরের মাত্রা> ইনপুট স্তর মাত্রা রাখতে পারেন। তারপরে আপনি লুকানো স্তরটিকে অন্য কোনও নেটওয়ার্ক / মডেলের ইনপুট হিসাবে ব্যবহার করতে পারেন। তবে এটি করার জন্য প্রচুর ডেটা দরকার।
আজরায়েল

আপনি যখন কমপক্ষে তিনটি ভেরিয়েবল দ্বারা সংজ্ঞায়িত 2 ত্রিমাত্রিক ডেটা বলছেন, তখন আপনি কীভাবে 'ভেরিয়েবল' শব্দটি ব্যবহার করেন? ক্লাস কি একটি উপযুক্ত বিকল্প হতে পারে? এটি লক্ষণীয় যে পিসিএ ডেটা থেকে সর্বাধিক বৈকল্পিক মাত্রা আহরণ করে, এটি প্রয়োগ করার জন্য সর্বাধিক বৈষম্যমূলক রূপান্তর নয়। গুচ্ছ দেখেছে?
চিত্র_ডোক্টর

আপনি কি মডেলটির আনলাইনারিটি সম্পর্কে কিছু জানেন? যদিও এটি সিমুলেট করা খুব জটিল হতে পারে, এটি জেনে যে এটি সর্বাধিক ডিগ্রি 3 পলিনোমায়াল দ্বারা গঠিত, বৈশিষ্ট্য ইঞ্জিনিয়ারিংকে উল্লেখযোগ্যভাবে সীমাবদ্ধ করে যেমন আপনি সমস্ত 3 য় ডিগ্রি পোলগুলি যুক্ত করতে পারেন এবং তারপরে পিসিএ এটি 3D এ ফিরে যেতে পারে।
এএন 6 ইউ 5

আমি আমার এক পরিসংখ্যানবিদ বন্ধুর সাথে আলোচনা করেছি যিনি আমার ofালু সন্ধানের জন্য আমার ডেটারিভেটিভের উপর কার্নেল পিসিএ ব্যবহার করার পরামর্শ দিয়েছিলেন । "ফিচার ইঞ্জিনিয়ারিং" হিসাবে ডেরিভেটিভ গণনা গ্রহণ করবেন?
ফিলম্যাককে

উত্তর:


8

সংক্ষিপ্ত উত্তর হল হ্যাঁ.

মূলত আপনি কিছু বৈশিষ্ট্য ইঞ্জিনিয়ারিং সম্পাদন করবেন। এর অর্থ হ'ল প্রায়শই আপনার ডেটাগুলির ক্রিয়াকলাপগুলি তৈরি করা:

φ(এক্স):আরপিআর ,  =1,,কে

যা, একসাথে স্ট্রিং করে এর দৈর্ঘ্যের রূপান্তরিত ডেটা ভেক্টর সংজ্ঞায়িত করে ।φ(এক্স)কে

এটি করার অনেকগুলি উপায় রয়েছে, আরও ভাল এবং আরও খারাপ। আপনি শর্তগুলি সন্ধান করতে পারেন:

  1. স্প্লাইস এবং সাধারণীকরণযোগ্য মডেল।
  2. কার্নেল ট্রিক (কীভাবে মডেল তৈরি করবেন যেখানে )।কে
  3. বৈশিষ্ট্য প্রকৌশল (ম্যানুয়াল বৈচিত্রের, উদাহরণস্বরূপ আপনার ডেটাতে একটি কলাম যুক্ত করা)।এক্স2
  4. গভীর শিক্ষা, উপস্থাপনা শেখা

আপনি যেমন কৌশলগুলির বিচিত্র ব্যাগ থেকে অনুমান করতে পারেন, এটি একটি বিশাল অঞ্চল। এটি সত্যই না বলে চলেছে তবে অতিরিক্ত পোশাক এড়াতে যত্ন নেওয়া উচিত।

এই কাগজটি উপস্থাপনা শেখা: একটি পর্যালোচনা এবং নতুন দৃষ্টিভঙ্গি একটি গভীর শিক্ষার দৃষ্টিকোণ থেকে বৈশিষ্ট্যগুলির একটি বিশেষ সেটকে 'ভাল' করে তোলে তার চারপাশের কয়েকটি বিষয় নিয়ে আলোচনা করে।


-2

আমার ধারণা আপনি এমন বৈশিষ্ট্য সন্ধান করছেন যা নতুন বৈশিষ্ট্যগুলি বের করে। একটি বৈশিষ্ট্য যা ডেটাসেটকে সেরা উপস্থাপন করে। যদি এটি হয় তবে আমরা এই জাতীয় পদ্ধতিটিকে "বৈশিষ্ট্য নিষ্কাশন" বলি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.