ডোমেন-অজোনস্টিক ফিচার ইঞ্জিনিয়ারিং যা অর্থগত অর্থ ধরে রাখে?


12

ফিচার ইঞ্জিনিয়ারিং প্রায়শই মেশিন লার্নিংয়ের একটি গুরুত্বপূর্ণ উপাদান (এটি ২০১০ সালের কেডিডি কাপ জয়ের জন্য বেশি ব্যবহৃত হয়েছিল )। তবে, আমি দেখতে পাই যে বেশিরভাগ বৈশিষ্ট্য ইঞ্জিনিয়ারিং কৌশলগুলি

  • অন্তর্নিহিত বৈশিষ্ট্যগুলির কোনও স্বজ্ঞাত অর্থ বা ধ্বংস করুন
  • একটি নির্দিষ্ট ডোমেন বা এমনকি বিশেষ ধরণের বৈশিষ্ট্যগুলির জন্য খুব নির্দিষ্ট।

প্রাক্তনটির একটি সর্বোত্তম উদাহরণ হ'ল মূল উপাদান বিশ্লেষণ। এটি আমার কাছে মনে হবে যে কোনও বিষয়-বিশেষজ্ঞের বৈশিষ্ট্যগুলি সম্পর্কে যে জ্ঞান রয়েছে সেগুলি বৈশিষ্ট্যগুলিকে মূল উপাদানগুলিতে রূপান্তর করে ধ্বংস করা হবে।

"মাসের দিন" এবং "সপ্তাহের দিন" -এর জন্য বৈশিষ্ট্যগুলিতে একটি তারিখকে রূপান্তর করার একটি সহজ কৌশলটির সাথে বৈসাদৃশ্য করুন। অন্তর্নিহিত অর্থটি এখনও নতুন বৈশিষ্ট্যগুলিতে বজায় রয়েছে তবে স্পষ্টতই এই নির্দিষ্ট কৌশলটি কেবল তারিখগুলির জন্য প্রযোজ্য কেবল নির্বিচার বৈশিষ্ট্যগুলির জন্য নয়।

স্বেচ্ছাসেবী ডোমেনগুলির ক্ষেত্রে (বা কমপক্ষে বিস্তৃত ডোমেনগুলির বিভিন্ন ক্ষেত্রে) প্রযোজ্য থাকাকালীন এমন কোনও বৈশিষ্ট্যযুক্ত প্রকৌশল প্রযুক্তি রয়েছে যা অন্তর্নিহিত বৈশিষ্ট্যগুলির অর্থ নষ্ট করে না?


2
পিসিএ কখনও কখনও বৈশিষ্ট্যগুলির জন্য স্বজ্ঞাত অর্থগুলি খুঁজে পেতে ব্যবহার করা যেতে পারে - যেমন ইগেনফেসগুলি
tdc

আপনি যে ডেটা মনে রেখেছেন তার উদাহরণগুলি (আরও) দিতে পারেন? আপনি যদি নিজের অ্যাপ্লিকেশন সম্পর্কে আরও সুনির্দিষ্ট হতে পারেন (এমনকি কিছু স্বেচ্ছাসেবী উদাহরণও) সঠিক উত্তর দেওয়া আরও সহজ হবে।
ডভ

1
@ ডভ ওয়েল পুরো বিষয়টি হ'ল (আদর্শভাবে) আমি এমন কিছু চাই যা কেবল কোনও কাঠামোগত, টেবুলার ডেটাসেটের জন্য কাজ করতে পারে (যার মধ্যে ডেটাপয়েন্ট এবং বৈশিষ্ট্য রয়েছে)। সুতরাং এটি বিক্রয় ডেটা, আর্থিক তথ্য, ওষুধ আবিষ্কারের ডেটা, বেসবল ডেটা ইত্যাদি হতে পারে
মাইকেল ম্যাকগওয়ান

উত্তর:


7

আমি একটি পচন পদ্ধতি সম্পর্কে সচেতন (তবে সম্ভবত আরও কিছু আছে ...) যা আপনার বর্ণনার মতো পরিস্থিতিতে কার্যকর হতে পারে। এটি 2 ডি-পিসিএ -র মতো - একটি উচ্চতর অর্ডার পচন পদ্ধতি যেখানে পচন (অর্থাৎ কারণগুলি) এর কিছু অর্থ রয়েছে। আপনি উদাহরণ দেখতে এবং এটি সম্পর্কে পড়তে পারেন এখানে এবং এখানে এবং চেষ্টা এখানে


+ দয়া করে আমাকে ক্ষমা করুন যে আমি কোনও স্থানীয় ইংরেজী স্পিকার নই :)
ডভ

আমাকে যা বলা হয়েছিল সেগুলি থেকে, পিসিএর শেষ ধাপে প্রিন্সিপাল কম্পোনেটটির অর্থ অনুসন্ধান করার চেষ্টা করা উচিত।
জেবি।

5

সীমাবদ্ধ বল্টজম্যান মেশিন ব্যবহার করে সাম্প্রতিক গভীর শেখার পদ্ধতিগুলি বেশ কয়েকটি ডেটা ধরণের (অডিও, চিত্র, পাঠ্য) উপর দুর্দান্ত বৈশিষ্ট্য দেখিয়েছে।

যেহেতু এই পদ্ধতিগুলি একটি জেনারেটরি মডেল তৈরি করে, আপনি প্রায়শই মডেল থেকে সত্যিই দুর্দান্ত নমুনা তৈরি করতে পারেন।

হিন্টনের প্রকাশনা দেখুন। http://www.cs.toronto.edu/~hinton/

এই পদ্ধতিগুলি সম্পূর্ণ সাধারণ নয় (প্রতিটি ডেটাতে একই কোড চালান) তবে অন্তর্নিহিত মডেলটি সাধারণত একই রকম হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.