বৈশিষ্ট্য প্রকৌশল জন্য টিউটোরিয়াল


19

যেমনটি সবার কাছে জানা যায়, ফিচার ইঞ্জিনিয়ারিং মেশিন লার্নিংয়ের জন্য অত্যন্ত গুরুত্বপূর্ণ, তবে আমি এই অঞ্চলের সাথে যুক্ত কয়েকটি উপাদান পেয়েছি। আমি কাগল-এর বেশ কয়েকটি প্রতিযোগিতায় অংশ নিয়েছি এবং বিশ্বাস করি যে ভাল বৈশিষ্ট্যগুলি কিছু ক্ষেত্রে ভাল শ্রেণিবদ্ধের চেয়ে আরও গুরুত্বপূর্ণ হতে পারে। কেউ কি বৈশিষ্ট্য ইঞ্জিনিয়ারিং সম্পর্কে কোনও টিউটোরিয়াল জানেন, বা এই খাঁটি অভিজ্ঞতা?


1
আপনি কি বৈশিষ্ট্যগুলির প্রাক-প্রক্রিয়াজাতকরণ (সাধারণকরণ এবং অন্যান্য রূপান্তরগুলি) বা বৈশিষ্ট্য নির্বাচন বলতে চান?
ম্যাটব্যাগ

2
@ mb3041023 না, উভয়ের আগের পদক্ষেপ, যাতে আপনি কিছু কাঁচা তথ্য যেমন পাঠ্য, চিত্র বা সিরিজকে কিছু ব্যবহারযোগ্য বৈশিষ্ট্যে রূপান্তর করেন।

8
আমার অভিজ্ঞতায়, মেশিন লার্নিংয়ের সমস্যার একটি বিশাল অংশটি আক্ষরিক অর্থে সঠিক সমস্যার সমাধান / অনুকূলিতকরণের জন্য সেট আপ করছে (যেমন বৈশিষ্ট্য, বৈশিষ্ট্য উপস্থাপনা, নির্বাচন ইত্যাদি)। আমি সত্যিকারের অনেক বাস্তব জীবনের চিত্র (যেমন ক্যাগল) এর সাথে অভিজ্ঞতামূলক বৈশিষ্ট্য নির্বাচন এবং প্রাক-প্রসেসিংয়ের জন্য নিখুঁতভাবে উত্সর্গীকৃত একটি বই দেখতে পছন্দ করব। কেউ যদি কেউ জানেন, প্লিজ। পোস্ট। ডেটা পরিষ্কার / ডেটা ইমপুটেশন এর মতো জিনিসগুলিতে উত্সর্গীকৃত বেশ কয়েকটি বই রয়েছে তবে বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে একটি উত্সর্গীকৃত ব্যবহারিক পাঠ্য খুব প্রয়োজন।
প্যাট করুন

2
একবার দেখুন: "বৈশিষ্ট্য এক্সট্রাকশন: ফাউন্ডেশন এবং অ্যাপ্লিকেশন", 2006
জেসনব

2
@jasonb, কিভাবে লেখক, আকার, মূল্য, এবং একটি লিঙ্কে, ভালো কিছু সম্পর্কে: Guyon ed, বৈশিষ্ট্য নিষ্কাশন। ফাউন্ডেশন অ্যান্ড অ্যাপ্লিকেসনস 2006, 778p, $ 306
ডেনিস

উত্তর:


7

আমি বলব অভিজ্ঞতা - মৌলিক ধারণাগুলি হ'ল:

  • শ্রেণিবদ্ধরা কীভাবে কাজ করে তা মাপসই; কোনও গাছকে জ্যামিতির সমস্যা দেওয়া, কেএনএনকে আকারের আকার এবং এসভিএমকে অন্তরবৃত্তির ডেটা দেওয়া ভাল ধারণা নয়
  • যথাসম্ভব অরৈখিকতা অপসারণ; কিছু শ্রেণিবদ্ধকারী ভিতরে ফুরিয়ার বিশ্লেষণ করবেন বলে আশা করা বরং নির্বোধ (এমনকি, এটি সেখানে অনেক জটিলতা নষ্ট করবে)
  • সমস্ত বস্তুর জন্য জেনেরিক বৈশিষ্ট্য তৈরি করুন যাতে চেইনে কিছু নমুনা সেগুলি ছিটকে না যায়
  • পূর্ববর্তী কাজগুলি পরীক্ষা করুন - প্রায়শই রূপকল্প বা অনুরূপ ধরণের ডেটা পরীক্ষার জন্য ব্যবহৃত আকর্ষণীয় দিকগুলি উন্মোচনের জন্য ইতিমধ্যে সুরযুক্ত
  • অস্থিরতা এড়াতে, পিসিএ এর মতো রূপান্তরকে অনুকূলিতকরণ করুন যা ওভারফিটিংয়ের দিকে নিয়ে যেতে পারে
  • অনেক পরীক্ষা

আপনি "ইন্টারভাল ডেটা" কীভাবে সংজ্ঞায়িত করবেন? আমি গুগলে অনুসন্ধান করেছি এবং বিভিন্ন সংজ্ঞা পেয়েছি।
পাওয়ার

আপনি পিসিএ পয়েন্ট বিস্তারিত বলতে পারেন?
ড্যানিয়েল ভেলকভ

এক্স|এক্স-নিকটতম প্রধান|<0.3

@ ড্যানিয়েলভেলকভ যখন আপনি কোনও শোরগোলের তথ্য পিসিএ বুটস্ট্র্যাপ করেন তখন উপাদানগুলি প্রায়শই অস্থির থাকে; এটি পুরো উপলব্ধ সেটে একটি বৈশ্বিক পিসিএ করার ধারণাটিকে উত্সাহ দেয়, কোনটি তথ্য ফাঁস করে এবং মূল্যায়নকে ফাঁকি দেওয়ার সোজা উপায়।

@ এমবিকিউ কী হবে যদি পিসিএ কেবল প্রশিক্ষণ সেটে চালিত হয়, এটি যেভাবে হওয়ার কথা?
ড্যানিয়েল ভেলকভ

1

ও'রিলির একটি বই রয়েছে যা ফেং ইঞ্জিনিয়ারিং ফর মেশিন লার্নিং "ঝেং এট আল দ্বারা রচিত ।

আমি বইটি পড়েছি এবং এটি বিভিন্ন ধরণের ডেটা (যেমন শ্রেণীবদ্ধ, পাঠ্য ...) কভার করে এবং বৈশিষ্ট্য ইঞ্জিনিয়ারিংয়ের বিভিন্ন দিক যা এটি দিয়ে যায় তা বর্ণনা করে। এর মধ্যে ডেটা স্বাভাবিককরণ, বৈশিষ্ট্য নির্বাচন, পাঠ্যে টিএফ-আইডিএফের মতো জিনিস রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.