সিদ্ধান্ত বনাম বনাম নিউরাল নেটওয়ার্ক


20

আমি ব্যাংক ইত্যাদির মতো আর্থিক ব্যবস্থাগুলিতে জালিয়াতির চেষ্টা করতে এবং ভবিষ্যদ্বাণী করার জন্য একটি মেশিন লার্নিং স্ট্রাকচার বাস্তবায়ন করছি ... এর অর্থ হ'ল মডেলকে প্রশিক্ষণ দেওয়ার জন্য প্রচুর বিভিন্ন ডেটা ব্যবহার করা যেতে পারে। কার্ড নম্বর, কার্ড ধারকের নাম, পরিমাণ, দেশ, ইত্যাদি ...

এই কাঠামোর জন্য কোন কাঠামোটি সেরা তা সিদ্ধান্ত নিতে আমার সমস্যা হচ্ছে। সিদ্ধান্ত গাছের সাথে আমার কিছু অভিজ্ঞতা আছে তবে বর্তমানে আমি প্রশ্ন করতে শুরু করেছি যে এই জাতীয় সমস্যার জন্য কোনও নিউরাল নেটওয়ার্ক আরও ভাল হবে কিনা। এছাড়াও অন্য কোনও পদ্ধতি যদি সেরা হয় তবে দয়া করে আমাকে আলোকিত করুন।

প্রতিটি কাঠামোর উপকারিতা এবং কনসগুলি কী এবং এই কাঠামোর জন্য কোন কাঠামোটি সেরা হবে?

এছাড়াও আমি এই বাস্তবতা সম্পর্কে নিশ্চিত নই তবে আমি মনে করি কার্যকর করার গতির ক্ষেত্রে সিদ্ধান্ত গাছগুলির নিউরাল নেটওয়ার্কগুলির উপর একটি দুর্দান্ত সুবিধা রয়েছে। এটি গুরুত্বপূর্ণ কারণ গতিও এই প্রকল্পের একটি মূল কারণ।

উত্তর:


24

এই দুটিয়ের মধ্যে অনেক পার্থক্য রয়েছে, তবে ব্যবহারিক দিক থেকে তিনটি প্রধান বিষয় বিবেচনা করতে হবে: গতি, ব্যাখ্যাযোগ্যতা এবং যথার্থতা।

সিদ্ধান্ত গাছ

  • একবার প্রশিক্ষিত হওয়া উচিত (যদিও উভয়ই অ্যালগরিদম সঠিক অ্যালগরিদম এবং ডেটার পরিমাণ / মাত্রিকতার উপর নির্ভর করে ধীরে ধীরে প্রশিক্ষণ নিতে পারে)। এর কারণ এটি একটি সিদ্ধান্ত গাছ অন্তর্নিহিতভাবে ইনপুট বৈশিষ্ট্যগুলিকে "দূরে নিক্ষেপ" করে যা এটি কার্যকর বলে মনে করে না, অন্যদিকে একটি প্রাকৃতিক প্রক্রিয়াজাতকরণ পদক্ষেপ হিসাবে কোনও বৈশিষ্ট্য নির্বাচন না করা হলে একটি নিউরাল নেট সেগুলি সমস্ত ব্যবহার করবে।
  • মডেলটি কী করছে তা যদি বোঝা গুরুত্বপূর্ণ তবে গাছগুলি খুব ব্যাখ্যামূলক।
  • কেবলমাত্র মডেল ফাংশন যা ডেটার অক্ষ-সমান্তরাল বিভাজন, যা ক্ষেত্রে নাও হতে পারে।
  • অতিরিক্ত ফিটিং এড়াতে আপনি সম্ভবত গাছের ছাঁটাই করতে নিশ্চিত হতে চান ।

নিউরাল নেট

  • ধীরে ধীরে (প্রশিক্ষণ এবং শ্রেণিবদ্ধার জন্য উভয়), এবং কম ব্যাখ্যাযোগ্য।
  • যদি আপনার ডেটা কোনও প্রবাহে আসে, আপনি স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত (ক্রমযুক্ত গাছের বিপরীতে, যা সহজাতভাবে ব্যাচ-লার্নিং অ্যালগরিদম ব্যবহার করে) সহ বর্ধিত আপডেটগুলি করতে পারেন।
  • আরও স্বেচ্ছাসেবী ফাংশন (ননলাইন সংক্রান্ত মিথস্ক্রিয়া ইত্যাদি) মডেল করতে পারে এবং তাই যথাযথ প্রশিক্ষণের ডেটা উপস্থিত থাকলে আরও সঠিক হতে পারে। তবে এটি ওভার-ফিটিংয়ের জন্যও প্রবণ হতে পারে।

কোনটি আরও ভাল এবং বেঞ্চমার্ক চলমান সময়গুলি তা দেখার জন্য আপনি উভয়ই প্রয়োগ করতে এবং আপনার ডেটাতে কিছু পরীক্ষা-নিরীক্ষার চেষ্টা করতে চাইতে পারেন। অথবা, আপনি উভয় পদ্ধতিতে ড্রাইভ পরীক্ষা করতে আপনার ডেটার প্রতিনিধি নমুনা সহ ওয়েকা জিইউআই টিকলিটের মতো কিছু ব্যবহার করতে পারেন ।

এটিও হতে পারে যে সিদ্ধান্তের গাছগুলির সাথে "ব্যাগিং" বা "বুস্টিং" অ্যালগরিদম ব্যবহার করা কিছু সরলতা এবং গতি বজায় রেখে সঠিকতার উন্নতি করবে। তবে সংক্ষেপে, যদি গতি এবং ব্যাখ্যাটি সত্যই গুরুত্বপূর্ণ হয় তবে গাছগুলি সম্ভবত কোথায় শুরু করা উচিত। অন্যথায়, এটি নির্ভর করে এবং আপনার কিছু কাজ করতে হবে ir


আপনি এ সম্পর্কে কিছুটা জানেন বলে মনে হচ্ছে, বেইসিয়ান নেটওয়ার্কগুলি বা অন্যান্য মেশিন লার্নিং পদ্ধতিগুলির সাথে আপনার কি কোনও অভিজ্ঞতা আছে যা এই সমস্যাটিতে সহায়তা করতে পারে?
টোপো

1
আমি পুরো বায়েশিয়ান নেটওয়ার্কগুলি, বেশিরভাগ নিষ্পাপ বেইস এবং টপিক মডেলগুলির সাথে খুব বেশি ফিউজড করতে পারি নি। আমি কখনও জালিয়াতি সনাক্তকরণ সমস্যা নিয়ে কাজ করি নি, তবে নিষ্পাপ বয়েস বা লজিস্টিক রিগ্রেশন এখানে যুক্তিসঙ্গত পন্থা হতে পারে।
বুড়ো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.