প্যাটার্ন স্বীকৃতি কার্যগুলিতে স্টেট অফ দ্য-আর্ট এনকাম্বল লার্নিং অ্যালগরিদম?


14

এই প্রশ্নের কাঠামোটি নিম্নরূপ: প্রথমে আমি জমায়েত শেখার ধারণাটি সরবরাহ করি, আরও আমি প্যাটার্ন সনাক্তকরণ কার্যগুলির একটি তালিকা সরবরাহ করি, তারপরে আমি জড়িত শেখার অ্যালগরিদমগুলির উদাহরণ দিই এবং অবশেষে, আমার প্রশ্নটি প্রবর্তন করি। যাদের সমস্ত পরিপূরক তথ্যের প্রয়োজন নেই তারা কেবল শিরোনামগুলি দেখুন এবং সরাসরি আমার প্রশ্নের দিকে যান।


জড়ো শেখা কি?

উইকিপিডিয়া নিবন্ধ অনুযায়ী :

পরিসংখ্যান এবং মেশিন লার্নিংয়ে, জাঁকজমকপূর্ণ পদ্ধতিগুলি এককভাবে নির্বাচনী শেখার অ্যালগরিদমগুলির যে কোনওর কাছ থেকে প্রাপ্ত সম্ভাবনাময় কর্মক্ষমতা অর্জনের জন্য একাধিক শেখার অ্যালগরিদম ব্যবহার করে। একটি পরিসংখ্যান জোটের মত নয়পরিসংখ্যান মেকানিক্সের যা সাধারণত অসীম হয়, একটি মেশিন লার্নিং এনামেম্বল কেবলমাত্র বিকল্প মডেলের একটি কংক্রিটের সীমাবদ্ধ সেটাকে বোঝায়, তবে সাধারণত সেই বিকল্পগুলির মধ্যে আরও অনেক নমনীয় কাঠামো বিদ্যমান থাকতে দেয়।


প্যাটার্ন সনাক্তকরণ কার্যগুলির উদাহরণ:


জমায়েত শেখার অ্যালগরিদমগুলির উদাহরণ:

PR টি কার্যক্রমে (উইকি অনুসারে) ব্যবহৃত নিম্নলিখিত সংকলন শেখার অ্যালগরিদমগুলি :

এনসেম্বল লার্নিং অ্যালগরিদমগুলি (একাধিক লার্নিং অ্যালগরিদমগুলিকে একত্রিত করার জন্য তদারকি করা মেটা-অ্যালগরিদম):


বিভিন্ন বাস্তবায়ন

  • নিউরাল নেটওয়ার্কগুলির এনসেমবেলস (স্বতন্ত্র মডেলগুলির ফলাফলগুলির গড় গড়ের দ্বারা সিদ্ধান্ত গ্রহণকারী নিউরাল নেটওয়ার্ক মডেলগুলির একটি সেট)।
  • র‌্যান্ডম অরণ্য (শ্রেণিবদ্ধকরণ, সংমিশ্রণ এবং অন্যান্য কাজের জন্য একটি পাঠদানের পদ্ধতি, যাপ্রশিক্ষণের সময়সিদ্ধান্তেরএকটিসংখ্যাতৈরি করে এবং শ্রেণীরমোড(শ্রেণিবিন্যাস) বা ব্যক্তির গড় পূর্বাভাস (রিগ্রেশন)হয় এমন শ্রেণীর আউটপুটতৈরি করে পরিচালনা করে গাছ)।
  • অ্যাডা বুস্ট (অন্যান্য শিখনের অ্যালগরিদমের আউটপুট ('দুর্বল শিখতে') একটি ভারিত যোগফলের সাথে মিলিত হয় যা উত্সাহিত শ্রেণিবদ্ধের চূড়ান্ত আউটপুটকে উপস্থাপন করে।

উপরন্তু:

  • বিভিন্ন শ্রেণিবদ্ধকে একত্রিত করার জন্য এমন একটি পদ্ধতি যা নিউরাল নেটওয়ার্ক ব্যবহার করে
  • যোগ্যতার ক্ষেত্র পদ্ধতি

আমার প্রশ্ন

আজকালীন কোন নকশাকৃত শিখনের অ্যালগরিদমকে আজকাল অত্যাধুনিক হিসাবে বিবেচনা করা হয় এবং বাস্তবে উদ্যোগ এবং ব্যবসায় এবং সংস্থাগুলি দ্বারা ব্যবহার করা হয় (মুখ সনাক্তকরণ, গাড়ির নিবন্ধকরণ প্লেটগুলির স্বীকৃতি, অপটিক্যাল চরিত্র স্বীকৃতি ইত্যাদি)? এনসেম্বল লার্নিং অ্যালগরিদমগুলি ব্যবহারের ফলে স্বীকৃতি যথার্থতা বৃদ্ধি পাবে এবং আরও ভাল গণনার দক্ষতার দিকে পরিচালিত হবে। কিন্তু, বিষয়গুলি কি বাস্তবে দাঁড়িয়ে আছে?

কোন নকশাকার পদ্ধতিটি, সম্ভাব্যভাবে, নিদর্শন স্বীকৃতি কার্যগুলিতে আরও ভাল শ্রেণিবদ্ধকরণ যথার্থতা এবং কার্য সম্পাদন করতে পারে? সম্ভবত, কয়েকটি পদ্ধতি এখন পুরানো, বা অকার্যকর বলে প্রমাণিত হয়েছে। এটি আরও সম্ভব যে জড়ো করা পদ্ধতিগুলি এখন কিছু নতুন অ্যালগরিদমের শক্তিতে ব্যবহার করা হয় না। যাঁরা এই অঞ্চলে অভিজ্ঞতা অর্জন করেন বা এই ক্ষেত্রে যথেষ্ট জ্ঞান রাখেন তারা কি বিষয়গুলি পরিষ্কার করতে সহায়তা করতে পারেন?


আমি সম্প্রতি যা শুনেছি তা হ'ল লোকেরা এক্সজিবিস্টকে ভালবাসেন এবং এটি বেশ কয়েকটি কেগল প্রতিযোগিতায় সত্যই চিত্তাকর্ষক অভিনয় দেখিয়েছিল।
সানগুওং ইউন

উত্তরটি সংক্ষিপ্ত: সেরা সিভি স্কোরটি দেয়। সাধারণত এটি স্ট্যাকিং
আলেক্সি গ্রিগোরভ

একটি নকশা করা মডেলটির সাফল্য এবং ব্যর্থতা নকলের সদস্যদের মডেলগুলির একটি ফাংশন এবং ডেটা প্রকৃতি। এনসেম্বল কাজ করে কারণ সদস্যদের মডেলগুলি একাধিক বৈচিত্র্য দেয়। আপনার প্রশ্নটি আপনার জবাবদিহি এবং ডেটাসেটের মধ্যে রেখেছেন এমন দুটি মডেলের নির্দিষ্টকরণ ব্যতীত আপনার প্রশ্নটি সম্ভবত উত্তরযোগ্য নয়।
horaceT

উত্তর:


9

শিল্পে উত্পাদনের ক্ষেত্রে যে স্টেট অফ দ্য আর্ট অ্যালগরিদম রয়েছে তার থেকে আলাদা হতে পারে। এছাড়াও, পরবর্তীকর্মীরা শিক্ষাবিদদের কী পছন্দ করবে তার চেয়ে আরও ভাল কাজ করার জন্য আরও বেসিক (এবং প্রায়শই আরও ব্যাখ্যাযোগ্য) পদ্ধতির জন্য সূক্ষ্ম সুরকরণে বিনিয়োগ করতে পারে।

উদাহরণ 1: মতে TechCrunch , সামান্য পার্থক্য এই সেপ্টেম্বর তার ড্রাগন কথন শনাক্তকরণ পণ্যে "গভীর শিক্ষা কারিগরি" ব্যবহার শুরু হবে।

উদাহরণ 2: চিতিকারিও, লরা, ইউনিয়াও লি এবং ফ্রেডেরিক আর রিস। "বিলে-ভিত্তিক তথ্য উত্তোলন মৃত! দীর্ঘ লাইভ নিয়ম ভিত্তিক তথ্য উত্তোলন সিস্টেমগুলি !." ইএমএনএলপিতে, না। অক্টোবর, পিপি। 827-832। 2013. https://scholar.google.com/scholar?cluster=12856773132046965379&hl=en&as_sdt=0,22 ; http://www.aclweb.org/website/old_anthology/D/D13/D13-1079.pdf

এখানে চিত্র বর্ণনা লিখুন

এর সাথে বলা হচ্ছে:

আজকের দিনে কোনটি নকশাকৃত শিখনের অ্যালগরিদমকে অত্যাধুনিক বলে বিবেচনা করা হয়

চিত্রের শ্রেণিবদ্ধকরণের জন্য একটি অত্যাধুনিক সিস্টেমের নকশাগুলি (যা আমি জানি যতটা অন্যান্য সিস্টেমের মতো) এর সাথে কিছুটা ভাল লাভ পায়: তিনি, কাইমিং, জিয়ানগিউ জাং, শওকিং রেন এবং জিয়ান সান। "চিত্র স্বীকৃতির জন্য গভীর অবশিষ্টাংশ শেখা।" আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1512.03385 (2015)। https://scholar.google.com/scholar?cluster=17704431389020559554&hl=en&as_sdt=0,22 ; https://arxiv.org/pdf/1512.03385v1.pdf

এখানে চিত্র বর্ণনা লিখুন


3

আমি অনুমান করতে পারি যে কেউ বলতে পারেন যে কম্পিউটারের দৃষ্টিভঙ্গির বেশ কয়েকটি সাবডোমেন (শ্রেণিবিন্যাস, সনাক্তকরণ, সুপার-রেজোলিউশন, প্রান্ত সনাক্তকরণ, ...) বাদে গভীর জ্ঞানার্জন অত্যাধুনিক state গভীর শেখা বিদ্যমান পদ্ধতির সাথে সমান নয়।

প্রায়শই প্রতিযোগিতামূলক নেটওয়ার্কগুলিতে জয়ের জন্য কয়েকটি অতিরিক্ত শতাংশ পাওয়ার জন্য গড় ব্যবহার করা হয় তবে নেটওয়ার্কগুলি এত ভাল হয়ে উঠছে যে এটি এত বেশি গুরুত্ব দেয় না।

উত্পাদনে এটি সম্পূর্ণ আলাদা different বড় সংস্থাগুলি সাধারণত পুরানো অ্যালগরিদমগুলির উপর নির্ভর করে যা কার্যকর হিসাবে প্রমাণিত হয়েছে এবং সেখানকার বিশেষজ্ঞরা তাদের ব্যবহারের বছর এবং অনুশীলনের জ্ঞান রাখে।
প্লাস সরবরাহ চেইনে একটি নতুন অ্যালগরিদম সংহত করতে অনেক সময় প্রয়োজন। আমি মনে করি কিছু ক্যামেরা সংস্থাগুলি এখনও মুখ সনাক্তকরণের জন্য ভায়োলা জোনস ডিটেক্টর ব্যবহার করে এবং আমি একটি সত্যের জন্য জানি যে শিল্পে প্রচুর অ্যাপ্লিকেশনগুলিতে এসআইএফটি ভারী ব্যবহৃত হচ্ছে।

তারা এখনও গভীর শিক্ষার পদ্ধতির প্রতি কিছুটা সংশয়বাদী যারা বিপজ্জনক কালো বাক্স হিসাবে বিবেচিত হয়।
তবে এই অ্যালগরিদমের চিত্তাকর্ষক ফলাফলগুলি ধীরে ধীরে লোকেরা এ সম্পর্কে তাদের মতামত পরিবর্তন করছে।

অর্থায়ন পেতে অভিনব সমাধান করতে হওয়ায় স্টার্ট-আপগুলি এ জাতীয় সমাধানগুলি ব্যবহার করতে আরও আগ্রহী।

আমি বলব যে বিশ বছরে বেশিরভাগ কম্পিউটার দৃষ্টিভিত্তিক পণ্যগুলি গভীরতর শিখন ব্যবহার করবে এমনকি যদি এর মধ্যে আরও কার্যকর কিছু আবিষ্কার হয়।
ফ্রাঙ্ক এর উত্তর গভীর শেখার যোগ করার জন্য এত দ্রুত পরিবর্তন করা হয় Kaiming তিনিই ResNets আছে না রাজ্য শিল্প আর এর ঘন সংযুক্ত Convolutional নেটওয়ার্ক এবং চওড়া এবং SGD পুনরায় চালু হচ্ছে সঙ্গে ডীপ নেটওয়ার্ক এখন SOTA হয় সম্পাদনা CIFAR এবং SVHN এবং সম্ভবত Imagenet খুব এবং এমনকি এই 16 সেপ্টেম্বর ILSVRC 2016 ফলাফলের সাথে কয়েক দিনের মধ্যে পরিবর্তন হতে পারে।

আপনি যদি এমএস-কোকোতে আর্ট ফলাফলের আরও স্থিতিতে আগ্রহী হন তবে চ্যালেঞ্জিং সনাক্তকরণের ডেটাসেট বিদ্যমান অক্টোবরে ইসিসিভিতে প্রকাশিত হবে।


1
আসলে, ডাবল চেকিংয়ের পরে, আমি যে নিবন্ধগুলি উদ্ধৃত করেছি সেগুলিতে ইমাজেনেটে তাদের ফলাফলের উল্লেখ নেই! তাহলে এটা আমার ভুল! তবে তারা সিআইএফএআর এবং এসভিএইচএন-র চেয়ে অনেক বেশি উন্নত বলে আমি মনে করি এটি অবশ্যই ইমাজেনেটে একই হতে পারে তবে আপনি কখনই জানেন না। আমি অনুমান করি তারা আইএলএসভিআরসি ফলাফলের জন্য অপেক্ষা করার জন্য এটি উল্লেখ করেনি তবে আমি ভুল হতে পারি!
জিন

1
@ ফ্র্যাঙ্কডেরননকোর্ট ফলাফলের এই উন্মত্ততাটি অত্যন্ত উত্তেজনাপূর্ণ তবে এই ক্ষেত্রে যে সমস্ত ব্যক্তি প্রকাশ করতে চান তাদের উপরও অনেক চাপ চাপিয়ে দিতে পারে, যা লেখক আজ এনআইপিএস থেকে প্রত্যাহার করে এমন কুখ্যাত এসআরএম প্রবন্ধের মতো ভুলের দিকে পরিচালিত করতে পারে ।
জিন

ধন্যবাদ, হ্যাঁ আমি এটি দেখতে পেয়েছি, কিন্তু সেই কাগজটি পরীক্ষা করার সুযোগ পেলাম না ... আমার এই নতুন সমস্ত এএনএন পিডিএফগুলির সাথে আমার টু-পঠন তালিকাটি খালি করতে সমস্যা হচ্ছে: /
ফ্রাঙ্ক ডারননকোর্ট

এই SARM প্রত্যাহারের ঘটনাটি পরিসংখ্যানগুলিতে আমাকে পুনরুত্পাদনযোগ্যতার সঙ্কটের বিষয়ে নতুন করে ভাবায়। পর্যালোচনা প্রক্রিয়ায় কতগুলি বাস্তবায়ন বিশদ প্রয়োজন, কতটুকু কম, ইত্যাদি
কতগুলি HoraceT

2

আপনার প্রশ্নের সাথে জড়িত অনেকগুলি রয়েছে, এবং সাধারণত সেরা মডেল সন্ধানে ডেটাতে এর বেশিরভাগের পরীক্ষা করা জড়িত। কেবলমাত্র তত্ত্বের কোনও মডেল আরও সঠিক ফলাফল আনতে পারে তার অর্থ এই নয় যে এটি সর্বদা সর্বনিম্ন ত্রুটিযুক্ত একটি মডেল তৈরি করবে।

বলা হচ্ছে ... যতক্ষণ না আপনি ব্ল্যাক বাক্সটি গ্রহণ করতে পারবেন নিউরাল নেট এনসেমব্লসগুলি খুব নির্ভুল হতে পারে। উভয় নোড এবং স্তরগুলির সংখ্যা দ্বারা পৃথক করা তথ্যগুলিতে অনেকগুলি বৈচিত্র্যকে কভার করতে পারে, মডেলিংয়ের এই অনেকগুলি কারণের সাথে তথ্য উপাত্তকে সাফল্য দেওয়া সহজ হতে পারে।

এলোমেলো অরণ্য খুব কমই সুনির্দিষ্ট ফলাফল এনেছে, তবে উত্সাহিত গাছগুলি অতিরিক্ত সম্পর্কের ঝুঁকি ছাড়াই আলোচিত এআই কার্যগুলির মতো জটিল সম্পর্ককে মডেল করতে পারে।

একজন ভাববেন, ভাল কেন এই মডেলগুলিকে কেবল একসাথে নয়, তবে এই মডেলটি পৃথক মডেলের সম্ভাব্য শক্তির সাথে আপস করে। আবার এটি সম্ভবত কিছু অতিরিক্ত সমস্যার সমাধান করতে পারে।

যে মডেলগুলি গণনাগতভাবে দক্ষ সেগুলি আলাদা বিষয়, এবং আমি খুব জটিল নিউরাল নেট দিয়ে শুরু করব না। একটি মানদণ্ড হিসাবে নিউরাল নেট ব্যবহার করে, আমার অভিজ্ঞতায় এটি বুস্টেড ট্রি ব্যবহার করে সবচেয়ে দক্ষ হয়েছে।

এটি আমার অভিজ্ঞতা এবং আলোচিত প্রতিটি মডেলিংয়ের অন্তর্নিহিত তত্ত্বের একটি যুক্তিসঙ্গত বোঝার উপর ভিত্তি করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.