এই পোস্টটি অনেক আপডেট করা হয়েছে। শীর্ষে, আপনি লিঙ্ক আপডেট দেখতে পারেন। নীচে, প্রাথমিক উত্তরের বিভিন্নতা। সংক্ষিপ্ত সংস্করণের জন্য: কনভোলশনাল নিউরাল নেটওয়ার্কগুলির সাফল্য এবং গভীর শেখার একরকম গ্যালিলিয়ান বিপ্লবের মতো দেখায়। ব্যবহারিক দৃষ্টিকোণের জন্য, শাস্ত্রীয় সিগন্যাল প্রসেসিং বা কম্পিউটার ভিশন মারা গেছে ... তবে আপনার যদি যথেষ্ট লেবেলযুক্ত ডেটা থাকে, স্পষ্টত শ্রেণিবদ্ধকরণ ব্যর্থতা ( গভীর ত্রুটিগুলি ) সম্পর্কে একটু যত্নশীল হন, কার্বন পদচিহ্ন সম্পর্কে চিন্তা না করে পরীক্ষা চালানোর অসীম শক্তি আছে , এবং যুক্তিযুক্ত ব্যাখ্যা বিরক্ত করবেন না। অন্যদের জন্য, এটি আমাদের আগে কী করেছিল সেগুলি সম্পর্কে আমাদের পুনর্বিবেচনা তৈরি করেছে: বৈশিষ্ট্য নিষ্কাশন, অপ্টিমাইজেশন (সিএফ। আমার সহকর্মী জে.সি. পিপকেট ডিপ নিউরাল নেটওয়ার্ক স্ট্রাকচারের বৈচিত্রগত বৈষম্যগুলি সমাধান করে)), চালচলন, পরিমাণ নির্ধারণ, ইত্যাদি এবং সত্যই আকর্ষণীয় গবেষণা থেকে উদ্ভূত হয়েছে, আশা করি দৃly় ভিত্তিতে ভিত্তিক নীতি এবং অনুরূপ কার্য সম্পাদন করে।
আপডেট লিংক:
আমরা প্রাকৃতিক বিদ্বেষমূলক উদাহরণগুলি উপস্থাপন করি - বাস্তব-জগৎ, আনমডিমাইটিড এবং প্রাকৃতিকভাবে ঘটে যাওয়া উদাহরণগুলি যা শ্রেণিবদ্ধকারের যথার্থতাকে উল্লেখযোগ্যভাবে হ্রাস করে। আমরা 7,500 প্রাকৃতিক বিদ্বেষমূলক উদাহরণগুলি সংশোধন করি এবং সেগুলিকে একটি ইমেজনেট শ্রেণিবদ্ধ পরীক্ষার সেটগুলিতে ছেড়ে দিই যা আমরা ইমেজনেট-এ বলি। এই ডেটাসেটটি শ্রেণিবদ্ধকারী দৃ rob়তা পরিমাপের জন্য একটি নতুন উপায় হিসাবে কাজ করে। L_p বিদ্বেষমূলক উদাহরণগুলির মতো, চিত্রনাট-এ উদাহরণগুলি সফলভাবে অদেখা বা ব্ল্যাক-বাক্স শ্রেণিবদ্ধে স্থানান্তর করে। উদাহরণস্বরূপ, ইমেজনেট-এ একটি ডেন্সনেট -121 প্রায় 2% নির্ভুলতা অর্জন করে, যা প্রায় 90% এর নির্ভুলতা ড্রপ করে। এই নির্ভুলতাটি পুনরুদ্ধার করা সহজ নয় কারণ ইমেজনেট-এ উদাহরণগুলি রঙিন, টেক্সচার এবং পটভূমির সংকেতের উপর অতিরিক্ত নির্ভরতা সহ বর্তমান শ্রেণিবদ্ধদের গভীর ত্রুটিগুলি ব্যবহার করে। আমরা পর্যবেক্ষণ করেছি যে দৃ improving়তা উন্নতির জন্য জনপ্রিয় প্রশিক্ষণের কৌশলগুলির খুব কম প্রভাব রয়েছে, তবে আমরা দেখাই যে কিছু স্থাপত্য পরিবর্তন প্রাকৃতিক প্রতিকূল উদাহরণগুলিতে দৃust়তা বাড়িয়ে তুলতে পারে। এই শক্ত ইমেজনেট পরীক্ষা সেটটিতে শক্তিশালী সাধারণীকরণ সক্ষম করতে ভবিষ্যতের গবেষণার প্রয়োজন।
- 2019/05/03: গভীর শিক্ষা: সংকেত প্রক্রিয়াকরণ এবং সময় সিরিজ বিশ্লেষণের জন্য চূড়ান্ত সীমান্ত? "এই নিবন্ধে, আমি বেশ কয়েকটি ক্ষেত্র প্রদর্শন করতে চাই যেখানে সংকেত বা সময় সিরিজ অতীব গুরুত্বপূর্ণ"
- 2018/04/23: আমি কেবলমাত্র আইসএএসএসপি 2018 শাব্দ, বক্তৃতা এবং সংকেত প্রক্রিয়াকরণ সম্পর্কিত বার্ষিক আন্তর্জাতিক সম্মেলন থেকে ফিরে এসেছি । ডিপ লার্নিং, ডিপ নেটওয়ার্কস ইত্যাদির উপর কিছুটা নির্ভরশীল কাগজপত্রের পরিমাণ দেখে আমি অবাক হয়ে গিয়েছিলাম। চারটির মধ্যে দুটি আবেদন (অ্যালেক্স এসেরো এবং ইয়ান লেকুন দ্বারা) এ জাতীয় বিষয়ের প্রতি অনুগত ছিল। একই সাথে, বেশিরভাগ গবেষক যে আমার সাথে দেখা হয়েছিল তাদের বেশিরভাগ ক্ষেত্রেই এগুলি নিয়ে রসিকতা করা হয়েছিল ("দুঃখিত, আমার পোস্টারটি ফিল্টার ব্যাঙ্কগুলিতে রয়েছে, ডিপ লার্নিংয়ে নেই", "আমি এর মধ্যে নেই, আমার কাছে ছোট ডেটাসেট রয়েছে")), বা মহৎ চ্যালেঞ্জের ক্ষেত্রে 0.5% অর্জন এবং পদার্থবিজ্ঞান বা পরিসংখ্যানগত প্রিরিয়ারগুলির মডেলিংয়ের আগ্রহ হারিয়ে ফেলতে ভাবছিলাম।
- 2018/01/14: একটি গভীর নেট একটি বিড়াল দেখতে পারেন? , "অ্যাবস্ট্রাক্ট বিড়াল" থেকে শুরু করে "সেরা বিড়াল" ইনভার্টেড, টানা ইত্যাদিতে এবং কোনওভাবে স্কেচগুলিতে ফলাফলকে ছাড়িয়ে যায়
- 2017/11/02: স্ক্র্যাটারিং ট্রান্সফর্ম / নেটওয়ার্কগুলিতে উল্লেখ যুক্ত করেছে
- 2017/10/21: ইমেজিংয়ের বিপরীতমুখী সমস্যার জন্য কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলির একটি পর্যালোচনা
- ডিপ লার্নিং এবং সিগন্যাল এবং তথ্য প্রসেসিং এর অ্যাপ্লিকেশনগুলি , আইইইই সিগন্যাল প্রসেসিং ম্যাগাজিন, জানুয়ারী ২০১১
স্ট্যান্ডার্ড সিগন্যাল / ইমেজ প্রসেসিংয়ের গভীর শিখন রেফারেন্সগুলি "স্টেপিং" নীচে পাওয়া যাবে। মাইকেল এলাদ সবেমাত্র গভীর, গভীর সমস্যা: চিত্র প্রক্রিয়াকরণ, গণিত এবং মানবতার উপর ডিপ লার্নিংয়ের প্রভাব (সিয়াম নিউজ, 2017/05) লিখেছেন, সংক্ষেপ:
তারপরে নিউরাল নেটওয়ার্কগুলি হঠাৎ ফিরে এসেছিল এবং একটি প্রতিশোধ নিয়েছিল।
এই ট্রিবিউনটি আগ্রহের বিষয়, কারণ এটি প্রচলিত "চিত্র প্রক্রিয়াকরণ" থেকে ডেটা মডেল করার / বোঝার চেষ্টা করে এতটা অন্তর্দৃষ্টি ছাড়াই নির্ভুলতার রাজ্যে স্থানান্তরিত করে।
এই ডোমেনটি বেশ দ্রুত বিকশিত হচ্ছে। এর অর্থ এই নয় যে এটি কিছু উদ্দেশ্যমূলক বা ধ্রুবক দিক দিয়ে বিকশিত হয়। সঠিক বা ভুলও নয়। তবে আজ সকালে, আমি নিম্নলিখিত কথাটি শুনেছি (বা এটি কোনও রসিকতা?):
একটি বিশাল সেট ডেটা সহ একটি খারাপ অ্যালগরিদম পস ডেটা সহ স্মার্ট অ্যালগরিদমের চেয়ে আরও ভাল করতে পারে ।
এখানে আমার খুব সংক্ষিপ্ত চেষ্টা ছিল: গভীর পড়াশোনাটি অত্যাধুনিক ফলাফলগুলি সরবরাহ করতে পারে তবে একজন কেন সবসময় বুঝতে পারে না এবং কেন আমাদের কাজ করা হয় তা ব্যাখ্যা করার জন্য আমাদের বিজ্ঞানী কাজের কিছু অংশ রয়ে গেছে, ডেটা টুকরোটির বিষয়বস্তু কী? ইত্যাদি
গভীর শিক্ষার জন্য (বিশাল) ভাল-ট্যাগ ডেটাবেস প্রয়োজন। যে কোনও সময় আপনি একক বা একক চিত্রের জন্য কারুকাজ করেন (অর্থাত্ একটি বিশাল ডাটাবেস ব্যতীত), বিশেষত "বিনামূল্যে ব্যবহারকারী-ভিত্তিক ট্যাগযুক্ত চিত্র" সরবরাহের সম্ভাবনা নেই (সেট " পরিশ্রমী " মজার বিড়াল " গেমস এবং ফেস খেলছে ") , আপনি কিছু সময়ের জন্য এবং লাভের জন্য forতিহ্যবাহী চিত্র প্রক্রিয়াকরণে আটকে থাকতে পারেন। সাম্প্রতিক একটি টুইট সংক্ষেপে বলেছে যে:
(প্রচুর) লেবেলযুক্ত ডেটা (কোনও নিখোঁজ ভার ছাড়া) প্রয়োজনীয়তা অনেকগুলি ডোমেনের জন্য একটি ডিল ব্রেকার (এবং অপ্রয়োজনীয়)
যদি তাদের হত্যা করা হয় (যা আমি স্বল্পমেয়াদী নোটিশে সন্দেহ করি) তবে তারা এখনও মারা যায় নি। সুতরাং সিগন্যাল প্রসেসিং, চিত্র বিশ্লেষণ, কম্পিউটার দৃষ্টিভঙ্গিতে আপনি যে কোনও দক্ষতা অর্জন করেছেন তা ভবিষ্যতে আপনাকে সহায়তা করবে। উদাহরণস্বরূপ এটি ব্লগ পোস্টে আলোচনা করা হয়েছে: আমরা কম্পিউটার ভিশনে জ্যামিতি সম্পর্কে কি ভুলে গেছি? অ্যালেক্স কেন্ডাল লিখেছেন:
গভীর শিক্ষণ কম্পিউটার দৃষ্টিতে বিপ্লব ঘটিয়েছে। আজ, এমন অনেকগুলি সমস্যা নেই যেখানে সেরা পারফরম্যান্স সমাধানটি শেষ থেকে শেষ গভীর শেখার মডেলের ভিত্তিতে নয় is বিশেষত, কনভোলশনাল নিউরাল নেটওয়ার্কগুলি জনপ্রিয় কারণ তারা বাক্সের বাইরে বেশ ভালভাবে কাজ করার ঝোঁক রয়েছে। তবে এই মডেলগুলি বেশিরভাগ ক্ষেত্রেই বড় কালো-বাক্স। সেগুলি সম্পর্কে আমরা অনেক কিছুই বুঝতে পারি না।
একটি কংক্রিট উদাহরণ নিম্নলিখিত হতে পারে: একই জায়গা থেকে বেশ কয়েকটি অন্ধকার (উদাহরণস্বরূপ নজরদারি) চিত্র, যাগুলির মধ্যে একটিতে নির্দিষ্ট পরিবর্তন রয়েছে যা সনাক্ত করা উচিত কিনা তা মূল্যায়ন করা দরকার, এটি সম্ভবত চিরাচরিত চিত্র প্রক্রিয়াকরণের বিষয়, এর চেয়ে বেশি ডিপ লার্নিং (আজকের হিসাবে)
অন্যদিকে, ডিপ লার্নিং যেমন বৃহত্তর পর্যায়ে সফল, তেমনি এটি একটি ছোট সেট ডেটারের ভুল শৃঙ্খলা তৈরি করতে পারে, যা কিছু অ্যাপ্লিকেশনগুলির জন্য "গড়পড়তা" হতে পারে। দুটি চোখের চিত্র যা মানুষের চোখের থেকে কিছুটা পৃথক পৃথকভাবে ডিএল এর মাধ্যমে শ্রেণিবদ্ধ করা যেতে পারে। বা এলোমেলো চিত্রগুলি একটি নির্দিষ্ট শ্রেণিতে সেট করা যেতে পারে। উদাহরণস্বরূপ দেখুন ডিপ নিউরাল নেটওয়ার্কগুলি সহজেই বোকা বানানো হয়: অবিশ্বাস্য চিত্রগুলির জন্য উচ্চ আত্মবিশ্বাসের পূর্বাভাস (Nguyen A, Yosinski J, Clune J. Proc। কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশন 2015), বা ডিপ লার্নিংয়ের কি গভীর ত্রুটি রয়েছে? , বিপরীতে নেতিবাচক নেভিগেশন:
গবেষকরা একটি নির্দিষ্ট অনির্বচনীয় পার্টথুনিউশন প্রয়োগ করার পরে নেটওয়ার্কটি একটি চিত্রের ভুল সংকলন করতে পারে। পূর্বাভাস ত্রুটি সর্বাধিকীকরণ করতে পিক্সেল মানগুলিকে সামঞ্জস্য করে বিশৃঙ্খলাগুলি পাওয়া যায়।
"ডিপ লার্নিং" এর প্রতি যথাযোগ্য সম্মানের সাথে, "নিবন্ধিত, জ্ঞাত, ভর-বৈধ বা প্রত্যাশিত আচরণ" বনাম "ক্র্যাফটের একক টুকরা" এর প্রতিক্রিয়া প্রকাশ করে ব্যাপক উত্পাদন সম্পর্কে ভাবুন। একক সূচক স্কেলে কোনওটিই ভাল (এখনও) নয়। দুজনেরই কিছু সময়ের জন্য সহাবস্থান থাকতে হতে পারে।
যাইহোক, গভীর জ্ঞান অনেক উপন্যাসের ক্ষেত্রকে বিস্তৃত করে, যেমন নীচের উল্লেখগুলিতে বর্ণিত।
ভাগ্যক্রমে, কিছু লোক গভীর শিক্ষার পিছনে গাণিতিক যুক্তি খুঁজে বের করার চেষ্টা করছেন, যার উদাহরণ স্কেটার নেটওয়ার্ক বা স্টাফেন ম্যালাট এবং সহ-লেখক দ্বারা প্রস্তাবিত রূপান্তর , বিক্ষিপ্ত হওয়ার জন্য ENS সাইট দেখুন । হারমোনিক বিশ্লেষণ এবং অ-লিনিয়ার অপারেটরগুলি, লিপস্চিটজ ফাংশন, অনুবাদ / রোটেশন ইনভার্ভিয়েন্স, গড় সংকেত প্রক্রিয়াকরণ ব্যক্তির পক্ষে আরও ভাল। উদাহরণস্বরূপ ডিপ কনভলিউশনাল নেটওয়ার্কগুলি বোঝার জন্য দেখুন ।