গভীর শেখার ইমেজ প্রসেসিং / কম্পিউটার ভিশন হত্যার কি?


52

আমি সিগন্যাল এবং ইমেজ প্রসেসিংয়ে এমএসসি বা সম্ভবত কম্পিউটার ভিশন (আমি এখনও সিদ্ধান্ত নিইনি) তে ভর্তির প্রত্যাশায় রয়েছি এবং এই প্রশ্নটি উত্থিত হয়েছে।

আমার উদ্বেগ হ'ল, গভীর শিক্ষার যেহেতু বৈশিষ্ট্য নিষ্কাশন এবং প্রায় কোনও ইনপুট প্রাক প্রক্রিয়াজাতকরণের প্রয়োজন নেই, তাই এটি কি চিত্র প্রক্রিয়াকরণটি (বা সাধারণভাবে সংকেত প্রক্রিয়াকরণ) নিধন করে?

আমি গভীর শিক্ষায় দক্ষ নই, তবে মনে হয় অন্যান্য প্রযুক্তিগুলির মতো বৈশিষ্ট্য ভেক্টরের পরিবর্তে চিত্রগুলি সরাসরি গ্রহণের স্বীকৃতি এবং শ্রেণিবদ্ধকরণের কাজগুলিতে এটি খুব ভালভাবে কাজ করছে।

এমন কোনও ক্ষেত্রে আছে যেখানে traditionalতিহ্যবাহী বৈশিষ্ট্য নিষ্কাশন + শ্রেণিবিন্যাসের পদ্ধতির চিত্রের প্রসেসিং কৌশল ব্যবহার করা আরও ভাল হবে, না গভীর শিক্ষার কারণে এই মারা যাচ্ছে?


3
এটি পুনরায় চালু করা কারণ এটির উচ্চ সংখ্যা রয়েছে এবং শীর্ষ ভোটের উত্তরের একটি উচ্চ সংখ্যা রয়েছে up
পিটার কে।

1
@ লরেন্টডুভাল আমার মনে হয় যে প্রতিটি উত্তর সহায়ক এবং খুব আকর্ষণীয় ছিল তবে মূলত আপনার এবং ম্যাথ্রেডলারগুলি (আলোচনার সাথে যে আলোচনার উত্থাপন হয়েছিল) সত্যিই বিষয়টি স্পষ্ট করেছে।
টনি

2
চলমান আলোচনায় আমি একটি ক্রসরোড তৈরি করতে চাই। কে বলেছে গভীর শেখার জন্য বৈশিষ্ট্য নিষ্কাশন দরকার হয় না? আমার নিজের ব্যবহারিক অভিজ্ঞতায়, আমাদের কাঁচা ডেটার জন্য ডিএনএন প্রশিক্ষণ দেওয়া উচিত নয়। আমাদের কিছু বৈশিষ্ট্য নিষ্কাশন করতে হবে এবং এটিকে অবশ্যই চিত্রটির কিছু প্রাথমিক ধারণা থাকতে হবে। গভীর শেখার যত্ন সহ ব্যবহার করা উচিত, তবে এটি একটি ভাল ধারণা।
অরুন রাজ

উত্তর:


45

এই পোস্টটি অনেক আপডেট করা হয়েছে। শীর্ষে, আপনি লিঙ্ক আপডেট দেখতে পারেন। নীচে, প্রাথমিক উত্তরের বিভিন্নতা। সংক্ষিপ্ত সংস্করণের জন্য: কনভোলশনাল নিউরাল নেটওয়ার্কগুলির সাফল্য এবং গভীর শেখার একরকম গ্যালিলিয়ান বিপ্লবের মতো দেখায়। ব্যবহারিক দৃষ্টিকোণের জন্য, শাস্ত্রীয় সিগন্যাল প্রসেসিং বা কম্পিউটার ভিশন মারা গেছে ... তবে আপনার যদি যথেষ্ট লেবেলযুক্ত ডেটা থাকে, স্পষ্টত শ্রেণিবদ্ধকরণ ব্যর্থতা ( গভীর ত্রুটিগুলি ) সম্পর্কে একটু যত্নশীল হন, কার্বন পদচিহ্ন সম্পর্কে চিন্তা না করে পরীক্ষা চালানোর অসীম শক্তি আছে , এবং যুক্তিযুক্ত ব্যাখ্যা বিরক্ত করবেন না। অন্যদের জন্য, এটি আমাদের আগে কী করেছিল সেগুলি সম্পর্কে আমাদের পুনর্বিবেচনা তৈরি করেছে: বৈশিষ্ট্য নিষ্কাশন, অপ্টিমাইজেশন (সিএফ। আমার সহকর্মী জে.সি. পিপকেট ডিপ নিউরাল নেটওয়ার্ক স্ট্রাকচারের বৈচিত্রগত বৈষম্যগুলি সমাধান করে)), চালচলন, পরিমাণ নির্ধারণ, ইত্যাদি এবং সত্যই আকর্ষণীয় গবেষণা থেকে উদ্ভূত হয়েছে, আশা করি দৃly় ভিত্তিতে ভিত্তিক নীতি এবং অনুরূপ কার্য সম্পাদন করে।

আপডেট লিংক:

আমরা প্রাকৃতিক বিদ্বেষমূলক উদাহরণগুলি উপস্থাপন করি - বাস্তব-জগৎ, আনমডিমাইটিড এবং প্রাকৃতিকভাবে ঘটে যাওয়া উদাহরণগুলি যা শ্রেণিবদ্ধকারের যথার্থতাকে উল্লেখযোগ্যভাবে হ্রাস করে। আমরা 7,500 প্রাকৃতিক বিদ্বেষমূলক উদাহরণগুলি সংশোধন করি এবং সেগুলিকে একটি ইমেজনেট শ্রেণিবদ্ধ পরীক্ষার সেটগুলিতে ছেড়ে দিই যা আমরা ইমেজনেট-এ বলি। এই ডেটাসেটটি শ্রেণিবদ্ধকারী দৃ rob়তা পরিমাপের জন্য একটি নতুন উপায় হিসাবে কাজ করে। L_p বিদ্বেষমূলক উদাহরণগুলির মতো, চিত্রনাট-এ উদাহরণগুলি সফলভাবে অদেখা বা ব্ল্যাক-বাক্স শ্রেণিবদ্ধে স্থানান্তর করে। উদাহরণস্বরূপ, ইমেজনেট-এ একটি ডেন্সনেট -121 প্রায় 2% নির্ভুলতা অর্জন করে, যা প্রায় 90% এর নির্ভুলতা ড্রপ করে। এই নির্ভুলতাটি পুনরুদ্ধার করা সহজ নয় কারণ ইমেজনেট-এ উদাহরণগুলি রঙিন, টেক্সচার এবং পটভূমির সংকেতের উপর অতিরিক্ত নির্ভরতা সহ বর্তমান শ্রেণিবদ্ধদের গভীর ত্রুটিগুলি ব্যবহার করে। আমরা পর্যবেক্ষণ করেছি যে দৃ improving়তা উন্নতির জন্য জনপ্রিয় প্রশিক্ষণের কৌশলগুলির খুব কম প্রভাব রয়েছে, তবে আমরা দেখাই যে কিছু স্থাপত্য পরিবর্তন প্রাকৃতিক প্রতিকূল উদাহরণগুলিতে দৃust়তা বাড়িয়ে তুলতে পারে। এই শক্ত ইমেজনেট পরীক্ষা সেটটিতে শক্তিশালী সাধারণীকরণ সক্ষম করতে ভবিষ্যতের গবেষণার প্রয়োজন।

  • 2019/05/03: গভীর শিক্ষা: সংকেত প্রক্রিয়াকরণ এবং সময় সিরিজ বিশ্লেষণের জন্য চূড়ান্ত সীমান্ত? "এই নিবন্ধে, আমি বেশ কয়েকটি ক্ষেত্র প্রদর্শন করতে চাই যেখানে সংকেত বা সময় সিরিজ অতীব গুরুত্বপূর্ণ"
  • 2018/04/23: আমি কেবলমাত্র আইসএএসএসপি 2018 শাব্দ, বক্তৃতা এবং সংকেত প্রক্রিয়াকরণ সম্পর্কিত বার্ষিক আন্তর্জাতিক সম্মেলন থেকে ফিরে এসেছি । ডিপ লার্নিং, ডিপ নেটওয়ার্কস ইত্যাদির উপর কিছুটা নির্ভরশীল কাগজপত্রের পরিমাণ দেখে আমি অবাক হয়ে গিয়েছিলাম। চারটির মধ্যে দুটি আবেদন (অ্যালেক্স এসেরো এবং ইয়ান লেকুন দ্বারা) এ জাতীয় বিষয়ের প্রতি অনুগত ছিল। একই সাথে, বেশিরভাগ গবেষক যে আমার সাথে দেখা হয়েছিল তাদের বেশিরভাগ ক্ষেত্রেই এগুলি নিয়ে রসিকতা করা হয়েছিল ("দুঃখিত, আমার পোস্টারটি ফিল্টার ব্যাঙ্কগুলিতে রয়েছে, ডিপ লার্নিংয়ে নেই", "আমি এর মধ্যে নেই, আমার কাছে ছোট ডেটাসেট রয়েছে")), বা মহৎ চ্যালেঞ্জের ক্ষেত্রে 0.5% অর্জন এবং পদার্থবিজ্ঞান বা পরিসংখ্যানগত প্রিরিয়ারগুলির মডেলিংয়ের আগ্রহ হারিয়ে ফেলতে ভাবছিলাম।
  • 2018/01/14: একটি গভীর নেট একটি বিড়াল দেখতে পারেন? , "অ্যাবস্ট্রাক্ট বিড়াল" থেকে শুরু করে "সেরা বিড়াল" ইনভার্টেড, টানা ইত্যাদিতে এবং কোনওভাবে স্কেচগুলিতে ফলাফলকে ছাড়িয়ে যায়
  • 2017/11/02: স্ক্র্যাটারিং ট্রান্সফর্ম / নেটওয়ার্কগুলিতে উল্লেখ যুক্ত করেছে
  • 2017/10/21: ইমেজিংয়ের বিপরীতমুখী সমস্যার জন্য কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলির একটি পর্যালোচনা
  • ডিপ লার্নিং এবং সিগন্যাল এবং তথ্য প্রসেসিং এর অ্যাপ্লিকেশনগুলি , আইইইই সিগন্যাল প্রসেসিং ম্যাগাজিন, জানুয়ারী ২০১১

স্ট্যান্ডার্ড সিগন্যাল / ইমেজ প্রসেসিংয়ের গভীর শিখন রেফারেন্সগুলি "স্টেপিং" নীচে পাওয়া যাবে। মাইকেল এলাদ সবেমাত্র গভীর, গভীর সমস্যা: চিত্র প্রক্রিয়াকরণ, গণিত এবং মানবতার উপর ডিপ লার্নিংয়ের প্রভাব (সিয়াম নিউজ, 2017/05) লিখেছেন, সংক্ষেপ:

তারপরে নিউরাল নেটওয়ার্কগুলি হঠাৎ ফিরে এসেছিল এবং একটি প্রতিশোধ নিয়েছিল।

এই ট্রিবিউনটি আগ্রহের বিষয়, কারণ এটি প্রচলিত "চিত্র প্রক্রিয়াকরণ" থেকে ডেটা মডেল করার / বোঝার চেষ্টা করে এতটা অন্তর্দৃষ্টি ছাড়াই নির্ভুলতার রাজ্যে স্থানান্তরিত করে।

এই ডোমেনটি বেশ দ্রুত বিকশিত হচ্ছে। এর অর্থ এই নয় যে এটি কিছু উদ্দেশ্যমূলক বা ধ্রুবক দিক দিয়ে বিকশিত হয়। সঠিক বা ভুলও নয়। তবে আজ সকালে, আমি নিম্নলিখিত কথাটি শুনেছি (বা এটি কোনও রসিকতা?):

একটি বিশাল সেট ডেটা সহ একটি খারাপ অ্যালগরিদম পস ডেটা সহ স্মার্ট অ্যালগরিদমের চেয়ে আরও ভাল করতে পারে ।

এখানে আমার খুব সংক্ষিপ্ত চেষ্টা ছিল: গভীর পড়াশোনাটি অত্যাধুনিক ফলাফলগুলি সরবরাহ করতে পারে তবে একজন কেন সবসময় বুঝতে পারে না এবং কেন আমাদের কাজ করা হয় তা ব্যাখ্যা করার জন্য আমাদের বিজ্ঞানী কাজের কিছু অংশ রয়ে গেছে, ডেটা টুকরোটির বিষয়বস্তু কী? ইত্যাদি

গভীর শিক্ষার জন্য (বিশাল) ভাল-ট্যাগ ডেটাবেস প্রয়োজন। যে কোনও সময় আপনি একক বা একক চিত্রের জন্য কারুকাজ করেন (অর্থাত্ একটি বিশাল ডাটাবেস ব্যতীত), বিশেষত "বিনামূল্যে ব্যবহারকারী-ভিত্তিক ট্যাগযুক্ত চিত্র" সরবরাহের সম্ভাবনা নেই (সেট " পরিশ্রমী " মজার বিড়াল " গেমস এবং ফেস খেলছে ") , আপনি কিছু সময়ের জন্য এবং লাভের জন্য forতিহ্যবাহী চিত্র প্রক্রিয়াকরণে আটকে থাকতে পারেন। সাম্প্রতিক একটি টুইট সংক্ষেপে বলেছে যে:

(প্রচুর) লেবেলযুক্ত ডেটা (কোনও নিখোঁজ ভার ছাড়া) প্রয়োজনীয়তা অনেকগুলি ডোমেনের জন্য একটি ডিল ব্রেকার (এবং অপ্রয়োজনীয়)

যদি তাদের হত্যা করা হয় (যা আমি স্বল্পমেয়াদী নোটিশে সন্দেহ করি) তবে তারা এখনও মারা যায় নি। সুতরাং সিগন্যাল প্রসেসিং, চিত্র বিশ্লেষণ, কম্পিউটার দৃষ্টিভঙ্গিতে আপনি যে কোনও দক্ষতা অর্জন করেছেন তা ভবিষ্যতে আপনাকে সহায়তা করবে। উদাহরণস্বরূপ এটি ব্লগ পোস্টে আলোচনা করা হয়েছে: আমরা কম্পিউটার ভিশনে জ্যামিতি সম্পর্কে কি ভুলে গেছি? অ্যালেক্স কেন্ডাল লিখেছেন:

গভীর শিক্ষণ কম্পিউটার দৃষ্টিতে বিপ্লব ঘটিয়েছে। আজ, এমন অনেকগুলি সমস্যা নেই যেখানে সেরা পারফরম্যান্স সমাধানটি শেষ থেকে শেষ গভীর শেখার মডেলের ভিত্তিতে নয় is বিশেষত, কনভোলশনাল নিউরাল নেটওয়ার্কগুলি জনপ্রিয় কারণ তারা বাক্সের বাইরে বেশ ভালভাবে কাজ করার ঝোঁক রয়েছে। তবে এই মডেলগুলি বেশিরভাগ ক্ষেত্রেই বড় কালো-বাক্স। সেগুলি সম্পর্কে আমরা অনেক কিছুই বুঝতে পারি না।

একটি কংক্রিট উদাহরণ নিম্নলিখিত হতে পারে: একই জায়গা থেকে বেশ কয়েকটি অন্ধকার (উদাহরণস্বরূপ নজরদারি) চিত্র, যাগুলির মধ্যে একটিতে নির্দিষ্ট পরিবর্তন রয়েছে যা সনাক্ত করা উচিত কিনা তা মূল্যায়ন করা দরকার, এটি সম্ভবত চিরাচরিত চিত্র প্রক্রিয়াকরণের বিষয়, এর চেয়ে বেশি ডিপ লার্নিং (আজকের হিসাবে)

অন্যদিকে, ডিপ লার্নিং যেমন বৃহত্তর পর্যায়ে সফল, তেমনি এটি একটি ছোট সেট ডেটারের ভুল শৃঙ্খলা তৈরি করতে পারে, যা কিছু অ্যাপ্লিকেশনগুলির জন্য "গড়পড়তা" হতে পারে। দুটি চোখের চিত্র যা মানুষের চোখের থেকে কিছুটা পৃথক পৃথকভাবে ডিএল এর মাধ্যমে শ্রেণিবদ্ধ করা যেতে পারে। বা এলোমেলো চিত্রগুলি একটি নির্দিষ্ট শ্রেণিতে সেট করা যেতে পারে। উদাহরণস্বরূপ দেখুন ডিপ নিউরাল নেটওয়ার্কগুলি সহজেই বোকা বানানো হয়: অবিশ্বাস্য চিত্রগুলির জন্য উচ্চ আত্মবিশ্বাসের পূর্বাভাস (Nguyen A, Yosinski J, Clune J. Proc। কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশন 2015), বা ডিপ লার্নিংয়ের কি গভীর ত্রুটি রয়েছে? , বিপরীতে নেতিবাচক নেভিগেশন:

গবেষকরা একটি নির্দিষ্ট অনির্বচনীয় পার্টথুনিউশন প্রয়োগ করার পরে নেটওয়ার্কটি একটি চিত্রের ভুল সংকলন করতে পারে। পূর্বাভাস ত্রুটি সর্বাধিকীকরণ করতে পিক্সেল মানগুলিকে সামঞ্জস্য করে বিশৃঙ্খলাগুলি পাওয়া যায়।

"ডিপ লার্নিং" এর প্রতি যথাযোগ্য সম্মানের সাথে, "নিবন্ধিত, জ্ঞাত, ভর-বৈধ বা প্রত্যাশিত আচরণ" বনাম "ক্র্যাফটের একক টুকরা" এর প্রতিক্রিয়া প্রকাশ করে ব্যাপক উত্পাদন সম্পর্কে ভাবুন। একক সূচক স্কেলে কোনওটিই ভাল (এখনও) নয়। দুজনেরই কিছু সময়ের জন্য সহাবস্থান থাকতে হতে পারে।

যাইহোক, গভীর জ্ঞান অনেক উপন্যাসের ক্ষেত্রকে বিস্তৃত করে, যেমন নীচের উল্লেখগুলিতে বর্ণিত।

ভাগ্যক্রমে, কিছু লোক গভীর শিক্ষার পিছনে গাণিতিক যুক্তি খুঁজে বের করার চেষ্টা করছেন, যার উদাহরণ স্কেটার নেটওয়ার্ক বা স্টাফেন ম্যালাট এবং সহ-লেখক দ্বারা প্রস্তাবিত রূপান্তর , বিক্ষিপ্ত হওয়ার জন্য ENS সাইট দেখুন । হারমোনিক বিশ্লেষণ এবং অ-লিনিয়ার অপারেটরগুলি, লিপস্চিটজ ফাংশন, অনুবাদ / রোটেশন ইনভার্ভিয়েন্স, গড় সংকেত প্রক্রিয়াকরণ ব্যক্তির পক্ষে আরও ভাল। উদাহরণস্বরূপ ডিপ কনভলিউশনাল নেটওয়ার্কগুলি বোঝার জন্য দেখুন ।


1
উপযুক্তভাবে সংশোধিত অনুলিপিগুলি ব্যবহার করে পর্যাপ্ত প্রশিক্ষণের ডেটা বৃদ্ধি করা গভীরতর শেখাকে সাধারণকরণে সহায়তা করে। ইদানীং, সম্পূর্ণ তত্ত্বাবধানে থাকা ট্যাগিংয়ের প্রয়োজনীয়তার জন্য উপায়গুলি সন্ধান করা হয়েছে: নিরীক্ষণযুক্ত ডেটা বর্ধন স্বয়ংক্রিয়ভাবে অর্ধ-তত্ত্বাবধানে শেখার প্রশিক্ষণ ডেটার লেবেলযুক্ত অংশের জন্য লেবেল তৈরি করে এবং সেই ডেটা প্রশিক্ষণের জন্য ব্যবহার করে। (উত্তরে এই বা অনুরূপ তথ্য সংযোজন নির্দ্বিধায়।)
ওলি নিমিত্তালো

1
আপনি যদি জানেন যে কীভাবে "ধারাবাহিকভাবে" বৃদ্ধি করা যায়। শাস্ত্রীয় ডেটাসেটগুলি ঠিক আছে, এখনও আমি যে বৈজ্ঞানিক ডেটা করব তা নিয়ে ঘুরে বেড়াচ্ছি (ভূতত্ত্ব, রসায়ন)
লরেন্ট ডুভাল

@ লরেন্ট, আপনি যা বলেছেন সে সম্পর্কে: "আমাদের বিজ্ঞানীর কাজ কেন কাজ করে তা ব্যাখ্যা করার জন্য রয়ে গেছে" : ডিএসপিতে গুরুত্ব সহকারে কাজ করার কথা বিবেচনা করে সোমোইনের জন্য ডেটা বিজ্ঞান একটি বৈধ কেরিয়ার বলে মনে হচ্ছে। আপনি যে সাধারণ "ডিএসপি ইঞ্জিনিয়ার" শিরোনাম শুনেছেন তা ছাড়া কি অন্য কোনও নাম রয়েছে?
JFonseca

21

প্রথমত, ইমেজ প্রসেসিং বা কম্পিউটার ভিশনে গ্রেড কাজ করা এবং গভীর শিক্ষার ব্যবহারে কোনও ভুল নেই । গভীর শিক্ষণ চিত্রের প্রক্রিয়াকরণ এবং কম্পিউটার ভিশনকে হত্যা করছে না, এটি কেবলমাত্র সেই ক্ষেত্রগুলির মধ্যে এখনকার গরম গবেষণার বিষয়।

দ্বিতীয়ত, গভীর শিক্ষণ প্রাথমিকভাবে অবজেক্ট বিভাগের স্বীকৃতিতে ব্যবহৃত হয়। তবে কম্পিউটার ভিশনের অনেকগুলি ক্ষেত্রে এটি একটি। অন্যান্য ক্ষেত্র রয়েছে, যেমন অবজেক্ট সনাক্তকরণ, ট্র্যাকিং, 3 ডি পুনর্নির্মাণ, ইত্যাদি, যার অনেকগুলি এখনও "হস্ত-নকশিত" বৈশিষ্ট্যগুলিতে নির্ভর করে।


5
সতর্ক থাকুন: DNNs খুব ভাল করছে সক্ষম সব ঐ যে আপনার উল্লেখ সঠিক নয়: অবজেক্ট সনাক্তকরণ, ট্র্যাকিং, 3D পুনর্গঠন, ইত্যাদি তাই বলা হয়, সংকেত প্রক্রিয়াজাতকরণ কিভাবে সংকেত কাজে ব্যবহৃত হচ্ছে শারীরিক দিক মধ্যে একটি অন্তর্দৃষ্টি, এবং কেন আমরা উচিত এগুলি কোনও উপায়ে চালিত করুন - এবং যারা (আমি বিশ্বাস করি) ডিএনএন-এর মতো অভিযোজিত অ্যালগরিদমগুলি কেন কাজ করে তা ব্যাখ্যা করার জন্য ফিরে আসবে । তবে কোনও ভুল করবেন না - ডিএনএনগুলি ইনপুট থেকে ভিত্তি করে রূপান্তর করতে খুব ভাল সক্ষম এবং লক্ষ্যভেদে (পার্থক্যযোগ্য) সমস্ত পথে।
তারিন জিয়াই

11

কোনও ডিপ লার্নিং ইমেজ প্রসেসিংকে হত্যা করছে না। গভীর শেখার জন্য আপনার বিশাল ডেটাসেট এবং প্রচুর গণ্য সংস্থান দরকার। প্রচুর অ্যাপ্লিকেশন রয়েছে যেখানে কম কম্পিউটেশনাল লোড এবং আরও ছোট মেমরির পদচিহ্নগুলি সহ এবং বিশাল ডেটাবেসে অ্যাক্সেস না রেখে ইমেজ প্রসেসিং করতে সক্ষম হওয়া বাঞ্ছনীয়। কয়েকটি উদাহরণ হ'ল মোবাইল ফোন, ট্যাবলেট, মোবাইল ক্যামেরা, অটোমোবাইল, কোয়াডকপ্টার। শ্রেণিবিন্যাসের কিছু খুব চিত্তাকর্ষক ফলাফল উপস্থিত হওয়ায় এখন গভীর শিক্ষণ খুব হাইপাইড।

শ্রেণীবদ্ধকরণ এমন অনেকের মধ্যে একটি সমস্যা যা ইমেজ প্রসেসিং এর সাথে সম্পর্কিত হয় এমনকি যদি সত্য যে সত্য শেখা থাকলে সমস্ত শ্রেণিবিন্যাসের সমস্যাগুলি সমাধান হয়ে যায় তবে অন্যান্য ধরণের ইমেজ প্রসেসিংয়ের প্রচুর পরিমাণে বাকি থাকতে হবে। শব্দ হ্রাস, চিত্র নিবন্ধকরণ, গতির গণনা, মোড়ফিং / মিশ্রণ, তীক্ষ্ণ সংশোধন, অপটিকাল সংশোধন এবং রূপান্তরকরণ, জ্যামিতি গণনা, 3 ডি অনুমান, 3 ডি + টাইম মোশন মডেল, স্টেরিও ভিশন, ডেটা সংক্ষেপণ এবং কোডিং, বিভাগকরণ, সংশোধন, গতি স্থিতিশীলতা, কম্পিউটার গ্রাফিক্স, সব ধরণের রেন্ডারিং।


আপনার উল্লিখিত সমস্তগুলি নিনোগাইজিং, থ্রিডি অনুমান ইত্যাদিতে উপযুক্ত আর্কিটেকচারের ডিএনএন এবং উপযুক্ত ডেটা দ্বারা খুব কাছাকাছি এবং সমাধান করা যায়।
তারিন জিয়াআই

1
হ্যাঁ হ্যাঁ এবং আপনি জাগুয়ারে আপনার সাপ্তাহিক শপিং করতে পারেন (তবে সেগুলি নির্মিত না কেন)।
mathreadler

1
হেই, সত্য - তবে এটি আপনার জাগুয়ারটি ব্যবহার করে শপিং করতে পারবেন না তার চেয়ে আলাদা ।
তারিন জিয়াই

ইঞ্জিনিয়ারিং সমস্যার জন্য দরকারী বাধা চাপানো সহজ, যা ডিএনএন হ্যান্ডেল করার পরিবর্তে কৃপণ। উদাহরণস্বরূপ একটি সীমাবদ্ধতা যে ব্যবহৃত পদ্ধতিটি কোনও নির্দিষ্ট ইনপুট ডেটার দিকে পক্ষপাতদুষ্ট হওয়া উচিত নয়। তারপরে ডিএনএনগুলি অবশ্যই ডিফল্টরূপে অযোগ্য ঘোষণা করা হবে কারণ তাদের সকলের প্রশিক্ষণের প্রয়োজন এবং তাই প্রশিক্ষণের ডেটা ব্যবহার করে পক্ষপাতদুষ্ট করা হবে।
mathreadler

যে কোনও ইঞ্জিনিয়ারিং সরঞ্জামের ক্ষেত্রে এটি সত্য: তবে এটি মূল বিষয় নয়। মুল বক্তব্যটি হ'ল আপনি উপরে উল্লিখিত সমস্ত কার্যগুলি ডিএনএন দ্বারা বাস্তবে খুব ভাল সমাধান করা যেতে পারে। হ্যাঁ, কয়েকটি আরও সাম্প্রতিক ঘটনাবলী, তবে এটি DNN দ্বারা সমাধান করা যায় না তা বলা ভুল-অগ্রণী ! এখানেই শেষ!
তারিন জিয়াই

11

আজ আমরা আমার এক বন্ধুর সাথে আলোচনা করেছি। এখানে মিউনিখে একটি বর্ষার দিন ছিল, যখন ইউরোপের বিশাল অংশে এক ধরণের রোদ বায়ুমণ্ডল ছিল। লোকেরা সোশ্যাল মিডিয়ায় ছবিগুলি ভাগ করছিল, যেখানে তারা গ্রীষ্মের সুন্দর পোশাক পরে সমুদ্রের চারপাশে ঘুরে বেড়াচ্ছিল। তিনি এই পরিস্থিতিতে বিরক্ত হয়ে আমার দিকে ফিরে জিজ্ঞাসা করেছিলেন: "সোশ্যাল মিডিয়ায় ছবিগুলি ব্লক করার জন্য আপনি কি কোনও সফ্টওয়্যার লিখতে পারেন, যা এখানে গ্রীষ্মের এমন সুন্দর ছবিগুলি জড়িত করে, যখন আবহাওয়ার অবস্থা এখানে খারাপ না?"। আমি বললাম, কেন হবে না। আপনাকে যা করতে হবে তা হ'ল গ্রীষ্মের চিত্রগুলির একটি বিশাল সেট এবং নেতিবাচক উদাহরণ সংগ্রহ করা, এটি একটি নেটওয়ার্কের মাধ্যমে খাওয়ানো, যা "ব্লক" বা "নো-ব্লক" এর স্তরে বাইনারি শ্রেণিবদ্ধকরণ করে। নেটওয়ার্কটি প্রশিক্ষণ ও টিউন করুন। এটাই.

তারপরে, আমি নিজের দিকে ফিরে গেলাম: মেশিনকে আমার জন্য চিন্তাভাবনা না করার পরিবর্তে আবহাওয়াটি চমৎকার কিনা তা নির্ধারণ করার জন্য কী আমি একটি সাধারণ অ্যালগরিদম লিখতে জানি? কদাচিৎ ... হতে পারে ... কৌতূহলী পাঠকের জন্য, এখানে কিছু বৈশিষ্ট্য রয়েছে যা আপনি ডিজাইন করতে চাইতে পারেন, যদি আপনি এটির জন্য চেষ্টা করতে চান:

দ্বি-শ্রেণীর আবহাওয়ার শ্রেণিবিন্যাস, সেউউ লু ডি লিন, জিয়া জিয়া, চি-কেওং টাং , সিভিপিআর 2014

স্পষ্টতই, আমি আজকাল এই সিভিপিআর প্রকাশনার বিষয়েও যত্ন নেব না এবং কেবল আরও গভীর হতে যাব। সুতরাং, অনেক পরিস্থিতিতে এর দৃ performance় পারফরম্যান্সের জন্য গভীর শিক্ষার যতটুকু আমি পছন্দ করি, আমিও এটি সতর্কতার সাথে ব্যবহার করি। এমনকি এটি আমার ইমেজ প্রসেসিংয়ের জ্ঞানকে হত্যা না করে, এটি আমার প্রয়োজনীয় ডোমেন দক্ষতা হ্রাস করে। বৌদ্ধিকভাবে, এটি খুব মার্জিত নয়।

যতক্ষণ না কোনও ব্যক্তি তাকে / নিজেকে ট্র্যাকে রাখার সিদ্ধান্ত নেয় এবং উভয় জগতের উপকার হয়, সে নিরাপদে থাকবে।


7

সংক্ষিপ্ত উত্তরটি হ'ল, নং ডিএল কোনও ছবিতে একটি মগকে চিনতে পারে, তবে এটি কোনওভাবেই সিগন্যাল প্রসেসিংটিকে হত্যা করে না। এই বলেছিল, এই প্রশ্নবিদ্ধ দিনগুলিতে আপনার প্রশ্নটি বেশ প্রাসঙ্গিক। স্টিফেন ম্যালাত ইত্যাদি বিশিষ্ট বিষয়টিতে এখানে একটি দুর্দান্ত প্যানেল আলোচনা রয়েছে ।


5

ডেটা ইঞ্জিনিয়ারিং এখনও মেশিন লার্নিংয়ে প্রিপ্রোসেস করতে ব্যবহৃত হয় এবং তাদের শেখার সময় এবং মূল্যায়নের দক্ষতা উন্নত করতে ডিএনএনগুলিতে দেওয়া ডেটা নির্বাচন করে। চিত্র প্রক্রিয়াকরণ (ক্যামেরা সেন্সর এবং আরজিবি / ইত্যাদির মধ্যে বিটম্যাপগুলি ডিএনএনগুলিতে খাওয়ানো), ডেটা ইঞ্জিনিয়ারিংয়ের একধরণের, এখনও প্রয়োজন।


4

সিগন্যাল প্রসেসিংয়ের একটি সম্পূর্ণ বোঝা (লিনিয়ার বীজগণিত, ভেক্টর ক্যালকুলাস, গাণিতিক পরিসংখ্যান ইত্যাদির সাথে) গভীর শিক্ষার ক্ষেত্রে, বিশেষত কম্পিউটার দৃষ্টিভঙ্গির ক্ষেত্রে অপ্রয়োজনীয় কাজের জন্য ইমো অপরিহার্য।

গভীর শিক্ষায় উচ্চ প্রভাবের কয়েকটি কাগজ (এখন বেশিরভাগ কম ঝুলন্ত ফল বেছে নেওয়া হয়েছে) সংকেত প্রক্রিয়াকরণ ধারণাগুলি সম্পর্কে ভাল বোঝার প্রমাণ দেয়।

কয়েকটি অনুপ্রেরণামূলক ধারণা:

  • বিভক্ত কনভলিউশনগুলি : এই ব্লগপোস্টটি দেখুন । প্রথম সমীকরণগুলির মধ্যে একটিতে সিগন্যাল প্রসেসিং ধারণাগুলিতে ভাল-ভিত্তিতে (হাহ) কোনও ব্যক্তির জন্য রুটি এবং মাখন থাকবে। এটি ক্লাসিকাল ওয়েভলেট সিগন্যাল প্রসেসিংয়ে পাওয়া ট্রাউস অ্যালগোরিদমের সাথেও ঘনিষ্ঠভাবে সম্পর্কিত ।
  • ট্রান্সপোজড কনভোলজিনাল স্তর / ডেকনভ স্তরসমূহ। আবার, বেসিক সিগন্যাল প্রসেসিং ধারণা।
  • রূপান্তরকারী ফিল্টারগুলির আকার - অপারেটরের মানদণ্ড এবং সংকোচনের ম্যাপিংয়ের ভাল ধারণা প্রয়োজন। এটি সাধারণত সিগন্যাল তত্ত্ব বা নিয়ন্ত্রণ সিস্টেমের গ্রেড EE কোর্সে, বা বিশ্লেষণের ম্যাথ কোর্সে (বাস্তব বা কার্যকরী) পাওয়া যায়।
  • বিদ্বেষমূলক উদাহরণ : এটি তদন্তের প্রথম কাগজগুলির মধ্যে একটি ( "উদ্বেগের বৈশিষ্ট্যগুলি ..." ) ব্যাহত হওয়ার ক্ষেত্রে এটি আনুষ্ঠানিকভাবে প্রবর্তন করেছে এবং সংবেদনশীলতার উপরের দিকে আবদ্ধ হওয়ার জন্য বিভিন্ন স্তর এবং অ-রেখাযুক্ততার লিপস্টিজ কনস্ট্যান্ট ব্যবহার করেছেন used যেমন বিশৃঙ্খলা। সম্মত হন, বিশ্লেষণটি খুব প্রাথমিক ছিল, তবে আমি আবারও বিশ্বাস করি যে এটি বিন্দুটি প্রমাণ করে যে কোনও কিছুতে অ-তুচ্ছ অগ্রগতি তৈরি করা, গভীর শিক্ষার অন্তর্ভুক্ত, তত্ত্বের অ-তুচ্ছ বোঝাপড়া প্রয়োজন understanding

তালিকাটি এগিয়ে যায়। সুতরাং, এমনকি যদি আপনি কম্পিউটার ভিশনে কাজ করে এবং আপনার সমস্যার গভীর শেখার প্রয়োগ করেন তবে সিগন্যাল প্রক্রিয়াজাতকরণের পটভূমি আপনার পক্ষে জিনিসগুলি উপলব্ধি করতে খুব সহজ করে তুলবে।


1
হ্যাঁ. নেটওয়ার্কে কী খাওয়াতে হবে তা শিখতে না নেওয়ার জন্য নেওয়া কোনও শর্টকাট খারাপ কর্মক্ষমতা দ্বারা কঠিন উপায়ে শিখতে হবে।
mathreadler

4

আমি সত্যিই খুব বেশি ইমেজ প্রসেসিং করি না তবে আমি এমন একটি সংস্থার (ইউএস নেভি) পক্ষে কাজ করেছি যা সিগন্যাল শ্রেণিবিন্যাসে গবেষণার জন্য অর্থ ব্যয় করেছিল এবং শেষবারের দশকের মাঝামাঝি থেকে নিউরাল জাল একটি গরম বিষয় ছিল hot আমাকে বিপুল পরিমাণ বিপণন সামগ্রীতে বসতে হয়েছিল। যুক্তিগুলি এই লাইনের সাথে ছিল:

  • এটি আপনার মস্তিষ্কের মতো নিউরাল এবং এটি যেহেতু একটি লিনিয়ার শ্রেণিবদ্ধকে ছাড়িয়ে গেছে, তাই এটি পরিসংখ্যান কৌশলগুলিকে মারধর করে। আমি প্রকৃতপক্ষে এমন কিছু লোককে জানি যাঁদের কাগজপত্র প্রত্যাখ্যান করা হয়েছিল কারণ তারা পারফরম্যান্স মূল্যায়নের জন্য পরিসংখ্যান ব্যবহার করেছিলেন।
  • নিউরাল নেটগুলি প্ররোচিত হয়, তারা প্রশিক্ষণের ক্ষেত্রে কোনও বা কয়েকটি উদাহরণ না থাকলে তারা জিনিসগুলি সঠিকভাবে শ্রেণিবদ্ধ করতে পারে।
  • DARPA কাজের তহবিল দিচ্ছে, এবং আমরা সকলেই জানি যে DARPA যা ​​কিছু করে তা বিজয়ী ((গুগল এখনও ছিল না)
  • পারফরম্যান্স কি দুর্দান্ত নয়, কনফিউশন ম্যাট্রিক্সের দরকার নেই, ক্লাস প্রিয়ারের দরকার নেই, আমি কেবল আপনাকে বলতে পারি যে আমার ত্রুটি হওয়ার সম্ভাবনা কী। সীমানা লাগবে না, আমি কেবল হোল্ড-ওয়ান-আউট এবং পুনরায় শিফেল করব।
  • কিছু বৈশিষ্ট্য বাছুন এবং এটির জন্য যান, এটি একটি ব্ল্যাক বক্স, স্কেলিং, ডেটা প্রান্তিককরণ, বিশৃঙ্খলা প্রত্যাখ্যান, খারাপ লেবেল, একাধিক ক্লাসের উপস্থিতি, আমার সমস্যা নয়।
  • ম্যাথের কুয়াশা, বোল্টজম্যান মেশিনস
  • আসুন একটি এসভিডি এবং সম্ভবত একটি ফ্র্যাক্টাল ডাইমেনশন জিনিসযুক্ত করা যাক।
  • তত্ত্বাবধানে / নিরীক্ষণ করা টোপ এবং স্যুইচ করুন, আমি আপনার সমস্ত লুকানো নিদর্শনগুলি খুঁজে পাব। এই সাহসী মেমরি জিনিস গভীর নয়?

বিশ্পের বইটি আমার কুৎসা রটনা করতে লাগল।

কয়েকটি অ্যাপ্লিকেশনেরও বেশি, অনুকূল সিগন্যাল প্রসেসিং অ্যালগরিদমের জন্য একটি বৃহত প্যারামিটার জায়গার উপরে একটি বিস্তৃত গণনা অনুসন্ধানের প্রয়োজন হবে যা দ্রুত অক্ষম হয়ে যায়। একটি বৃহত সার্ভার খামার সেই অর্জনযোগ্য অনুসন্ধানের জায়গাটিকে বাড়িয়ে তুলতে পারে তবে কিছু সময়ে আপনাকে একটি হিউরিস্টিক সন্ধান করতে হবে। ডিএল মনে হয় যে সেগুলির মধ্যে কিছু হিউরিস্টিকস খুঁজে পেতে সক্ষম হয়েছে তবে এটি অন্তর্নিহিত এনপি হার্ড অপ্টিমাইজেশনের সমাধান করে না।


অনেক লোককে হতাশ করে বলে মনে হচ্ছে আপনি নিন্দাভাবকে পুরোপুরি ঠিক করে দিচ্ছেন। আমার মাঝে মাঝে ইচ্ছা হয় আমি জীবনে প্রথমটি শিখেছি।
ম্যাথ্রেডলার ২17

3

বিশ্ববিদ্যালয় থেকে আমার দৃষ্টিভঙ্গিটি ছিল যে অনেক সিগন্যাল প্রসেসিং লোক এমএল-এর প্রতি কিছুটা বৈরী ছিল, আমি সন্দেহ করি কারণ তারা হুমকি অনুভব করেছিল যে এটি তাদের ডোমেনটিতে ছড়িয়ে পড়েছে। তবে সম্প্রতি জটিল মূল্যবান গভীর স্নায়ুবিক নেটওয়ার্কগুলির সুবিধাগুলি সম্পর্কে অনেক গবেষণা হয়েছে, যা সুপারিশ করতে পারে যে সোনার টিকিটটি সত্যই উভয় শাখারই দৃ understanding় বোঝা।


1
হাঁ। সিগন্যাল প্রসেসিং মেশিন লার্নিংয়ের সাথে খুব ঘনিষ্ঠভাবে সম্পর্কিত। সিগন্যাল প্রক্রিয়াজাতকরণের একটি দৃ understanding় বোঝা এমএল অ্যালগরিদমগুলি কীভাবে তৈরি করতে এবং ব্যবহার করতে হয় এবং কীভাবে ডেটা (আন) তাদের খাওয়ানোর জন্য উপযুক্ত তা বুঝতে সহায়তা করে।
ম্যাথ্রেডলার

2

হ্যাঁ ঠিক. সি ++ এবং পাইথনের মতো উচ্চ স্তরের প্রোগ্রামিং ভাষার ক্ষেত্রে যেমন 'ডেভিড' সমাবেশ প্রোগ্রামিংয়ের বিকাশ। এর অর্থ এই নয় যে আপনি যখন কোনও সিএস কোর্সে ভর্তি হন তখন সমাবেশ শেখা অপ্রাসঙ্গিক। এটি কম্পিউটার কীভাবে কাজ করে, উচ্চ স্তরের ভাষাগুলির নেপথ্যে কী চলে, কম্পিউটার ভাষার মূল নীতিগুলি কী ইত্যাদি ইত্যাদি সম্পর্কে দুর্দান্ত অন্তর্দৃষ্টি দেয় তবে তার সঠিক মনের কেউই এখন সমাবেশে ডেস্কটপ অ্যাপ্লিকেশন করতে পারে না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.