মেশিন লার্নিংয়ে ডাইমেনশন-হপ্পিং


10

মেশিন লার্নিংয়ের ক্ষেত্রে ডাইমেনশন হপিং সমস্যাটি কী (কনভোলশনাল নিউরাল নেটওয়ার্ক এবং চিত্রের স্বীকৃতিতে ঘটে)? আমি এটি সম্পর্কে গুগল করেছি তবে আমি যা পাই তা হ'ল পদার্থবিজ্ঞানের উপাদানগুলির আকৃতি বিকৃতি সম্পর্কিত তথ্য। কেউ যদি মেশিন লার্নিং সম্পর্কিত উদাহরণ সহ এটি ব্যাখ্যা করেন তবে এটি আমার পক্ষে আরও সহায়ক হবে। কেউ কি আমাকে এই সাহায্য করতে পারে বা আমাকে যে সংস্থান করতে পারে তার দিকে নির্দেশ করতে পারে?

উত্তর:


7

ডেটা সায়েন্স.এসই তে স্বাগতম! আমি কখনও এই সমস্যার কথা শুনিনি তাই আমি এটি সন্ধান করলাম। এটা তোলে তৃতীয় স্লাইডে ব্যাখ্যা করা হয় এই জিওফ Hinton দ্বারা উপস্থাপনা:

আরও বেশি জিনিস যা অবজেক্টগুলি সনাক্ত করতে অসুবিধা হয়

View দৃষ্টিকোণে পরিবর্তনগুলি এমন চিত্রগুলির পরিবর্তনের কারণ যা স্ট্যান্ডার্ড শেখার পদ্ধতিগুলি মোকাবেলা করতে পারে না।

- ইনপুট মাত্রা (অর্থাত পিক্সেল) এর মধ্যে তথ্যের হপস

A এমন একটি মেডিকেল ডাটাবেসের কল্পনা করুন যাতে রোগীর বয়স কখনও কখনও ইনপুট মাত্রাকে সহায়তা করে যা সাধারণত ওজনের জন্য কোড করে!

- মেশিন লার্নিং প্রয়োগ করার জন্য আমরা প্রথমে এই মাত্রা-হপিংটি বাদ দিতে চাই।

অন্য কথায়, এটি ধারণাগত বৈশিষ্ট্যগুলি হ'ল স্থানান্তরিত বা এক ইনপুট বৈশিষ্ট্যের মাত্রা থেকে অন্যটিতে প্রত্যাশার সময় একই জিনিসটির প্রতিনিধিত্ব করার সময়। যে কোনও ইনপুট মাত্রাটি এনকোডড থাকা অবস্থায় অবিচল থাকাকালীন কেউ বৈশিষ্ট্যটির সারাংশ ক্যাপচার বা এক্সট্রাক্ট করতে সক্ষম হতে চান।


আমি বুঝতে পারি যে কম্পিউটার ভিশনে একজন চিত্রের জায়গাগুলির জন্য অবিসক্ত হতে চায়, তবে বয়সের উদাহরণ আমি পাই না।
মার্টিন থোমা

আমি বুঝিয়েছি যে বয়স এবং ওজন নির্ভরশীল, তবে আমি নিশ্চিত নই; এটা আমার উপস্থাপনা না! অথবা হতে পারে তাদের অর্থ তারা আক্ষরিকভাবে ভুল কলামটি ব্যবহার করেছে এবং আমরা এটি সনাক্ত করতে চাই।
এমরে

@ এসড্রিম আমি কেবল একটি মন্তব্য করেছি; এর উত্তর দিলেন এমরে। (তবে আপনার সম্ভবত এটি গ্রহণ করা উচিত)। সিএনএনগুলির সাথে কথাটি হ'ল কোনও বস্তু অন্য কোথাও থাকলে কেবল একটি বৈশিষ্ট্যই পরিবর্তিত হয় না, তবে সম্পূর্ণ প্যাটার্নটি অন্য ইনপুটটিতে থাকে।
মার্টিন থোমা

@ এমরে, আমি আপনার উত্তর থেকে যা পাচ্ছি তা হ'ল কোনও নির্দিষ্ট সম্পত্তি যে দিক থেকে ইনপুট তা বিবেচনাধীন নয়, বৈশিষ্ট্য যা এই নির্দিষ্ট সম্পত্তিটির কারণ হিসাবে এই সম্পত্তিটির ইনপুট মাত্রায় অবিচ্ছিন্ন হওয়া উচিত। ধন্যবাদ! :)। এখনও আরও কিছু নির্দিষ্ট উত্তরের জন্য অপেক্ষা করা, অন্যথায় আপনার উত্তরটিকে উত্তর হিসাবে চিহ্নিত করবে।
16'7

3
বয়সের উদাহরণটি এমন একটি ডেটাসেটকে হাইলাইট করার কথা বলেছে যার ডাইমেনশন-হপিং নেই। বয়স এবং ওজন উদাহরণগুলির মধ্যে এলোমেলোভাবে "হপ" বা অদলবদল করে না - এগুলি বিনিময়যোগ্য নয় এবং উদাহরণটি দেখিয়ে দিচ্ছে যে এটি কতটা অদ্ভুত হবে (এবং এটি লিনিয়ার রিগ্রেশন-এর মতো সাধারণ কাজকে কতটা কঠিন করে তুলবে)। সমস্যার প্রকৃতির কারণে চিত্রগুলিতে পিক্সেল মানগুলি (এবং অনেক সংকেত প্রক্রিয়াকরণের কাজে একই রকম ডেটা) আদান-প্রদান করে বা সহজেই সরানো হয়।
নিল স্লেটার

7

আমি যতদূর বুঝতে পারি সমস্যাটি নিম্নরূপ: চিত্র স্বীকৃতিতে আপনার নেটওয়ার্কের ইনপুটগুলি পিক্সেল (গ্রেস্কেল বা কালো এবং সাদা জন্য কেবল 1 এবং 0) হতে পারে। যদি আপনি চান, উদাহরণস্বরূপ হস্তাক্ষরযুক্ত সংখ্যাগুলি সনাক্ত করুন কেবলমাত্র এই জাতীয় মানগুলির সাথে কাজ করা খুব কঠিন কারণ আপনি কখনই জানেন না যে সংখ্যাটি (অর্থাত কালো মানগুলি) কোথায় হবে exactly

পিক্সেল 140 কালো বা 142 কালো? উভয় ক্ষেত্রেই এটি তিনটি হতে পারে। বয়স / ওজনের উদাহরণে এই ইনপুটগুলি ভালভাবে সংজ্ঞায়িত হয়। বৈশিষ্ট্য 2 ওজন। বৈশিষ্ট্য 3 বয়স। এই "মাত্রা" আপনার ডেটাসেটে "হপ" করা উচিত।

সুতরাং: আপনার ছবির প্রশিক্ষণে "থ্রেস" বা "গাড়ি" বা "বাড়িগুলি" ছবিতে তাদের অবস্থানের চেয়ে আলাদাভাবে স্বীকৃতি দিতে হবে, যেমন পিক্সেল মানগুলি, যেমন বৈশিষ্ট্য / ইনপুট ভেক্টর, অর্থাত্ স্পষ্টভাবে সংজ্ঞায়নের বিপরীতে মাত্রা রোগীর ডেটা হিসাবে ইনপুট।

চিত্র স্বীকৃতিতে আপনি এটি কীভাবে সমাধান করবেন? আপনি অতিরিক্ত কৌশলগুলি ব্যবহার করেন, যেমন সমঝোতা।


2

আমি পূর্বের উত্তরগুলি পড়েছিলাম, এবং নীচে আবার অনুলিপি করা এমারের পোস্টে নীল স্লটারের মন্তব্য, পেরেকটি আঘাত করে। "ডাইমেনশন হপ্পিং" একটি শব্দটি যা ভিউ পয়েন্টের প্রসঙ্গে মেশিন লার্নিং অগ্রণী খ্যাতির ডাঃ হিন্টন দ্বারা নির্মিত একটি শব্দ is ডঃ হিন্টনকে উদ্ধৃত করার জন্য "সুতরাং, সাধারণত ইনপুট মাত্রাগুলি পিক্সেলের সাথে সম্পর্কিত বলে ধারণা করুন এবং যদি কোনও জিনিস পৃথিবীতে চলে এবং আপনি এটি অনুসরণ করতে আপনার চোখ সরিয়ে না রাখেন তবে অবজেক্ট সম্পর্কিত তথ্য বিভিন্ন পিক্সেলের উপরে আসবে" " বয়স এবং ওজন ইনপুট মাত্রা যা সহজে বিভ্রান্ত হয় না। ডাঃ হিন্টন সম্ভবত রোগীদের বয়স এবং ওজনের পরিস্থিতি নিয়ে প্রত্যাশিত সম্ভাবনাযুক্ত মাত্রাটি ব্যবহার করে বোঝাতে চেয়েছিলেন যে আমরা অবশ্যই এই ধরণের ডেটাগুলির মধ্যে কোনও ভুল খুঁজে পেতে এবং এটি ঠিক করতে সক্ষম হব (বেশিরভাগ প্রাপ্তবয়স্কদের বয়স 100 বছরের কম বয়সী এবং আরও বেশি 100 পাউন্ডের চেয়ে বেশি)। ডাইম হিন্টন সম্বোধন করে ডাইমেন হিপিংয়ের ডাইমেনশন সম্ভাব্য সমস্যাটি হ'ল পিক্সেলগুলি বাস্তুচ্যুত হতে পারে কারণ আমাদের ভিন্ন দৃষ্টিভঙ্গি রয়েছে (যেমন বস্তুটি সরে যেতে পারে বা আমরা এটি অন্য একটি কোণ থেকে দেখছি)। লিনিয়ার নিউরাল নেটওয়ার্কগুলি এটি সনাক্ত করতে সক্ষম হবে না, অন্যদিকে ডিজাইনের মাধ্যমে কনভোলশিয়াল নিউরাল নেটওয়ার্কগুলি।

"বয়সের উদাহরণটি এমন একটি ডেটাসেটকে হাইলাইট করার কথা যার মধ্যে মাত্রা-হপ্পিং নেই Age বয়স এবং ওজন উদাহরণস্বরূপ এলোমেলোভাবে" হপ "বা অদলবদল করে না - এগুলি বিনিময়যোগ্য নয় এবং উদাহরণটি দেখিয়ে দিচ্ছে যে এটি কতটা অদ্ভুত হবে (এবং কীভাবে লিনিয়ার রিগ্রেশন এর মতো সহজ কাজগুলি করা সহজ difficult সমস্যাগুলির প্রকৃতির কারণে চিত্রগুলিতে পিক্সেল মানগুলি (এবং অনেক সংকেত প্রক্রিয়াকরণ কার্যগুলিতে একই রকম ডেটা) আদান-প্রদান করে বা সহজেই সরানো হয় - নীল স্লটার মে 29 '16 এ 18:01 "


1

মেশিন লার্নিংয়ের জন্য নিউট্রাল নেটওয়ার্কগুলির বিষয়ে হিন্টনের কোর্স থেকে সরাসরি ব্যাখ্যা ....

"ডাইমেনশন হপিং তখন ঘটে যখন কেউ কিছু ইনপুটটির মাত্রাগুলিতে থাকা তথ্য নিতে পারে এবং লক্ষ্য পরিবর্তন না করে এই মাত্রাগুলির মধ্যে স্থানান্তরিত করতে পারে The ক্যানোনিকাল উদাহরণটি গ্রহণ করছে একটি হস্তাক্ষর ডিজিটের চিত্র এবং চিত্রের মধ্যে এটি অনুবাদ করা। "কালি" যুক্ত মাত্রাগুলি এখন আলাদা (তারা অন্যান্য মাত্রায় চলে গেছে), তবে আমরা অঙ্কটিতে যে লেবেলটি অর্পণ করেছি তা পরিবর্তন হয়নি। দ্রষ্টব্য যে এটি কিছু নয় এটি ডেটাসেট জুড়ে ধারাবাহিকভাবে ঘটে থাকে, তা হ'ল আমাদের হাতে দুটি হাতে লেখা অঙ্কযুক্ত একটি ডেটাসেট থাকতে পারে যেখানে একটি অন্যটির অনুবাদিত সংস্করণ, তবে এটি এখনও ডিজিটগুলির সংশ্লিষ্ট লেবেলটি পরিবর্তন করে না। "


0

প্রত্যাশা কেবলমাত্র ইমেজ বা পিক্সেলের অংশ মাত্রা (বেশিরভাগ ক্ষেত্রে) এবং কিছু সময় অন্য ম্লান (বিভিন্ন গ্রহণযোগ্য ক্ষেত্র) এর মধ্যে চলে এমন সমস্যাগুলি সম্পর্কে তবে আউটপুট একই থাকে।

এই ইস্যুটি অদম্যতা বা সমতুল্যতার সাথে মোকাবিলা করা হয় এবং দেখে মনে হয় ওজন এবং বয়সের উদাহরণটি বলা সহজ উপায়। মনে করুন আমরা যদি এই ওজন এবং বয়সের আশায় সচেতন হই তবে আমরা সহজেই অ্যালগোতে পরিবর্তন করে সঠিক ফলাফল পেতে পারি। তবে ডেটা / তথ্য হপ্পিংয়ের মতো চিত্রের হপিংও ঘটে, আমরা যদি একটি '4' এবং '4' বিবেচনা করি তবে বেশ কয়েকটি পিক্সেলকে বামে স্থানান্তরিত করে বিভিন্ন শ্রেণিতে পরিণত করা হয়েছে যার বিভিন্ন লক্ষ্য রয়েছে।

অনুবাদ ইনভেরিয়েন্স বা আরও ভাল সমতুল্যতার মাধ্যমে এই আন্দোলনটি ফিল্টার করা বা হপ্পিং কোনও সমস্যা নয় যদিও এটি জটিলতা বৃদ্ধি করে এবং অবস্থানের মতো তথ্য ছুঁড়ে দেওয়ার ব্যয়ে।

আপনার আরও স্পষ্টতার প্রয়োজন হলে আমি চেষ্টা করব দয়া করে আমাকে জানান P

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.