ইমেজনেটে ​​কোনও ব্যক্তি শ্রেণি রয়েছে? মানুষের সাথে সম্পর্কিত কোন শ্রেণি রয়েছে কি?


14

আমি যদি ইন্টারনেটে ইমেজেনেট ক্লাসের জন্য বহু উত্সের মধ্যে একটির দিকে নজর রাখি তবে আমি মানুষের সাথে সম্পর্কিত কোনও একক শ্রেণির সন্ধান করতে পারি না (এবং না, ফসল কাটানোর লোক নয়, তবে এটি আমি ড্যাডি লম্বেলস হিসাবে জানতাম, এক ধরণের মাকড়সা :-)। কীভাবে সম্ভব? আমি অন্তত একটি প্রত্যাশিত এ হবে personবর্গ এমনকি আরো কিছু নির্দিষ্ট যেমন, এবং man, woman, toddler, ইত্যাদি ধরণের কিছুই নেই। কেন? কি ফেই-ফেই লি ও তাঁর দল একটি সচেতন পছন্দ ডাটাবেসের মধ্যে মানুষ ইমেজ আছে না? আমি কি ভুল ফাইলটি দেখছি? প্রশ্নের খাতিরে, আমরা ImageNet২০১৪ সাল থেকে সংস্করণগুলি বিবেচনা করতে পারি ।

উত্তর:


7

আপনি ইমেজনেটের লেবেলের জন্য এখানে একবার দেখে নিতে পারেন । আমি অনুমান করি আপনি ঠিক বলেছেন, ডেটা সেটে মানুষের জন্য কোনও লেবেল নেই তবে লক্ষ্য করার মতো কিছু আছে। ইমেজনেটে ​​কাউবয়ের মতো লেবেল বা শার্ট এবং টি-শার্টের মতো কিছু নির্দিষ্ট টুপি এবং অন্যান্য সম্পর্কিত জিনিস রয়েছে things আপনি দেখে নিতে পারেন এখানে এবং এখানে। পরবর্তী লিঙ্কে ইয়োসিনস্কি এট আল, এটি দেখানোর চেষ্টা করেছেন যে জনপ্রিয় অ্যালেক্সনেট মানব মুখগুলি চিনতে শিখেছে যদিও চিত্রের ডেটা-সেটে মানুষের মুখ হিসাবে কোনও লেবেল নেই। তাদের গবেষণাপত্রে তারা তদন্ত করেছেন যে কনভলিউশনাল নিউরাল নেটওয়ার্কগুলি স্তরগুলির মধ্যে বিতরণ করা জিনিসগুলি শেখার চেষ্টা করতে পারে বা নাও হতে পারে এবং প্রশিক্ষণের ডেটাতে তাদের বিশেষ লেবেল নাও থাকতে পারে। উদাহরণ হিসাবে, বিড়াল এবং মানুষের মুখ উল্লেখ করা যেতে পারে। তদুপরি, আপনি এখানে দেখতে পাচ্ছেন লক্ষ্যটি পৃষ্ঠার শেষ লাইনে উদ্ধৃত হিসাবে উল্লেখ করা হয়েছে বৃহত্তর স্কেল ডেটাসেটগুলিতে অ্যাট্রিবিউট লার্নিং


আমি উত্তরটি পছন্দ করি তবে আপনার শেষ বাক্যটি আমি বুঝতে পারি না। বৈশিষ্ট্য শেখার দ্বারা আপনি কী বোঝাতে চেয়েছেন, চিত্রের শ্রেণিবদ্ধকরণ থেকে এটি কীভাবে আলাদা হয় (যদি এটি পৃথক হয়) এবং এটি আমার প্রশ্নের সাথে কীভাবে সম্পর্কিত ( personইমেজনেটে কোনও ক্লাস রয়েছে)?
ডেল্টাভিও

@ ডেল্টাইভ আমার বোঝানো শেষ লিঙ্কটিতে আমি বোঝাতে চেয়েছি, সেখানে একটি রেফারেন্স রয়েছে যা এই কাজটিতে তারা এই সমস্যাটি নিয়ে আলোচনা করে। আমি যা বলেছিলাম তা মুখগুলি শেখার মতো ছিল, যা লেবেল নয় তবে সম্ভবত টি-শার্টগুলি বোঝার প্রয়োজন।
মিডিয়া

ঠিক আছে, এনএনগুলি এমন বৈশিষ্ট্যগুলি শিখায় যা মুখগুলির মতো দেখায় কারণ তারা লেবেলগুলি সনাক্ত করতে (বা এর মধ্যে বোঝার জন্য) সহায়তা করে। হ্যাঁ, আমি এটি প্রত্যাশা করি। ধন্যবাদ
ডেল্টাভিও

@DeltaIV আমি এই আমরা হয়তো কি কল শেখার
মিডিয়া

2
আমি মনে করি শেখার নিউরাল নেটওয়ার্কের জন্য খুব সামান্য মানুষের শিক্ষণ পদ্ধতি কি আছে। এই হ্যালুসিনেশন দেখুন । তারপরে আবার, এই অপটিমাইজড চিত্রগুলি যে নিউরাল নেটওয়ার্কগুলি কী শিখেছে তা প্রদর্শন করা উচিত, একই ধারণা গভীরভাবে ত্রুটিযুক্ত এবং উচ্চ-মাত্রিক সম্ভাব্যতা বিতরণ কী তা একটি ভুল বোঝাবুঝির ভিত্তিতে। বিষয়টি অত্যন্ত সূক্ষ্ম: আমার প্রশ্নটি ছিল আরও অনেক প্রাথমিক।
ডেল্টাআইভি

6

আমি পেয়েছি 7846 ক্লাসটি (নাম = "n00007846") ব্যক্তি জন্য। শ্রেণীর বিবরণে অ্যাক্সেস পেতে http://image-net.org/download-API পড়ুন । আরও উন্নততর, নীচের পাঠ্য ফাইলগুলিতে আপনার চিত্রবিজ্ঞান ডেটাসেটের (শ্রেণি = ওয়ার্ডনেট আইডি) ক্লাসগুলি বোঝার জন্য যা কিছু দরকার তা রয়েছে:

  • ওয়ার্ডনেট আইডি এবং সমস্ত সিএনসেটের শব্দের মধ্যে http://image-net.org/archive/words.txt মানচিত্র

  • http://image-net.org/archive/gloss.txt : ওয়ার্ডনেট আইডি এবং সমস্ত সিএনসেটের জন্য গ্লোসেসের মধ্যে মানচিত্র

n00007846 ব্যক্তি, ব্যক্তি, কারও কারও, নশ্বর, আত্মাকে মানচিত্র । সম্পর্কিত গ্লস হ'ল: একটি মানুষ; "একজন ব্যক্তির করার জন্য অনেক কিছু ছিল"


আপনি একটি উত্স লিঙ্ক করতে পারেন? এটি অন্যান্য ব্যবহারকারীদের জন্য সহায়ক হবে।
এলিয়াস স্ট্রেলে

ইমেজেনেট মডেলগুলি বিভিন্ন ব্যাকগ্রাউন্ডের মানুষের তুলনায় কম অভিনয় করছে বলে মনে হচ্ছে। আমার ডেটাতে দৌড়াদৌড়ি করার লোক রয়েছে এবং তারা বেশিরভাগ রাগবি বল এবং ভলিবল হিসাবে চিহ্নিত।
লেভসেক

2

আপনি এটি পরীক্ষা করে দেখতে পারেন: http://www.image-net.org/about-stats

বড় বিভাগ এবং উপশ্রেণী হিসাবে ব্যক্তি তালিকাভুক্ত করা হয়। এছাড়াও ব্যক্তিদের সাথে চিত্রের মোট সংখ্যা সরবরাহ করা হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.