আমি সম্প্রতি ডিপওয়াক এবং লাইন হিসাবে গ্রাফ এম্বেডিং জুড়ে এসেছি। তবে গ্রাফ এম্বেডিং বলতে কী বোঝায় এবং কখন এটি ব্যবহার করতে হবে (অ্যাপ্লিকেশনগুলি) তা এখনও আমার কাছে পরিষ্কার ধারণা নেই? কোন পরামর্শ স্বাগত!
আমি সম্প্রতি ডিপওয়াক এবং লাইন হিসাবে গ্রাফ এম্বেডিং জুড়ে এসেছি। তবে গ্রাফ এম্বেডিং বলতে কী বোঝায় এবং কখন এটি ব্যবহার করতে হবে (অ্যাপ্লিকেশনগুলি) তা এখনও আমার কাছে পরিষ্কার ধারণা নেই? কোন পরামর্শ স্বাগত!
উত্তর:
গ্রাফ এম্বেডিং প্রাসঙ্গিক নেটওয়ার্ক বৈশিষ্ট্য সংরক্ষণের সময় কোনও নেটওয়ার্ক থেকে ভেক্টর স্পেসে ম্যাপিং শিখতে পারে।
গ্রাহকের চেয়ে ডেটা সায়েন্সে ভেক্টর স্পেসগুলি আরও কার্যকর। গ্রাফগুলিতে প্রান্ত এবং নোড থাকে, সেই নেটওয়ার্ক সম্পর্কগুলি কেবল গণিত, পরিসংখ্যান এবং মেশিন লার্নিংয়ের একটি নির্দিষ্ট উপসেট ব্যবহার করতে পারে। ভেক্টরের স্পেসগুলিতে সেই ডোমেনগুলির থেকে আরও সমৃদ্ধ একটি টুলসেট রয়েছে। অতিরিক্তভাবে, ভেক্টর অপারেশনগুলি সমতুল্য গ্রাফ ক্রিয়াকলাপগুলির তুলনায় প্রায়শই সহজ এবং দ্রুত হয়।
একটি উদাহরণ নিকটতম প্রতিবেশীদের সন্ধান করা। আপনি গ্রাফের নোড থেকে অন্য নোডে "হप्स" সম্পাদন করতে পারেন। বেশ কয়েকটি হپسের পরে অনেক রিয়েল-ওয়ার্ল্ড গ্রাফগুলিতে খুব কম অর্থবহ তথ্য রয়েছে (যেমন, বন্ধুদের বন্ধুদের বন্ধুদের প্রস্তাবনা)। তবে, ভেক্টর স্পেসগুলিতে, আপনি পরিমাণগত ফলাফলগুলি (যেমন, ইউক্যালিডিয়ান দূরত্ব বা কোসিন সাদৃশ্য) পেতে দূরত্বের মেট্রিক ব্যবহার করতে পারেন। আপনার যদি অর্থবহ ভেক্টর জায়গাতে পরিমাণগত দূরত্বের মেট্রিক থাকে তবে নিকটবর্তী প্রতিবেশীদের সন্ধান করা সোজা।
" গ্রাফ এম্বেডিং কৌশল, অ্যাপ্লিকেশন এবং পারফরম্যান্স: একটি সমীক্ষা " একটি ওভারভিউ নিবন্ধ যা আরও বিস্তারিতভাবে যায়।
গ্রাফ এম্বেডিংগুলি কী কী? "গ্রাফ এম্বেডিংস" আজ মেশিন লার্নিংয়ের একটি উত্তপ্ত অঞ্চল। এর মূল অর্থ গ্রাফের "সুপ্ত ভেক্টরের উপস্থাপনা" সন্ধান করা যা গ্রাফের টপোলজি (খুব প্রাথমিক অর্থে) ক্যাপচার করে। আমরা এই "ভেক্টর প্রতিনিধিত্ব" সমৃদ্ধ-ভার্টেক্স সম্পর্ক, প্রান্ত-তথ্য ইত্যাদি বিবেচনা করে সমৃদ্ধ করতে পারি গ্রাফটিতে মোটামুটি দুটি স্তর এম্বেডিং রয়েছে (অবশ্যই আমরা যে কোনও সময় লজিকভাবে পুরো গ্রাফকে বিভক্ত করে আরও স্তরের সংজ্ঞা দিতে পারি বিভিন্ন আকারের অনুচ্ছেদ):
অ্যাপ্লিকেশন - সাবধানে তাকানোর দ্বারা, এম্বেডিংগুলি "সুপ্ত" উপস্থাপনা যার অর্থ গ্রাফের একটি | ভি | * | ভি | সংলগ্ন ম্যাট্রিক্স যেখানে | ভি | = 1 এম, অ্যালগরিদমে 1M * 1M সংখ্যা ব্যবহার করা বা প্রক্রিয়া করা শক্ত। সুতরাং, মাত্রা 'ডি' এর সুপ্ত এম্বেডিং, যেখানে ডি << | ভি |, সংলগ্ন ম্যাট্রিক্স তৈরি করবে | ভি | * ডি এবং ব্যবহারে তুলনামূলক সহজ। আর একটি অ্যাপ্লিকেশন হতে পারে - একটি সাধারণ দৃশ্যের বিষয়টি বিবেচনা করুন যেখানে আমরা সামাজিক নেটওয়ার্কে অনুরূপ আগ্রহী ব্যক্তিদের কাছে পণ্যগুলির সুপারিশ করতে চাই। ভার্টেক্স এম্বেডিংগুলি পেয়ে এখানে (এটির অর্থ প্রতিটি ব্যক্তির ভেক্টর উপস্থাপনা), আমরা এই ভেক্টরগুলিকে চক্রান্ত করে অনুরূপগুলি খুঁজে পেতে পারি এবং এটি সুপারিশকে সহজ করে তোলে। এগুলি কিছু অ্যাপ্লিকেশন এবং অন্য কিছু রয়েছে। আপনি একটি দুর্দান্ত জরিপ কাগজ উল্লেখ করতে পারেন - গ্রাফ এম্বেডিং প্রযুক্তি, একটি সমীক্ষা ।
কোথা থেকে এলো সব? এই অঞ্চলে প্রচুর কাজ হয়েছে এবং প্রায় সবগুলিই প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ক্ষেত্রে গ্রাউন্ডব্রেকিং গবেষণা থেকে এসেছে - মিকোলভের "ওয়ার্ড 2 ভেক"। আপনি যদি গ্রাফ এম্বেডিংগুলিতে গবেষণা শুরু করতে চান তবে আমি প্রথমে ওয়ার্ড 2Vec কীভাবে কাজ করে তা বোঝার পরামর্শ দেব। আপনি চমৎকার ব্যাখ্যা জানতে পারেন - Word2Vec প্যারামিটার লার্নিং ব্যাখ্যা এবং স্ট্যানফোর্ড বক্তৃতা । তারপরে আপনি তালিকাভুক্ত কাগজপত্রগুলিতে ঝাঁপিয়ে পড়তে পারেন। এই কাজগুলিকে শ্রেণিবদ্ধ করা যেতে পারে:
" ভার্টেক্স এম্বেডিংস" এর উপর ভিত্তি করে কাজ করে: - ডিপওয়াক , নোড 2ভেক , লাইন ।
"গ্রাফ এম্বেডিংস" এর উপর ভিত্তি করে কাজ করে: - ডিপ গ্রাফ কার্নেলস , সাবগ্রাফিক 2ভেক ।
কাগজে লেভিন ইট.এল দ্বারা র্যান্ডম ডট পণ্য গ্রাফের সর্বজনীন এমবেডিংয়ের জন্য একটি কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য কাগজ, একটি নির্দিষ্ট ধরণের গ্রাফ এম্বেডিং (ওমনিবাস এম্বেডিং) গ্রাফ এম্বেডিংকে একটি পদ্ধতি হিসাবে সংজ্ঞায়িত করে "যেখানে গ্রাফের শীর্ষগুলি একটি নিম্ন-মাত্রিক ইউক্লিডিয়ান স্পেসে ভেক্টরগুলিতে ম্যাপ করা হয়।" আরও তথ্যের জন্য লিঙ্কটি চেক করুন।