জিপিইউ রেফারেন্সের লোকেশনটি কী চিন্তিত?


9

জিপিইউর পারফরম্যান্সের সাথে রেফারেন্সের লোকেশন কি এতটা পার্থক্য আনতে পারে?

উদাহরণস্বরূপ, আমি যদি জিপিইউতে 200 ড্র কমান্ড প্রেরণ করি তবে কি প্রতিটি কমান্ডের ডেটা বাফার / টেক্সচার মানচিত্রের চারপাশে জাম্প দেওয়ার পরিবর্তে স্মৃতিতে সামঞ্জস্যপূর্ণ হলে আমি একটি (সম্ভাব্য) লক্ষণীয় পার্থক্য দেখতে পাব?

পার্শ্ব প্রশ্ন: আমি ধরে নিচ্ছি যে জিপিইউ বেশিরভাগ সংস্থানকে অপরিবর্তনীয় রেখে মিথ্যা ভাগ করে নেওয়ার বিষয়গুলির বিরুদ্ধে নিশ্চিত করে। তবে যেখানে তারা নেই সেখানে থ্রেডগুলি কেন সর্বদা চারটি টুকরো টুকরো কাজ করে?

উত্তর:


10

রেফারেন্সের স্থানীয় জায়গাটি গুরুত্বপূর্ণ, তবে আপনাকে এতটা চিন্তা করতে হবে না ... কারণ আপনার নিখুঁত নিয়ন্ত্রণ নেই।

ওপেনজিএল / ডাইরেক্টএক্স ব্যবহার করার সময় আপনার সাধারণত মেমরি লেআউটের উপর সীমিত নিয়ন্ত্রণ থাকে, ড্রাইভার বাকী কাজটি করে। উদাহরণস্বরূপ আপনি একাধিক ভার্টেক্স বাফার লেআউট চেষ্টা করতে পারেন, যেমন আন্তঃবাহিত বা নন-ইন্টারলিভড ভার্টেক্স ডেটা ব্যবহার করা এবং আপনার ডেটা / ড্রাইভার / জিপিইউর পারফরম্যান্সের উপর নির্ভর করে ভিন্ন হতে পারে। প্রোফাইল এবং আপনার অ্যাপ্লিকেশন সবচেয়ে ভাল ফিট করে তা চয়ন করুন।

উদাহরণস্বরূপ, জিপিইউ রত্ন পাইপলাইন অপ্টিমাইজেশনে, রেফারেন্সের স্থানীয়তার কথা দু'বার উল্লেখ করা হয়েছে , প্রথম:

অপেক্ষাকৃত ক্রমানুসারে পদ্ধতিতে ভার্টেক্সের ডেটা অ্যাক্সেস করুন। শীর্ষস্থান আনার সময় আধুনিক জিপিইউস ক্যাশে মেমরির অ্যাক্সেস করে। যেকোন মেমোরি শ্রেণিবিন্যাসের মতো, স্থানীয় রেফারেন্সের স্থানীয় রেখাগুলি ক্যাশে সর্বাধিক হিটকে সহায়তা করে, ফলে ব্যান্ডউইথের প্রয়োজনীয়তা হ্রাস করে।

এবং দ্বিতীয়

টি-টি ও এল শীর্ষস্থানীয় ক্যাশের জন্য অনুকূলিত করুন। আধুনিক জিপিইউগুলির একটি ছোট ফার্স্ট-ইন, ফার্স্ট-আউট (ফিফো) ক্যাশে রয়েছে যা সর্বাধিক রূপান্তরিত উল্লম্বের ফলাফল সঞ্চয় করে; এই ক্যাশে হিট হ'ল পাইপলাইনে পূর্বে করা সমস্ত কাজের পাশাপাশি সমস্ত রূপান্তর এবং আলো কাজ সংরক্ষণ করে work এই ক্যাশের সুবিধা নেওয়ার জন্য আপনাকে অবশ্যই সূচিযুক্ত আদিমগুলি ব্যবহার করতে হবে এবং জালের উপর দিয়ে রেফারেন্সের সর্বাধিকতা বাড়ানোর জন্য আপনাকে অবশ্যই আপনার শীর্ষগুলি অর্ডার করতে হবে। ডিও 3 ডিএক্স এবং এনভিটি ট্রাইস্ট্রিপ (এনভিআইডিআইএ 2003) সহ এমন কিছু সরঞ্জাম উপলব্ধ রয়েছে hat যা আপনাকে এই কাজটিতে সহায়তা করতে পারে।

আমার মতে এই সুপারিশগুলি আমি যা বলি তা অনুসরণ করে এবং বোঝায় যে মেমরি লেআউটের উপর আপনার সম্পূর্ণ নিয়ন্ত্রণ নেই, তবুও আপনার কী নিয়ন্ত্রণ রয়েছে, উদাহরণস্বরূপ, প্রতিটি ভিবিও উল্টানো কীভাবে কার্য সম্পাদনে প্রভাব ফেলতে পারে।

যদি আপনার অ্যাপ্লিকেশনটির কোনও পারফরম্যান্স হিট হচ্ছে, আপনার প্রথমে বাধাটি সনাক্ত করা উচিত, এটি কোনও রেফারেন্সের ডেটা স্থানীয় অবস্থান নাও হতে পারে, তবে এটির কারণেই সম্ভবত প্রচুর পরিমাণে ডেটা নেই যেহেতু কোনও ক্লুলিং নেই, উদাহরণস্বরূপ আপনি হতাশায় ক্লিয়ারিং করছেন না .. ইত্যাদি আপনি এখানে আমার উত্তরটি পরীক্ষা করতে পারেন।

আমি মনে করি ওপেনসিএল / সিইউডিএ ব্যবহার করার সময় আপনার রেফারেন্সের লোকালটি সম্পর্কে আরও বেশি চিন্তা করা উচিত যখন আপনি প্রায়শই মেমরি লেআউটের উপর নিখুঁত নিয়ন্ত্রণ রাখতেন।


3

মূলত, জিপিইউগুলি কেবলমাত্র মাল্টিমিডিয়া অ্যাপ্লিকেশনগুলির জন্য ব্যবহৃত হত যা ডেটা ব্যবহারের সামান্য ব্যবহার দেখায়। জিপিইউগুলি সাধারণ-উদ্দেশ্যে অ্যাপ্লিকেশনগুলির জন্য ক্রমবর্ধমানভাবে ব্যবহারযোগ্য হয়ে ওঠে (অতএব, জিপিপিইউ শব্দটি), এখন তারা বড় আকারের হার্ডওয়্যার-পরিচালিত ক্যাশে বৈশিষ্ট্যযুক্ত রয়েছে, উদাহরণস্বরূপ, ফার্মি জিপিইউতে শেষ স্তরের ক্যাশের 768 কেবি রয়েছে, কেপলার জিপিইউটির 1536 কেবি রয়েছে সর্বশেষ স্তরের ক্যাশে এবং ম্যাক্সওয়েল জিপিইউতে 2048 কেবি শেষ স্তরের ক্যাশে রয়েছে। এটি, জিপিইউ ক্যাশে সম্পর্কিত বিশাল সংখ্যক গবেষণার পাশাপাশি দেখায় যে জিপিইউগুলির জন্য ডেটা লোকালটি অবশ্যই গুরুত্বপূর্ণ। উপরের বিবরণ এবং রেফারেন্সের জন্য আমার জরিপ কাগজটি দেখুন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.