কতগুলি প্রত্যক্ষ / গণনা / অনুলিপি সারি অর্থবহ?


11

ডাইরেক্টএক্স 12 গ্রাফিক্স ("ডাইরেক্ট" নামে পরিচিত), গণনা বা অনুলিপি কার্যগুলির জন্য কমান্ড সারি উন্মুক্ত করে। প্রদত্ত কার্যকারিতার শর্তাবলী, প্রত্যেকটি হ'ল নিম্নলিখিতটির একটি সুপার সেট। স্পেসিফিকেশন যে কমান্ড লাইনে দাঁড়িয়ে থাকতো একই সময়ে ডিভাইস দ্বারা মৃত্যুদন্ড কার্যকর করা যেতে পারে। তবে, এপিআই কোনওভাবে কমান্ড সারিগুলির সংখ্যা সীমাবদ্ধ করে না (কমপক্ষে আমি কোনও সীমাবদ্ধতা অবগত নই)।

স্পষ্টতই, বিভিন্ন বিক্রেতারা এটি একেবারেই পৃথক করে:

  • ইন্টেল সাম্প্রতিক উপস্থাপনায় জানিয়েছে (২৩ স্লাইড) যে বর্তমানে তাদের জিপিইউ গ্রাফিক্স এবং কম্পিউটকে সমান্তরালভাবে পরিচালনা করতে সক্ষম নয় এবং অনুলিপি ইঞ্জিনটির একটি দুর্বল থ্রুপুট রয়েছে। তারা একাধিক গ্রাফিক্স / গণনা সারি ব্যবহারের বিরুদ্ধে পরামর্শ দেয়।
  • এএমডি দীর্ঘকাল আগে ম্যান্টল এবং বর্তমান জেন কনসোল দিয়ে শুরু করে সারি / "অ্যাসিনক্রোনাস শেডার" ব্যবহারের বিজ্ঞাপন দিতে শুরু করেছিল। কিছু বিকাশকারীও রয়েছে ( উদাহরণস্বরূপ ) সমান্তরালে গণনা এবং গ্রাফিক্স কার্য সম্পাদন করে উল্লেখযোগ্য পারফরম্যান্স লাভ নিশ্চিত করে।
  • এনভিডিয়া হার্ডওয়্যারে অ্যাসিক্রোনাস শেডারকে সমর্থন না করার বিষয়ে সম্প্রতি কিছুটা হৈচৈ পড়েছে : পৃথক গ্রাফিক্স এবং কম্পিউট ক্যু একবারে ব্যবহার করা জিনিসকে ধীর করে দিয়েছে যা চালকের অনুকরণকে নির্দেশ করে। অন্যদিকে সমান্তরাল অনুলিপি অপারেশনগুলিকে খুব দীর্ঘ সময় ধরে সিইউডিএ সমর্থন করেছে, এটি স্পষ্ট করে দেয় যে ডিএমএ ইঞ্জিনটি স্বাধীনভাবে কাজ করতে পারে।

রানটাইমের সময় সিদ্ধান্ত নেওয়ার কোনও উপায় কি যদি এককটির পরিবর্তে একাধিক কমান্ডকিউতে কমান্ডলিস্টগুলি করা অর্থপূর্ণ হয়? (প্রদত্ত যে পূর্ববর্তী ক্ষেত্রে তেমন ইঞ্জিনিয়ারিং-ওভারহেড জড়িত না)

আমি সহজেই দেখতে পেলাম যে এটি গণনা / গ্রাফিক্স অপারেশনের সমান্তরালে মেমরি অপারেশনগুলি সম্পাদন করতে কার্যকর, এটি আমাকে সমান্তরালভাবে একাধিক গণনা এবং গ্রাফিক্স প্রক্রিয়া চালানোর জন্য অযৌক্তিকভাবে জটিল বলে মনে করে (যদি কোনও বড় পারফরম্যান্স না থাকে তবে) benefit এটি আমার কাছেও পরিষ্কার নয়, কীভাবে এটি যেভাবে উন্নততর পারফরম্যান্সের দিকে নিয়ে যেতে পারে; প্যাথলজিকাল কেস ব্যতীত যেখানে অনেকগুলি ছোট ক্রমিক ক্রিয়াকলাপ পর্যাপ্ত GPU লোড তৈরি করতে সক্ষম হয় না।


1
জিপিইউ কে করে তোলে তা খতিয়ে দেখে এই মুহূর্তে এই ধরণের রায় কল করার কোনও অর্থবহ উপায় আছে বলে আমি মনে করি না। শেষ পর্যন্ত "হার্ডওয়্যার একসাথে একাধিক কাতারে কমান্ড কার্যকর করতে পারে" এর চেয়ে আরও বেশি কারণ রয়েছে এবং ডি 3 ডি 12 এই বিবরণগুলি সরিয়ে ফেলে। প্রকৃতপক্ষে ডি 3 ডি 12 এমনকি একই সাথে এমন হার্ডওয়্যারগুলির মধ্যে পার্থক্য করতে পারে না যা একই সাথে কাতগুলি কার্যকর করতে পারে এবং যা এটি ক্রমানুসারে করতে পারে, ডক্স কেবলমাত্র বলে যে তাদের বিমূর্ততা যুগ্ম সম্পাদনের অনুমতি দেয়
এমজেপি

1
ভাল প্রশ্ন ! আমারও মনে হয় একসাথে গণনা এবং শেড চালানোর জন্য পারফরম্যান্স অর্জন করা বিশেষ হবে। লাভগুলি একই ঘটনাগুলির জন্য ধন্যবাদ ঘটায় যা হাইপারথ্রেডিংকে আরও দ্রুততর করে তোলে। যখন কিছু ইউনিট অন্য সারির জন্য ব্যস্ত থাকে তখন ইন্টারলিভিং অপারেশনগুলি। যেমন শেডারগুলি টেক্সচার ইউনিটগুলিকে আটকে রাখে, যা গণনা পর্যায় দ্বারা ব্যবহৃত হয় না, যা নিজেই এফপিইউ বা ডিপিইউ ক্লগ করে।
v.oddou

এইচ এম খুব খারাপ। এরপরে "কে জিপিইউ তৈরি করে তা খতিয়ে দেখা বাদ দিয়ে, কোনও" ইতিমধ্যে উত্তর হিসাবে গণনা করে না যদি এর মধ্যে আরও কিছু না থাকে। এএমডি বিপণনের সমস্ত স্টাফ পড়ার পরে আমি শুনে খুশি হয়েছি যে আমি আমার বিভ্রান্তিতে একা নই।
উল্প

1
আপনি এই বিষয়টির গুরুত্ব (প্রকৃতপক্ষে গুরুত্বহীনতা) এর জন্য কিছুটা ওজন তুলতে জানেন। পিএস 4 এসডিকে একটি বাগ রয়েছে যা 0 সারির চেয়ে অন্য কোনও সারিতে নির্গত করতে দেয় না I আমি মনে করি এটি যদি এত গুরুত্বপূর্ণ হয় তবে এটি আরও দ্রুত স্থির করা হত।
v.oddou

উত্তর:


1

আসল প্ল্যাটফর্মের পরীক্ষা করে একটি বেঞ্চমার্কিং ক্রম দিয়ে আপনার অ্যাপ্লিকেশনটি পাঠান। (আমার মনে হয় এমন অনেক প্রশ্নের সম্ভাব্য উত্তর ...)

আমি সন্দেহ করি যে আপনি কীভাবে হার্ডওয়্যার ব্যবহার করেন তার উপর পারফরম্যান্স অত্যন্ত নির্ভরশীল । যেহেতু হার্ডওয়্যারটি কোনওভাবেই আপনার অ্যাপ্লিকেশনটিকে পিছনের দিকে চালিত করার সম্ভাবনা নেই, আপনাকে কী করতে হবে তা বলায়, আপনার নকশায় যা ভাল লাগবে আমি তা নিয়ে যেতে চাই না।

"... কমান্ড সারিগুলি ডিভাইস দ্বারা একই সাথে সম্পাদন করা যেতে পারে ..."

কীওয়ার্ডটি ক্যান। কোনও বিক্রেতাকে কেন এটি ঘায়েল করার কোনও কারণ আমি দেখছি না। শেষ পর্যন্ত এটি প্ল্যাটফর্ম সরবরাহকারী (ইনটেল / এএমডি / এনভিডিয়া) যিনি আপনাকে স্যুইচিং ভেন্ডর বিবেচনা না করার জন্য আপনাকে যথেষ্ট উপযুক্ত ড্রাইভার তৈরি করার জন্য দায়বদ্ধ। যদি তাদের এই কার্যকারিতাটির সাথে "জ্ঞানের সমস্যা" থাকে (যার উপায় দ্বারা কোনও কার্যকরী অর্থ নেই, কেবলমাত্র পারফরম্যান্স) তবে তারা যা জানে তা ব্যবহার করে তাদেরও এটি সমাধান করা উচিত । আমি উচ্চস্বরে চিৎকার করার অর্থ, ফ্যালব্যাক এমন কিছু যা তারা ইতিমধ্যে বাস্তবায়ন করেছে; সিঙ্ক্রোনাস এক্সিকিউশন।

হার্ডওয়্যার পর্যাপ্ত ভুডু যেমন এটি আমাদের বিকাশকারীদের।


এএমডি-র জিসিএন গ্রাফিক্স কাতারে জারি করা হলেও একই সাথে গ্রাফিক্স এবং গণনা সম্পাদন করবে, তবে সাধারণত একাধিক কমান্ড বাফার জুড়ে নয় (একাধিক ড্র কল এমনকি স্কেচিযুক্ত হতে পারে)। ড্রাইভার (বা অ্যাপ্লিকেশন - আমি মনে করি ডিএক্স 12 বা ভলকান) ডেটা নির্ভরতা পরীক্ষা করতে হবে এবং প্রয়োজনে ড্র (গ্রাফিক্স) এবং প্রেরণ (গণনা) এর মধ্যে ব্লক করতে হবে। একাধিক কমান্ড সারি সম্ভবত কার্যকর হবে যদি আপনার কাছে গ্রাফিকগুলি (পরবর্তী ফ্রেমের জন্য পদার্থবিজ্ঞানের মতো) প্রকৃতপক্ষে অবিচ্ছিন্ন এমন গণনা থাকে তবে এর সাথে আমার সরাসরি অভিজ্ঞতা নেই।
ড্যানিয়েল এম গেসেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.