ঘন ম্যাট্রিক্সের জন্য পিইটিএসসি কতটা কার্যকর?


14

আমি যেখানেই দেখেছি, পিইটিএসসি টিউটোরিয়াল / ডকুমেন্টস ইত্যাদি বলে যে এটি লিনিয়ার বীজগণিতের জন্য দরকারী এবং সাধারণত উল্লেখ করে যে স্পার সিস্টেমগুলি উপকৃত হবে। ঘন ম্যাট্রিক্স সম্পর্কে কি? আমি ঘন জন্য জন্য উদ্বিগ্ন ।একজনএক্স=একজন

আমি ফরট্রানে সিজি এবং কিউএমআরের জন্য নিজের কোড লিখেছি। মৌলিক কনস্ট্রাক্ট ছদ্ম কোড পৃথক্ চেরা এবং Blas রুটিন যেখানে সম্ভব (যোগ হয় ddot, dnrmএবং dgemvএকটু স্ব টিউনিং সহ)। এটি পিইটিএসসি এর সাথে কীভাবে তুলনা করবে?

আমি জানি সবচেয়ে ভাল উত্তরটি আমার নিজের চেষ্টা করার জন্য হবে তবে সময় এবং অন্যদের কারণে, এটি সম্ভব নয়।

কোন সাহায্যের অনেক প্রশংসা করা হয়।

উত্তর:


7

কাঠামোর সাথে যদি আপনার ঘন ম্যাট্রিক থাকে (যেমন দ্রুত রূপান্তর, শুর কমপ্লিমেন্টস ইত্যাদি), পিইটিএসসি দরকারী হতে পারে। এই ক্ষেত্রে, আপনি পুরো ম্যাট্রিক্স একত্রিত করবেন না।

একত্রিত ঘন সিস্টেমের জন্য, পিইটিএসসি বর্তমানে প্লেপ্যাক ব্যবহার করে, তবে পিইটিএসসি নেটিভ ফর্ম্যাটে ম্যাট্রিক্স বিতরণ যোগাযোগ হ্রাস করার পক্ষে সবচেয়ে ভাল নয় (বেশিরভাগ ক্রিয়াকলাপের জন্য)। জ্যাক পলসন, ম্যাট নিপলি এবং আমি জেকের আরও আধুনিক ঘন লিনিয়ার বীজগণিত গ্রন্থাগার এলিমেন্টালটি ব্যবহার করার জন্য পিইটিএসসি-র ঘন লিনিয়ার বীজগণিত বন্দর করার বিষয়ে আলোচনা করেছি । এটি এখনও ঘটেনি, তবে আমরা সময় পেলেই এটি করব।

যদি একটি পূর্ণ বৈশিষ্ট্যযুক্ত ঘন লিনিয়ার বীজগণিত গ্রন্থাগার চান তবে এলিমেন্টালটি ব্যবহার করুন। এটি সর্বদা পিইটিএসসি এর চেয়ে বেশি অপারেশনগুলির জন্য আরও একটি সম্পূর্ণ এপিআই থাকার সম্ভাবনা রয়েছে। আপনার যদি স্পারস বা আনসেম্বলড সিস্টেমের সাথে ইন্টারঅ্যাক্ট করতে হয়, তবে এটি সম্ভবত পিইটিএসসিটির সাথে লেগে থাকা এবং ঘন অংশগুলির জন্য আপনাকে এলিমেন্টালটি কী ব্যবহার করতে হবে তা এক্সট্র্যাক্ট করা (বা আমাদেরকে এলিমেন্টালের পিইটিএসসি ইন্টারফেস লিখতে সহায়তা করবে) বোধগম্য হয়।


যদি আমি একটি ভাগ করা মেমরি সিস্টেমে কাজ করি তবে আপনার উত্তর কী হবে?
সুরতহাল

1
আপনি একাধিক এমপিআই প্রক্রিয়া বা একাধিক পাইথ্রেড ব্যবহার করতে পারেন। সমান্তরাল সফ্টওয়্যারটি লেখার ক্ষেত্রে আমি তেমন পয়েন্ট দেখতে পাচ্ছি না যা কেবল ভাগ করা মেমরির সাথে কাজ করে কারণ সাধারণত বিতরণের মেমরির জন্য লেখার সময় আপনি যে মেমরির লোকালটি ভাবেন সেগুলি সর্বোত্তম থ্রেডযুক্ত বাস্তবায়ন ছাড়াও সকলের তুলনায় কর্মক্ষমতা উন্নত করে। আপনি যদি কেবল এমন একটি "সিরিয়াল" এপিআই চান যা ঘন লিনিয়ার বীজগণিতের জন্য অভ্যন্তরীণভাবে থ্রেড ব্যবহার করে, আপনি একটি থ্রেডেড বিএলএএস ব্যবহার করতে পারেন।
জেদ ব্রাউন

আমি চাই যে আমার কোডগুলি আমার Xeon 12 কোর ওয়ার্কস্টেশনে কাজ করবে (আমি এখন পর্যন্ত ক্লাস্টারগুলিতে দেখছি না)। আমি (থ্রেডযুক্ত) বিএলএএস এর জন্য ইন্টেল এমকেএল ব্যবহার করছি। আপনি কি এখনও আমি পিইটিএসসি চেষ্টা করার পরামর্শ দিবেন?
সুরতহাল

আপনি যদি চান সমস্তই BLAS, আপনি এটিতে খুশি এবং আপনি ইতিমধ্যে কোডটি লিখেছেন, কেবল এটি ব্যবহার করুন। আপনি যদি আরও নমনীয়তা এবং / অথবা বিতরণ মেমরি ব্যবহার করার সুযোগ চান তবে আপনি পিইটিএসসি চাইতে পারেন।
জেদ ব্রাউন

পদক্ষেপে নমনীয়তা? স্মৃতি বিতরণ?
সুরতহাল

5

O(n3)O(n2)

যেহেতু আপনি উল্লেখ করেছেন যে আপনি একটি ভাগ করা মেমরি সিস্টেমে আছেন, আমি libFLAME এবং / অথবা PLASMA এর প্রস্তাব দিই , তবে আমি মনে করি না যে হয় আপনার স্তর 1 এবং স্তর 2 ক্রিয়াকলাপের জন্য বিক্রেতার থ্রেডেড বিএলএলএসের তুলনায় তাড়াতাড়ি দ্রুত হবে be

জেড এলিমেন্টালের প্রস্তাবিত হয়েছিল , যা আমি বিকাশ করতে পারি, তবে আমি আবার জোর দিয়ে বলব যে স্তর 1 এবং স্তর 2 অপারেশনগুলি সমান্তরাল ঘন লিনিয়ার বীজগণিত গ্রন্থাগারগুলির মূল ফোকাস নয়। আমি সত্যই কখনও এই রুটিনগুলির কোনওটিরই মানদণ্ড করি নি।


সুতরাং, আমি যা পাই তা থেকে প্রতিটি পরবর্তী সমান্তরাল ঘন লিনিয়ার বীজগণিত গ্রন্থাগার বিএএলএসের পরিবর্তে ইগেনভেেক্টর গণনা, সিস্টেমের সমাধানের মতো ক্রিয়াকলাপগুলি অনুকূল করতে চেষ্টা করবে। এছাড়াও, এলিমেন্টাল দেখতে সত্যিই চিত্তাকর্ষক। আমি পারলে অবশ্যই এটিকে একটি রান দেব run
সুরতহাল

তারা সাধারণত 3 স্তরের স্তরের অনুকূলিত করবে। কারণটি হ'ল পাঠাগারটি ব্যবহার করে বেশিরভাগ লোকেরা বড় বড় গণনা করে যা সাধারণত 3 স্তরের স্তরে ম্যাপ করা যায়।
জ্যাক পলসন

এর কারণ কি বিএলএএস ১/২ আরও ভাল হতে পারে না? (সম্ভবত পৃষ্ঠের থেকে ভলিউম সম্পত্তিটির কারণে?) হে (এন ^ 2) ডেটা এবং হে (এন ^ 2) গণনা?
সুরতহাল

এটি কারণ BLAS 1 এবং 2 গণনায় নিম্নতর অর্ডার শর্তাদি। উচ্চ-কার্যকারিতা ঘন লিনিয়ার বীজগণিতের সম্পূর্ণ 'গেম' হ'ল প্রতিটি ক্রিয়াকলাপকে সঠিক উপায়ে স্ক্রিন্ট করা যাতে আপনি যতটা সম্ভব কাজের জন্য এক্সজিইএমএম এবং বন্ধুদের কল করতে পারেন।
জ্যাক পলসন

এছাড়াও, হ্যাঁ, তারা স্মৃতি হিসাবে প্রায় একই পরিমাণে ফ্লপগুলি সম্পাদন করে এ কারণেই তারা যতটা সম্ভব এড়ানো যায়।
জ্যাক পলসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.