আমরা আমাদের সমস্ত ব্যবহারকারীদের কঠোরভাবে -O3 -xHost -ipo
ifort 11 এবং ifort 12 উভয়ের জন্যই শুরু করার পরামর্শ দিচ্ছি যদি ও 3 দ্বারা সুনির্দিষ্ট কোনও ফ্লোটিং পয়েন্ট ট্রান্সফর্মেশনগুলি থাকে যা আপনার কিছু সংখ্যার যথার্থতাকে প্রভাবিত করে তবে আপনি সেগুলি বিশেষভাবে বন্ধ করতে পারেন -fp-model precise -fp-model except
(বা আরও তীব্রভাবে, -fp-model strict
) অন্যান্য অপ্টিমাইজেশানগুলি ধরে রাখার সময় ও 3 সক্ষম করে যেমন ক্যাশের জন্য লুপ ব্লক করা, লুপ ফিউশন এবং আনরোলিং, এবং মেমরি অ্যাক্সেস অপ্টিমাইজেশন।
আমি পৃথক ফাইলগুলিতে ভাসমান বিন্দু মডেল স্টাফ চেষ্টা করে দেখার চেষ্টা করব এবং বিশ্বব্যাপী এটি বন্ধ করার পরিবর্তে এটি কোথায় কোনও পার্থক্যের সন্ধান করবে; এটি একটি ~ 15% স্পিড বাম্প হতে পারে এবং আপনি যেখানে এটি আপনার গণনাগুলিকে প্রভাবিত করে না সেখানে রাখতে সক্ষম হতে চান। যথার্থতা কোথায় প্রভাবিত হচ্ছে তা আপনি যদি নিশ্চিত না হন তবে আপনি সেই ফাইলগুলির জন্য ভাসমান পয়েন্ট মডেল পতাকাগুলি চালু এবং বন্ধ করে বা গোলাকার মোডগুলি নিয়ে খেলতে খেলতে পারেন ।
আমরা সম্প্রতি x86 এর জন্য gnu এবং ইন্টেল সংকলকগুলিতে ফোকাস করে, অপ্টিমাইজেশন পতাকাগুলি সম্পর্কে আমাদের ব্যবহারকারীদের কাছে একটি সংক্ষিপ্ত আলোচনা করেছি; আপনি এখানে আলাপ থেকে স্লাইড দেখতে পারেন ।
ঘটনাক্রমে, আমরা যখন এখন আপনার কোডের জন্য অপ্টিমাইজেশন পতাকাগুলি বেছে নেওয়ার কথা বলছি, তখন কম্পায়েলারের কোথায় একটি লুপ ভেক্টরাইজ করার চেষ্টা করেছে এবং পারে নি তা দেখার জন্য -vec- রিপোর্টের আউটপুটটি দেখার বিষয়; কখনও কখনও আপনি নিজের লুপে ছোট ছোট পরিবর্তন করতে পারেন যার ফলে ভেক্টরাইজেশন সম্ভব হতে পারে (যা একটি 4x স্পিডআপ হতে পারে)। একইভাবে আরও সাধারণ -প্রতিবেদনের জন্য ।