প্রশ্ন ট্যাগ «assembly»

সমাবেশ ভাষা (asm) প্রোগ্রামিং প্রশ্ন। আপনি যে প্রসেসর এবং / অথবা নির্দেশক সেটটি ব্যবহার করছেন তেমনি এসেম্বলারের সাথেও TAG তে নিশ্চিত হন। সতর্কতা: .NET সমাবেশগুলির জন্য, পরিবর্তে [[নেট-এসেম্বলি] ট্যাগটি ব্যবহার করুন। জাভা এএসএম-এর পরিবর্তে [জাভা-বাইটকোড-এসএম] ট্যাগটি ব্যবহার করুন।

12
জিসিসি কেন * * * * * * * * * * * * (ট * (এ * এ * এ) * (এ * এ * ক) কে অনুকূলিত করে না?
আমি একটি বৈজ্ঞানিক অ্যাপ্লিকেশন নেভিগেশন কিছু সংখ্যাগত অপ্টিমাইজেশন করছি। একটি জিনিস আমি লক্ষ্য করেছি যে জিসিসি কলটি pow(a,2)সংকলন করে কলটি অনুকূল করে তুলবে a*a, তবে কলটি pow(a,6)অনুকূলিত হয়নি এবং প্রকৃতপক্ষে লাইব্রেরির ফাংশনটি কল করবে pow, যা কার্য সম্পাদনকে অনেক ধীর করে দেয়। (বিপরীতে, ইন্টেল সি ++ কম্পাইলার , এক্সিকিউটেবল icc, …

14
<কি <= এর চেয়ে দ্রুত?
কি if( a &lt; 901 )যতো তাড়াতাড়ি if( a &lt;= 900 )। এই সাধারণ উদাহরণের মতো ঠিক নয় তবে লুপ জটিল কোডে সামান্য পারফরম্যান্সের পরিবর্তন রয়েছে। আমি মনে করি এটি জেনারেটেড মেশিন কোড সহ কিছু করতে হবে যদি এটি এমনকি সত্য হয়।

10
32৪-বিটের সাথে একটি 32-বিট লুপের কাউন্টার প্রতিস্থাপনের সাথে ইনটেল সিপিইউগুলিতে _mm_popcnt_u64 এর সাথে ক্রেজি পারফরম্যান্সের বিচ্যুতিগুলি প্রবর্তিত হয়
আমি popcountডেটা বৃহত অ্যারে দ্রুততম উপায় খুঁজছিলাম । আমি খুব অদ্ভুত প্রভাবের মুখোমুখি হয়েছি : লুপ ভেরিয়েবল থেকে অন্যটিতে পরিবর্তন unsignedকরছিuint64_t আমার পিসিতে 50% কর্মক্ষমতা ড্রপ করেন। বেঞ্চমার্ক #include &lt;iostream&gt; #include &lt;chrono&gt; #include &lt;x86intrin.h&gt; int main(int argc, char* argv[]) { using namespace std; if (argc != 2) { cerr &lt;&lt; …

11
হাতের লিখিত সমাবেশের চেয়ে কোলাটজ অনুমানটি দ্রুত পরীক্ষার জন্য সি ++ কোড - কেন?
আমি এই দুটি সমাধান প্রজেক্ট অয়লার কিউ 14 এর জন্য , সমাবেশে এবং সি ++ এ লিখেছি । কোলাটজ অনুমানের পরীক্ষার জন্য এগুলি একই অভিন্ন বৌদ্ধ শক্তি পদ্ধতির । সমাবেশ সমাধান একত্রিত হয়েছিল nasm -felf64 p14.asm &amp;&amp; gcc p14.o -o p14 সি ++ এর সাথে সংকলিত হয়েছিল g++ p14.cpp -o …


4
আমি কীভাবে চক্রের তাত্ত্বিক সর্বোচ্চ 4 টি এফএলওপি অর্জন করব?
একটি আধুনিক x86-64 ইন্টেল সিপিইউতে চক্র প্রতি 4 ভাসমান পয়েন্ট অপারেশনগুলির (ডাবল যথার্থতা) তাত্ত্বিক শিখর সম্পাদন কীভাবে করা যায়? যতদূর আমি বুঝতে পেরেছি এটি কোনও এসএসইর জন্য তিনটি চক্র addএবং mulআধুনিক ইন্টেল সিপিইউগুলির বেশিরভাগের জন্য সম্পূর্ণ করার জন্য পাঁচটি চক্র লাগে (উদাহরণস্বরূপ অ্যাগ্রার ফগের 'নির্দেশাবলী সারণী' দেখুন )। পাইপলাইনের কারণে …

30
সমাবেশ যখন সি এর চেয়ে দ্রুত হয়?
এসেম্বেলারকে জানার একটি উল্লেখযোগ্য কারণ হ'ল, উপলক্ষে, কোডটি উচ্চতর স্তরের ভাষায়, বিশেষত সি-র লেখার চেয়ে আরও পারফরম্যান্সযুক্ত কোড লিখতে নিয়োগ করা যেতে পারে। যাইহোক, আমি এটি বহুবার শুনেছি যে এটি সম্পূর্ণ মিথ্যা না হলেও, এসেম্বলারের প্রকৃতপক্ষে আরও পারফরম্যান্ট কোড উত্পন্ন করতে ব্যবহার করা যেতে পারে সে ক্ষেত্রে উভয়ই বিরল এবং …
474 c  performance  assembly 

17
আপনি সিসি / সি ++ উত্স থেকে জিসিসিতে এসেম্বলারের আউটপুট পাবেন কীভাবে?
এক এই কিভাবে কাজ করে? যদি আমি বিশ্লেষণ করতে চাই যে কীভাবে কোনও কিছু সংকলিত হচ্ছে, আমি কীভাবে নির্গত সমাবেশ কোড পাব?
378 c++  c  debugging  gcc  assembly 

4
সংযুক্ত খালিগুলিতে জাভা স্যুইচ কেন যোগ হওয়া মামলার সাথে দ্রুত চালিত হয়?
আমি এমন কিছু জাভা কোড নিয়ে কাজ করছি যা এটির জন্য উচ্চতর অনুকূলিতকরণ হওয়া দরকার কারণ এটি আমার মূল প্রোগ্রামটির যুক্তিতে বহু পয়েন্টে অনুরোধ করা হট ফাংশনগুলিতে চলবে। এই কোডের অংশে স্বেচ্ছাসেবক অ-নেতিবাচক গুলিগুলিকে উত্থিত করে গুণকগুলি গুণিত doubleকরে । এক দ্রুত উপায় (সম্পাদনা: কিন্তু না দ্রুততম সম্ভব, নীচের আপডেট …

10
পঠনযোগ্য সমাবেশ উত্পাদন করতে জিসিসি ব্যবহার করছেন?
আমি ভাবছিলাম যে কীভাবে আমার সি উত্স ফাইলটিতে জিসিসি ব্যবহার করতে হবে মেশিন কোডটির একটি স্মৃতি সংস্করণ ডাম্প করার জন্য যাতে আমি দেখতে পারি যে আমার কোডটি কী সংকলিত হচ্ছে। আপনি জাভা দিয়ে এটি করতে পারেন তবে আমি জিসিসির সাথে কোনও উপায় খুঁজে পাচ্ছি না। আমি সমাবেশে একটি সি পদ্ধতি …
256 c  gcc  assembly 

3
একটি রেটপোলিন কী এবং এটি কীভাবে কাজ করে?
অর্ডার কার্নেল বা ক্রস প্রসেস মেমরি ডিসক্লোজার (বিরুদ্ধে প্রশমিত করার জন্য স্পেকটের এটাক), লিনাক্স কার্নেল 1 একটি নতুন বিকল্প কম্পাইল করা হবে , -mindirect-branch=thunk-externপ্রচলন gccএকটি তথাকথিত মাধ্যমে পরোক্ষ কল সম্পাদন করতে retpoline । গুগল অনুসন্ধান কেবলমাত্র সাম্প্রতিক ব্যবহারের ক্ষেত্রে পরিণত হয়েছে (সাধারণত 2018 এ সমস্তই) এটি একটি নতুন উদ্ভাবিত শব্দ …

10
মাল্টিকোর অ্যাসেম্বলি ভাষা দেখতে কেমন?
একসময়, x86 এসেম্বলার লিখতে, উদাহরণস্বরূপ, আপনার কাছে নির্দেশাবলী থাকবে যে "ইডিএক্স নিবন্ধটি 5 মান সহ লোড করুন", "ইডিএক্স ইনক্রিমেন্ট" রেজিস্ট্রার ইত্যাদি থাকবে। আধুনিক সিপিইউগুলিতে 4 টি কোর (বা আরও বেশি) রয়েছে, মেশিন কোড স্তরে কি এটি দেখতে দেখতে 4 টি পৃথক সিপিইউ রয়েছে (অর্থাত্ কেবলমাত্র 4 টি স্বতন্ত্র "ইডিএক্স" রেজিস্ট্রার …
243 assembly  x86  cpu  multicore  smp 

12
'যদি' এর চেয়ে 'সুইচ' দ্রুত হয়?
একটি switchবিবৃতি আসলে একটি বিবৃতি চেয়ে দ্রুত if? আমি /Oxপতাকাটির সাথে ভিজুয়াল স্টুডিও 2010 এর x64 সি ++ সংকলকটিতে নীচে কোডটি চালিয়েছি : #include &lt;stdlib.h&gt; #include &lt;stdio.h&gt; #include &lt;time.h&gt; #define MAX_COUNT (1 &lt;&lt; 29) size_t counter = 0; size_t testSwitch() { clock_t start = clock(); size_t i; for (i = …

3
অপারেটিং সিস্টেম ছাড়াই কীভাবে একটি প্রোগ্রাম চালানো যায়?
অপারেটিং সিস্টেমটি না চালিয়ে আপনি কীভাবে কোনও প্রোগ্রাম চালাবেন? আপনি কি এমন সংসদীয় প্রোগ্রাম তৈরি করতে পারেন যা কম্পিউটার শুরুতে লোড এবং চালাতে পারে, যেমন একটি ফ্ল্যাশ ড্রাইভ থেকে কম্পিউটার বুট করে এবং এটি সিপিইউতে থাকা প্রোগ্রামটি চালায়?

16
উইন্ডোজ .exe কে "ডিকম্পাইল" করা কি সম্ভব? নাকি কমপক্ষে বিধানসভা দেখে?
আমার এক বন্ধু ফেসবুক থেকে কিছু ম্যালওয়্যার ডাউনলোড করেছে এবং আমি নিজেকে আক্রান্ত না করে এটি কী করে তা দেখার জন্য আগ্রহী। আমি জানি যে আপনি সত্যিই একটি .xe বিয়োগ করতে পারবেন না, তবে আমি কি কমপক্ষে এটি সমাবেশে দেখতে পারি বা কোনও ডিবাগার সংযুক্ত করতে পারি? এটি কোনও নেট …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.