লিনাপ্যাক ব্যবহার করে i5 (2.5Ghz) এর বিরুদ্ধে একটি i7 (3.2Ghz) তুলনা করে i7 আরও খারাপ হচ্ছে


1

আমি একটি আই 5 -3210 এম @ 2.5 গিগাবাইটের 6 গিগাবাইট RAM এবং একটি i7 970 @ 3.2GHz এর সাথে 24 গিগাবাইট RAM এর ক্র্যাঞ্চিং পারফরম্যান্স তুলনা করার চেষ্টা করছি। ফলাফল তাই অপ্রত্যাশিত আমি অনুমান করছি যে আমি কিছু ভুল করছি অথবা i7 এর সাথে কিছু ভুল আছে।

পটভূমি হিসাবে, নিম্নলিখিত সাইটের তথ্য দেখায় যে i7 ভাল উপায় (পুরোনো সিপিই মডেলের চেয়ে প্রায় ২ বছর) ব্যতীত।

http://www.cpubenchmark.net/compare.php?cmp[]=840&cmp[]=815

উভয় কম্পিউটারের অপারেটিং সিস্টেমগুলি অভিন্ন (আর্ক লিনাক্স x86_64)। উভয় কম্পিউটার সমানভাবে স্থিতিশীল এবং ক্র্যাশ না।

আমি xlinpack_xeon64 ব্যবহার করছি, যা আমি এখানে পেয়েছি https://aur.archlinux.org/packages/linpack/

এই পরীক্ষা "... SMP সমান্তরাল ব্যবহার করে এবং ডিফল্টভাবে অনেকগুলি জেনারেট করে এসএমপি সিস্টেমের প্রসেসর সংখ্যা হিসাবে এক্সিকিউশন এর থ্রেড। "আমি এটি শীর্ষ / হট দেখার দ্বারা এটি করছে তা যাচাই করতে পারি। এছাড়াও, যখন আমি স্পষ্টভাবে থ্রেডের পরিবর্তনশীল সংখ্যায় ওয়্যারলেস পরিবর্তনশীল OMP_NUM_THREADS সেট করি, আমি শীর্ষ / নির্দিষ্ট সংখ্যা ব্যবহার করা হচ্ছে যে হপ।

এই ব্যবহার করে, আমি i5 থেকে কখনও কখনও 1.2 এর একটি ফ্যাক্টর দ্বারা দ্রুত হতে i5 পেয়েছি। আমি নীচের উভয় জন্য ফলাফল pasted আছে।

আমি প্রাথমিকভাবে এই খুব সমান্তরাল পরীক্ষায় আশা করি, i7 তিনটি একটি ফ্যাক্টর দ্বারা i5 কে অপারেটিং করবে (i7 এর 6 টি শারীরিক কোরে এবং i5 আছে 2)।

আমি এখানে লিনপ্যাক সম্পর্কে কিছু অসাধারণ ছিল কিনা তা দেখার জন্য সিস্টাস্টার বেঞ্চমার্কার ব্যবহার করেছি, এবং এটি প্রায় অভিন্ন ফলাফল (1.2 এর একটি ফ্যাক্টরের কাছাকাছি i5 দ্রুততর) সরবরাহ করেছিল।

অবশেষে, আমি এই সাইটে রিপোর্ট করা দুটি সিপিইর জন্য রেকর্ডকৃত জিএফফপ চেক করেছি http://www.intel.com/support/processors/sb/CS-017346.htm

এখানে, i5 এর জন্য নির্দিষ্ট gflops 40 হয়। তাই linpack ফলাফলগুলি দেখায় ঠিক কি কম। অন্যদিকে, i7 এর জন্য নির্দিষ্ট Gflops প্রায় 79। এবং আমি প্রায় অর্ধেক পেয়ে যাচ্ছি।

আমি বিরক্তিকর কিন্তু আমি i7 (কিনা সিপিই নিজেই বা RAM বা এমবি) ত্রুটিপূর্ণ মনে হয়। প্রকৃতপক্ষে i7 এর ফলাফলগুলির পরিবর্তনশীলতা এবং i5 এর জন্য বৈচিত্র্যের সম্পূর্ণ অভাব এছাড়াও i7 এর সাথে ভীতিকর কিছু নির্দেশ করে।

কোন অন্তর্দৃষ্টি খুব সহায়ক হবে।

-m

======= ফলাফল =================

============================================================================
========== i7 linpack test =================================================
============================================================================

 Input data or print help ? Type [data]/help :

Number of equations to solve (problem size): 20000
Leading dimension of array: 20000
Number of trials to run: 4
Data alignment value (in Kbytes): 4
Current date/time: Wed May 21 23:51:14 2014

CPU frequency:    3.206 GHz
Number of CPUs: 1
Number of cores: 6
Number of threads: 12

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 20000
Leading dimension of array                  : 20000
Number of trials to run                     : 4    
Data alignment value (in Kbytes)            : 4    

Maximum memory requested that can be used=3200404096, at the size=20000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
20000  20000  4      149.874    35.5909  3.288586e-10 2.911119e-02   pass
20000  20000  4      135.832    39.2701  3.288586e-10 2.911119e-02   pass
20000  20000  4      142.117    37.5334  3.288586e-10 2.911119e-02   pass
20000  20000  4      121.434    43.9262  3.288586e-10 2.911119e-02   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
20000  20000  4       39.0801  43.9262 

Residual checks PASSED

End of tests

============================================================================
========== i5 linpack test =================================================
============================================================================

Input data or print help ? Type [data]/help :

Number of equations to solve (problem size): 20000
Leading dimension of array: 20000
Number of trials to run: 4
Data alignment value (in Kbytes): 4
Current date/time: Wed May 21 23:54:15 2014

CPU frequency:    3.092 GHz
Number of CPUs: 1
Number of cores: 2
Number of threads: 4

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 20000
Leading dimension of array                  : 20000
Number of trials to run                     : 4    
Data alignment value (in Kbytes)            : 4    

Maximum memory requested that can be used=3200404096, at the size=20000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
20000  20000  4      125.668    42.4461  4.097986e-10 3.627616e-02   pass
20000  20000  4      125.602    42.4686  4.097986e-10 3.627616e-02   pass
20000  20000  4      125.551    42.4856  4.097986e-10 3.627616e-02   pass
20000  20000  4      125.550    42.4861  4.097986e-10 3.627616e-02   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
20000  20000  4       42.4716  42.4861 

Residual checks PASSED

End of tests

5
আপনার ফলাফলগুলি i7 970 এর বয়স এবং আপনার আইভিব্রিজে তুলনা করার চেষ্টা করার কারণে প্রত্যাশিত হবে।
Ramhound

গুলফটন বনাম আইভিব্রিজ, আমি আইভরিব্রিজকে বেশিরভাগ সময়ই জয় করতে বলব, যতক্ষণ না আপনার বেঞ্চমার্ক অ্যাপ্লিকেশনটি মাল্টি প্রসেসর পক্ষপাতী হয় ... কোন লাইনপ্যাক আপনি চলছেন? লিঙ্ক করবেন?
Austin T French

দুই সিস্টেমের উপর মেমরি বেঞ্চমার্ক চালান। এই বিশেষ পরীক্ষাটি সম্পূর্ণরূপে সিপিইউ সীমিত নয় এবং এই দিন সিপিএসগুলি ঘড়ি ফ্রিকোয়েন্সি বা কোর সংখ্যাগুলির তুলনায় মেমরি কন্ট্রোলার উন্নত করে আরও ভাল থ্রুপুট অর্জন করে। একটি ধীর CPU যে মেমরির জন্য অপেক্ষা করা কম সময় ব্যয় করে, সেক্ষেত্রে কাগজে তাত্ত্বিকভাবে দ্রুত চলাচল করতে পারে।
Andon M. Coleman

আপনি আপনার linpack পরীক্ষা একাধিক থ্রেড ব্যবহার করে নিশ্চিত? আপনার ফলাফল প্রায় পুরোপুরি এই দুই CPU এর প্রত্যাশিত একক থ্রেড কর্মক্ষমতা বর্ণনা।
David Schwartz

আমি অবশ্যই স্বীকার করি যে, একটি গলফাউনকে ivybridge দ্বারা সর্বোত্তম করা উচিত, এবং যদি আমি প্রতিটিটির একটি কোর তুলনা করি, তবে আমি এই ফলাফলগুলিতে একটি ভ্রু বাড়াতে পারি না। কিন্তু এখানে ইস্যু 6 গলফ্টাউন কোর 2 ivybridge (বা 12 বনাম 4 লজিক্যাল কোর)। আধুনিক সাবেক তুলনায় ভাল হতে হবে না। এবং হ্যাঁ, আমি যতটা সম্ভব নিশ্চিত যে আমি সব উপলব্ধ কোর ব্যবহার করছি। আমি এই clarify আমার প্রশ্ন সম্পাদনা। যতটুকু আমি দেখি, তত বেশি নিশ্চিত যে i7 এ কিছু ত্রুটিযুক্ত। সম্ভবত, ঠিক উল্লিখিত, এটা স্মৃতি।
mjandrews

উত্তর:


1

আমার উত্তর বেশ কিছুটা দেরিতে আসছে, কিন্তু যেহেতু আমি শুধু এইচপিএল (হাই পারফরমেন্স লিনপ্যাক) বেঞ্চমার্ক করেছি তাই আমিও আমার উত্তরটি লিখতে পারি।

আপনার পরীক্ষার ফলাফল বোঝার জন্য, আপনাকে লিনপ্যাক গণনা করা এবং বেঞ্চমার্কিংয়ের লক্ষ্য কী তা জানা দরকার। উচ্চ-ঘনত্ব ভাসমান বিন্দু গণনার কার্যকারিতা পরিমাপ করার জন্য লিনপ্যাক ঘন-ম্যাট্রিক্স রৈখিক বীজগণিত গণনা ব্যবহার করে। ফলাফল হ'ল প্রভাবশালী ম্যাট্রিক্স-গুণমান ক্রিয়াকলাপগুলির কারণে সিপিওর তাত্ত্বিক FLOPS ক্ষমতা শীর্ষে প্রতিফলিত হয়। (অবশ্যই কিছু অন্যান্য কারণ বিদ্যমান - মেমরি, অতিরিক্ত মেমরি অপারেশন, ইত্যাদি - যা পূর্ণ CPU তত্ত্বগত FLOPS অর্জনের অনুমতি দেয় না তবে সর্বোপরি 70-80% পূর্ণ FLOPS অর্জনযোগ্য হয়, যদি আপনি TOP500 তালিকাগুলি দেখেন ।)

আমি বিশ্বাস করি আপনার লিনপ্যাক এক্সিকিউটেবলটি ইন্টেল এমকেএল (ম্যাথ কার্নেল লাইব্রেরী) কে লিভারেজ করছে। পুরানো আর্কিটেকচারের (স্যান্ডি সেতুর আগে, যা আপনার i7 এর অন্তর্গত), কেবলমাত্র "দ্রুত" ভাসমান-বিন্দু প্রক্রিয়াকরণ ইউনিট উপলব্ধ এসএসই ইউনিট, যা একটি সময়ে 2 ভাসমান বিন্দু সংখ্যার প্রক্রিয়া করে। আপনার নতুন আই 5 প্রসেসর আইভি ব্রিজ আর্কিটেকচারের যা এভিএক্স ইউনিট রয়েছে, এটি একটি সময়ে 4 ভাসমান বিন্দু সংখ্যার প্রক্রিয়া করতে পারে। (প্রকৃতপক্ষে, যদি আপনি হার্ডওয়্যার ক্ষমতাতে আরো ঘনিষ্ঠভাবে দেখেন তবে ভাসমান বিন্দু সংখ্যা দ্বিগুণ করে, কারণ তারা একসাথে একসাথে এবং গুণমান করতে পারে, এভাবে এগুলি যথাক্রমে প্রতিটি এসএসই এবং এভিএক্স ইউনিটগুলির জন্য FLOP / চক্র এবং 8 FLOP / চক্র)।

সুতরাং আপনার i7 (3.2 GHz) থেকে i5 (2.5 GHz) CPU গুলির সিঙ্গল কোর CPU কার্যকারিতাটির তাত্ত্বিক অনুপাত হবে:

(2.5) * 2 / (3.2) = 1.56

(ফ্যাক্টর 2 অ্যাকাউন্টিং এসএসই-এভিএক্স পার্থক্য।) তবে আপনি যদি সমস্ত কোর ব্যবহার করেন বিনা হাইপারথ্রেডিং, আপনি পেতে হবে:

(2.5) * 2 * 2 / (3.2 * 6) = 0.52

এখন, আমি আপনার পর্যবেক্ষণ সম্পূর্ণরূপে হিসাব করতে পারবেন না, তারপর! যদি না, 6-কোর গণনা সত্যিই CPU এর তথ্য গণনা করতে পারে? I5 দ্রুততর CPU এর গতি থেকে আসা না আসা অন্য উন্নতিগুলি নির্দেশ করতে পারে & amp; একা গণনা ক্ষমতা।

Wirawan

PS: "i7" এবং "i5" পদগুলির ইন্টেলের ব্যবহার সর্বদা বিভ্রান্তিকর; "i7" অবশ্যই "i5" এর চেয়ে অবশ্যই ভাল, তবে এটি পূর্বরূপটি কী দেয় তার পারফরম্যান্স সুবিধাটি কী স্পষ্ট নয় তা নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.