এফপিজিএ ফার্মওয়্যার ডিজাইন: কত বড় বড়?


13

আমার একটি বিশেষত বৃহত সংকেত প্রক্রিয়াকরণ রূপান্তর রয়েছে যা মাতলাব থেকে ভিএইচডিএলে পোর্ট করা দরকার। এটি অবশ্যই এক ধরণের সম্পদ ভাগ করে নেওয়ার প্রয়োজন। কিছুটা গণনা আমাকে নিম্নলিখিতটি দিয়েছে:

  • 12৪-পয়েন্টের 512 ফিট
  • 41210 মাল্টিপল-অ্যাড অপারেশন

বৃহত্তম ভার্টেক্স 6 এফপিজিএ বিবেচনা করে 2000 ডলার ডিএসপি 48 ই ব্লক রয়েছে, আমি জানি যে আমি একাধিকবার রিসোর্সগুলি পুনরায় ব্যবহার করতে রিসোর্স-শেয়ার করতে পারি। কার্যকর করার সময়টি আসলেই কোনও সমস্যা নয়, প্রসেসিং সময়টি এফপিজিএ শর্তাবলী তুলনামূলকভাবে বেশি সময় নিতে পারে।

উত্সের ব্যবহারের দিকে তাকিয়ে, রেডিক্স -2 লাইট আর্কিটেকচার ব্যবহার করে আমার 4 ডিএসপি ব্লক / এফএফটি অপারেশন = 2048 ডিএসপি ব্লক, মোট ~ 43k gets বৃহত্তম ভার্টেক্স এফপিজিএতে 2 কে ব্লক, বা 20 টি অপারেশন / ম্যাক্স রয়েছে।

স্পষ্টতই ফ্যাব্রিক মধ্যে বৃহত muxes অন্তর্ভুক্ত এছাড়াও টুকরা নিতে চলেছে। এই সীমাটির উপরের প্রান্তটি কোথায় পাব? আমি এফপিজিএ সংস্থানগুলি অসীমভাবে ভাগ করতে পারি না। 41210 গুণকগুলি কি খুব বড়? কীভাবে খুব বড় তা গণনা করব?

আমি অন্যান্য সংস্থানগুলি (স্লাইস, ব্র্যামস, ইত্যাদি) দেখেছি। রেডিক্স -2 লাইট 4 x 18 কে ব্র্যামস / fft = 2048 ব্র্যামের বৃহত্তম জিলিনেক্স এফপিজিএতে 2128 ব্র্যাম দেয়। খুব সীমানা। আমি উদ্বিগ্ন যে আমার নকশাটি খুব বড়।


হালনাগাদ:

নকশা নিজেই আরও কিছু তথ্য। আমি বিশদে যেতে পারি না, তবে আমি যা দিতে পারি তা এখানে:

Initial conditions -> 512 ffts -> 40k multipliers ---------|----> output data to host 

                 ^------re-calculate initial conditions----|

আউটপুট ডেটারেট স্পেক: "ম্যাট্লাব সিমুলেশনের চেয়ে দ্রুত"

গণনা অনুসারে, আমি এখানেই রয়েছি:

এফএফটি পর্যায়: সহজ। আমি 1/2/4/8 এফএফটি প্রয়োগ করতে পারি, ফলাফলগুলিকে এসডিআরএমে সংরক্ষণ করতে পারি এবং পরে অ্যাক্সেস করতে পারি। তুলনামূলকভাবে ছোট, যদিও এটি বেশি সময় নেয়, ঠিক আছে। র‌্যাডিক্স -2 লাইট ব্যবহার করে আমি 2 ডিএসপি 48 ই এবং 2 18 কে বিআরএএমএস / এফএফটি পেতে পারি। স্ট্রিমিং 6 ডিএসপি 48 এ 0 বিআরএমএস / এফএফটি দেয়। উভয় ক্ষেত্রেই, P৪ পয়েন্টের এফএফটি এফপিজিএ রিসোর্সের ক্ষেত্রে ছোট is

গুণক : এটি আমার সমস্যা। গুণের ইনপুটগুলি লকিং টেবিল বা এফএফটি ডেটা থেকে নেওয়া হয়। এটি সত্যিই কেবলমাত্র বহুগুণিত সংযোজন। অপ্টিমাইজ করার মতো অনেক কিছুই নেই। ফিল্টার নয়, তবে ফিল্টারের মতো বৈশিষ্ট্য রয়েছে।

এফপিজিএতে রিসোর্স ভাগ করে নেওয়ার বিষয়টি বিবেচনা করে গণিতগুলি নিম্নরূপে কাজ করে: একটি LUT-6 4-উপায় ম্যাক্স হিসাবে ব্যবহার করা যেতে পারে। এন-ওয়ে, এম বিট মাক্সের সূত্রটি নিম্নরূপ:

N*M/3 = number of luts, or N*M/12 = slices (4 LUTS/slice).

আমার প্রয়োগের জন্য সংখ্যার ক্রাঞ্চ করা ভাল ফলাফল দেয় না। 40k অপারেশন সম্পাদনের জন্য 90% কুমারী -6 পরিবারের ডিএসপিগুলিকে সংস্থান-ভাগ করার পর্যাপ্ত টুকরা নেই।


সম্পদ ভাগ করে নেওয়ার সর্বাধিক দক্ষ ফর্মগুলি আংশিক সিরিয়ালাইজেশন যেখানে আপনি মেমরির ঠিকানা দিয়ে ডেটা অ্যাক্সেস করতে পারেন। অবশ্যই, এর চূড়ান্ত সময়ে আপনি একটি প্রচলিত সঞ্চিত-প্রোগ্রাম প্রসেসরের কাছে ফিরে এসেছেন - কঠোর পারফরম্যান্সের প্রয়োজনীয়তার অভাব সম্ভবত একটি কম্পিউট ক্লাউডে চলমান একটি সফ্টওয়্যার বাস্তবায়নের নমনীয়তার দিকে ফিরে যেতে শুরু করে।
ক্রিস স্ট্রাটন

1
এটি আপনার প্রশ্নের অংশ নয়, তবে আপনার উত্স গণনায় আপনি কোন আকারের অপারেন্ড বর্ণনা করেন নি। 512 FFTs x 64 পয়েন্ট x কত বিট? একটি এফপিজিএতে অপারেন্ডের আকারটি পুরোপুরি আপনার উপর নির্ভর করে, সুতরাং আপনার সমস্যার আকারটি বের করার সময় আপনাকে এটি বিবেচনা করতে হবে।
ফোটন

আপনি বুঝতে পেরেছিলেন কিনা আমি জানি না, তবে এই বড় এফপিজিএগুলি বেশ ব্যয়বহুল। কিছু $ 5k এর উপরে হতে পারে। সম্ভবত আপনারও সেই বিষয়টি বিবেচনা করা উচিত, যদি না ব্যয় কোনও সমস্যা না হয়।
গুস্তাভো লিটোভস্কি

1
দুর্ভাগ্যক্রমে আপনি এখন পর্যন্ত উত্তরগুলিতে যে ধরণের বিকল্প সমাধানের পরামর্শ পেয়েছেন সেগুলি ছাড়িয়ে আমি সন্দেহ করি যে আমরা আপনার পক্ষে আরও অনেক কিছু করতে পারি কিনা। আমার অর্থ, আপনি কেবল একটি এফএফটি কোর তৈরি করতে পারেন এবং এটির মাধ্যমে একের পর এক আপনার 512 ইনপুট চালাতে পারেন এবং স্পষ্টতই এটি মোটামুটি ছোট এফপিজিএতেও খাপ খায়। এর মধ্যে কোথাও এবং সমান্তরালভাবে সমস্ত কিছু করা আপনার আবেদনের জন্য গতি বনাম সংস্থানগুলির সঠিক ভারসাম্য ... তবে এটি যে কারও পক্ষে ভারসাম্য হওয়া উচিত তা আপনার পক্ষে বলা শক্ত।
ফোটন

1
আপনি কি এই জন্য একটি বাজেট নম্বর আছে? গুস্তাভো যেমন উল্লেখ করেছেন, উচ্চ-এফপিজিএগুলি ব্যয়বহুল, যেমন তাদের উপর বসার জন্য একটি পিসিবি বিকাশ করছে। যেখানে কেবল দ্বিগুণ (বা চতুর্ভুজ বা ...) গণনা হার্ডওয়ারের পরিমাণ এবং বিদ্যমান, প্রমাণিত (?) ব্যবহার চালিয়ে যাওয়া, মতলব কোড সম্ভবত প্রদত্ত গতির বৈশিষ্ট্য পূরণ করতে পারে।
ফোটন

উত্তর:


8

আমি ভাবছি সমস্যাটি দেখার অন্য কোনও উপায় আছে কিনা?

আপনার 512 এফএফটি অপারেশনগুলি (প্রতিটি point৪ পয়েন্ট) এবং 42 কে ম্যাক অপারেশনগুলির প্রাক্কলনটি চালাচ্ছি ... আমি মনে করি এটিই কি আপনাকে অ্যালগরিদম দিয়ে একটি পাসের জন্য প্রয়োজন?

এখন আপনি 4 টি ডিএসপি ইউনিট ব্যবহার করে একটি এফএফটি কোর পেয়েছেন ... তবে এফএফটি প্রতি কত ঘড়ির চক্র লাগবে? (থ্রুপুট, বিলম্ব নয়)? চলুন যাক 64, বা প্রতি পয়েন্ট 1 চক্র। তারপরে আপনাকে সেই 42 কে ম্যাক ক্রিয়াকলাপগুলি 64 টি চক্রের মধ্যে শেষ করতে হবে - প্রতিটি ম্যাকের সাথে প্রতিটি ম্যাক 42 টি অপারেশন পরিচালনা করে cycle

এখন আরও বিস্তারিতভাবে অ্যালগরিদমের বাকী অংশটি দেখার সময় এসেছে: ম্যাকগুলি নয় তবে উচ্চতর স্তরের অপারেশনগুলি (ফিল্টারিং, পারস্পরিক সম্পর্ক, যাই হোক না কেন) যা আবার ব্যবহার করা যায় তা চিহ্নিত করুন। পুনরায় ব্যবহারযোগ্যতা সহ এই ক্রিয়াকলাপের প্রতিটি জন্য কোর তৈরি করুন (উদাহরণস্বরূপ, বিভিন্ন নির্বাচনযোগ্য সহগের সেট সহ ফিল্টারগুলি) এবং শীঘ্রই আপনি দেখতে পাবেন তুলনামূলকভাবে বড় কোরগুলির মধ্যে অপেক্ষাকৃত কয়েকটি মাল্টিপ্লেক্সার প্রয়োজন ...

এছাড়াও, কোন শক্তি হ্রাস সম্ভব? আমার এমন কিছু ঘটনা ছিল যেখানে লুপগুলিতে গুণের জন্য চতুর্ভুজগুলি (এবং উচ্চতর) তৈরি করা প্রয়োজন। এগুলিকে নিবন্ধভুক্ত করে, আমি পুনরাবৃত্তভাবে এগুলি সংখ্যাবৃদ্ধি ছাড়াই উত্পন্ন করতে পারতাম: যেদিন আমি এফপিজিএতে একটি ডিফারেন্স ইঞ্জিন তৈরি করেছি সেদিন আমি নিজের সাথে বেশ সন্তুষ্ট ছিলাম!

অ্যাপ্লিকেশন না জেনে আমি আরও বিশদ দিতে পারি না তবে এ জাতীয় বিশ্লেষণের ফলে কিছু বড় সরলকরণ সম্ভব হয়েছে।

এছাড়াও - যেহেতু এটি যেন আপনি মনের মধ্যে একটি নির্দিষ্ট প্ল্যাটফর্ম হবে না শোনাচ্ছে - কথা বিবেচনা করতে পারেন একাধিক FPGAs জুড়ে পার্টিশন করতে পারেন ... কটাক্ষপাত করা এই বোর্ডের বা এই এক যা সুবিধাজনক প্ল্যাটফর্ম একাধিক FPGAs অফার। তাদের 100 টি স্পার্টান -3 ডিভাইস সহ একটি বোর্ড রয়েছে ...

(পিএস আমি হতাশ হয়েছি যখন সফটওয়্যার লোকেরা এই অন্যান্য প্রশ্নটি বন্ধ করে দিয়েছে - আমি মনে করি এটি কমপক্ষে সেখানে যথাযথ হিসাবে উপযুক্ত)

সম্পাদনা করুন: আপনার সম্পাদনাটি আবার করুন - আমি মনে করি আপনি সেখানে পৌঁছতে শুরু করছেন। যদি সমস্ত গুণক ইনপুট হয় হয় এফএফটি আউটপুট, বা "ফিল্টার নন" সহগুণ, আপনি যে ধরণের নিয়মিততা কাজে লাগাতে হবে তা দেখতে শুরু করছেন। প্রতিটি গুণকের এক ইনপুট একটি এফএফটি আউটপুট সংযোগ করে, অন্য ইনপুটটি একটি সহগ রমকে (ব্লকরাম একটি ধ্রুবক অ্যারে হিসাবে প্রয়োগ করা হয়)।

একই এফএফটি ইউনিটের মাধ্যমে বিভিন্ন এফএফটি ক্রিয়াকলাপ সিকোয়েন্সিং স্বয়ংক্রিয়ভাবে এই গুণকটি পেরিয়ে যাওয়া এফএফটি আউটপুটগুলি সিকোয়েন্স করবে। অন্যান্য এমপিওয়াই ইনপুটটিতে সঠিক গুণফলগুলি সিকোয়েন্স করা এখন "নিছক" সঠিক সময়ে সঠিক রম অ্যাড্রেসগুলি সংগঠিত করার বিষয়: একটি সাংগঠনিক সমস্যা, ম্যাক্সের বিশাল মাথাব্যথার পরিবর্তে।

পারফরম্যান্সে: আমার মনে হয় ডেভ ট্যুইড অকারণে হতাশাব্যঞ্জক ছিল - এফএফটি এন * লগ (এন) ক্রিয়াকলাপ গ্রহণ করছে তবে আপনাকে ও (এন) প্রজাপতি ইউনিট এবং ও (লগএন) চক্র বা ও (লগএন) ইউনিট এবং ও ( n) চক্র, বা আপনার সংস্থান এবং গতির লক্ষ্য অনুসারে কিছু অন্য সমন্বয়। এই জাতীয় একটি মিশ্রণ পোস্ট-এফএফটি গুণমানের কাঠামো অন্যদের তুলনায় অনেক সহজ করে তুলতে পারে ...


একটি একক হার্ডওয়্যার প্রজাপতি দিয়ে প্রয়োগ করা একটি এফএফটি সম্পূর্ণরূপে এনলগএন ক্লক চক্রের প্রয়োজন হবে; 512 পয়েন্টের জন্য এটি 256 * 8 প্রজাপতি বা 2048 ঘড়ি হবে। এর অর্থ হ'ল 41210 (বা 32768?) ম্যাকগুলিতে একই সময়ে একই পরিমাণে কাজ করতে 8-10 হার্ডওয়্যার মাল্টিপ্লায়ারগুলির প্রয়োজন হবে।
ডেভ টুইট করেছেন

মানে 16-20 গুণক multip
ডেভ টুইট করেছেন

দুঃখিত, আমি ঠিক বুঝতে পেরেছিলাম যে আমি এটি পিছনের দিকে পেয়েছি। Indiivdual FFTs points৪ পয়েন্ট, সুতরাং একক প্রজাপতি বাস্তবায়নের জন্য 32 * 5 = 160 ঘড়ি প্রয়োজন। ম্যাকগুলি তখন 200-250 হার্ডওয়্যার মাল্টিপ্লায়ার দিয়ে করা যেতে পারে।
ডেভ টুইট করেছেন

এটাই আমাকে হতাশ করে। Xilinx কীভাবে 16k / 32k fouts করতে সক্ষম এমন একটি কোর ডিজাইন করতে পারে যার জন্য 400k মাল্টিপল-অ্যাড অপারেশন (এনলগএন) প্রয়োজন এবং এখনও আমি আমার 41k এর সাথে লড়াই করছি? একটি উপায় হতে হবে!
stanri

@ ডেভ: আমি বিশ্বাস করি আপনার অর্থ 160 টি চক্র নয়, অবশ্যই 160 গুণ? এফএফটি-তে এতটা সহজাতভাবে সিরিয়ালীকৃত কিছুই নেই ...
ব্রায়ান ড্রামমন্ড

2

যদি এই সমস্যায় রিয়েলটাইমের সীমাবদ্ধতা না থাকে এবং এটির মতো শোনা যায় - আপনি কেবল এটি "দ্রুত" চালনা করতে চান তবে মনে হয় এটি এক বা একাধিক জিপিইউতে ত্বরণ করার পক্ষে যথেষ্ট উপযুক্ত হতে পারে। বেশ কয়েকটি সফ্টওয়্যার লাইব্রেরি রয়েছে যা এটিকে তুলনামূলকভাবে সোজাসাপ্টা প্রস্তাব দেয় এবং এটি সরাসরি কাস্টম এফপিজিএ হার্ডওয়্যারে যাওয়ার চেয়ে সহজতর মানের অর্ডার হতে পারে।

শুরু করতে "GPU- সক্ষম লাইব্রেরি" বা "GPU- গতিযুক্ত লাইব্রেরি" এর জন্য কেবল গুগল।


আকর্ষণীয়ভাবে যথেষ্ট, আমি এই প্রকল্পের কথা শুনে ক্লায়েন্টের সাথে জিপিইউ উল্লেখ করেছি এবং সে আগ্রহী ছিল না।
stanri

@ স্ট্যাসিঅ্যানরাইক: তিনি কেন বলেছেন?
ডেভ টুইট করেছেন

তিনি সত্যিই কেন বলেননি, একটি এফপিজিএ ব্যবহারের আগে তিনি কেবল এটি দেখেছিলেন বলে মনে হয়েছিল, দৃশ্যত apparent আমি আবার এটি আনতে হবে।
stanri

@ ইস্ত্রি: এমনকি আপনি যদি শেষ পর্যন্ত কোনও এফপিজিএ বাস্তবায়নের কাজটি শেষ করেন, তবুও আমার কাছে মনে হয় যে জিপিইউ সামগ্রিক সিস্টেমের আর্কিটেকচারকে "ব্রেডবোর্ড" করার একটি ভাল উপায় হতে পারে। আপনার কাছে কি (এবং আপনি ভাগ করে নিতে পারেন?) অ্যালগরিদমের জন্য কোনও ধরণের উচ্চ-স্তরের ডেটাফ্লো গ্রাফ রয়েছে এবং আপনি কি পরিমাণ জড়িত ডেটা সম্পর্কে ধারণা দিতে পারেন? এই জাতীয় প্রশ্নের উত্তর ছাড়াই আপনাকে খুব জেনেরিক পরামর্শ ব্যতীত অন্য কিছু দেওয়া সত্যিই কঠিন হতে পারে।
ডেভ টুইট করেছেন

এটি আসলে খুব সাধারণ অ্যালগরিদম, এটি কেবলমাত্র স্কেল যা এটিকে জটিল করে তোলে। মূলত নিম্নরূপ: প্রাথমিক শর্তসমূহ -> সমান্তরালে 512 ফিট - এফএফটি আউটপুটে
32768 গুণমান

1

নির্দিষ্ট ধরণের গণিত ক্রিয়াকলাপকে তীব্রতর করার জন্য একটি বিশেষায়িত হার্ডওয়্যার বা একটি এফপিজিএ (বা এমনকি একটি সিপিএলডি) ব্যবহার করা সম্ভব। গণিত ক্রিয়াকলাপকে ত্বরান্বিত করার জন্য হার্ডওয়্যার (সার্কিটরি বা এফপিজিএ লজিক) ডিজাইনের চেষ্টা করার সময় মূল বিষয়টি মনে রাখা উচিত, আপনার ডিভাইসে কী অর্ডার ডেটা প্রবেশ করতে হবে এবং কী প্রয়োজন হবে তা নির্ধারণ করা। একটি দক্ষ আই / ও লেআউট সহ একটি ডিভাইস অদক্ষ লেআউটযুক্ত একের চেয়ে অনেক বেশি ভাল পারফরম্যান্স সরবরাহ করতে পারে, এমনকি যদি পরবর্তী ডিভাইসটির জন্য আরও বেশি সার্কিটরি প্রয়োজন হয়।

আমি এফএফটি-র জন্য একটি হার্ডওয়্যার-সহায়তা নকশা তৈরির চেষ্টা করিনি, তবে আমি যেটি দেখেছি তা হ'ল বড় গুণিত ক্রিয়াকলাপগুলির জন্য হার্ডওয়্যার সহায়তা (যেমনটি আরএসএ এনক্রিপশনের জন্য ব্যবহৃত হতে পারে)। অনেকগুলি মাইক্রোকন্ট্রোলার, এমনকি যারা বিশেষ দ্রুত-গুণক হার্ডওয়্যারগুলিও রয়েছে, তারা এই ধরণের অপারেশনগুলিতে মারাত্মকভাবে দক্ষ হয় না কারণ তাদের প্রচুর নিবন্ধকার বদলানো প্রয়োজন। রেজিস্টার অদলবদলকে হ্রাস করতে নকশাকৃত হার্ডওয়্যারটি বহু-নির্ভুলতা গুণক ক্রিয়াকলাপের সাথে আরও ভাল পারফরম্যান্স অর্জন করতে পারে, এমনকি হার্ডওয়্যার নিজেই অত্যাধুনিক না হলেও। উদাহরণস্বরূপ, হার্ডওয়্যার যা একবারে পাইপলাইনযুক্ত 16xN গুণকে দুটি বিট সম্পাদন করতে পারে (মাল্টিপ্ল্যান্ডের দুটি নিম্ন বিটগুলিতে স্থানান্তরিত এবং ফলাফলের দুটি উচ্চ বিট স্থানান্তরিত) হার্ডওয়ারের চেয়ে আরও ভাল পারফরম্যান্স অর্জন করতে পারে যা একটি চক্রের 8x8 গুণ করতে পারে, যদিও প্রাক্তন কম সার্কিটরি নিতে পারে (এবং পাইপলাইনের কারণে, একটি সংক্ষিপ্ত সমালোচনামূলক ডেটা পাথ থাকে)। কীটি প্রয়োজনীয় কোডটির "অভ্যন্তরীণ লুপ" কেমন হবে তা নির্ধারণ করা এবং কোনও অকার্যকরতা রয়েছে যা সহজেই নির্মূল করা যেতে পারে তা নির্ধারণ করা উচিত।


এই ধরণের অপ্টিমাইজেশনের জন্য বিশেষত কোন ধরণের অপারেশনগুলি উপযুক্ত? আমি উপরের প্রশ্নটি বহুগুণ ক্রিয়াকলাপের প্রকৃতি সম্পর্কে আরও বিশদ সম্পাদনা করেছি। হার্ডওয়্যার-সহায়তা নকশা সত্যিই আকর্ষণীয় মনে হচ্ছে!
stanri

0

আমাদের কার্যকর করার সময় কতটা ইস্যু?

এটি সত্যিই এমন পরিস্থিতির মতো মনে হচ্ছে যেখানে আপনার সত্যিকার অর্থে নরম-এমসিইউ, একটি সংহত হার্ড-এমসিইউ সহ একটি এফপিজিএ, এমনকি একটি পৃথক এমসিইউ ডিভাইস প্রয়োগ করা উচিত এবং আপনার সমস্ত ক্রিয়াকলাপ সিরিয়ালাইজ করা উচিত।

ধরুন আপনার কার্যকর হওয়ার সময় রয়েছে, সফ্টওয়্যারটিতে আপনার এফএফটি করা ডিবাগ করা আরও সহজ এবং সম্ভবত ডিজাইন করাও অনেক সহজ।


1
কোনও এফপিজিএতে একটি নরম কোর সিপিইউতে ভারী গণনা করা বোকামি; আপনি যদি কোনও সঞ্চিত প্রোগ্রাম আর্কিটেকচারে গণনাটি করতে যাচ্ছেন (এমন কিছু যা বিবেচনা করা উচিত), এটি উচ্চ পারফরম্যান্স / ডলার হার্ড সিপিইউ (স) এর কারণে যেখানে আপনি তুলনামূলক-ফাব- এর চেয়ে নমনীয় যুক্তির গতি জরিমানা পরিশোধ করেন না where প্রজন্মের হার্ড যুক্তি।
ক্রিস স্ট্রাটন

@ ক্রিসট্রেটটন - ভাল পয়েন্ট। এই প্রভাবটিতে একটি অতিরিক্ত নোট যুক্ত করেছে।
কনার উলফ

1
এমনকি হার্ড-সিপিইউতে অন্তর্নির্মিত সফ্টওয়্যার ভিত্তিক কাজের জন্য পণ্য প্রচলিত প্রসেসর / জিপিইউগুলিতে একটি মোমবাতি রাখবে না এবং এতে ব্যয় আরও বেশি হবে।
ক্রিস স্ট্রাটন

@ ক্রিসট্রাটটন - আমি ভেবেছিলাম সবচেয়ে সাধারণ সমন্বিত হার্ড-সিপিইউ আর্কিটেকচারগুলি হয় এআরএম বা শক্তি? সেক্ষেত্রে, এটি মূলত হয় একটি পণ্য CPU- র।
কনার ওল্ফ

1
আপনার অন্যান্য এফপিজিএ প্রশ্নটি দেওয়া হয়েছে, এফপিজিএ বোর্ড গঠন করা সম্ভবত একটি শেখার অভিজ্ঞতা হতে পারে যা অনুমানের চেয়ে কিছুটা বেশি ব্যয় করতে পারে। আমি মনে করি এই মুহুর্তে করণীয় হ'ল ক্লায়েন্টকে ট্রায়াল কম্পিউট ক্লাউড রানগুলি (যা শেষ পর্যন্ত ক্রয়কৃত হার্ডওয়্যার হয়ে উঠতে পারে) থেকে কিছু শক্ত দাম / পারফরম্যান্স নম্বর প্রদান করা হবে, এফপিজিএ প্রচেষ্টার উচ্চ মূল্য এবং আরও উচ্চতর ঝুঁকি সম্পর্কে কিছু ধারণা ।
ক্রিস স্ট্রাটন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.