এআই-এর কাজের ত্বরণের জন্য কীভাবে ASIC ব্যবহার করবেন?


9

আমরা উইকিপিডিয়া পৃষ্ঠায় পড়তে পারি যে গুগল মেশিন লার্নিংয়ের জন্য একটি কাস্টম এএসআইসি চিপ তৈরি করেছে এবং টেনসরফ্লোয়ের জন্য উপযুক্ত যা এআইকে ত্বরান্বিত করতে সহায়তা করে।

যেহেতু ASIC চিপগুলি তার সার্কিট পরিবর্তন করার ক্ষমতা ছাড়াই একটি বিশেষ ব্যবহারের জন্য বিশেষভাবে কাস্টমাইজ করা হয়েছে, তাই অবশ্যই কিছু স্থির অ্যালগরিদম থাকতে হবে যা অনুরোধ করা হয়েছে।

সুতরাং এএসআইসি চিপস ব্যবহার করে এআই এর ত্বরণটি ঠিক কীভাবে কাজ করে যদি এর অ্যালগরিদম পরিবর্তন করা যায় না? এর কোন অংশটি ঠিক ত্বরান্বিত হচ্ছে?


1
কোন মূলধারার এআই পন্থা যা আমি সচেতন আছি পরিবর্তনের প্রয়োজন অ্যালগরিদম , যদিও অধিকাংশ সংশোধন করার ক্ষমতা উপর নির্ভরশীল তথ্য ইত্যাদি (সংযোগ শক্তি জনসংখ্যার সদস্য)
NietzscheanAI

তাই নেটওয়ার্কের একমাত্র গতিশীল অংশটি কি কোনও ফ্ল্যাশ মেমরি বা ড্রাইভে রাখা হয়?
কেনোরব

মতে en.wikipedia.org/wiki/Application-specific_integrated_circuit , আধুনিক ASICs র্যাম থাকতে পারে ...
NietzscheanAI

উত্তর:


4

টেনসর অপারেশন

বেশিরভাগ এমএল অ্যাপ্লিকেশনগুলির প্রধান কাজটি কেবল (খুব বড়) টেনসর অপারেশনগুলির একটি সেট, যেমন ম্যাট্রিক্সের গুণ lic আপনি কি করতে পারেন যে একটি ASIC সহজে, এবং সমস্ত অন্যান্য আলগোরিদিম ঠিক যে উপরে রান করতে পারেন।


1
একটি গুরুত্বপূর্ণ বিষয় হ'ল টিপিইউতে 8 বিট গুণ করা হয়েছে, যা সিপিইউ দ্বারা প্রদত্ত প্রশস্ত গুণকের চেয়ে অনেক বেশি দক্ষতার সাথে প্রয়োগ করা যেতে পারে। এই জাতীয় একটি স্বল্প নির্ভুলতা যথেষ্ট এবং এটি একটি হাজার হাজার গুণককে একক চিপে প্যাক করতে দেয়।
মার্টিনাস

3

আমি মনে করি অ্যালগরিদম ন্যূনতম পরিবর্তিত হয়েছে, তবে প্রয়োজনীয় হার্ডওয়্যারটি হাড়ের ছাঁটাই হয়েছে।

গেট ট্রানজিশনের সংখ্যা হ্রাস পেয়েছে (সম্ভবত ফ্লোট অপস এবং যথার্থতাও), যেমন ডেটা মুভ অপারেশনের সংখ্যা, সুতরাং শক্তি এবং রানটাইম উভয়ই সাশ্রয় হয়। গুগল প্রস্তাব দেয় যে তাদের টিপিইউ একই কাজটি করতে 10 এক্স ব্যয় সাশ্রয় করে।

https://cloudplatform.googleblog.com/2016/05/Google-supercharges-machine-learning-tasks-with-custom-chip.html


1

ASIC - এটি অ্যাপ্লিকেশন নির্দিষ্ট আইসি বোঝায়। মূলত আপনি প্রোগ্রাম লিখতে একটি চিপ ডিজাইন করতে এইচডিএল । আমি কীভাবে আধুনিক কম্পিউটারগুলি আমার বক্তব্যটি ব্যাখ্যা করার জন্য কাজ করে তাগুলির কেস নেব:

  • সিপিইউস - সিপিইউ হ'ল মাইক্রোপ্রসেসর যার সাহায্যে অনেক সহায়ক আইসির নির্দিষ্ট কাজ সম্পাদন করে। একটি মাইক্রোপ্রসেসর সেখানে শুধুমাত্র একটি একক পাটিগণিত প্রসেসিং ইউনিট (মেয়াদ গঠিত) বলা হয় সঁচায়ক যেখানে একজন মান হিসাবে কম্পিউটেশন শুধুমাত্র এবং শুধুমাত্র সঁচায়ক সঞ্চিত মান সঞ্চালিত হয়, সঞ্চিত হবে। সুতরাং প্রতিটি নির্দেশ, প্রতিটি অপারেশন, প্রতিটি আর / ডাব্লু অপারেশন সঞ্চয়ের মাধ্যমে সম্পন্ন করতে হয় (এজন্য আপনি যখন কোনও ফাইল থেকে কোনও ডিভাইসে লিখেছিলেন তখন পুরানো কম্পিউটারগুলি হিমায়িত করা হত, যদিও আজকাল প্রক্রিয়াটি পরিমার্জন করা হয়েছে এবং সম্ভবত সংযোজকের প্রয়োজন হতে পারে না) বিশেষত ডিএমএ -এর মধ্যে আসার জন্য)। এমএল অ্যালগরিদমগুলিতে আপনাকে ম্যাট্রিক্সের গুণগুলি করতে হবে যা সহজেই সমান্তরালভাবে তৈরি করা যায় তবে আমাদের কেবলমাত্র একটি একক প্রক্রিয়াকরণ ইউনিট রয়েছে এবং তাই জিপিইউ এসেছে।
  • জিপিইউ - জিপিইউতে 100 টি প্রসেসিং ইউনিট রয়েছে তবে তাদের কাছে সিপিইউয়ের বহুমুখী সুবিধার অভাব রয়েছে। সুতরাং এগুলি সমান্তরাল গণনার জন্য ভাল। যেহেতু ম্যাট্রিক্স বহুগুণে কোনও মেমরির ওভারল্যাপিং নেই (মেমরির 2 টি প্রক্রিয়া দ্বারা ম্যানিপুলেট করা হচ্ছে একই অংশ) তাই জিপিইউ খুব ভালভাবে কাজ করবে। যদিও জিপিইউ মাল্টি-ফাংশনাল নয় এটি সিপিইউর মেমোরিতে ডেটা ফিড হিসাবে তত দ্রুত কাজ করবে।
  • ASIC - ASIC আপনি যে কোনও পরিমাণ স্মৃতি দিয়ে দিতে চান তার সাথে কোনও GPU, CPU বা আপনার ডিজাইনের প্রসেসর হতে পারে anything বলুন যে আপনি নিজের বিশেষায়িত এমএল প্রসেসর ডিজাইন করতে চান, ASIC তে একটি প্রসেসর ডিজাইন করতে চান। আপনি 256 বিট এফপি নম্বর চান? 256 বিট প্রসেসর তৈরি করুন। আপনি চান আপনার সমষ্টি দ্রুত হোক? প্রচলিত প্রসেসরের তুলনায় বেশি সংখ্যক বিট পর্যন্ত সমান্তরাল সংযোজক প্রয়োগ করুন? তুমি চাওnকোর সংখ্যা? সমস্যা নেই. আপনি বিভিন্ন প্রসেসিং ইউনিট থেকে বিভিন্ন জায়গায় ডেটা-প্রবাহকে সংজ্ঞায়িত করতে চান? তুমি এটা করতে পার. এছাড়াও সাবধানী পরিকল্পনার সাহায্যে আপনি ASIC এরিয়া বনাম পাওয়ার বনাম গতির মধ্যে একটি বাণিজ্য বন্ধ পেতে পারেন। একমাত্র সমস্যা হ'ল এই সমস্তটির জন্য আপনাকে নিজের মান তৈরি করতে হবে। সাধারণত বেশ কিছু সংজ্ঞায়িত মানগুলি প্রসেসরের ডিজাইনে অনুসরণ করা হয়, যেমন পিনের সংখ্যা এবং তাদের কার্যকারিতা, আইআইইই 754 ভাসমান পয়েন্ট উপস্থাপনের জন্য স্ট্যান্ডার্ড ইত্যাদি, যা প্রচুর পরীক্ষার এবং ত্রুটির পরে উঠে এসেছে। সুতরাং আপনি যদি এই সমস্তগুলি কাটিয়ে উঠতে পারেন তবে সহজেই আপনার নিজের ASIC তৈরি করতে পারেন।

আমি জানি না যে গুগল তাদের টিপিইউ দিয়ে কী করছে তবে স্পষ্টতই তারা হাতের প্রয়োজনীয়তার উপর নির্ভর করে তাদের 8 বিট কোরের জন্য কিছু ধরণের ইন্টিজার এবং এফপি স্ট্যান্ডার্ড তৈরি করেছে। তারা সম্ভবত এটি বিদ্যুৎ, অঞ্চল এবং গতির বিবেচনার জন্য ASIC এ বাস্তবায়ন করছে।


0

কম নির্ভুলতা কনভভ এবং এফসি স্তরগুলিতে উচ্চ সমান্তরাল গণনা সক্ষম করে। সিপিইউ এবং জিপিইউ স্থির আর্কিটেকচার, তবে এএসআইসি / এফপিজিএ নিউরাল নেটওয়ার্ক আর্কিটেকচারের ভিত্তিতে ডিজাইন করা যেতে পারে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.