এনভিডিয়া চিপস উপলব্ধ হওয়ার পরে এমএল কেন কেবল কার্যকর ছিল?


11

আমি আলাপ শোনার প্যানেল দুই প্রভাবশালী চীনা বিজ্ঞানীরা গঠিত দ্বারা: ওয়াং গ্যাং এবং ইয়ু কাই এবং অন্যদের।

অদূর ভবিষ্যতে (3 থেকে 5 বছর) কৃত্রিম বুদ্ধিমত্তার বিকাশের সবচেয়ে বড় বাধা সম্পর্কে জিজ্ঞাসা করা হলে, হার্ডওয়্যার শিল্পে একটি ব্যাকগ্রাউন্ড রয়েছে ইউ কাই বলেছিলেন যে হার্ডওয়্যারটি প্রয়োজনীয় সমস্যা হবে এবং আমাদের বেশিরভাগ অর্থ প্রদান করা উচিত আমাদের মনোযোগ যে। তিনি আমাদের দুটি উদাহরণ দিয়েছেন:

  1. কম্পিউটারের প্রাথমিক বিকাশে, আমরা আমাদের মেশিনগুলিকে এর চিপগুলির সাথে তুলনা করি;
  2. এই বছরগুলিতে কৃত্রিম বুদ্ধিমত্তা যা খুব জনপ্রিয়, এনভিডিয়ার জিপিইউ দ্বারা ক্ষমতাপ্রাপ্ত না হলে প্রায় অসম্ভব হবে।

মৌলিক অ্যালগরিদমগুলি ইতিমধ্যে 1980 এবং 1990 এর দশকে বিদ্যমান ছিল, তবে কৃত্রিম বুদ্ধিমত্তা 3 এআই শীতের মধ্য দিয়ে গিয়েছিল এবং আমরা জিপিইউ দিয়ে মেগা সার্ভারগুলিকে উত্সাহিত মডেলদের প্রশিক্ষণ না দেওয়া পর্যন্ত অনুপ্রেরণামূলক ছিল না।

তারপরে ডাঃ ওয়াং তার মতামত নিয়ে মন্তব্য করেছিলেন যে আমাদেরও সফ্টওয়্যার সিস্টেম বিকাশ করা উচিত কারণ আমরা বিশ্বের সকল জিপিইউ এবং গণনা একসাথে একত্রিত করে থাকলেও আমরা একটি স্বয়ংক্রিয় গাড়ি তৈরি করতে পারি না।

তারপরে, যথারীতি আমার মন ঘুরে গেল এবং আমি ভাবতে শুরু করেছিলাম যে ১৯৮০ এবং ১৯৯০ এর দশকে যারা সুপার কম্পিউটারগুলি পরিচালনা করতে পারে তারা যদি তত্কালীন নিউরাল নেটওয়ার্ক অ্যালগরিদম ব্যবহার করে এবং তাদেরকে প্রচুর বৈজ্ঞানিক ডেটা দিয়ে প্রশিক্ষণ দেয় তবে কী হবে? সেই সময়ে কিছু লোক স্পষ্টতই আমরা এখন তৈরির এআই সিস্টেমগুলি তৈরির চেষ্টা করতে পারি। তবে কেন এআই একটি উত্তপ্ত বিষয় হয়ে ওঠে এবং দশক পরেও অনুপ্রেরণায় পরিণত হয়েছিল? এটি কি কেবল হার্ডওয়্যার, সফ্টওয়্যার এবং ডেটার বিষয়?


3
এই প্রশ্নটি অনুমান করে যে এআই কেবলমাত্র মেশিন লার্নিং, যা স্পষ্টতই ভুল। এটি প্রায় +০+ বছর ধরে চলেছে এবং বর্তমানে উপলব্ধ ডিভাইসগুলির দ্বারা কেবল গভীর শিক্ষার / স্নায়বিক নেটওয়ার্কগুলির খুব সংকীর্ণ ক্ষেত্রটি ত্বরান্বিত হয়েছে। এআই বেশ কয়েকবার আলোচ্য বিষয় হয়ে দাঁড়িয়েছে, প্রতিবার অতিরিক্ত হাইপাইটিভ করে পিছনে ঠেলে দেয়।
অলিভার মেসন

@ অলিভারম্যাসন হ্যাঁ সেই প্রসঙ্গে আমরা এআইকে কেবলমাত্র মেশিন লার্নিং এবং গভীর শিক্ষার দিকে সংকুচিত করেছিলাম।
লারনার ঝাং

ঠিক আছে, আমি সেই অনুসারে শিরোনাম সংশোধন করেছি।
অলিভার মেসন

উত্তর:


14

এআই শিল্পের বুমের জন্য অনেকগুলি কারণ রয়েছে। অনেক লোকেরা যা মিস করছেন তা বেশিরভাগ ক্ষেত্রে এআইয়ের মেশিন লার্নিং অংশে রয়েছে। এটি পূর্ববর্তী সময়ে তাদের তুলনাগুলির সাথে বিভিন্ন সাধারণ কারণে দায়ী করা যেতে পারে:

  • গণিত : এমএল অ্যালগরিদমের পিছনে গণিতগুলি বেশ সহজ এবং দীর্ঘকাল ধরে পরিচিত (এটি কাজ করবে কিনা তা জানা যায়নি)। পূর্ববর্তী সময়ে অ্যালগরিদমগুলি প্রয়োগ করা সম্ভব ছিল না যেখানে একটি চিপের উপর নির্ভরযোগ্য সংখ্যার উচ্চ নির্ভুলতার প্রয়োজন হয়, গ্রহণযোগ্য পরিমাণে। সংখ্যার একটি প্রধান পাটিগণিত অপারেশন বিভাগ আধুনিক প্রসেসরগুলিতে এখনও প্রচুর চক্র গ্রহণ করে। পুরানো প্রসেসরগুলি আধুনিক প্রসেসরের (100x এরও বেশি) চেয়ে দৈর্ঘ্যের গতি কম ছিল, এই বাধাটি সমসাময়িক প্রসেসরের উপর পরিশীলিত মডেলগুলি প্রশিক্ষণ দেওয়া অসম্ভব করে তুলেছিল।
  • 10
  • সমান্তরালকরণ : ম্যাট্রিক্স অপারেশনের সমান্তরালকরণের ধারণাটি নতুন কিছু নয়। এটি কেবল তখনই যখন আমরা ডিপ লার্নিংটিকে ম্যাট্রিক্স অপারেশনের একটি সেট হিসাবে দেখতে শুরু করেছিলাম আমরা বুঝতে পেরেছিলাম যে এটি সহজেই ব্যাপকভাবে সমান্তরাল জিপিইউতে সমান্তরাল হতে পারে, এখনও যদি আপনার এমএল অ্যালগরিদম সহজাতভাবে সমান্তরাল না হয় তবে আপনি সিপিইউ বা জিপিইউ ব্যবহার করেন কিনা তা খুব কমই গুরুত্বপূর্ণ matters যেমন আরএনএন এর)।
  • ডেটা : এমএল বুমের সম্ভবত সবচেয়ে বড় কারণ। ইন্টারনেট ব্যবহারকারীদের কাছ থেকে বিপুল পরিমাণে ডেটা সংগ্রহ করার এবং আগ্রহী পক্ষগুলিতে এটি উপলব্ধ করার সুযোগ সরবরাহ করেছে। যেহেতু একটি এমএল অ্যালগরিদম কেবলমাত্র তথ্যের উপর ভিত্তি করে একটি ফাংশন আনুমানিক হয় তাই অতএব এমএল অ্যালগরিদমের মধ্যে ডেটা একমাত্র সবচেয়ে গুরুত্বপূর্ণ বিষয়। আপনার মডেলের পারফরম্যান্স তত বেশি ডেটা।
  • ব্যয় : একটি এমএল মডেলের প্রশিক্ষণের ব্যয় উল্লেখযোগ্যভাবে হ্রাস পেয়েছে। সুতরাং একটি মডেল প্রশিক্ষণের জন্য একটি সুপার কম্পিউটার ব্যবহার করা ভাল হতে পারে, তবে এটি কি মূল্যবান ছিল? সাধারণ পিসির মতো সুপার কম্পিউটারগুলি শীতলকরণ, স্থান ইত্যাদির ক্ষেত্রে প্রচুর ক্ষুধার্ত সংস্থান করে A সাম্প্রতিক একটি নিবন্ধঅন ​​এমআইটি প্রযুক্তি পর্যালোচনা একটি ডিপ লার্নিং মডেল (এমএল-এর উপ-শাখা) প্রশিক্ষণের কার্বন পদচিহ্নগুলি নির্দেশ করে। এটি পূর্ববর্তী সময়ে সুপার কম্পিউটারে প্রশিক্ষণ দেওয়া কেন অসম্ভব হয়ে উঠত এটি বেশ ভাল সূচক (আধুনিক প্রসেসরগুলি বিবেচনা করে অনেক কম শক্তি গ্রহণ করে এবং উচ্চতর গতি দেয়)। যদিও, আমি নিশ্চিত নই তবে আমি মনে করি এর আগে সুপার কম্পিউটারগুলি "সমান্তরাল + খুব উচ্চ নির্ভুলতা কম্পিউটিং" (আবহাওয়া, জ্যোতির্বিজ্ঞান, সামরিক অ্যাপ্লিকেশন ইত্যাদির জন্য প্রয়োজনীয়) এবং বিশেষত "খুব উচ্চতর প্রাকৃতিক অংশ" মেশিন লার্নিংয়ের দৃশ্যে ওভারকিল ছিল।

আরেকটি গুরুত্বপূর্ণ বিষয় হ'ল আজকাল প্রত্যেকেরই শক্তিশালী কম্পিউটারে অ্যাক্সেস রয়েছে। সুতরাং, যে কেউ নতুন এমএল মডেল তৈরি করতে পারে, প্রাক-বিদ্যমান মডেলগুলিকে পুনরায় প্রশিক্ষণ দিতে পারে, মডেলগুলি পরিবর্তন করতে পারে earlier

এই সমস্ত কারণগুলি এমএলটির প্রতি আগ্রহের দিকে তীব্র উত্সাহ নিয়েছে এবং এটি আজ আমরা দেখতে পাচ্ছি এমন বাড়ে caused আমরা কীভাবে ডিজিটাল প্রসেসরের বাইরে চলে যাচ্ছি এই প্রশ্নটি দেখুন


2

জিপিইউগুলি এআই বুম বেকোজের জন্য আদর্শ ছিল

  • তারা সঠিক সময় আঘাত

এআই দীর্ঘকাল গবেষণা করা হয়েছে। প্রায় অর্ধশতক। যাইহোক, এটি সমস্ত অনুসন্ধান ছিল যে কীভাবে অ্যালগরিদমগুলি কাজ করবে এবং দেখতে হবে। এনভি যখন দেখেছিল যে এআই মূলধারার দিকে চলে যাচ্ছে তখন তারা তাদের জিপিইউগুলির দিকে তাকাচ্ছে এবং বুঝতে পেরেছিল যে প্রোগ্রামিংয়ের তুলনামূলক স্বাচ্ছন্দ্য সহ বিশাল প্যারেলেল প্রসেসিং শক্তিটি সেই সময়ের জন্য আদর্শ। অন্যান্য অনেক লোক তা বুঝতে পেরেছিল।

  • জিপিইউ হ'ল সাধারণ উদ্দেশ্য ত্বরণকারী of

জিপিজিপিইউ সাধারণ কাজের জন্য জিপিইউ সমান্তরাল প্রক্রিয়াকরণ ব্যবহার করার একটি ধারণা। আপনি গ্রাফিক্সকে ত্বরান্বিত করতে পারেন, বা আপনার অ্যালগরিদমকে জিপিইউতে উপলব্ধ কালের সংখ্যাকে সমান করতে পারবেন। এটি এআই সহ সমস্ত ধরণের ব্যবহারের ক্ষেত্রে জিপিইউকে দুর্দান্ত লক্ষ্য করে তোলে। প্রদত্ত যে তারা ইতিমধ্যে উপলব্ধ এবং প্রোগ্রাম করা খুব কঠিন নয়, এআই অ্যালগরিদমগুলি ত্বরান্বিত করার জন্য এটির আদর্শ পছন্দ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.