লাভলেস টেস্ট ২.০ সফলভাবে কোন একাডেমিক সেটিংয়ে ব্যবহার করা হয়েছে?


18

২০১৪ সালের অক্টোবরে ডঃ মার্ক রিডেল এআই গোয়েন্দা পরীক্ষার একটি পদ্ধতির প্রকাশ করেছিলেন, যার নাম "লাভলেস টেস্ট ২.০" , মূল লাভলেস টেস্ট (2001 সালে প্রকাশিত) দ্বারা অনুপ্রাণিত হয়ে । মার্ক বিশ্বাস করেছিলেন যে আসল লাভলেস টেস্টটি পাস করা অসম্ভব, এবং তাই, একটি দুর্বল এবং আরও ব্যবহারিক সংস্করণের পরামর্শ দিয়েছেন।

লাভলেস টেস্ট ২.০ অনুমান করে যে কোনও এআই বুদ্ধিমান হওয়ার জন্য এটি অবশ্যই সৃজনশীলতা প্রদর্শন করবে। নিজেই কাগজ থেকে:

লাভলেস ২.০ টেস্টটি নিম্নরূপ: কৃত্রিম এজেন্টকে চ্যালেঞ্জ করা হয়েছে:

  • একটি অবশ্যই টাইপ টির একটি শিল্পকর্ম তৈরি করতে হবে;

  • o সি-সি সি প্রাকৃতিক ভাষায় প্রকাশযোগ্য কোনও মানদণ্ড যেখানে সি বাধার একটি সংখ্যার সাথে সঙ্গতিপূর্ণ হতে হবে;

  • একটি মানব মূল্যায়নকারী এইচ, টি এবং সি বেছে নিয়ে সন্তুষ্ট যে o টি এর একটি বৈধ উদাহরণ এবং সিটির সাথে মিলিত হয়; এবং

  • একজন হিউম্যান রেফারি টি টি এবং সি এর সংমিশ্রণটি গড় মানুষের পক্ষে অবাস্তব না হওয়ার জন্য নির্ধারণ করে।

যেহেতু একজন মানব মূল্যায়নকারীকে এআইয়ের জন্য মারার পক্ষে কিছু সহজ প্রতিবন্ধকতাগুলি পাওয়া সম্ভব, তাই মানবিক মূল্যায়নকারী এআই ব্যর্থ হওয়া অবধি এআইয়ের জন্য আরও বেশি জটিল বাঁধা নিয়ে আসবেন বলে আশা করা যায়। লাভলেস টেস্ট ২.০-এর মূল বক্তব্যটি বিভিন্ন এআই-এর সৃজনশীলতার তুলনা করা , ট্যুরিং টেস্টের মতো 'বুদ্ধি' এবং 'অবিজ্ঞান' এর মধ্যে একটি নির্দিষ্ট বিভাজন রেখা সরবরাহ করা নয়।

তবে, এই পরীক্ষাটি আসলে কোনও একাডেমিক সেটিংয়ে ব্যবহৃত হয়েছিল কিনা তা নিয়ে আমি আগ্রহী, বা এই মুহূর্তে এটি কেবল একটি চিন্তার পরীক্ষা হিসাবে দেখা যায়। লাভলেস টেস্টটি একাডেমিক সেটিংসে প্রয়োগ করা সহজ বলে মনে হচ্ছে (আপনি কেবল কৃত্রিম এজেন্ট পরীক্ষা করতে ব্যবহার করতে পারেন এমন কিছু পরিমিত প্রতিবন্ধকতাগুলি বিকাশ করতে হবে) তবে এটি খুব স্বার্থগতও হতে পারে (মানুষ নির্দিষ্ট কিছু প্রতিবন্ধকতার যোগ্যতার সাথে একমত হতে পারে না এবং একটি এআই দ্বারা উত্পাদিত একটি সৃজনশীল নিদর্শন আসলে চূড়ান্ত ফলাফল পূরণ করে)।

উত্তর:


5

না।

টিএল; ডিআর: লাভলেস টেস্ট ২.০ খুব অস্পষ্ট, এটি বুদ্ধিমত্তার মূল্যায়নের জন্য একে খারাপ-উপযুক্ত করে তোলে। এটি সাধারণত গণনা সৃজনশীলতার গবেষকরা উপেক্ষা করেন, যাদের ইতিমধ্যে সৃজনশীলতার মূল্যায়নের জন্য নিজস্ব পরীক্ষা আছে।

দীর্ঘ উত্তর: গুগল স্কলারের মতে, "লাভলেস টেস্ট ২.০" কাগজের 10 টি উল্লেখ রয়েছে। এই সমস্ত উল্লেখ কেবল লাভলেস টেস্ট ২.০ বিদ্যমান বলে উল্লেখ করার জন্য বিদ্যমান exist প্রকৃতপক্ষে, কমপক্ষে দুটি নিবন্ধ আমি পরামর্শ নিয়েছি ( একটি মানুষের মতো স্ব-সচেতন আচরণ চিহ্নিত করার জন্য একটি অভিনব পদ্ধতি এবং ফ্রেমোটেক: অ্যাডাপটিভ কন্ট্রোল সিস্টেমগুলি মূল্যায়নের জন্য মডুলার টাস্ক-এনভায়রনমেন্ট কনস্ট্রাকশন ফর ফ্রেমওয়ার্ক ) এর পরিবর্তে তাদের নিজস্ব পরীক্ষার প্রস্তাব দিয়েছে instead

ফ্রেমোটেক পেপার লিখেছেন এমন একজন লেখকও লিখেছিলেন উপর তাঁর থিসিস এবং পরোক্ষভাবে লাভলেস টেস্ট ২.০ এবং অন্যান্য অনুরূপ পরীক্ষার সমালোচনা করেছেন:

পাইগেট-ম্যাকগাইভার রুমের সমস্যা [ব্রিংসর্ড এবং লিকাটো, ২০১২], লাভলেস টেস্ট ২.০ [রিডেল, ২০১৪] এবং খেলনা বাক্স সমস্যা [জনস্টন, ২০১০] সমস্তই খুব অস্পষ্টভাবে সংজ্ঞায়িত হওয়ার সতর্কতার সাথে আসে - এই মূল্যায়নের পদ্ধতিগুলি সম্ভবত আসতে পারে বুদ্ধিমত্তার জন্য যুক্তিসঙ্গত মূল্যায়ন সহ, তবে তাদের নিজস্ব ডোমেন-নির্দিষ্ট মূল্যায়নে অংশ নেওয়া দুটি পৃথক এজেন্ট (বা নিয়ন্ত্রণকারী) এর সাথে তুলনা করা খুব কঠিন, এজেন্টরা যখন নির্দিষ্ট মূল্যায়নগুলি পাস করার জন্য তৈরি করা হয় তখন ঘন ঘন এটিই ঘটে।

লাভলেস টেস্ট ২.০ নিয়ে আর একটি বড় সমস্যা হ'ল এআইয়ের সৃজনশীলতা "পরিমাপ" করার জন্য অন্যান্য পরীক্ষার বিস্তার রয়েছে । মূল্যায়ন মূল্যায়ন: কম্প্যুটেশনাল সৃজনশীলতা গবেষণা অগ্রগতি দ্বায়িত্বপ্রাপ্ত , 2011 সালে আনা Jordanous দ্বারা প্রকাশিত (3 বছর আগে লাভলেস টেস্ট 2.0 উদ্ভাবন) এআই সৃজনশীলতা সম্পর্কে গবেষণা কাগজপত্র বিশ্লেষণ করে লিখেছিলেন:

18 টি কাগজ যা তাদের সিস্টেমের সৃজনশীলতা মূল্যায়নের জন্য সৃজনশীলতা মূল্যায়ন পদ্ধতি প্রয়োগ করেছিল, সম্প্রদায়ের মধ্যে কোনও পদ্ধতিই স্ট্যান্ডার্ড হিসাবে আবির্ভূত হয়নি। কল্টনের ক্রিয়েটিভ ট্রিপড ফ্রেমওয়ার্ক ( কল্টন ২০০ 2008 ) প্রায়শই ব্যবহৃত হত ( uses ব্যবহার), রিচির অভিজ্ঞতামূলক মানদণ্ড ( রিচি 2007 ) ব্যবহার করে 4 টি কাগজপত্র ছিল ।

এটি বিবিধ সৃজনশীলতার মূল্যায়নের পদ্ধতির সাথে 10 টি কাগজপত্র ফেলেছে।

"মূল্যায়ন মূল্যায়ন" এর লক্ষ্য ছিল সৃজনশীলতার মূল্যায়নের প্রক্রিয়াটির মানিককরণ করা, এতগুলি সৃজনশীলতা পরীক্ষার প্রসারের কারণে ক্ষেত্রটি স্থবির হওয়ার সম্ভাবনা এড়ানো। আনা জর্দানস এখনও সৃজনশীলতা পরীক্ষাগুলির মূল্যায়নে আগ্রহী ছিলেন, "অগ্রগতির দিকে এগিয়ে যাওয়ার পদক্ষেপ: গণনার সৃজনশীলতার মেটা-মূল্যায়নের জন্য স্ট্যান্ডার্ডস নির্ধারণ" এবং কমপিউটেশনাল সৃজনশীলতার বিষয়ে চারটি পিপিপি'র দৃষ্টিভঙ্গি

"মূল্যায়ন মূল্যায়ন" সৃজনশীলতার মূল্যায়ন করার জন্য সিস্টেমগুলির প্রসারণের ব্যাখ্যা দেওয়ার জন্য কিছু ভাষ্য সরবরাহ করে:

মূল্যায়ন মানগুলি সংজ্ঞায়িত করা সহজ নয়। সৃজনশীলতার মূল্যায়ন করা কঠিন এবং এমনকি আমরা সৃজনশীলতাকে কীভাবে মূল্যায়ন করি তা বর্ণনা করা আরও কঠিন, মানব সৃজনশীলতার পাশাপাশি গণ্য সৃজনশীলতায়ও। প্রকৃতপক্ষে, এমনকি সৃজনশীলতার খুব সংজ্ঞা সমস্যাযুক্ত (প্লুকার, বেগহেটো এবং ডা 2004)। 'সৃজনশীল হওয়া' কী জড়িত তা সনাক্ত করা শক্ত, সুতরাং এর বিরুদ্ধে পরিমাপ করার মতো কোনও মানদণ্ড বা গ্রাউন্ড সত্য নেই।

সৃজনশীলতার এতগুলি পরীক্ষাগুলি ইতিমধ্যে বিদ্যমান (জর্দানস এগুলি অধ্যয়নের ক্ষেত্রে যেভাবে একাডেমিক কেরিয়ার তৈরি করতে পারে) এর অর্থ এই যে কোনও নতুন পরীক্ষা (যেমন লাভলেস টেস্ট ২.০) এর জন্য এমনকি এটি লক্ষ করাও খুব কঠিন (খুব কম উদ্ধৃত করা) )। আপনি যদি এর পরিবর্তে আরও অনেক পরীক্ষা ব্যবহার করতে পারেন তবে কেন আপনি লাভলেস টেস্ট ২.০ এর মতো কিছু ব্যবহার করতে চান?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.