যন্ত্র অনুবাদগুলির আসল গুণটি কী?


27

আজ অবধি আমি - একটি এআই সাধারণ মানুষ হিসাবে - স্বয়ংক্রিয় অনুবাদের প্রতিশ্রুতিবদ্ধ এবং অর্জিত উন্নতি দেখে বিভ্রান্ত।

আমার ধারণাটি হ'ল: এখনও অনেকদূর যেতে হবে। বা অন্যান্য ব্যাখ্যা রয়েছে যে খুব সাধারণ উইকিপিডিয়া নিবন্ধগুলির স্বয়ংক্রিয় অনুবাদ (প্রস্তাবিত এবং গুগল দ্বারা সরবরাহ করা) এখনও মূলত নিরীহভাবে পড়া এবং শব্দ করা হয় না, খুব সহজেই পঠনযোগ্য, এবং কেবল খুব আংশিক সহায়ক এবং দরকারী?

এটি ব্যক্তিগত পছন্দগুলির উপর নির্ভরযোগ্য হতে পারে (পঠনযোগ্যতা, সহায়কতা এবং উপযোগিতা সম্পর্কিত) তবে আমার ব্যক্তিগত প্রত্যাশাগুলি খুব খারাপভাবে হতাশ।

অন্য উপায়ে: গুগলের অনুবাদগুলি কি তবুও বেশিরভাগ ব্যবহারকারীর পক্ষে পাঠযোগ্য, সহায়ক এবং দরকারী ?

বা গুগলের কি তার অর্জনগুলি ধরে রাখার কারণ রয়েছে (এবং ব্যবহারকারীদের কাছে তারা সবচেয়ে ভাল দেখাতে পারে না)?


প্রাথমিক ফলাফল: আমরা কেবলমাত্র স্ট্রিংয়ের স্তরে - সমান পদক্ষেপ এবং বোঝার জন্য কৃত্রিম বুদ্ধিজীবীদের সাথে কথা বলতে সক্ষম হওয়া থেকে এখনও অনেক দূরে। তাহলে আমাদের কেন ভয় পাওয়া উচিত? কারণ তারা আমাদের চেয়ে বেশি জানেন - তবে আমরা জানি না?


2
মেশিন অনুবাদ একটি কঠিন সমস্যা, বিশেষত যেহেতু আধুনিক কৌশলগুলি অনুবাদটির পাঠ্য বোঝার চেষ্টা করে না। এটি অনেক ক্ষেত্রে কমবেশি কাজ করে, তবে দর্শনীয়ভাবে ব্যর্থও হতে পারে। আমি ব্যক্তিগতভাবে এটি দেখতে পাই - এটি মনে রেখে - বেশিরভাগ অনুবাদ সহায়ক হয় এবং এমটি সংস্থাগুলি পিছিয়ে রয়েছে বলে আমার বিশ্বাস করার কোনও কারণ নেই। সম্ভবত কিছু ডোমেন-নির্দিষ্ট অ্যাপ্লিকেশন যা আরও বাণিজ্যিকভাবে সংবেদনশীল তবে ব্রড সাধারণ এমটি নয়।
অলিভার ম্যাসন

@ অলিভারমাসন: "আধুনিক কৌশলগুলি অনুবাদটির পাঠ্য বোঝার চেষ্টা করে না" - মূল কথাটি কি বলা যায়? এমটি ফলাফল কীভাবে আমাকে বুঝতে হবে? যথেষ্ট দুঃখিত। (এআই সম্প্রদায়ের কিছু দ্বন্দ্ব খুব স্বাগত জানাবে!)
হান্স-পিটার স্ট্রাইকার

1
@ হান্স-পিটারস্ট্রাইকার: ঠিক আছে, ফ্রেড জিলিনেক লক্ষ্য করেছেন যে গুলি চালানো ভাষাতত্ত্ববিদরা তাঁর ভাষণ শনাক্তকারীকে আরও সঠিক করে তুলেছেন। তার পর থেকে, বিভিন্ন ধরণের মেশিন লার্নিং নিয়ম-ভিত্তিক এআইকে ছাড়িয়ে গেছে এবং এখন স্ট্র্যাকস্টিক স্তরের ব্যতীত বেশিরভাগ এআই সিস্টেমগুলি কীভাবে "সত্যই কাজ করে" তা আমাদের কাছে খুব কমই ধারণা রয়েছে।
কেভিন

2
@ হান্স-পিটারস্ট্রিকার একটি আধুনিক এআই সিস্টেমকে 'বোঝার' কিছু হিসাবে ভাবা সত্যই সহায়ক নয়। এটিকে আরও এমন একটি সিস্টেম হিসাবে ভাবেন যা ইনপুটগুলির একটি সেট নেয় এবং ফলাফলগুলি একটি সেট তৈরি করে। ইনপুটটি একটি ইংরেজি পাঠ্য এবং আউটপুট একটি স্প্যানিশ পাঠ্য হতে পারে। সিস্টেমটি পুরো ইংরেজী পাঠ এবং তাদের সমতুল্য স্প্যানিশ পাঠগুলি থেকে এটি 'শিখেছে'। এর অর্থ কি এটি ইংরেজি বোঝে, বা স্প্যানিশ বোঝে? এটি আরও একটি দর্শনের প্রশ্ন। কার্যত যা গুরুত্বপূর্ণ তা হ'ল এটি কিছুটা নির্ভরযোগ্যতার সাথে ইংরেজি স্প্যানিশ ভাষায় রূপান্তর করতে পারে।
জোশ এলার

উত্তরগুলিতে এটি হালকাভাবে স্পর্শ করা হয়েছিল, তবে আমি মনে করি এটি উল্লেখ করা উপযুক্ত যে উত্তরটি আপনি যে ভাষাগুলির সাথে কথা বলছেন তার উপর নির্ভর করে depends ইংলিশ <-> স্প্যানিশ বলার গুণমানটি ইংরেজি <-> জাপানি থেকে অনেক বেশি।
এমব্রিগ

উত্তর:


21

কে দাবি করেছেন যে মেশিন অনুবাদ একজন মানব অনুবাদকের মতোই ভাল? আমার জন্য, একজন পেশাদার অনুবাদক যিনি অনুবাদে এখন ৩৫ বছর ধরে জীবিকা নির্বাহ করছেন, এমটি মানে আমার দৈনিক মানব মানের অনুবাদটি উত্স পাঠ্যের জটিলতার উপর নির্ভর করে 3 থেকে 5 গুণকে বৃদ্ধি পেয়েছে।

আমি একমত হতে পারি না যে এমটিটির গুণমান বিদেশী ভাষার ইনপুটটির দৈর্ঘ্যের সাথে হ্রাস পায়। অর্থ ও ব্যাকরণগত বিশ্লেষণ সহ পুরানো সিস্টেমগুলির ক্ষেত্রে এটি সত্য ছিল to আমি মনে করি না যে আমি সমস্ত পুরানো সিস্টেমগুলি জানি (আমি সিসট্রান জানি, সিমেন্সের একটি ট্র্যাসি হাতিয়ার যা ডানারের উপহার, এক্সএল 8, ব্যক্তিগত অনুবাদক এবং অনুবাদ হিসাবে একটি সংস্থা থেকে পরের দিকে বিক্রি হয়েছিল), তবে এমনকি একটি পেশাদার সিস্টেমও যার মধ্যে আমি 28.000 ডিএম বিনিয়োগ করেছি (!!!!) খারাপভাবে ব্যর্থ হয়েছে।

উদাহরণস্বরূপ, বাক্য:

এই গ্রীষ্মের গরমের দিনে আমাকে কাজ করতে হয়েছিল এবং এটি পাছার ব্যথা ছিল।

জার্মানিতে বেশ কয়েকটি এমটি সরঞ্জাম ব্যবহার করে অনুবাদ করা যেতে পারে।

ব্যক্তিগত অনুবাদক 20 :

আউফ ডাইসেম হেইইন সোমারটাগ মুস্তে আইচ আরবিটেন, আন এস এ এস ওয়ার ওয়ার ইইন স্মার্জ ইম এসেল।

অনুরোধ :

আন ডাইসেম হেইইন সোমারটাগ মুসতে আইচ আরবিটেন, আন এস এ এস ইয়ার ইইন স্মারজ আইএম এসেল।

ডিপএল :

আন ডাইসেম হেইইন সোমারটাগ মুস্তে আইচ আরবাইটেন আন এস ওয়ার ইইন কোয়াল।

গুগল:

আন ডাইসেম হেইইন সোমারটাগ মুস্তে আইচ আরবাইটেন আন এস ওয়ার যুদ্ধ শ্মারজ ইম আরশ্চ।

আজ, গুগল সাধারণত আমাকে পাঠযোগ্য, প্রায় সঠিক অনুবাদ সহ উপস্থাপন করে এবং ডিপএল আরও ভাল। ঠিক আজ সকালে আমি 3 ঘন্টা মধ্যে 3500 শব্দের অনুবাদ করেছি এবং উত্স পাঠ্য ভুল দ্বারা পূর্ণ ছিল (যদিও চীনা দ্বারা লিখিত) ফলাফল ত্রুটিহীন।


4
আমাদের মধ্যে যারা জার্মান ভাষায় সাবলীল নয় তাদের পক্ষে এটি পরিষ্কার নয় যে এই বিকল্পগুলির মধ্যে কোনটি ভাল এবং খারাপ। আমি জানি যে "এসেল" এর অর্থ "গাধা (প্রাণী)" এবং "আরশ" এর অর্থ "গাধা (দেহের অংশ)"। আমি জানি না "কোয়াল" অর্থ কী, বা যদি "আইন স্মার্জ ইম আরশচ" গ্রহণযোগ্য হয়।
স্টিগ হেমার

3
"শ্মেরজ ইম এসেল" হাস্যকর (এবং ভুল)। "আরশ" হ'ল একটি উচ্চারণমূলক শব্দ, যা আপনি লিখিত জার্মান ভাষায় ব্যবহার করবেন না। "কোয়াল" হ'ল "ব্যথা", সুতরাং বাক্যটি যথাযথ ব্যথার চেয়ে বিরক্তি প্রকাশ করার কারণে যথেষ্ট নির্ভুল না হলেও এটি আরও ভাল পছন্দ IM
অলিভার ম্যাসন

1
@ অলিভারমাসন কোয়াল একটি ভাল অনুবাদ: ডিক.লেও.আর.
ডিউচস্

4
@ অলিভারমাসন আমি একজন স্থানীয় জার্মান স্পিকার এবং আমি এটি যথেষ্ট ভাল হিসাবে বিবেচনা করি
yunzen

5
@ অলিভারমাসন "গাধা ব্যথা" একটি মূর্খতা। "শ্মেরজ ইম আরশ" নয়: কেউ তা বলে না। "কোয়াল" হ'ল ইংলিশ রচনার একটি সঠিক অনুবাদ যা আপনি যা বলেছেন তার বিপরীতে খুব কমই প্রকৃত, শারীরিক ব্যথা বোঝায় (এবং তেমনিভাবে "কোয়াল" আক্ষরিক এবং রূপক ব্যথাও হতে পারে)। আরও প্রসঙ্গ ছাড়াই ডিপএল অনুবাদটি নিখুঁত বলে মনে হয়।
কনরাড রুডলফ

7

গুগলের অনুবাদগুলি দরকারী হতে পারে, বিশেষত যদি আপনি জানেন যে অনুবাদগুলি নিখুঁত নয় এবং আপনি যদি কেবলমাত্র পাঠ্যের অর্থের প্রাথমিক ধারণা পেতে চান (যার গুগলের অনুবাদগুলি কখনও কখনও বেশ বিভ্রান্তিকর বা ভুল হতে পারে)। আমি কোনও গুরুতর অনুবাদ সম্পাদনের জন্য গুগলের অনুবাদ (বা অন্য কোনও মানবেতর অনুবাদক) এর পরামর্শ দেব না, যদি না এটি সম্ভবত একটি সাধারণ বাক্য বা শব্দ না হয় তবে এটি খুব দীর্ঘ পাঠ্য এবং অনানুষ্ঠানিক ভাষা (বা অপবাদ) জড়িত না, অনুবাদগুলি এতে জড়িত ইংরেজি ভাষা বা আপনার কোনও মানব অনুবাদকের অ্যাক্সেস নেই।

0100100

কাগজে মেকিং এআই অর্থপূর্ণ আবার , লেখক এছাড়াও অনুবাদ কাজটি (যা একটি বিশ্বাস করা হয় অসুবিধা নিয়ে আলোচনা এআই-সম্পূর্ণ সমস্যা )। তারা ট্রান্সফরমার (আরও একটি অত্যাধুনিক মেশিন অনুবাদ মডেল) উল্লেখ করেছেন, যা বেশ খারাপ ফলাফল অর্জন করে (বিএলইউ মেট্রিক ব্যবহার করে মূল্যায়ন)।

উপসংহারে, মেশিন অনুবাদ একটি কঠিন সমস্যা এবং বর্তমান মেশিন অনুবাদ সিস্টেমগুলি অবশ্যই একজন পেশাদার মানব অনুবাদকের পাশাপাশি সম্পাদন করে না।


100 বিএলইউ স্কোর মানে মানব স্বর্ণ-মানক অনুবাদ নয়, এর অর্থ এটি রেফারেন্স অনুবাদটির সাথে ঠিক মিলে যায়। একটি বাক্য অনুবাদ করার জন্য সাধারণত একাধিক উপায় রয়েছে, এমনকি মানুষের অনুবাদেও সাধারণত 100 বিএলইউ থাকে না, তবে এটি 50-60 এর মতো বেশি।
জাস্টহালফ

@ জাফরহাল্ফ আমার উত্তরটি আবার পড়ুন।
এনবিরো

1
উত্তরের জন্য ধন্যবাদ, এবং আমার আগের মন্তব্যটি অভদ্র প্রদর্শিত হলে দুঃখিত। আমার আগের মন্তব্যে আমার বক্তব্যটি ছিল যে এই ধারণাটি দেওয়া ভুল যে মানব অনুবাদটি 100 বিএলইউ পয়েন্ট পাবে, যা আপনার বর্তমান উত্তর বলে মনে হচ্ছে।
justhalf

100

5

আপনি বেশ কয়েকটি প্রশ্ন জিজ্ঞাসা করেছেন, যার কয়েকটি নির্দিষ্টভাবে উত্তর দেওয়া যায় না। মেশিন অনুবাদগুলির মানের (এবং এর ইতিহাস) একটি অন্তর্দৃষ্টি দেওয়ার জন্য আমি ক্রিস্টোফার ম্যানিংকে তার বক্তৃতায় উপস্থাপিত '' একটি বাক্য মানদণ্ড '' উল্লেখ করতে চাই । এটিতে একটি চীনা থেকে ইংরেজী উদাহরণ রয়েছে যা গুগল অনুবাদ আউটপুটটির সাথে তুলনা করা হয়। উদাহরণটির সঠিক অনুবাদটি হ'ল:

1519 সালে, কয়েক মিলিয়ন জনসংখ্যা নিয়ে অ্যাজটেক সাম্রাজ্যকে জয় করতে ছয় শতাধিক স্পেনিয়ার্ড মেক্সিকোতে অবতরণ করেছিল। তারা প্রথম সংঘর্ষে তাদের দুই তৃতীয়াংশ সৈন্যকে হারিয়েছিল।

গুগল অনুবাদ নিম্নলিখিত অনুবাদগুলি ফিরিয়ে দিয়েছে।

২০০৯ 1519 ani০০ স্প্যানিয়ার্ড মেক্সিকোতে অবতরণ করেছিল, লক্ষ লক্ষ লোক অ্যাজটেক সাম্রাজ্য জয় করতে পেরেছিল, তাদের ক্ষতির বিরুদ্ধে প্রথম দুই তৃতীয়াংশ সৈন্য ছিল।

২০১১ ১৫১৯ ani০০ স্প্যানিয়ার্ড মেক্সিকোয় অবতরণ করেছে, কয়েক মিলিয়ন মানুষ অ্যাজটেক সাম্রাজ্য জয় করতে পেরেছিল, সৈন্যদের প্রাথমিক ক্ষতি হয়েছিল, তাদের দুই তৃতীয়াংশের লড়াই হয়েছিল।

2013 1519 ani০০ স্প্যানিয়ার্ডস অ্যাজটেক সাম্রাজ্য জয় করতে মেক্সিকোয় অবতরণ করেছিল, কয়েক লক্ষ লক্ষ মানুষ, সেনা বাহিনীর প্রাথমিক দ্বন্দ্বের দুই-তৃতীয়াংশ লোকসান হয়েছিল।

2015 1519 600 স্পেনীয়ার্ড মেক্সিকোতে অবতরণ করেছে, লাখ লাখ মানুষের অ্যাজটেক সাম্রাজ্য সৈন্য তারা সংঘর্ষ ক্ষতির প্রথম দুই-তৃতীয়াংশ জয় করতে।

2017 1519-এ অ্যাজটেক সাম্রাজ্যের লক্ষ লক্ষ লোককে জয় করতে মেক্সিকোয় 600 জন স্প্যানিয়ার্ড নেমেছিল, প্রথম লড়াইয়ে তারা দুই তৃতীয়াংশকে হত্যা করেছিল।

গুগল তাদের সেরা ফলাফলগুলি ধরে রাখুক বা লুকিয়ে রাখুক: আমি সন্দেহ করি। প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (এনএলপি) ক্ষেত্রে কাজ করছেন অনেক দুর্দান্ত গবেষক are গুগলের যদি অনুবাদটির জন্য 'সর্বাধিক অর্জন' হয় তবে গবেষকরা তাড়াতাড়ি বা পরে এটি বের করে আনতে পারবেন। (গুগল কেন তাদের 'বৃহত্তম সাফল্য' লুকিয়ে রাখবে? তারা ওপেন সোর্সের সুবিধা দেখে মনে হচ্ছে, ট্রান্সফর্মার [1] বা বার্ট [2] দেখুন)

বিশেষ দ্রষ্টব্য। এনএলপিতে অত্যাধুনিক আলগোরিদিমগুলির আপডেট হওয়া তালিকার জন্য, এসকিউএডি 2.0 লিডারবোর্ডটি দেখুন

[1] ভাসওয়ানি, আশীষ, এবং অন্যান্য। "আপনার দৃষ্টি নিবদ্ধ করা দরকার" " নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমগুলিতে অগ্রগতি। 2017।

[2] ডেভলিন, জ্যাকব, ইত্যাদি। "বার্ট: ভাষা বোঝার জন্য গভীর দ্বিদ্বন্দ্বী ট্রান্সফর্মারগুলির প্রাক প্রশিক্ষণ।" আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1810.04805 (2018)।


"ভাল ক্ষতিপূরণ গবেষক" এর লিঙ্কটির জন্য অনেক ধন্যবাদ Thanks ক্ষতিপূরণ মনে রেখে সর্বদা জিনিসগুলি আরও ভালভাবে বুঝতে সহায়তা করে (যদিও এই লিঙ্কটি সেট করার সময় আপনার মনে কী ছিল তা আমি জানি না)।
হান্স-পিটার স্ট্রাইকার

তর্কও খুব একটা শক্ত ছিল না। লিঙ্কটি সরানো হয়েছে এবং যুক্তিটি উন্নত করার চেষ্টা করেছে। আমি প্রচুর এনএলপি কাগজ পড়ছি এবং আমার অনুসন্ধানে যথেষ্ট আত্মবিশ্বাসী, তবে যুক্তির পক্ষে সমর্থন পাওয়া মুশকিল।
রিকএইচ

দয়া করে আপনার অনুসন্ধানগুলি সম্পর্কে আমাকে জানান (যদি আপনি কিছু মনে করেন না)। আমার মেল ঠিকানাটি আমার প্রোফাইল পৃষ্ঠায় পাওয়া যাবে।
হ্যান্স-পিটার স্ট্রাইকার

1
2019 :In 1519, 600 Spaniards landed in Mexico to conquer the Aztec empire of millions of people, and they first met two-thirds of their soldiers.
ড্যান এম

4

এটি সত্যিই ভাষার জুড়ি এবং বিষয়বস্তুর বিষয়ের উপর নির্ভর করে। ইংরেজি থেকে / অন্য যে কোনও ভাষায় অনুবাদ করা সাধারণত সেরা সমর্থিত। জনপ্রিয় ভাষাগুলিতে এবং থেকে অনুবাদ করা আরও ভাল কাজ করে, উদাহরণস্বরূপ, ইংরেজী থেকে রোমানিয়ান ভাষায় অনুবাদ করা ইংরেজি থেকে রাশিয়ান এর চেয়ে দরিদ্র অনুবাদ। তবে ইংরেজি থেকে রাশিয়ান বা রোমানিয়ান অনুবাদ করা রাশিয়ান থেকে রোমানিয়ান অনুবাদ করার চেয়ে ভাল than এবং রোমানিয়ান থেকে ইংরেজী অনুবাদ করা রোমানিয়ান থেকে ইংরেজি অনুবাদ করার চেয়ে ভাল।

তবে আপনি যদি অনুবাদকদের সাথে কাজ করতে অভ্যস্ত হন এবং ভাষা, অনুবাদ ভুল এবং বিষয়গুলির সাথে আপনার একটি সুপরিচিত পরিচিতি রয়েছে তবে সেখানে কী থাকার কথা ছিল তা বোঝা সহজ। এবং, সেই সময়ে, কখনও কখনও তাত্ক্ষণিক স্ক্যানিংয়ের জন্য আপনার স্থানীয় ভাষায় অনুবাদ করা কিছু পড়ার পক্ষে এটি দ্বিতীয় ভাষায় পড়ার চেয়ে সহজ।

কম জনপ্রিয় ভাষা (স্পিকারের সংখ্যায় অনুবাদ করার জন্য অগত্যা নয়) আক্ষরিক অনুবাদগুলির চেয়ে অনেক কাছাকাছি যেটি আপনি ব্যক্তিগতভাবে জানেন না এমন দুটি ভাষার জন্য অভিধান ব্যবহার করে আপনি ব্যক্তিগতভাবে যা করবেন তার চেয়ে কিছুটা ভাল।


2

আমি কি ভুল এবং গুগলের অনুবাদগুলি তবুও বেশিরভাগ ব্যবহারকারীর পক্ষে পাঠযোগ্য, সহায়ক এবং দরকারী?

হ্যাঁ, তারা কিছুটা সহায়ক এবং আপনাকে দ্রুত অনুবাদ করার অনুমতি দেয়।

বা গুগলের কি তার বৃহত্তম অর্জনগুলি ধরে রাখার কারণ রয়েছে (এবং ব্যবহারকারীদের কাছে তারা সবচেয়ে ভাল দেখাতে পারে না)?

হতে পারে, আমি জানি না। আপনি যদি অনুসন্ধানের জন্য অনুসন্ধান করেন, গুগল সত্যই প্রচুর ভয়াবহ বোকামি করে তোলে যেমন ব্যবহারকারীরা ইন্টারনেটে যা বলে তা থেকে শেখা, বিশ্বস্ত ইনপুট ডেটা সেট হিসাবে অনুপযুক্ত ডেটা গ্রহণ করা।


2

ইংরেজিতে না লেখার জন্য ক্ষমা চাইছি। অনুগ্রহ করে অনুবাদটি এখানে সন্ধান করুন:

আগ্রহী ব্যক্তিদের এমটি (ডিপিএল) এর মানের ধারণা দেওয়ার জন্য দয়া করে এই সকালে আমি যে পাঠ্যটি নিয়ে কাজ করছিলাম তা থেকে এই উদাহরণটি দেখুন (,,৩০০ শব্দ, সকাল ৯ টায় শুরু হয়েছিল, ডেলিভারি আজ দুপুর ১ টার দিকে এবং এখনও এই পোস্টের জন্য সময় সন্ধান করি)। আমি আমার মন্তব্য পোস্ট করার সময় আমি এই বাক্যটিতে (201 শব্দ) কাজ করছিলাম।

অথবা আপনি এই ওয়েবসাইটে লগইন না থাকাকালীন চলমান বা সক্রিয় হওয়া কোনও প্রক্রিয়া বা অন্যথায় এই ওয়েবসাইটটির অবকাঠামোতে অযৌক্তিক লোডের যথাযথ কার্যকারিতা বা হস্তক্ষেপ বা হস্তক্ষেপ; বা (ঙ) এই ওয়েবসাইটের কোনও পৃষ্ঠা "ক্রল," "স্ক্র্যাপ," বা "স্পাইডার" করতে ম্যানুয়াল বা স্বয়ংক্রিয় সফ্টওয়্যার, ডিভাইসগুলি বা অন্যান্য প্রক্রিয়াগুলি ব্যবহার করুন; বা (চ) ডিকম্পাইল, বিপরীত প্রকৌশলী, অথবা অন্যথায় এই ওয়েবসাইটের উত্স কোড পাওয়ার চেষ্টা করুন।

ডিপিএল এটি ফেরত দেয়:

সিয় ভার্সিচারান, গ্যারান্টিয়ার আন্ড ভার্ফ্লিচটেন সিচ গেঞ্জেনবার এবিসি, ডাস সিয়ে মারা যান নিচ টু ওয়ার্নডেন: (ক) বেটারজারিচে, মিসব্রুচলিচে ওভার অ্যান্ডিভিটেটেন ডার্চজুফুহেন, ডাই অ্যানগাস ফের মরে অ্যাঞ্জারস ডায়েঙ্গার রিজার্ট রিসার্টসে ওডার (খ) মেটালাইজেন ওডার অফর্ডারজেন, মাই ডুজু সিস্ট ওভার সিড, পাসওয়ার্ডার, কন্টেন্ট ওভার প্রাইভেট ইনফর্মেশন ওয়েবসাইট এবং ওয়েবসাইট নিউজর্ন ডিজাইনের ওয়েবসাইটের জন্য পোস্ট করা যেতে পারে; ওডার (সি) মারা শিখরাইট ইইনস কমপুর্নেটজার্ভর্স ভারলেটজেন, পাসওয়ার্টার ওডার সিচিরহেটসওয়ার্চ্লিসালুংস্কোডস ন্যাকেন, অবৈধ মেটেরিয়াল (আইনশ্লাইলিচ মেটেরিয়াল, ডেস অলস বেডরোহ্লিক ওডার অবজেক্ট অ্যাঞ্জেলিয়ান ওয়েস্টার্ন কাউন্ট), আর্টজার্জেনজেন্ট আচারেজ die ausdrücklich verboten sind; ওডার (ডি) মাইলিস্ট, শ্রোতা ওভার ফর্ম ফটোগুলি ও অটো-রিসপন্ডার ফটোগুলি "স্প্যাম" ওয়েবসাইটের অধীনে কাজ করে নিন, ওয়েবসাইটটি প্রকাশিত হবে, ওয়েব সাইটের ওয়েবসাইট বা অ্যান্ড্রাইজিংয়ের কাজ শুরু করবে বেলাস্টং ডের ইনফ্রাস্ট্রাক্টর ডাইজার ওয়েবসাইট স্টোর; ওডার (ঙ) ম্যানুয়েল ওডার অটোমেটিসিয়ার সফটওয়্যার, গ্লিট ওডার অ্যান্ডের প্রোসেস ভার্ভেন্ডেন, ইউ এম ইইন সাইট ডাইজার ওয়েবসাইট zu "ক্রলন", ক্রুডজেন, স্পুড স্পেন ওডার স্পু স্পিনেন; ওডার (চ) ডেকম্পিলিয়েরেন, জুরাকজুয়েন্টউইকেলেন ওডার অ্যান্ডারওয়েটিগ জিউ ভার্সুচেন, ডান কুইলকোড ডাইজার ওয়েবসাইটের ওয়েবসাইট। ডাই অ্যাসেজফর্ট ওয়ার্ল্ড ওভার অ্যাক্টিভিয়ার ওয়েডডেন, আপনি কেবল ওয়েবসাইটের জন্য কাজ করতে পারবেন না, ফাইটিং ফিরকশন এর ওয়েবসাইটের জন্য কাজ করতে পারেন; ওডার (ঙ) ম্যানুয়েল ওডার অটোমেটিসিয়ার সফটওয়্যার, গ্লিট ওডার অ্যান্ডের প্রোসেস ভার্ভেন্ডেন, ইউ এম ইইন সাইট ডাইজার ওয়েবসাইট zu "ক্রলন", ক্রুডজেন, স্পুড স্পেন ওডার স্পু স্পিনেন; ওডার (চ) ডেকম্পিলিয়েরেন, জুরাকজুয়েন্টউইকেলেন ওডার অ্যান্ডারওয়েটিগ জিউ ভার্সুচেন, ডান কুইলকোড ডাইজার ওয়েবসাইটের ওয়েবসাইট। ডাই অ্যাসেজফর্ট ওয়ার্ল্ড ওভার অ্যাক্টিভিয়ার ওয়েডডেন, আপনি কেবল ওয়েবসাইটের জন্য কাজ করতে পারবেন না, ফাইটিং ফিরকশন এর ওয়েবসাইটের জন্য কাজ করতে পারেন; ওডার (ঙ) ম্যানুয়েল ওডার অটোমেটিসিয়ার সফটওয়্যার, গ্লিট ওডার অ্যান্ডের প্রোসেস ভার্ভেন্ডেন, ইউ এম ইইন সাইট ডাইজার ওয়েবসাইট zu "ক্রলন", ক্রুডজেন, স্পুড স্পেন ওডার স্পু স্পিনেন; ওডার (চ) ডেকম্পিলিয়েরেন, জুরাকজুয়েন্টউইকেলেন ওডার অ্যান্ডারওয়েটিগ জিউ ভার্সুচেন, ডান কুইলকোড ডাইজার ওয়েবসাইটের ওয়েবসাইট। zu kratzen, zu spinnen oder zu spinnen; ওডার (চ) ডেকম্পিলিয়েরেন, জুরাকজুয়েন্টউইকেলেন ওডার অ্যান্ডারওয়েটিগ জিউ ভার্সুচেন, ডান কুইলকোড ডাইজার ওয়েবসাইটের ওয়েবসাইট। zu kratzen, zu spinnen oder zu spinnen; ওডার (চ) ডেকম্পিলিয়েরেন, জুরাকজুয়েন্টউইকেলেন ওডার অ্যান্ডারওয়েটিগ জিউ ভার্সুচেন, ডান কুইলকোড ডাইজার ওয়েবসাইটের ওয়েবসাইট।

এই অনুচ্ছেদটি সামঞ্জস্য করতে আমার প্রায় 5 থেকে 10 মিনিট সময় লেগেছে।

অনুবাদক হিসাবে, আমি জানি যে আমি মেশিন অনুবাদে নির্ভর করতে পারি না, তবে আমি সময়ের সাথে সাথে বিভিন্ন সিস্টেমের সুনির্দিষ্ট বৈশিষ্ট্য এবং দক্ষতাগুলি শিখেছি এবং আমি কীভাবে মনোযোগ দিতে হবে তা আমি জানি।

এমটি আমাকে আমার কাজে অনেক সাহায্য করে।


2
লক্ষ্য করুন যে আইনী পাঠ্যগুলি আরও ভাল স্বয়ংক্রিয় অনুবাদ প্রদান করে, যেহেতু এই ক্ষেত্রে বহুভাষিক পাঠ্যের বালতিলোড রয়েছে।
কোওরা ফ্যানস

1

এটি একটি মন্তব্য হিসাবে এত উত্তর হবে না।

গুণটি বেশ কয়েকটি বিষয়ের উপর নির্ভর করে, যেমন (হারুন উপরে বলেছে) 1) ভাষার জুটি এবং 2) বিষয়, তবে 3) জেনার এবং 4) মূলটির স্টাইল এবং 5) আপনার সমান্তরাল পাঠ্যের পরিমাণ এমটি সিস্টেম প্রশিক্ষণ।

মঞ্চ স্থাপনের জন্য, আজকাল সমস্ত এমটি সমান্তরাল পাঠগুলির উপর ভিত্তি করে, এটি দুটি পৃথক ভাষায় একটি পাঠ্য, সম্ভবত একটির অন্যটির অনুবাদ (বা উভয়ই কিছু তৃতীয় ভাষার অনুবাদ); যখন সমান্তরাল পাঠগুলিতে নির্দিষ্ট শব্দ থাকে না তখন সম্ভাব্যভাবে অভিধানগুলি (সম্ভবত রূপের প্রক্রিয়া দ্বারা সহায়তা করা) ব্যাকঅফ হিসাবে ব্যবহার করা হয়।

তদুপরি, অন্যরা যেমন বলেছে, একটি এমটি সিস্টেম কোনওভাবেই এর অনুবাদ করা পাঠগুলি বোঝে না; এটি কেবল অক্ষরের স্ট্রিংগুলি এবং অক্ষর দ্বারা গঠিত শব্দের ক্রমগুলি দেখে এবং এটি এর আগে অনুবাদ করা গ্রন্থগুলিতে অনুরূপ স্ট্রিং এবং ক্রমগুলির সন্ধান করে। (ঠিক আছে, এটি এর চেয়ে কিছুটা জটিল, এবং গণ্য ব্যবস্থাতে শব্দার্থবিজ্ঞানের বিষয়ে চেষ্টা করার চেষ্টা করা হয়েছিল, তবে আপাতত এটি বেশিরভাগ স্ট্রিং।)

1) ভাষা বিভিন্ন হয়। কিছু ভাষার প্রচুর আকারবিজ্ঞান থাকে যার অর্থ তারা একক শব্দ দিয়ে কাজ করে যা অন্যান্য ভাষাগুলি বেশ কয়েকটি শব্দের সাথে করে। একটি সাধারণ উদাহরণ হ'ল স্প্যানিশ 'ক্যান্টেরেমোস' = ইংরেজি "আমরা গান করব" be এবং একটি ভাষা এমন কিছু কাজ করতে পারে যা অন্য ভাষা এমনকি স্প্যানিশ ভাষায় অনানুষ্ঠানিক / ফর্মাল (তু / উস্টেড) পার্থক্যের মতো বিরক্ত করে না, যার ইংরেজির সমান পরিমাণ নেই। অথবা একটি ভাষা শব্দবিজ্ঞানের সাথে এমন জিনিসগুলি করতে পারে যা অন্য ভাষা শব্দের সাথে থাকে। অথবা ভাষাটি যে স্ক্রিপ্টটি ব্যবহার করে তা শব্দের সীমাও চিহ্নিত করতে পারে না (চাইনিজ এবং কয়েকটি অন্যান্য)। দুটি ভাষা যত বেশি পৃথক হবে, এমটি সিস্টেমের মধ্যে তাদের মধ্যে অনুবাদ করা তত কঠিন হবে। পরিসংখ্যানমূলক এমটি-তে প্রথম পরীক্ষাগুলি ফরাসী এবং ইংরেজির মধ্যে হয়েছিল,

২) বিষয়: বাইবেলে যদি আপনার সমান্তরাল পাঠ থাকে (যা প্রায় কোনও জোড়ের লিখিত ভাষার জন্য সত্য), এবং আপনি আপনার এমটি সিস্টেমকে সেগুলি থেকে প্রশিক্ষিত করেন তবে ইঞ্জিনিয়ারিং পাঠগুলিতে এটি ভাল করার আশা করবেন না। (ঠিক আছে, বাইবেলটি এমটি সিস্টেমগুলি প্রশিক্ষণের মানদণ্ডের তুলনায় খুব কম পরিমাণে পাঠ্য, তবে ভান করুন :-))) বাইবেলের শব্দভাণ্ডার প্রকৌশল পাঠগুলির চেয়ে খুব আলাদা এবং বিভিন্ন ব্যাকরণটির ফ্রিকোয়েন্সিও তাই বাক্য। (ব্যাকরণ মূলত একইরকম, তবে ইংরেজিতে উদাহরণস্বরূপ, আপনি বৈজ্ঞানিক ও প্রকৌশল পাঠ্যে আরও অনেক প্যাসিভ ভয়েস এবং আরও যৌগিক বিশেষ্য পেয়েছেন))

3) জেনেরা: যদি আপনার সমান্তরাল পাঠ্যটি সমস্ত ঘোষণামূলক হয় (যেমন ট্র্যাক্টর ম্যানুয়ালগুলি, বলুন), ডায়ালগের ফলাফলের এমটি সিস্টেমটি ব্যবহার করার চেষ্টা করা ভাল ফলাফল পাবে না।

4) স্টাইল: হিলারি বনাম ডোনাল্ড ভাবুন; জনপ্রিয় জনপ্রিয়। একের উপর প্রশিক্ষণ অন্যটিতে ভাল ফলাফল পাবে না। অনুরূপভাবে প্রাপ্তবয়স্ক স্তরের উপন্যাসগুলিতে এমটি সিস্টেমকে প্রশিক্ষণ দেওয়া এবং এটি শিশুদের বইয়ে ব্যবহার করা।

5) ভাষার জুটি: ইংরেজিতে প্রচুর পাঠ্য রয়েছে এবং রাশিয়ান এবং ইগবো ভাষায় সমান্তরাল পাঠগুলি খুঁজে পাওয়ার সম্ভাবনার চেয়ে ইংরাজীতে অনেকগুলি পাঠ্য রয়েছে যা প্রদত্ত ইংরেজি পাঠ্যের সমান্তরাল কিছু অন্যান্য ভাষায় পাঠ্য খুঁজে পাওয়ার সম্ভাবনা অনেক বেশি। (এটি বলেছিল যে, ভারতের ভাষার মতোও এর ব্যতিক্রম হতে পারে)) স্থূল সাধারণীকরণ হিসাবে, এমটি সিস্টেমকে প্রশিক্ষণের জন্য আপনাকে এ জাতীয় সমান্তরাল পাঠগুলি আরও ভাল ফলাফল করতে হবে।

সংক্ষেপে, ভাষা জটিল (যে কারণে আমি এটি পছন্দ করি - আমি একজন ভাষাবিদ)। সুতরাং এটি অবাক হওয়ার কিছু নেই যে এমটি সিস্টেমগুলি সর্বদা ভাল কাজ করে না।

বিটিডাব্লু, মানব অনুবাদকরা সর্বদা হয় তেমন ভাল করেন না। এক-দু'দশক আগে, আমি এমটি সিস্টেমের প্রশিক্ষণ উপকরণ হিসাবে ব্যবহার করার জন্য, মানব অনুবাদকদের ইংরেজিতে নথির অনুবাদ পাচ্ছিলাম। কিছু অনুবাদ বোঝা শক্ত ছিল এবং কিছু ক্ষেত্রে যেখানে আমরা দু'জন (বা আরও বেশি) মানব অনুবাদকের কাছ থেকে অনুবাদ পেয়েছি, অনুবাদকরা একই দস্তাবেজগুলি পড়ছিলেন বলে বিশ্বাস করা শক্ত ছিল।

এবং পরিশেষে, এখানে (প্রায়) কখনই কেবল একটি সঠিক অনুবাদ হয় না; প্যাসেজ অনুবাদ করার একাধিক উপায় রয়েছে, যা আপনি চান তা (ব্যাকরণগত শুদ্ধতা, শৈলী, ব্যবহারের ধারাবাহিকতা, ...) এর উপর নির্ভর করে কমবেশি ভাল হতে পারে। "নির্ভুলতা" এর সহজ কোনও পরিমাপ নেই।


1

আশ্চর্যজনকভাবে অন্যান্য সমস্ত উত্তর খুব অস্পষ্ট এবং এটি মানব অনুবাদক পিওভের কাছ থেকে পৌঁছানোর চেষ্টা করুন। আসুন এমএল ইঞ্জিনিয়ারে স্যুইচ করি।

অনুবাদ সরঞ্জাম তৈরি করার সময়, আমাদের প্রথম প্রশ্নগুলির যেটি বিবেচনা করা উচিত তা হ'ল "আমাদের সরঞ্জামটি কীভাবে কাজ করে তা আমরা কীভাবে পরিমাপ করব?"

ওপি যা জিজ্ঞাসা করছে তা মূলত।

এখন এটি কোনও সহজ কাজ নয় (কিছু অন্যান্য উত্তর কেন তা ব্যাখ্যা করে)। একটি উইকিপিডিয়া নিবন্ধে মেশিন অনুবাদ ফলাফলগুলি মূল্যায়নের বিভিন্ন উপায়ে উল্লেখ করা হয়েছে - উভয় মানবিক এবং স্বয়ংক্রিয় স্কোর বিদ্যমান রয়েছে (যেমন বিএলইউ , এনআইএসটি , এলইআরপি )।

নিউরাল নেটওয়ার্ক কৌশলগুলির উত্থানের সাথে সাথে এই স্কোরগুলি উল্লেখযোগ্যভাবে উন্নত হয়েছিল।

অনুবাদ একটি জটিল সমস্যা। অনেকগুলি জিনিস সঠিক (বা ভুল) যেতে পারে এবং কম্পিউটার অনুবাদ সিস্টেম প্রায়শই কিছু সূক্ষ্মতা উপেক্ষা করে যা মানব বক্তার পক্ষে দাঁড়ায়।

আমি মনে করি আমরা যদি ভবিষ্যতের কথা চিন্তা করি তবে কয়েকটি বিষয় রয়েছে যার উপর আমরা নির্ভর করতে পারি:

  • আমাদের কৌশলগুলি আরও উন্নত হচ্ছে, আরও বিস্তৃত পরিচিত এবং পরীক্ষিত। এটি দীর্ঘমেয়াদে নির্ভুলতার উন্নতি করতে চলেছে।
  • আমরা এমন নতুন কৌশল বিকাশ করছি যা অ্যাকাউন্টগুলিতে ভেরিয়েবলগুলিকে আগে উপেক্ষা করা বা কেবল আরও ভাল কাজ করতে পারে।
  • বর্তমানে বিদ্যমান অনুবাদ মডেলগুলির মধ্যে অনেকগুলি অন্যান্য ভাষায় অনুবাদ করার জন্য প্রায়শই "পুনঃব্যবহৃত" হয় (উদাহরণস্বরূপ, গুগল অনুবাদক ব্যবহার করে পোলিশ থেকে চাইনিজ (traditionalতিহ্যবাহী) অনুবাদ করার চেষ্টা করুন - আপনি "ওয়ান" দিয়ে শেষ করবেন, যা প্রমাণ হিসাবে দেখানো হয়েছে গুগল পোলিশকে ইংরেজিতে এবং পরে ইংরেজিতে চাইনিজ ভাষায় অনুবাদ করে)। এটি সম্ভবত একটি ভাল পদ্ধতির নয় - আপনি প্রক্রিয়াটিতে কিছু তথ্য হারাতে চলেছেন - তবে এটি এমন একটি যা এখনও কাজ করবে, তাই গুগলের মতো সংস্থাগুলি এমন ভাষাগুলিতে এটি ব্যবহার করে যেখানে তাদের পর্যাপ্ত কর্মশক্তি বা ডেটা নেই। সময়ের সাথে আরও অধিকতর বিশেষায়িত মডেল উপস্থিত হবে, যা পরিস্থিতির উন্নতি করবে।
  • এছাড়াও, পূর্ববর্তী পয়েন্ট হিসাবে বলা হয়েছে, আরও এবং আরও ডেটা কেবল মেশিন অনুবাদকে উন্নত করতে সহায়তা করবে।

সংক্ষিপ্তসার হিসাবে, এই জটিল সমস্যাটি সমাধান না হলেও অবশ্যই একটি ভাল উপায়ে রয়েছে এবং ভাল-গবেষিত ভাষা যুগলের জন্য কিছু চিত্তাকর্ষক ফলাফলের অনুমতি দেয়।


"আশ্চর্যজনকভাবে অন্য সমস্ত উত্তর ...", অন্য সমস্ত উত্তর নয়। আমি "কিছু অন্যান্য উত্তর" বা "সর্বাধিক অন্যান্য উত্তর" বলব।
এনবিরো

0

"বা গুগলের কী কী অর্জন রয়েছে তা ধরে রাখার কারণ রয়েছে (এবং ব্যবহারকারীদের কাছে তারা যে সর্বোত্তম প্রদর্শিত করতে পারে তা না দেখায়)"

যদি তারা হয় তবে তারা কী ধরেছে তা আশ্চর্যজনক হবে । গুগল প্রাকৃতিক ভাষা প্রসেসিংয়ে প্রচুর শক্তিশালী কাগজপত্র প্রকাশ করে , সেগুলি সহ যেগুলি কলা ফলাফলের স্থিতি পায় বা উল্লেখযোগ্য ধারণাগত অগ্রগতি অর্জন করে । তারা খুব দরকারী ডেটাসেট এবং সরঞ্জাম প্রকাশ করেছে । গুগল সেখানকার কয়েকটি সংস্থার মধ্যে একটি যা কেবল বর্তমান গবেষণার প্রবণতা ব্যবহার করছে না, তবে সক্রিয়ভাবে সাহিত্যে অবদান রাখছে।

যন্ত্র অনুবাদ কেবল একটি কঠিন সমস্যা। কাজটি ভাল করার জন্য একজন ভাল মানব অনুবাদক উভয় ভাষায় সাবলীল হওয়া দরকার। প্রতিটি ভাষার নিজস্ব আইডিয়াম এবং অ-আক্ষরিক বা প্রসঙ্গ নির্ভর নির্ভর অর্থ থাকবে। কেবলমাত্র দ্বৈত ভাষার অভিধান থেকে কাজ করলে ভয়াবহ ফলাফল পাওয়া যায় (কোনও মানব বা কম্পিউটারের জন্য), সুতরাং শব্দগুলি কীভাবে ব্যবহৃত হয় তা শিখতে আমাদের একাধিক ভাষায় বিদ্যমান বিদ্যমান কর্পোরায় আমাদের মডেলগুলি প্রশিক্ষণ করতে হবে (এনবি হ্যান্ড-সংকলিত বাক্যাংশ) অনুবাদ টেবিলগুলি বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে ; তারা কেবল পুরো গল্পই হতে পারে না)। কিছু ভাষার জোড়া জন্য, সমান্তরাল কর্পোরার প্রচুর পরিমাণে হয় (যেমন ইইউ ভাষার জন্য, আমাদের ইউরোপীয় সংসদের সম্পূর্ণ প্রক্রিয়া রয়েছে)। অন্যান্য জোড়গুলির জন্য, প্রশিক্ষণের ডেটা অনেক স্পার্সার। এমনকি আমাদের প্রশিক্ষণের ডেটা থাকলেও ব্যবহারযোগ্য কম শব্দ এবং বাক্যাংশ রয়েছে যা প্রায়শই শেখার মতো পর্যাপ্ত উপস্থিত হয় না।

এটি আরও বড় সমস্যা হিসাবে ব্যবহৃত হত, যেহেতু প্রতিশব্দগুলির জন্য অ্যাকাউন্টে কঠিন ছিল। যদি আমাদের প্রশিক্ষণের তথ্যগুলিতে "কুকুরটি বলটি ধরেছিল" এর বাক্যগুলি থাকে তবে "কুকুরছানাটি বলটি ধরেছিল" নয়, তবে আমরা দ্বিতীয় বাক্যটির কম সম্ভাবনা নিয়ে শেষ করব। প্রকৃতপক্ষে, এরকম অনেক ক্ষেত্রে সম্ভাব্যতা শূন্য থেকে রোধ করার জন্য উল্লেখযোগ্য স্মুথিংয়ের প্রয়োজন হবে ।

গত 15 বছর বা তার মধ্যে নিউরাল ভাষার মডেলগুলির উত্থান এই সমস্যার সাথে ব্যাপকভাবে সহায়তা করেছে, শব্দের মধ্যে সংযোগগুলি শিখার আগে শব্দগুলিকে একটি সত্যিকারের মূল্যবান সিন্থেটিক স্পেসে ম্যাপ করার অনুমতি দিয়ে । এটি এমন মডেলগুলিকে শিখতে দেয় যা অর্থের সাথে একত্রে থাকা শব্দগুলি শব্দার্থক স্পেসেও একত্রে খুব কাছাকাছি থাকে এবং এইভাবে এর প্রতিশব্দটির জন্য কোনও শব্দ পরিবর্তন করা যুক্ত বাক্যটির সম্ভাব্যতাকে খুব বেশি প্রভাবিত করে না। word2vecএটি এমন একটি মডেল যা এটি খুব ভালভাবে চিত্রিত করে; এটি দেখিয়েছিল যে আপনি উদাহরণস্বরূপ, "কিং" এর জন্য শব্দার্থক ভেক্টর নিতে পারেন, "পুরুষ" এর জন্য ভেক্টর বিয়োগ করতে পারবেন, "মহিলা" এর জন্য ভেক্টর যুক্ত করতে পারবেন এবং ফলস্বরূপ ভেক্টরটির নিকটতম শব্দটি "রানী" ছিল। একবার নিউরাল ল্যাঙ্গুয়েজ মডেলগুলির উপর গবেষণাটি আন্তরিকতার সাথে শুরু হয়ে গেলে আমরা অবিলম্বে এবং বিস্তীর্ণতার বৃহত ড্রপগুলি দেখতে শুরু করি (উদাহরণস্বরূপ, মডেলগুলি প্রাকৃতিক পাঠ্য দ্বারা কীভাবে বিভ্রান্ত হয়ে পড়েছিলেন) এবং আমরা বিএইলইউ স্কোরের সাথে সম্পর্কিত বৃদ্ধি দেখতে পেয়েছি (অর্থাত্ অনুবাদটির গুণমান) এখন যেগুলি ভাষা মডেলগুলি মেশিন অনুবাদ সিস্টেমে সংহত করা হচ্ছে।

মেশিন অনুবাদের এখনও যেমন মানের মানব অনুবাদের ভাল হিসাবে নয়, এবং খুব সম্ভবত হবে না যে ভাল যতক্ষণ না আমরা সম্পূর্ণরূপে বিজ্ঞ এআই ফাটল। তবে ভাল মানব অনুবাদক ব্যয়বহুল, অন্যদিকে ইন্টারনেট অ্যাক্সেস সহ প্রত্যেকের কাছে মেশিন অনুবাদক রয়েছে। মানব অনুবাদটি আরও ভাল কিনা তা প্রশ্ন নয়, বরং যন্ত্রটি সেই মানের মানের কতটা কাছে যায়। এই ফাঁকটি সঙ্কুচিত হয়ে আসছে এবং সঙ্কুচিত হতে চলেছে।


আমি এই পদ্ধতির পছন্দ করি না - তবে এটি স্বাদ এবং মতামতের বিষয়। "মানব অনুবাদক ব্যয়বহুল" "" অনুবাদ / সাধক / বোঝার "অনুবাদ ব্যতীত করা আমার দুঃখ বোধ করে। তাহলে অনুবাদ কি সব সম্পর্কে?
হান্স-পিটার স্ট্রাইকার

@ হান্স-পিটারস্ট্রিকার অনুবাদটি এমন লোকদের সাথে যোগাযোগ করতে সক্ষম হবেন যার সাথে আপনি একটি সাধারণ ভাষা ভাগ করেন না। মেশিন অনুবাদ বর্তমানে আমাদের কিছুটা ভাল করার অনুমতি দেওয়ার জন্য যথেষ্ট যথেষ্ট, যদিও ফলাফলগুলি অনুবাদগুলি প্রায়শই অ-নেত্রজগত বা অ-নেটিভ স্পিকারের মতো শব্দযুক্ত হয়। (অব্যাহত ...)
রে

"শিখেছি / সাধক / বোঝার" দ্বারা আপনি কী বোঝাতে চাইছেন তার উপর নির্ভর করে আমরা ইতিমধ্যে এটি করে চলেছি। অর্থার্থক ভেক্টরকে ম্যাপিং এটাই; শব্দগুলি একটি ভেক্টর স্পেসে এম্বেড করা থাকে যা তাদের অন্তর্নিহিত অর্থ উপস্থাপন করে। আমি সংযুক্ত সুটসকিভার কাগজটি ("ধারণাগত" হিসাবে) আসলে পুরো বাক্যটি একটি শব্দার্থ ভেক্টরের সাথে ম্যাপিং করে এবং সেই ভেক্টরকে লক্ষ্য ভাষায় একটি বাক্যে রূপান্তরিত করে অনুবাদ করে । সুতরাং একটি ধরণের "বোধগম্যতা" অবশ্যই সেখানে ঘটছে। (অব্যাহত ...)
সত্যজিৎ

অন্তর্নিহিত বাক্য গঠন (যেমন বাক্য গঠন) শিখেছে এমন মডেলগুলিও বিদ্যমান রয়েছে এবং এইটিকে নিউরাল মডেলগুলিতে একীকরণের কাজও করা হয়েছে , যদিও এই মুহুর্তে, মডেলগুলি যে কোনও মুহুর্তে বাক্যটির কোন অংশগুলিতে মনোযোগ দেওয়া উচিত তা শিখেন সুস্পষ্ট সিনট্যাকটিক মডেলগুলির চেয়ে এই ধরণের জিনিস পরিচালনা করতে আরও কার্যকর হতে to (অব্যাহত ...)
রে

আপনি যদি ভাবেন না যে এই ধরণের "বোধগম্যতা" সত্যিকারের বোঝার জন্য গণ্য হয়, তবে ট্যুরিং টেস্টে পাস হওয়া একটি এআই ছাড়া পুরোপুরি নিরাপদ হিসাবে কী গণ্য হবে ? মনে রাখবেন যে আমি কখনই বলিনি যে আমরা পুরোপুরি নিরাপদ এআই তৈরি করতে পারি না (আমি এটি বলতে পারি না যে এটি কতটা সময় নেবে; এটি আমার ক্ষেত্রের অংশ নয় But তবে আমার সেখানে সন্দেহ নেই যে আমরা শেষ পর্যন্ত সেখানে যাব)। তবে আমি যে মডেলগুলি এখানে বর্ণনা করছি সেগুলি হ'ল আমরা এখন কী ব্যবহার করছি এবং লোকেরা যোগাযোগের সুযোগ দেওয়ার ক্ষেত্রে তারা মোটামুটি ভালভাবে কাজ করে। এআই গবেষণা সবগুলিই "যথেষ্ট ভাল" এর ধারাবাহিকভাবে আরও ভাল সংস্করণ পাওয়ার বিষয়ে
রে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.