তথ্য পুনরুদ্ধার এবং তথ্য নিষ্কাশন মধ্যে সম্পর্ক এবং পার্থক্য?


11

উইকিপিডিয়া থেকে

তথ্য পুনরুদ্ধার হ'ল তথ্য সংস্থান থেকে তথ্য প্রয়োজনীয়তার সাথে সম্পর্কিত তথ্য সংস্থান প্রাপ্তির ক্রিয়াকলাপ। অনুসন্ধানগুলি মেটাডেটা বা পূর্ণ-পাঠ্য ইনডেক্সিংয়ের ভিত্তিতে হতে পারে।

উইকিপিডিয়া থেকে

তথ্য নিষ্কাশন (আইই) হ'ল কাঠামোগত তথ্য অস্ট্রাস্ট্রাক্টড এবং / বা আধা-কাঠামোগত মেশিন-পঠনযোগ্য ডকুমেন্টগুলি থেকে স্বয়ংক্রিয়ভাবে আহরণের কাজ। বেশিরভাগ ক্ষেত্রে এই কার্যকলাপটি প্রাকৃতিক ভাষা প্রসেসিং (এনএলপি) এর মাধ্যমে মানব ভাষার পাঠ্য প্রক্রিয়াকরণের বিষয়ে উদ্বেগ প্রকাশ করে। মাল্টিমিডিয়া ডকুমেন্ট প্রসেসিংয়ের সাম্প্রতিক ক্রিয়াকলাপগুলি যেমন স্বয়ংক্রিয় টিকাশকরণ এবং চিত্র / অডিও / ভিডিওর বাইরে থাকা সামগ্রীগুলি নিষ্কাশনের তথ্য হিসাবে দেখা যেতে পারে।

তথ্য পুনরুদ্ধার এবং তথ্য নিষ্কাশন মধ্যে সম্পর্ক এবং পার্থক্য কি?

ধন্যবাদ!

উত্তর:


9

তথ্য আহরণ করা হয় একটি ক্যোয়ারী উপর ভিত্তি করে - আপনি কি আপনি তথ্য প্রয়োজন এবং এটা মানুষের বোধগম্য আকারে ফিরিয়ে দেওয়া হয় উল্লেখ করুন।

তথ্য নিষ্কাশন হ'ল কাঠামোগত তথ্য কাঠামো সম্পর্কে - কিছু উত্স দেওয়া সমস্ত (প্রাসঙ্গিক) তথ্য একটি ফর্ম কাঠামোগত যা প্রক্রিয়াজাতকরণ সহজ হবে। এটি মানুষের বোধগম্য আকারে হবে না - এটি কেবল কম্পিউটার প্রোগ্রাম ব্যবহারের জন্যই হতে পারে।

কিছু উত্স:


7

http://gate.ac.uk/ie/ একটি খুব সুন্দর, সংক্ষিপ্ত পার্থক্য দেয়:

তথ্য নিষ্কাশন তথ্য পুনরুদ্ধার নয়: তথ্য নিষ্কাশন traditionalতিহ্যগত কৌশলগুলির থেকে পৃথক যে এটি কোনও সংগ্রহ থেকে পুনরুদ্ধার হয় না যা আশাবাদী কী-ওয়ার্ড অনুসন্ধানের ভিত্তিতে অনুসন্ধানের (সম্ভবত কোনও থিসরাস দ্বারা সংযোজন করা হয়েছে) উপর ভিত্তি করে একটি প্রশ্নের সাথে প্রাসঙ্গিক। পরিবর্তে লক্ষ্যটি হ'ল নথিগুলি (যা বিভিন্ন ভাষায় হতে পারে) থেকে পূর্বনির্ধারিত প্রকারের ইভেন্ট, সত্ত্বা বা সম্পর্কের বিষয়ে গুরুত্বপূর্ণ তথ্যগুলি থেকে বের করা। এই তথ্যগুলি সাধারণত একটি ডাটাবেসে স্বয়ংক্রিয়ভাবে প্রবেশ করা হয়, যা ট্রেন্ডগুলির জন্য ডেটা বিশ্লেষণ করতে, প্রাকৃতিক ভাষার সংক্ষিপ্ত বিবরণ দিতে বা অন-লাইন অ্যাক্সেসের জন্য সহজভাবে পরিবেশন করতে ব্যবহৃত হতে পারে।

এটি চিত্রযুক্তভাবে বলতে:

তথ্য পুনরুদ্ধার প্রাসঙ্গিক নথির সেট পায়:

এখানে চিত্র বর্ণনা লিখুন

তথ্য নিষ্কাশন নথির বাইরে তথ্য পায়:

এখানে চিত্র বর্ণনা লিখুন


2

মডেলিং দৃষ্টিকোণ থেকে তথ্য পুনরুদ্ধার হ'ল পরিসংখ্যান, গণিত, ভাষাতত্ত্ব, কৃত্রিম বুদ্ধিমত্তা এবং এখন ডেটা সায়েন্স সহ বেশ কয়েকটি শাখায় পূর্বাভাস দেওয়া গভীর ক্ষেত্র। অনুশীলনে, ডেটাগুলিতে নিদর্শনগুলি আবিষ্কার করতে এই মডেলগুলি কর্পোরার মধ্যে পাঠ্যের বিপরীতে প্রয়োগ করা হয়। আইআর মডেলগুলি কেবল তাদের ব্যবহারের ক্ষেত্রেই ওভারল্যাপ করে না, তারা অন্যান্য মডেল যেমন কে-মানে বা কে-নিকটতম প্রতিবেশী মডেলগুলির সাথে "অংশীদার" করতে পারে, তবে অন্যান্য মডেলগুলি এলডিএ / এলডিআই এবং কম্পিউটারের ভাষাতত্ত্বের ভ্যানটেজ পয়েন্ট থেকে প্রয়োগ করা যেতে পারে এবং বিষয় মডেলিং তারপরে, শেষ গেমটি এই আবিষ্কারের কিছু ধরণের তথ্য ভিজ্যুয়ালাইজেশন - র‌্যাঙ্কিং, ক্লাস্টারিং এবং সামগ্রিক কাজের পরে। তথ্য পুনরুদ্ধার একটি গুপ্তচর অনুশাসন হতে পারে, তবে গুরুতর প্রচেষ্টা, যা প্রশংসিত হয় প্রতিটি মডেলের গভীর বোঝার জন্য এবং মডেলগুলির মধ্যে মিথস্ক্রিয়াটির জন্য অঞ্চলটি খোলার দিকে যাচ্ছে। আমি "তথ্য ধারণা, পুনরুদ্ধার, এবং পরিষেবাদি সম্পর্কিত সংশ্লেষ বক্তৃতা" সিরিজ আইআর এর একটি ভিত্তি মধ্যে উদ্বেগ জন্য সেরা জায়গা হিসাবে উল্লেখ।

যদিও আমি সম্পূর্ণরূপে আইআর এবং তথ্য এক্সট্রাকশনকে আলাদা করি না, সম্ভবত আইআই এর একটি উপসেট, ধারণা স্তর নিষ্কাশন, সম্পর্কিত অনটোলজগুলি নিষ্কাশনের জন্য এআই-ভিত্তিক ইনফারেন্সিং বিধিগুলির সাথে আইআর প্যাটার্নগুলি প্রয়োগ করে। এই সম্পর্কের গ্রাফিকাল প্রকৃতিটি ওডাব্লুএল এবং আরডিএফ-তে অ্যান্টোলজি মডেলিংয়ের সাথে এবং গ্রাফ ডাটাবেসের সাহায্যে বাড়ানো হচ্ছে যা সম্পর্কের মডেলিংয়ের একটি কম কঠোর বা কঠোর সেটকে মঞ্জুরি দেয় এবং আরও প্রতি সম্পর্কের উপর ভিত্তি করে নিয়ন্ত্রণের পরিবর্তে আরও সম্পর্ক স্থাপনের অনুমতি দেয়। তথ্য নিষ্কাশন গতিশীলভাবে বৃদ্ধি করার ক্ষমতা গবেষকদের কাছে এটির "শৃঙ্খলা" দৃ strongly়ভাবে আকর্ষণীয় করে তোলে।

আইআর এবং আইই উভয়ই আমাদের নিজস্ব "মুহুর্তের সত্ত্বাগুলি" খেলেন - কেউ কেউ "ডায়নামিক অ্যান্টোলজিস" বলেছিলেন - কারও কারও পালান্টিয়ার - ব্যবসা করার জন্য আমাদের সেই উল্লেখযোগ্য সংস্থার নিদর্শন, মডেল, সিমুলেশন এবং ভিজ্যুয়ালাইজেশন প্রয়োজন in তথ্যের নতুন উত্সগুলি এবং বিদ্যমান তথ্যের পরিবর্তনের মুখ। ধারণাগত, সম্পর্কিত, সংজ্ঞা, প্যাটার্ন এবং অ্যান্টোলজিকাল মডেলিংয়ের নমনীয় হতে হবে এবং তাদের ভিজ্যুয়ালাইজেশন একই রকম হতে হবে। তথ্য উত্তোলন এবং ইনফারেন্সিং ক্ষেত্রগুলিতে ওয়াটসনের মতো এআই ইঞ্জিনগুলির ভারী উত্তোলন আইই এবং স্পষ্টতই আইআর ক্ষেত্রগুলিতে স্পষ্টলাইট ফেলেছে। এছাড়াও প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণ এবং মেশিন লার্নিংয়ের সর্বব্যাপী আইআর এবং আইই মডেল এবং ইঞ্জিনগুলিতে মনোযোগ আকর্ষণ করছে। অনুসন্ধান এবং এসইওতে এবং অর্থসূচক ওয়েব মডেলিংয়ে আইআর মডেলগুলির প্রভাব "এর মধ্যে একটি"


1

তথ্য পুনরুদ্ধার একটি নির্দিষ্ট কোয়েরি বা আগ্রহের ক্ষেত্রের জন্য প্রাসঙ্গিক তথ্য ফেরত সম্পর্কে। নোট করুন যে এই তথ্যগুলি সাধারণ নথিগুলির আকারেও হতে পারে, নিশ্চিত যে যথেষ্ট সার্চ ইঞ্জিনগুলি এই জাতীয় কাজের একটি উল্লেখযোগ্য উদাহরণ। আমি বলব যে তথ্য পুনরুদ্ধারের জন্য স্বীকৃত সবচেয়ে গুরুত্বপূর্ণ সত্তা হ'ল নথি / তথ্যের প্রাথমিক সেট এবং কোয়েরি যা "কী অনুসন্ধান করবে" তা নির্দিষ্ট করে।

অন্যদিকে তথ্য নিষ্কাশন হ'ল ডকুমেন্টস বা তথ্যের একটি সেট থেকে সাধারণ জ্ঞান (বা সম্পর্ক) বের করা সম্পর্কে আরও বেশি। নোট করুন যে এখানে নথির সমস্ত বিষয়বস্তু এমন একটি সম্পূর্ণ কর্পাস হিসাবে বিবেচনা করা যেতে পারে যা থেকে জ্ঞান বের করে। অবশ্যই এই ক্ষেত্রে আপনি একরকম নির্দিষ্ট করতে পারেন আপনি কী কী উত্তোলন করতে চান তবে এটি নির্দিষ্ট বিষয় / বিষয়গুলির চেয়ে বৈশিষ্ট্য / সম্পর্ক সম্পর্কে বেশি। বৈশিষ্ট্যগুলি আরও ডোমেন-নির্দিষ্ট, অন্যদিকে সাধারণত সম্পর্কগুলি আরও জেনেরিক পরিস্থিতি coverেকে রাখে।

আবার, অনুসন্ধান ইঞ্জিনগুলির সাহায্যে আপনি সেই নির্দিষ্ট সাইট সম্পর্কে তথ্য থাকতে পারে এমন সাইটগুলি পেতে বলছেন। এটি তথ্য পুনরুদ্ধারের উদাহরণ ।

জন্য তথ্য নিষ্কাশন আপনি যদি এর পরিবর্তে, উদাহরণস্বরূপ, সমস্ত শহর, অথবা ই-মেইল ঠিকানার নাম, যে নথির একটি কর্পাস মধ্যে প্রদর্শিত বের করে আনতে জিজ্ঞাসা করতে পারে। আপনি আরও বেশি জেনেরিক যেতে পারেন, কেবল জ্ঞান আহরণের জন্য জিজ্ঞাসা করেছিলেন। যেহেতু আপনি দেখতে পাচ্ছেন এটি সত্যই জেনেরিক তবে এটি সম্পন্ন হতে পারে, উদাহরণস্বরূপ, কোনও পাঠ্যের প্রতিটি বৈধ বাক্যটির জন্য ফর্ম সাবজেক্ট-অ্যাকশন-অবজেক্টের ট্রিপল্ট অর্জন করে (এটি প্রাকৃতিক ভাষার পাঠ্যপুস্তকের পক্ষে সবচেয়ে উপযুক্ত)।

আপনি যদি আগ্রহী হন তবে এই (এবং অন্যান্য) বিষয়গুলি আর্টি ফিসিয়াল ইন্টেলিজেন্স: একটি আধুনিক পদ্ধতির বইয়ের প্রাকৃতিক ভাষা প্রসেসিং অধ্যায়টিতে বিশদভাবে ব্যাখ্যা করা হয়েছে ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.