লিনাক্স সিস্টেমগুলিতে ওসিআর [বন্ধ]


14

আমি সর্বদা ওসিআর প্রযুক্তি ওপেন সোর্স সিস্টেমে পিছনে থাকতে পেয়েছি । শৈশবকাল থেকেই আমি ওক্রপাস প্রকল্পও দেখেছি । আমি যা শুনেছি তা চেষ্টা করেছি লিনাক্স, টেস্টেরাক্টের জন্য উপলব্ধ সেরা ওসিআর ইঞ্জিন এবং এটি ব্যবসায়ের নথিপত্রের জন্য খুব খারাপভাবে পাওয়া গেছে। আরও কোন প্রতিশ্রুতিযুক্ত ওসিআর বাস্তবায়ন আছে? হাতের লেখার ব্যাখ্যার জন্য আরও বেশি আশাবাদী লক্ষ্য কী? এই ক্ষেত্রে * নিক্স সিস্টেমে কী সম্ভব?


1
এটি কি সফ্টওয়্যাররেসে স্থানান্তরিত করা উচিত?
জেফ শ্যাচলার

@ জেফ সম্ভবত এটি সাত বছরের পুরানো নয়, দেওয়া উচিত। তারপর থেকে অনেক কিছু ঘটেছে। ওসিআর এর কয়েকটি ... ;-)
রোয়াইমা

উত্তর:


4

টেসেরাক্ত

2018 হিসাবে, সেরা উপলব্ধ ওপেন সোর্স ওসিআর সফ্টওয়্যারটি তার নতুন এলএসটিএম নিউরাল নেটওয়ার্ক ওসিআর মডেল সহ টেসারেক্ট 4 (বিটা) । এর ওসিআর পারফরম্যান্সটি সংস্করণ 3-এ ব্যবহৃত পূর্ববর্তী ওসিআর মডেলের তুলনায় অনেক ভাল।

উদাহরণ ( output.pdfস্ক্যান করা জার্মান ডকুমেন্টের জন্য একটি পাঠ্য স্তর সহ একটি পিডিএফ ফাইল উত্পাদন করুন ):

$ echo page-*.png > input.list
$ tesseract --oem 1 -l deu input.list output pdf

Stdout এ স্বীকৃত পাঠ্য মুদ্রণ করুন:

$ tesseract --oem 1 -l deu page page-0001.png stdout

ইনস্টল করা ভাষাগুলির তালিকা করুন:

$ tesseract --list-langs

ডাউনলোডযোগ্য প্রশিক্ষণপ্রাপ্ত ডেটা সেট আকারে বেশ কয়েকটি ভাষা / স্ক্রিপ্টের জন্য সমর্থন উপলব্ধ , যেমন ফ্রেকটুরের জন্য এমনকি একটি ডেটা সেট রয়েছে।

নতুন এলএসটিএম মডেলটির সাথে, টেস্ট্রাক্ট ওসিআরসিপাস গবেষণা প্রকল্প থেকে কিছুটা অনুপ্রেরণা নিয়েছে ।

পরীক্ষামূলক সংস্করণ 3 এমনকি ভাল মানের ইনপুট চিত্রগুলিতে তুলনামূলকভাবে খারাপ সম্পাদন করে, অর্থাত্ এটি প্রায়শই ধূলিকণা পিক্সেলগুলিতে একক অক্ষর সনাক্ত করে (কোনও পাঠ্য প্রসঙ্গে বাইরে) এবং সুপরিচিত শব্দগুলিতে সহজেই একক অক্ষর ত্রুটির পরিচয় দেয়।

কীলকাকার

কিউনিফর্ম ওসিআর পারফরম্যান্সটি ততটা খারাপ নয়, তবে এটি সক্রিয়ভাবে রক্ষণাবেক্ষণ করা হয়নি (শেষ প্রকাশ ২০১১, সংস্করণ ১.১) এবং সহজেই ক্র্যাশ হয়ে যায় এবং এর সাথে আরও কিছু সমস্যা রয়েছে:

আপনি লেআউট অ্যালগরিদম এই জাতীয় অক্ষম করতে পারেন:

$ cuneiform --singlecolumn -l ger -f text -o foo.txt image-0001

(-l উত্স নথির ভাষা নির্দিষ্ট করে)

ocrad

$ ocrad -F utf8 image-0001

পাঠ্য ডিফল্টভাবে stdout এ মুদ্রিত হয়।

ব্যবসায়ের নথিতে এটি একটি আন্ডারলাইন করা শব্দটি মিস করেছে, যেখানে কিউনিফর্ম / টেস্ট্রাক্ট / গোকার নেই।

gocr

$ gocr image-0001

পাঠ্য ডিফল্টভাবে stdout এ মুদ্রিত হয়।

হার্ডওয়্যারের

বিবেকী স্বয়ংক্রিয় নথিটি ফিড (ADF) স্ক্যানার, যেমন জন্য অনেক জন্য খুব ভাল সমর্থন আছে Avision এবং ফুজিৎসু বেশী।

স্যানের সাথে অন্তর্ভুক্ত হ'ল scanimageকমান্ড লাইন প্রোগ্রাম যা আপনি স্ক্রিপ্টযুক্ত স্ক্যান পাইপলাইনগুলি তৈরি করতে ব্যবহার করতে পারেন (সিএফ। যেমন আমার adf2pdf.pyস্ক্রিপ্ট)।


আমি কিউনিফর্ম চেষ্টা করেছি। আপনার স্ক্যান করা চিত্র (ছবি নয়) সনাক্ত করতে হবে তবে এটি ভাল কাজ করে। আমি ইয়াগফকে জিইউআই হিসাবে ব্যবহার করেছি।
সের্গেই

3

আমি স্ট্যাকওভারফ্লোতে অনুরূপ একটি প্রশ্ন পেয়েছি এবং সংযুক্ত বাণিজ্যিক পণ্যগুলির মধ্যে অন্যতম, অ্যাশপ্রেশন ওসিআর এসডিকে একটি লিনাক্স সংস্করণ রয়েছে bo


যদিও এই লিঙ্কটি প্রশ্নের উত্তর দিতে পারে, উত্তরের প্রয়োজনীয় অংশগুলি এখানে অন্তর্ভুক্ত করা এবং রেফারেন্সের জন্য লিঙ্কটি সরবরাহ করা ভাল। লিঙ্কযুক্ত পৃষ্ঠাগুলি পরিবর্তিত হলে লিঙ্ক-শুধুমাত্র উত্তরগুলি অবৈধ হতে পারে। - পর্যালোচনা থেকে
টমাস

1
@ থমাস লিঙ্কটি একমাত্র সম্ভাব্য উত্তর, যেহেতু লিঙ্কটি কোনও নির্দিষ্ট সরঞ্জামকে নির্দেশ করেছে যেমন ওপি দ্বারা অনুরোধ করা হয়েছে। সমস্ত লিঙ্ক-কেবল উত্তরগুলি খারাপ নয়। এটি একটি নির্দিষ্ট সফ্টওয়্যারটির নাম এবং এর ওয়েবপৃষ্ঠায় একটি লিঙ্ক দেয়। লিঙ্কটি ভেঙে গেলেও, নামটি থেকে এখনও এটি সন্ধান করা উচিত।
টেরডন

1

কয়েকটি জনপ্রিয় ওসিআর কমান্ড-লাইন সরঞ্জাম রয়েছে:

  • পরীক্ষক ( ReadMe , FAQ) ) (পাইথন)

    এছাড়াও এর জন্য উপলব্ধ: পরীক্ষামূলক। নেট , পরীক্ষামূলক আইওএস

    একটি ওসিআর ইঞ্জিন যা 1985 এবং 1995 এর মধ্যে এইচপি ল্যাবগুলিতে ... এবং এখন গুগলে বিকশিত হয়েছিল। পরীক্ষামূলক সম্ভবত সবচেয়ে সঠিক ওপেন সোর্স ওসিআর ইঞ্জিন উপলব্ধ।

    ব্যবহার:

    tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
    

    উদাহরণ: কমান্ড লাইন / স্ক্রিপ্টের মাধ্যমে বিদ্যমান পিডিএফ অনুসন্ধানযোগ্য (ওসিআর) করুন

  • GOCR

    মুক্ত উত্স অক্ষর স্বীকৃতি। এটি পাঠ্যের স্ক্যান হওয়া চিত্রগুলিকে আবার পাঠ্য ফাইলগুলিতে রূপান্তর করে। জিওসিআর বিভিন্ন ফ্রন্ট-এন্ডের সাথে ব্যবহার করা যেতে পারে যা বিভিন্ন ওএস এবং আর্কিটেকচারে পোর্ট করা খুব সহজ করে তোলে। এটি বিভিন্ন ইমেজ ফর্ম্যাটগুলি খুলতে পারে এবং এর মানটি প্রতিদিনের তুলনায় উন্নত হচ্ছে।

  • ওসিআরপাস FA ( এফএকিউ ) (পাইথন, নুমপি এবং সায়্পাইয়ে লেখা)

    ওসিআর সিস্টেমটি ডকুমেন্ট বিশ্লেষণে সমস্যা সমাধানের জন্য প্লাগেবল লেআউট বিশ্লেষণ, প্লাগেবল চরিত্রের স্বীকৃতি, পরিসংখ্যানগত প্রাকৃতিক ভাষার মডেলিং এবং বহু-ভাষাগত দক্ষতার জন্য বড় আকারের মেশিন লার্নিংয়ের ব্যবহারের উপর দৃষ্টি নিবদ্ধ করে।

    ওসিআরপাস ইঞ্জিন দুটি গবেষণা প্রকল্পের উপর ভিত্তি করে: 90 এর দশকের মাঝামাঝি সময়ে উন্নত এবং মার্কিন সেন্সাস ব্যুরো দ্বারা মোতায়েন করা একটি উচ্চ-পারফরম্যান্স হস্তাক্ষর স্বীকৃতি প্রদানকারী এবং উপন্যাসের উচ্চ-পারফরম্যান্স বিন্যাস বিশ্লেষণ পদ্ধতি।

    ওসিআরপাস হ'ল ডেভলপমেন্ট হ'ল গুগল স্পনসর করে এবং প্রাথমিকভাবে এটি হাই-থ্রুপুট, উচ্চ-ভলিউম ডকুমেন্ট রূপান্তর প্রচেষ্টার জন্য উদ্দিষ্ট। আমরা আশা করি যে এটি অন্যান্য অনেক অ্যাপ্লিকেশনগুলির জন্য একটি দুর্দান্ত ওসিআর সিস্টেমও হবে।

  • টেসনেট 2 (ওপেন সোর্স, ওসিআর, পরীক্ষামূলক,। নেট, ডটনেট, সি #, ভিবি.এনইটি, সি ++ / সিএলআই)

    টেসারেক্ট একটি সি ++ ওপেন সোর্স ওসিআর ইঞ্জিন। টেসনেট 2 হ'ল। নেট সমাবেশ যা ওসিআর করার জন্য খুব সাধারণ পদ্ধতি প্রকাশ করে। টেসনেট 2 অ্যাপাচি 2 লাইসেন্সের অধীনে (যেমন টেসারেক্ট), অর্থাত আপনি বাণিজ্যিক পণ্যগুলিতে অন্তর্ভুক্ত এটির মতো ব্যবহার করতে পারেন।

অন্যান্য ইতিমধ্যে প্রস্তাবিত: লিনাক্সের জন্য এবিওয়াই সি এল আই ওসিআর , অ্যাসপ্রাইজ ওসিআর

আরও পড়ুন:

আরও সম্পূর্ণ তালিকার জন্য, পরীক্ষা করুন: উইকিপিডিয়ায় অপটিক্যাল চরিত্র স্বীকৃতি সফ্টওয়্যারটির তালিকা


0

... ওসিআর "কেবলমাত্র চরিত্রের স্বীকৃতি" এর চেয়ে বেশি। চিত্র পরিচালনা, প্রাক প্রসেসিং - পাঠ্য, চিত্র, টেবিল বা বারকোডগুলি সন্ধান করতে পৃষ্ঠা / বিন্যাস বিশ্লেষণ। স্বীকৃতির জন্য, আপনাকে বিভিন্ন হরফ, আকার এবং ভাষা ব্যবহার করতে হবে। এটি গুরুত্বপূর্ণ কারণ ভাল ফলাফল পেতে আপনাকে অভিধান এবং ভাষার সংজ্ঞা ব্যবহার করতে হবে। অবশেষে লোকেরা পাঠ্যের চেয়ে বেশি রফতানি বিকল্প আশা করে (যেমন, এক্সএমএল, আরটিএফ, বা অনুসন্ধানযোগ্য পিডিএফ)। এসডিকে জন্য কিছু বাণিজ্যিক বিকল্প রয়েছে, তবে সেগুলি সস্তা এবং নিখরচায় নয়।

সম্প্রতি আমি ABBYY থেকে লিনাক্সের জন্য একটি সি এল এল ওসিআর পেয়েছি । একটি বিনামূল্যে 100 পৃষ্ঠার ট্রায়াল রয়েছে।


0

আপনার যদি বাজেট থাকে তবে আমি লিনাক্সের জন্য দৃB়ভাবে ABBYY FineReader ইঞ্জিন সিএলআইয়ের পরামর্শ দিচ্ছি । আমাদের সংস্থাটি এক বছরের জন্য আমাদের ওয়েব-অ্যাপ্লিকেশনটিতে এটি ব্যবহার করে আসছে এবং আমরা লাইসেন্সটি পুনর্নবীকরণের পরিকল্পনা করছি। খুব ভাল স্বীকৃতি মানের, কমান্ড-লাইন ইন্টারফেস, অনেক ভাষায় স্বীকৃতি।


2
এই পণ্যটি ইতিমধ্যে পূর্বের উত্তরে উল্লেখ করা হয়েছিল । উত্তরগুলি সদৃশ করবেন না!
ডেভিড ফোরস্টার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.