আমি স্ক্যান হওয়া চিত্রগুলিকে কীভাবে অনুসন্ধানযোগ্য পিডিএফ ফাইলে পিডিএফ হিসাবে রূপান্তর করতে পারি? [বন্ধ]


19

আমার কাছে একটি স্ক্যান করা বইয়ের পিডিএফ আছে।

আমি একটি নিখরচায় সফ্টওয়্যার খুঁজছি যা ওসিআর সম্পাদন করবে এবং তারপরে এটি আবার পিডিএফ বা নথি হিসাবে সংরক্ষণের জন্য একটি বিকল্প সরবরাহ করবে।

একটি আছে?


আপনার অর্থ আপনি পিডিএফ-এর চিত্রগুলিকে পাঠ্যে রূপান্তর করতে চান?
ডেভপ্যারিলো

হ্যাঁ, তবে আউটপুট হিসাবে আমি কোনও টেক্সট ফাইল চাই না। আমি ঠিক একই

আপনি পাঠ্য বিন্যাস এবং শৈলী না হারিয়ে এই পিডিএফ রূপান্তর করতে খুব কঠিন সময় কাটাবেন। স্ক্যান করা চিত্রগুলি থেকে কোনও দস্তাবেজ সঠিকভাবে সংরক্ষণ করতে সক্ষম ওসিআর সফ্টওয়্যারটি এখনও খুঁজে পাইনি। কিছু গাধা কাজের জন্য প্রস্তুত করুন (যেমন প্রুফরিডিং ইত্যাদি) :)

উত্তর:


5

আপনি অ্যাডোব অ্যাক্রোব্যাট প্রো এর 30 দিনের ট্রায়ালটি ডাউনলোড করতে পারেন এবং 'ওসিআর পাঠ্য স্বীকৃতি' ফাংশন ('ডকুমেন্ট> ওসিআর পাঠ্য স্বীকৃতি> ওসিআর ব্যবহার করে পাঠ্য সনাক্তকরণ ...') ব্যবহার করতে পারেন। সেটিংস কথোপকথনে, আউটপুট শৈলী হিসাবে 'অনুসন্ধানযোগ্য চিত্র' চয়ন করুন। এটি পৃষ্ঠার চিত্রটি রাখবে তবে ওসিআর'র পাঠ্য এম্বেড করবে যাতে দস্তাবেজটি অনুসন্ধানযোগ্য হবে এবং পাঠ্যটি নির্বাচন করা, অনুলিপি এবং আটকানো যাবে।

ওসিআর চালানোর পরে আপনাকে ওসিআর 'ওসিআর সাসপেক্টস সন্ধান করুন' ফাংশনটি ব্যবহারের বিষয়ে অনিশ্চিত এমন শব্দগুলি নিশ্চিত করতে বা সংশোধন করতে হবে।


যদিও অ্যাডোব নিখরচায় নয়, এটি এখন পর্যন্ত সবচেয়ে সক্ষম ওসিআর সমাধান
জেমস হ্যালি

4

আপনার যদি একটি গুগল অ্যাকাউন্ট থাকে তবে গুগল ডক্সে এখন পিডিএফ ফাইল আপলোড করতে ওসিআর করার জন্য কার্যকারিতা অন্তর্ভুক্ত রয়েছে।

আমি নিজে চেষ্টা করেছি এবং এটি স্বীকৃত ভাল ফর্ম্যাটেড পিডিএফটিতে ন্যায্য ছুরিকাঘাত করে।

ফর্ম্যাটটি বেশ ধ্বংস হয়ে গেছে তবে লেখাটি টিকে আছে বলে মনে হচ্ছে।


4

নিম্নলিখিত পণ্যগুলি ইন্টারনেটে তালিকাবদ্ধ পাওয়া গেছে, কিন্তু আমি সেগুলি ব্যবহার করি নি।

অনলাইন ওসিআর

ওসিআর টার্মিনাল

ওসিআর টার্মিনাল একটি অনলাইন ওসিআর পরিষেবা যা আপনার স্ক্যান করা চিত্র এবং পিডিএফ ফাইলগুলিতে অপটিক্যাল ক্যারেক্টার রিকগনিশন (ওসিআর) সম্পাদন করে এবং সম্পাদনাযোগ্য এবং পাঠ্য সন্ধানযোগ্য নথিগুলিতে রেন্ডার করে।

বিনামূল্যে ওসিআর

ফ্রি- ওসিআর.কম একটি বিনামূল্যে অনলাইন ওসিআর (অপটিক্যাল ক্যারেক্টার রিকগনিশন) সরঞ্জাম। আপনার সরবরাহিত যে কোনও চিত্রের ওসিআর সম্পাদন করতে আপনি এটি ব্যবহার করতে পারেন।
এই পরিষেবাটি নিখরচায়, কোনও নিবন্ধকরণের প্রয়োজন নেই। আমাদের আপনার ইমেল ঠিকানাও দরকার নেই।
শুধু আপনার ইমেজ ফাইল আপলোড করুন। ফ্রি-ওসিআর কোনও জেপিজি, জিআইএফ, টিআইএফএফ বিএমপি বা পিডিএফ নেয় ( কেবল প্রথম পৃষ্ঠায় )। কেবলমাত্র সীমাবদ্ধতাটি হ'ল চিত্রগুলি 2MB এর চেয়ে বড়, বৃহত্তর বা 5000 পিক্সেলের বেশি হওয়া উচিত নয় এবং প্রতি ঘন্টা 10 টি চিত্র আপলোডের সীমা রয়েছে।

মায়েস্ট্রো রিকগনিশন সার্ভারটি বাণিজ্যিক, তবে এটি একটি অনলাইন চেষ্টা-ডেমো রয়েছে।

বিনামুল্যের সফটওয়্যার

ফ্রিওসিআর - কেবল চিত্রের জন্য।

ফ্রিওসিআর হ'ল টেস্টারাক্ট ফ্রি ওসিআর ইঞ্জিন সহ একটি স্ক্যান ও ওসিআর প্রোগ্রাম যা পরীক্ষামূলক জিওআই নামে পরিচিত। এটিতে একটি উইন্ডোজ ইনস্টলার রয়েছে এবং এটি মাল্টি-পেজ টিফস, ফ্যাক্স ডকুমেন্টস পাশাপাশি সংক্ষিপ্ত টিফস সহ বেশিরভাগ চিত্রের ধরণের যা ব্যবহার করে তা নিজেই টেসারেক্ট ইঞ্জিনটি পড়তে পারে না এটি সমর্থন করে এবং এটি সমর্থন করে। এটিতে এখন টোয়েন স্ক্যানিং রয়েছে।

pdfsandwich - pdf -> pdf রূপান্তরকারী conver

ওডিআর স্ক্যান করা বই বা জার্নালের জন্য পিডিএফসানডউইচ একটি কমান্ড লাইন সরঞ্জাম। এটি বহু-কলাম পাঠ্যের জন্যও পৃষ্ঠা বিন্যাসটি সনাক্ত করতে সক্ষম।

মূলত, পিডিএফসানডউইচ একটি মোড়ক স্ক্রিপ্ট যা নিম্নলিখিত বাইনারিগুলিকে কল করে: রূপান্তর, কিউনিফর্ম, জিএস এবং হকার 2 পিডিএফ। এটি ইউনিক্স সিস্টেমে চালিত হিসাবে পরিচিত এবং এটি লিনাক্স এবং ম্যাকোস এক্সে পরীক্ষা করা হয়েছে। এটি মাল্টিপ্রসেসর সিস্টেমে সমান্তরাল প্রক্রিয়াকরণ সমর্থন করে।


আমি সদ্য pdfsandwich ব্যবহার করেছি। এটি কাজ করে এবং এটি নিখরচায়! :) এটি অবশ্যই আমার থিসিসে সাহায্য করবে, ধন্যবাদ!
এডি

দেখে মনে হচ্ছে পিডিএফসানডভিচ চলে গেছে? tobias-elze.de/pdfsandwich
পিয়োটো

@ পিয়োটো: এটি আমার উপরে নেই যা উপরের পিডিএফসানডউইচ যুক্ত করেছে, তবে আপনার পরামর্শ অনুসারে আমি লিঙ্কটি ঠিক করেছি।
harrymc

2

কিউনিফর্ম + হকার 2 পিডিএফ + ঘোস্টস্ক্রিপ্ট : একটি ডিআইওয়াই ওপেন সোর্স সমাধান।

আমি একটি পোস্ট উত্তর একটি সমাধান জড়িত outlining একটি সংস্করণ এখন ওপেন সোর্স এর কুনেইফর্ম OCR করুন সিস্টেম এবং hocr2pdf একসাথে প্রস্তুতকারী Ghostscript পিডিএফ পেজ একসঙ্গে নির্বাণ জন্য।

এটি লিনাক্সের জন্য বিশেষত ছিল তবে আপনি উইন্ডোজের জন্যও কুনিফর্ম এবং ঘোস্টস্রিপ্ট পেতে পারেন। যদিও আমি hocr2pdf বা এর সমতুল্য সম্পর্কে নিশ্চিত নই।


1

এখানে একটি খুব অদ্ভুত পদ্ধতি রয়েছে, যার মধ্যে গুগল সূচী দেওয়া এবং এটি কোনও ওয়েবসাইটে আপনার জন্য ওসিআর দেওয়া, তারপরে এটি পুনরুদ্ধার করা অন্তর্ভুক্ত।


হ্যাঁ, আমি এটিও দেখেছি ... অদ্ভুত সত্যিই :) আমি এটি শেষ করতে পারি ...

0

ইমেজম্যাগিক ইনস্টল করুন । একটি সেন্টিমিডি উইন্ডো বা টার্মিনাল খুলুন:

convert myfile.pdf myfile-%02d.jpg

আউটপুটটি আপনার পিডিএফ, মাইফাইল -00.jpg, মাইফাইল -01.jpg, ইত্যাদির প্রতিটি পৃষ্ঠার জন্য 1 জেপিজি ফাইল হবে etc.

একটি চিত্র প্রোগ্রাম যদিও প্রতিটি চিত্র পাস। আমার এটির সাথে খুব বেশি অভিজ্ঞতা নেই, তবে অনেকগুলি পছন্দ আছে বলে মনে হচ্ছে।

পাঠ্যের প্রতিটি পৃষ্ঠা পিডিএফ-তে রূপান্তর করুন। আপনি আবার চিত্রগ্রাহক দিয়ে এটি করতে পারেন, তবে অন্যান্য উপায়ও রয়েছে:

convert page-%02d.txt -density 300x300 -compress jpeg final.pdf

0

আপনার অনুরোধটি সমস্যার জটিল সমাধান বলে মনে হচ্ছে, যদিও আমি সমস্যাটি সঠিকভাবে বুঝতে পারি না। যে কোন মূল্যে:

কেন এমন পিডিএফ লেখক পাবেন না যা আপনাকে পিডিএফ পৃষ্ঠায় সরাসরি ডেটা প্রবেশের অনুমতি দেবে?


0

পিডিএফ কিউবেড.কম চেষ্টা করুন ইনস্টল করার মতো কিছুই নয়, এটি সবই অনলাইনে হয়ে গেছে। আপনি ওয়েব, ইমেল বা ড্রপবক্সের মাধ্যমে প্রক্রিয়া করার জন্য আপনার দস্তাবেজগুলি পাঠাতে পারেন। স্ক্যান করা পিডিএফ এবং টিআইএফগুলি অনুসন্ধানযোগ্য পাঠ্য পিডিএফসে রূপান্তরিত হয় এবং তারপরে ওয়েব, ইমেল বা ড্রপবক্সের মাধ্যমে পুনরুদ্ধার করা যায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.