শারীরিক পাঠ্য থেকে ডিজিটাল পাঠ্য


9

আমাকে এই প্রশ্নটির সাথে প্রথমে উপসর্গ করা যাক, এই প্রশ্নের জন্য কোন স্ট্যাক এক্সচেঞ্জ সাইটটি সবচেয়ে উপযুক্ত হবে তা আমার কোনও ধারণা নেই তবে আমি ভেবেছিলাম যে লাইফহ্যাকস সম্ভবত কাজ করবে ...

১৯৯৯ সালে আমার মায়ের পরিবারের পাশে একটি বড় পারিবারিক পুনর্মিলন ঘটে (আমার দাদির দশটি বাচ্চা ছিল তাই এটি সত্যিই একটি বড় সমাবেশ ছিল)। আমার এক দূর চাচা এই পুনর্মিলনের জন্য আমাদের পরিবারের ইতিহাসে এক ধরণের বই লিখেছিলেন এবং আমার মা আমাকে বইটি পড়তে দিয়েছিলেন। আমি বিশ্বাস করতে পারছিলাম না এটি কতটা বড় এবং কত গবেষণা বইয়ে গেছে। আমি পুরো ওয়েবসাইটটি এমন একটি ওয়েবসাইটে তৈরি করার একটি উপায় বের করতে চাই যেখানে আমি এটি তৈরি করতে যাচ্ছি তখন আমি এটি আমাদের পরিবারের সবার সাথে ভাগ করে নিতে পারি এবং শেষ পর্যন্ত ইতিহাসটি এই ক্ষুধার্ত বইয়ের চেয়ে দীর্ঘ সময়ের জন্য সংরক্ষণ করতে পারি।

এই পুরো 300 পৃষ্ঠার বইটির শব্দের জন্য আমাকে শব্দটি টাইপ করতে হবে না এই আশায় আমি কীভাবে কেবল পৃষ্ঠাগুলি স্ক্যান করতে এবং সেগুলি ডিজিটাল পাঠ্যে পেতে পারি? স্পষ্টতই আমি ছবি তুলতে এবং ছবিগুলি ব্যবহার করে ওয়েবসাইট তৈরি করতে পারতাম তবে আমার মনে হচ্ছে এটি প্রকৃত পাঠ্য হিসাবে পাওয়া আরও বেশি উপকারী হবে কারণ তখন কেউ যদি কোনও পরিবারের সদস্যের নাম বা এর মতো কিছু সন্ধান করে তবে গুগল অনুসন্ধানে এটি আরও ভাল প্রদর্শিত হতে পারে। এছাড়াও, পরিবারের কেউ যদি কখনও আমাদের পরিবার নিয়ে কোনও গবেষণা প্রকল্প করেন তবে তারা কিছু পাঠ্য অনুলিপি করতে পারবেন এবং আরও সহজেই এটি উল্লেখ করতে পারবেন।

সুতরাং কেউ কি এই পুরাতন পারিবারিক বইটি ডিজিটাল পাঠ্যে পাওয়ার সবচেয়ে ভাল উপায় জানেন?

বইয়ের প্রথম পৃষ্ঠা

বেধ ইঙ্গিত বই

উত্তর:


14

একটি অ্যান্ড্রয়েড ফোন এবং " গুগল লেন্স। " বৈশিষ্ট্যটি সম্প্রতি ফটোগুলি অ্যাপ এবং ক্যামেরার ফটো পর্যালোচনার স্ক্রিনউইভিতে যুক্ত হয়েছে।

গুগল লেন্সের মাধ্যমে ওসিআর আমি যে কোনও ওসিআর সফ্টওয়্যার ব্যবহার করেছি তার বাইরে চমত্কার এবং নির্ভুল।

নীচে কয়েকটি স্ক্রিনশটগুলি সস্তার (100 ইউএসডি) নোকিয়া 3 ব্যবহার করে পদ্ধতির রূপরেখা দেখাচ্ছে, আমার প্রিয় নেক্সাস 4 ভুতটি ছেড়ে দেওয়ার পর থেকে আমি সবচেয়ে ভাল ফোন ব্যবহার করতে পেরেছি।

আমি 1976 সালে মুদ্রিত একটি গ্রীক নৃতাত্ত্বিক বইয়ের একটি নমুনা ওসিআর স্ক্যানের বিষয়ে বিস্তারিত জানাব যা আমি স্ক্যান করার জন্য ছিঁড়ে ফেলার সাহস পাচ্ছিলাম না, মনে হয় এটির মতো চরিত্রের ঘনত্ব এবং টাইপফেস রয়েছে।

আমি এই আসল ছবিটি আদর্শ আলোক শর্তের চেয়ে কম ক্ষেত্রে নিয়েছি, তাই ফোন ক্যামেরায় সমস্ত অটো সেটিংস ব্যবহার করে, ফলাফলটি বাড়ানোর জন্য কোনও বিশেষ ফটো কৌশল বা ফিক্সচার ব্যবহার করা হয়নি, আপনি বলতে পারেন এটি কেবল একটি সরল অপেশাদারভাবে নেওয়া ফোন পিক বই এর পাতা । (কেবল নিশ্চিত করুন যে পাঠ্যটি কেন্দ্রীভূত হয়েছে, কোনও ওসিআর অস্পষ্টভাবে অফ-ফোকাসের পাঠ্যকে বোঝাবেন না)

এখানে চিত্র বর্ণনা লিখুন

গুগল লেন্স আইকনে ক্লিক করুন, ছবি তোলার পরে বা নিজের ফটোতে গুগল ফটো অ্যাপ্লিকেশন ব্যবহার করে পূর্বরূপের মাধ্যমে উপলব্ধ

এখানে চিত্র বর্ণনা লিখুন

এখানে স্কাইনেট- এর ^M^M^M^M^M^Mঅর্থ হ'ল গুগল লেন্স তার যাদু স্ক্যান করছে (বিন্দুগুলি কিছুটা ভয়ঙ্কর তবে তারা আপনাকে কিছুটা জানাতে হয়েছিল যে গুগলআই এআই কাজ করছে, আমার ধারণা)

এখানে চিত্র বর্ণনা লিখুন

ছবিটি স্ক্যান হয়ে গেলে আপনি গুগল লেন্সের ছবিটিতে পাওয়া টেক্সট অঞ্চলগুলি স্পষ্টভাবে বর্ণিতভাবে খুঁজে পেয়েছেন এবং ইতিমধ্যে তাদের পাঠ্যটি স্ক্রিনের নীচের অর্ধেকটি নিয়ে গেছে। আপনি যদি কেবল কিছু অঞ্চল চান এবং অন্যগুলি না চান তবে তাদের নির্বাচন সক্রিয় / নিষ্ক্রিয় করতে কেবল আপনার নির্বাচনের স্পর্শ করুন।

যদি আপনি নিষ্কাশিত পাঠ্যটি স্পর্শ করেন তবে এটি আপনার ফোনের যে কোনও জায়গায় অনুলিপি / পেস্ট করার জন্য আপনার ক্লিপবোর্ডে স্থাপন করা হবে ।

এখানে চিত্র বর্ণনা লিখুন

এরপরে, কেবল একটি Google ডক্স নথিতে পাঠ্যটি পেস্ট করুন । সেখানে, আপনি এইগুলি করতে পারেন: - ঠিক সেখানে বা আপনার পিসিতে যে কোনও ত্রুটি সংশোধন করতে পারেন - দস্তাবেজটি আপনার হৃদয়ের বিষয়বস্তুতে ভাগ করে নিতে পারেন - এটি আপনার সম্পাদনাগুলির লাইভ আপডেটিংয়ের সাথে একটি ওয়েব পৃষ্ঠা হিসাবে প্রকাশ করুন, বা - সরল পাঠ্য, - শব্দ নথিতে এক্সপোর্ট করুন - Open Office নথি, - কিন্ডল সামঞ্জস্যপূর্ণ EPUB reflowing পাঠ্য, অথবা সঙ্গে ইলেকট্রনিক বই - ভাল ওল 'অ DRMd পিডিএফ

এটি যুক্তিযুক্ত হতে পারে যে এটি সম্ভবত প্রকাশনার সবচেয়ে সংক্ষিপ্ততম পথ, আরও বিস্তৃত সম্ভাব্য আউটপুট পছন্দগুলির সাথে।

আপনি এটি একটি একক ডিভাইস, (যথাযথ অ্যাপ্লিকেশনগুলির সাথে ইনস্টল করা অ্যান্ড্রয়েড ফোন) থেকে করতে পারেন এবং মূলত বিনামূল্যে জন্য উচ্চ নির্ভুলতার হারের সাথে এটির সাথে কোনও কাজ করা হবে।

এখানে গুগল ডক্স প্যাস্ট করা টুকরা দেওয়া আছে
এখানে চিত্র বর্ণনা লিখুন

এখানে গুগল ডক্স ইউআরএল শেয়ার, বিনা দ্বিধায় মন্তব্য করুন। দূর থেকে এবং একসাথে দস্তাবেজ সম্পাদনা করতে আপনাকে কেউ সহায়তা করতে পারে।

https://docs.google.com/document/d/1aizUDOHerSraU3fIw6lHLabmLSNsQ7PMXOl1IHHE0RU/edit?usp=drivesdk

অবশেষে এখানে একটি গুগল সাইট ওয়েবসাইট লিঙ্কযুক্ত উত্স হিসাবে পূর্বোক্ত নথিটি ব্যবহার করে প্রকাশিত হয়েছে

https://sites.google.com/h-lo.me/ocrsample

এটি https, ডেস্কটপ এবং মোবাইল সক্ষম এবং স্বাদের উপর নির্ভর করে সাধারণত চোখে ক্ষত হয় না। 15 মিনিটের মোট কাজের জন্য খারাপ নয় এবং কোনও কোডিং নেই।


এখানে একটি পরিশোধন বাকি আছে এবং তা হ'ল গুগল ডকুমেন্টে যথাযথ অনুচ্ছেদ তৈরি করা , যেহেতু গুগল লেন্স নিষ্কাশিত পাঠ্যের প্রতিটি লাইনের পরে একটি হার্ড রিটার্ন সন্নিবেশ করায়, যা প্রতিটি লাইনের নিজস্ব অনুচ্ছেদে তৈরি করে এবং আপনি যদি ব্যবহার করতে চান তবে এটি একটি সমস্যা হয়ে উঠবে গুগল ডক্স বৈশিষ্ট্য যেমন বিষয়বস্তুর সারণী , বা আপনি যখন আপনার দস্তাবেজটি একটি প্রকারের সামঞ্জস্যপূর্ণ ই-পাব ইলেকট্রনিক বইতে রফতানি করেন (রিফ্লুয়িং পাঠ্যকে মেসেজ করে)

আপনি প্রতিটি লাইনে শুরু করতে ব্যাকস্পেস কীটি চাপুন যেখানে উপযুক্ত উপযুক্ত প্রতিটি লাইনে যোগ দিতে পারেন, বা এটি কোনও স্ক্রিপ্টের সাহায্যে স্বয়ংক্রিয় করা যেতে পারে।

সুতরাং, আমি একটি অ্যাপস স্ক্রিপ্ট অ্যাড-অন লিখছি যা আমি শীঘ্রই এই প্রক্রিয়াটি স্বয়ংক্রিয় করতে প্রকাশ করব। এটি হয়ে গেলে আমি আপনাকে এখানে জানাব


দুর্দান্ত বিবরণ। আমি এই নিখরচায় সমাধানটি পছন্দ করি। ধন্যবাদ!
কাইল ব্রাইডেনস্টাইন

আমার আনন্দ! এমনকি আপনার ইতিমধ্যে যা প্রয়োজন সমস্ত কিছু থাকতে পারে! :)
hlecuanda

একটি ঘন বইয়ের জন্য, এটি সত্যিই শ্রম-নিবিড় পদ্ধতি: আপনাকে প্রতিটি পৃষ্ঠা ম্যানুয়ালি ফ্লিপ করতে হবে এবং তারপরে এটি ছবি তোলা উচিত।
হবিস

6

আপনি পর্যায়ক্রমে এটি করতে পারেন। পৃষ্ঠার স্ক্যান হিসাবে অনলাইনে সমস্ত কিছু রেখে এবং যখন আপনি পারেন তখন আপডেট করে শুরু করুন। সেরলক্স ™ প্লাস্টিকের ঝুঁটি বাঁধাই এটিকে আলাদা করে এনে বাঁধাই করাতে সহজ করে তোলে।

মুদ্রণটি একই আকারে সাধারণ সেরিফ প্রকার হিসাবে উপস্থিত বলে মনে হয়, অপটিকাল চরিত্র সনাক্তকরণ সফ্টওয়্যার ব্যবহার করে স্ক্যানগুলি ডিজিটাইজড করা যায়। ওসিআর আপনাকে একটি খসড়া পাঠ্য ফাইল দিতে পারে যা আপনি তার চূড়ান্ত ফর্মের জন্য ওয়েবসাইটে প্রুফ্রেড এবং প্রকাশ করতে পারেন।

একই সময়ে, আপনি ছবি এবং অন্যান্য চিত্রাবলিক উপাদান পরিষ্কার করতে পারেন।

সময় / সংস্থানগুলি আপনার কাছে প্রকল্পের জন্য উপলব্ধ হওয়ার সাথে সাথে আপনি এটি করতে পারেন।


আগের উত্তরের মতো, তবে বিস্তারিত হিসাবে নয়।
ট্রাজান এস্পেলিয়েন

@ ট্রাজানস্পিলিয়ান এর আগের উত্তরটি কী? টাইমস্ট্যাম্প পরীক্ষা করুন। উত্তরটি প্রথম ছিল, হাইকুয়ান্ড জমা দেওয়ার দু'দিন আগে। :)
স্ট্যান

হ্যাঁ তবে এটির অন্যান্য উত্তরের মতো এতটা বিশদ নেই যার কারণেই আমি এইটিকে অন্যটির কাছে গ্রহণ করেছি। এটি প্রথম আসার আগে সার্ভার নয় .. এটি সেরা উত্তর।
কাইল ব্রাইডেনস্টাইন

পুনঃটুইট করেছেন কাইলবিডেনস্টাইন আমি হাইকিউন্ডাকেও উজ্জীবিত করেছি। এটি একটি দুর্দান্ত উত্তর ছিল। যাইহোক, যদি আপনার অ্যান্ড্রয়েড ফোন না থাকে বা গ্লাস অ্যাক্সেস করতে না পারে তবে কী হবে? আমি প্রশ্নের জেনেরিক উত্তর দিয়েছি। :)
স্টান

1
কাইলিব্রিডেনস্টাইন এই ধরনের শব্দগুলির জন্য আপনাকে ধন্যবাদ। আমরা রাজি. আমি মনে করি আপনি অপেক্ষা করে সঠিক কাজটি করেছেন। প্রথম উত্তর না করাই ভাল (যদি না তা হয় কোনো কারণে। সময়সীমা আছে, সব পরে।) আমি আপনার প্রশ্ন এবং একজন সহকর্মী যারা স্কুল থেকে রেকর্ড একটি বিশাল গাদা সঙ্গে একই জিনিস করে রয়েছে hiecuanda এর মহান উত্তর লিঙ্ক পাঠানো ব্রাজিল!
স্টান

2

এটি নিজের কাছে যাওয়ার জন্য এখানে কয়েকটি ভাল উত্তর।

আমি অন্য কাউকে এটির জন্য অর্থ প্রদান করার অভিজ্ঞতাটি যুক্ত করতে চাই।

আমি যুক্তরাজ্যে ডিজিটাইজড মাই বই ব্যবহার করেছি (আমি নিজে যুক্তরাজ্য ভিত্তিক))

ফলাফলগুলি নিয়ে আমি খুব সন্তুষ্ট ছিলাম: প্রতিটি বই পিডিএফ হিসাবে ফিরে আসে যা সন্ধানযোগ্য (এবং অনুলিপিযোগ্য) পাঠ্য রয়েছে। একটি স্ট্যান্ডার্ড পিডিএফ কৌশল ব্যবহৃত হয় যার মাধ্যমে প্রতিটি পৃষ্ঠার মূল চিত্রটি ধরে রাখা হয় তবে একটি পাঠ্য ওভারলে সহ, যেমন আপনি পৃষ্ঠায় মূল পাঠ্যটি হাইলাইট করতে পারেন। খুব ভাল মান। ইউ কে থেকে বিদেশে কেউ হিসাবে, আপনি এখনও তাদের বই পাঠাতে পারেন।

তারা অতিরিক্ত কিন্তু খুব যুক্তিসঙ্গত ব্যয়ে বইটিকে সম্পাদনযোগ্য শব্দ নথি বিন্যাসে রাখার বিকল্প দেয় offer

যদি আপনার কাছে আসলটি ফেরত দেওয়ার প্রয়োজন হয় না, তবে সবচেয়ে সস্তার বিকল্পটি হ'ল ধ্বংসাত্মক স্ক্যানিং চয়ন করা। এই পৃষ্ঠাগুলি পৃথকভাবে বই থেকে নেওয়া এবং স্ক্যান করা হয়। ডিফল্টরূপে, মূল বইটি ফেরত আসেনি, যদিও আমি বিশ্বাস করি আপনি সম্ভবত এটির অতিরিক্ত ব্যয়ে (উদাহরণস্বরূপ রিটার্ন ডাকটিকিটের জন্য) অনুরোধ করতে পারেন তবে পৃষ্ঠাগুলি আলগা হয়ে যাবে, আলাদাভাবে স্ক্যান করার জন্য পৃষ্ঠাগুলি সরিয়ে ফেলা হবে। ধ্বংসাত্মক স্ক্যানিং হ'ল বিকল্পটি আমি আমার সমস্ত বইয়ের জন্য বেছে নিয়েছি এবং আমার কাছে মূলগুলি ফেরত দেওয়ার দরকার নেই।

আপনার যদি মূলটির প্রয়োজন হয় তবে তারা ব্যয় আরও বেশি করে তারা অ-ধ্বংসাত্মক অনুলিপি সরবরাহ করে। যদি আপনি ইতিমধ্যে কোনও বই নিজে স্ক্যান করে থাকেন তবে তারা আপনার নিজের ডিজিটাল স্ক্যানগুলিও গ্রহণ করে - তারা এটি অনুসন্ধানযোগ্য, সক্ষম পিডিএফ বা ওয়ার্ড ডকটিতে অনুলিপি করতে পারে।

তাদের ওয়েবসাইট ঘুরে দেখুন। আমি সত্যিই মনে করি এটি সেরা বিকল্প: অর্থ সাশ্রয়ের জন্য সময় ব্যয় না করে সময় বাঁচানোর জন্য অর্থ ব্যয় করুন।

আমি আমার বই ডিজিটালাইজ করার জন্য কাজ করি না বা সেগুলিতে কোনও আর্থিক আগ্রহ নেই (শেয়ারহোল্ডার বা অন্যথায়)।

মূলত আমি নিজেই ডিএসএলআর ক্যামেরা (ফ্ল্যাটবেড স্ক্যানিংয়ের তুলনায় ফটোগ্রাফি দ্রুত) প্রত্যেকটি পৃষ্ঠা ক্লিপবোর্ড ক্লিপ এবং ব্লু-টাক দিয়ে খোলা রেখে ছবিগুলিতে বইগুলিতে নিজেই "স্ক্যান" করতে শুরু করেছিলাম। তবে আমি এটি শ্রম নিবিড় বলে মনে করেছি।

আপনি যদি এখনও এটি নিজে করতে আগ্রহী হন তবে স্ক্যান টেইলর হ'ল একটি ওপেন সোর্স উইন্ডোজ অ্যাপ্লিকেশন যা ফর্ম্যাট করবে, ডাবল পৃষ্ঠাগুলি / পৃষ্ঠাগুলির জোড়াগুলিকে পৃথক পৃষ্ঠাগুলিতে স্ক্যান করা অনুসারে বিভক্ত করবে, সেগুলি সোজা করবে এবং "ডিয়ারপাট" করবে। ফলস্বরূপ পৃষ্ঠাগুলি পছন্দসই হিসাবে সমতল এবং সোজা প্রদর্শিত হয়, তবে এটি ওসিআর করে না: ফলাফলগুলি এখনও বিটম্যাপ ইমেজ। তবে কমপক্ষে এটি ব্যাচগুলি স্বয়ংক্রিয়ভাবে পৃষ্ঠাগুলির কোনও বিকৃতিটি পরিষ্কার করার পক্ষে চলেছে, বিশেষত অ-ধ্বংসাত্মক অনুলিপি যেখানে বড় বইয়ের জন্য পৃষ্ঠাগুলি সম্পূর্ণ সমতল হওয়ার ব্যবস্থা করা কারও পক্ষে কঠিন is

আপডেট করা হয়েছে

কোনও পরিষেবা দ্বারা প্রদত্ত স্ক্যানিং বিকল্প সম্পর্কে আরও তথ্য যুক্ত করা হয়েছে Added স্ক্যান টেইলরের আরও তথ্য। ব্যাকরণ সংশোধন।


1

এটি করার দ্রুততম উপায় হ'ল আপনার আত্মীয়ের সাথে যোগাযোগ করা এবং দেখুন যে তাদের কাছে এখনও সেই বইটি তৈরি করার জন্য ব্যবহৃত মূল ফাইল রয়েছে। প্রথম পৃষ্ঠার ফটো থেকে আমি বলব এটি কম্পিউটারে তৈরি হয়েছে। এখানে really সত্যিই পুরানো ওয়ার্ড প্রসেসর প্যাকেজ সন্নিবেশ করান from থেকে বর্তমান ফর্ম্যাটে রূপান্তর করুন এবং আপনার কাজ শেষ হয়েছে।

ডিজিটাল ডকুমেন্টে মুদ্রিত উপাদানের স্ট্যাক ঘুরিয়ে দেওয়ার দ্বিতীয় দ্রুততম উপায়:

  1. বাইন্ডিং সরান।
  2. গর্তগুলি থেকে মুক্তি পেতে পৃষ্ঠাগুলির বাম প্রান্তটি কেটে ফেলুন। গর্তগুলি একটি দস্তাবেজ ফিডারের সাথে হস্তক্ষেপ করে।
  3. বইটি দেখুন এবং এমন কোনও ক্রিজ এবং অন্যান্য ক্ষয় উন্মোচন করুন যা কোনও ডকুমেন্ট ফিডারের সাথে হস্তক্ষেপ করবে।
  4. কোনও যুক্তিযুক্ত আধুনিক দ্বৈত প্রিন্টার সন্ধান করুন যার একটি ডকুমেন্ট ফিডার এবং একটি স্ক্যানিং বৈশিষ্ট্য রয়েছে। পিডিএফ থেকে স্ক্যান করুন।

তারপরে স্ক্যান করা পৃষ্ঠাগুলিকে একটি ওয়ার্ড ফাইলে পরিণত করতে যে কোনও ওসিআর প্যাকেজ ব্যবহার করুন। আমি এই উদ্দেশ্যে অ্যাডোব অ্যাক্রোব্যাটের সম্পূর্ণ সংস্করণে ওসিআর বৈশিষ্ট্যগুলি ব্যবহার করি তবে আশেপাশে অনেকগুলি ওসিআর ইঞ্জিন রয়েছে।


0

আপনি খুব ব্যয়বহুল পরিষেবাটি ব্যবহার করতে চাইতে পারেন: সংরক্ষণ করুন -আপনি- মেমরিজ.info। এটি নিজে করার সময়, আমি আমার স্ক্যানারটি ওমনিপেজ, একটি ওসিআর প্রোগ্রামে স্ক্যান করতে ব্যবহার করি এবং তারপরে পিডিএফ ফাইল হিসাবে সংরক্ষণ করি যা সম্পূর্ণ অনুসন্ধানযোগ্য। যেহেতু আপনার প্রকাশনাটি প্লাস্টিকের ঝুঁটিযুক্ত, তাই পৃথক পৃষ্ঠাগুলি স্ক্যান করার পরে আলাদা করা সহজ এবং তারপরে পুনঃতফসিল। উপরের পরামর্শগুলিতে বর্ণিত হিসাবে ছবি তোলাও খুব কার্যক্ষম - অনেক পদ্ধতির মধ্যে একটি ভাল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.