একটি বড় বইকে ডিজিটাল ফর্ম্যাটে রূপান্তর করার জন্য ব্যবহারিক ওসিআর সমাধান?


12

আমি এই গত সপ্তাহান্তে আমার পিতামহীর জায়গায় এসেছি। আমার দাদি তার পারিবারিক ইতিহাসের এই দৈত্যাকার (1400 ডলার পৃষ্ঠা) বইটি 1630 বা তারও পরে ফিরে গেছে। আমি যে বিশাল দৈত্য, আমি ভেবেছিলাম এটি একটি ডেটাবেজে সংরক্ষিত এবং ওয়েব থেকে উপলব্ধ সমস্ত তথ্য চতুর হবে। আমি সমস্ত ওয়েব প্রোগ্রামিং এবং নিয়মিত এক্সপ্রেশনগুলি হ্যান্ডেল করতে পারি এবং কী না, তবে যা আমি জানি না তা বই থেকে কম্পিউটারে পাঠ্য পাওয়ার সর্বোত্তম উপায়।

আমি জানি যে এক ধরণের ওসিআর প্রয়োজনীয় হবে, আমি যে সামান্য গবেষণা করেছি তা থেকে মনে হয় আমার বিকল্পগুলি হ'ল:

  1. ক্যামেরায় প্রতিটি পৃষ্ঠার একটি ছবি তুলুন এবং ওসিআর সফ্টওয়্যার দিয়ে ছবিগুলি প্রসেস করুন
  2. প্রতিটি পৃষ্ঠা স্ক্যান করতে একটি স্ক্যানার ব্যবহার করুন, তারপরে ওসিআর সফ্টওয়্যার দিয়ে প্রক্রিয়া করুন
  3. মত, হাতে অনুষ্ঠিত ডিভাইসের কিছু ধরনের ব্যবহার এই

এই সমস্যা মোকাবেলার সর্বোত্তম উপায় সম্পর্কে কারও কি কোনও ধারণা আছে? আমি বইটি ধ্বংস করতে চাই না, কারণ যতদূর আমি জানি, এটি প্রতিস্থাপন করা যায় না। আমি সম্ভবত কোনও সময়ই কোনও বড় বই স্ক্যান করতে যাচ্ছি, তাই আমি মনে করি না যে আমি কোনও ধরণের ডিভাইসে 250 ডলারের বেশি ব্যয় করতে চাই। আমি এখানে কিছু ম্যানুয়াল প্রচেষ্টা আপত্তি করি না (আমি বুঝতে পারি এটি সম্ভবত বেশ কয়েক মাস সময় নেবে) তবে আমি সবচেয়ে কার্যকর পদ্ধতিটি খুঁজে পেতে চাই।

বইটি সম্পর্কে দ্রষ্টব্য: এটি প্রায় 20 বছর বয়সী, সুতরাং এটি বেশ ভাল আকারে। এটি একরঙা এবং পৃষ্ঠাগুলি হলুদ হতে শুরু করে নি। যদিও এটি এতটাই বিশাল, আমি পাঠ্যটি বাইন্ডিংয়ের কাছাকাছি নেমে গেলে সম্ভাব্য ছায়াগুলির বিষয়ে চিন্তা করি।

ocr 

1
সাইড নোটে, বইটি যদি কেবল 20 বছরের পুরানো হয় এবং তথ্যটি 1600 এর দশকে ফিরে যায় তবে আসল উত্স উপাদানটি কোথায়? এটি পাশাপাশি ক্যাপচার ভাল হতে পারে!
ক্রেগ

হ্যাঁ, এটা খুব সুন্দর হবে। আমি দেখতে যাচ্ছি যে আমি মূল লেখককে সন্ধান করতে পারি কিনা।

উত্তর:


8

আমি জুড়ে এসেছিল এই লাইফহ্যাকারে উপর বেশ কিছু সময়ের পিছনে, এবং এটি আগের থেকে আমার শীর্ষ DIY প্রকল্প এক হয়েছে।

এখানে চিত্র বর্ণনা লিখুন

আইফোনটিকে কোনও ক্যামেরা বা ইমেজিংয়ের মাধ্যমে প্রতিস্থাপন করুন এবং আপনার কাছে কোনও হাই সফটওয়্যার, এমনকি (ইউআরএস!) এমএস অফিস ...;) সহ ওসিআরের জন্য প্রস্তুত দুর্দান্ত উচ্চ-রেজিলিপ জেপিগের একটি স্ট্যাক পাবেন;

সস্তা। কার্যকরী। , DIY। আপনি এই মত একটি ধারণা পরাজিত করতে পারবেন না।

সম্পাদনা: মন্তব্যগুলি ছায়া, পৃষ্ঠা কার্লিং ইত্যাদির বিষয়ে কিছু পয়েন্ট উত্থাপন করেছে, আক্ষরিক ফটো-অনুলিপি গ্রন্থাগারের পাঠ্যপুস্তক যারা আছে তাদের পক্ষে যথেষ্ট সমাধান করা যায়।

বইটি আলোকিত করার জন্য একাধিক আলোক উত্স যুক্ত করুন এবং ছায়াগুলি দূর করুন।

পৃষ্ঠাগুলিতে 90 ডিগ্রি বইটি তির্যক করুন মাঝখানে বাঁধাইয়ের দিকে কার্ল করবেন না। এটি বাইন্ডিংও সংরক্ষণ করে।

আমি একটি উদাহরণ দিতে পারি এবং একটি সেট আপ করতে পারি কিনা তা আমি দেখব।

সম্পাদনা 2: আপনার কীভাবে বইটি রাখা উচিত তার নমুনা আপলোড করা হয়েছে এবং বাম দিক থেকে আলোর উত্সটিও লক্ষ্য করুন।

এখানে চিত্র বর্ণনা লিখুন


যে এত শান্ত! আশা করি আমি এটি করতে পারতাম :)
অ্যালেক্স

যাইহোক, এটি করার জন্য আপনার একটি সত্যিকারের ক্যামেরা এবং একটি ভাল মানের প্রয়োজন, বা আপনি যে ছবিটি শোষণ করতে পারবেন না তার দ্বারা শেষ হবে, বিশেষত একটি খুব পুরানো বই থেকে। সুতরাং এটি সস্তা থেকে অনেক দূরে।
জ্ঞানপি

অনেক আগ্রহব্যাঞ্জক. আমি ভাবছি কীভাবে এটি কোনও বইয়ের সাথে কাজ করবে, সেখানে ছায়াগুলি সম্ভবত পৃষ্ঠাগুলির মধ্যে থাকতে পারে তা বিবেচনা করে।

পৃষ্ঠাগুলি যদি বাঁকানো হয় বা ছায়া থাকে তবে চিঠিগুলি সনাক্ত করতে ওসিআর সফ্টওয়্যার পেতে আপনার সমস্যা হবে।
অ্যালেক্স

বইটি আলোকিত করতে একাধিক আলোক উত্স যুক্ত করুন এবং ছায়াগুলি দূর করুন। 90 ডিগ্রীতে বইটি তির্যক করুন যাতে পৃষ্ঠাগুলি মাঝখানে বাঁধাইয়ের দিকে ঝুঁকতে না পারে। এটি সাধারণ সাধারণ জ্ঞান, আমরা যা করি কলেজটিতে সমস্ত সময় গ্রন্থাগারের পাঠ্যগুলির ছবি তোলা।
ক্যালিবিয়ান

3

আমি যা জানি, তা থেকে এবিওয়াইওয়াই সেরা ওসিআর সফ্টওয়্যার তৈরি করে, তবে এটি নিখরচায় নয়। আপনার ABBYY FINReader এর একটি ট্রায়াল সংস্করণ ব্যবহার করার চেষ্টা করা উচিত , সম্ভবত এটি আপনাকে সহায়তা করবে।


1

আপনার কোনওভাবে ছবিটি ক্যাপচার করতে হবে। আপনার জন্য এটি করতে বিভিন্ন পরিষেবা বিদ্যমান। প্রুফরিডের জন্য পাঠ্যের সামগ্রীর সাথে পরিচিত এমন একজনেরও আপনার প্রয়োজন হবে কারণ ওসিআর এখনও নিখুঁত নয়। বিশেষত হাতে লেখা কিছু নিয়ে।

অন্যরা আপনার প্রশ্নটি এখানে আলোচনা করছে: http://ask.metafilter.com/92506/scan-my-books

কিছু সংস্থাগুলি আপনার জন্য এটি করবে: http://www.scandexsystems.com/BookScanning2.html http://www.kirtas.com/index.php?option=com_content&view=article&id=13&Itemid=48 http: // www। ristech.ca/product.html

কিছু নিখরচায় সফ্টওয়্যার: http://download.cnet.com/ চিত্র / টো- পিডিএফ- ওসিআর- কনভার্টার- পিডিএফ- ই- বুক- মেকার


1

আপনার এবং আপনার পারিবারিক প্রকল্পের মতো বড় এবং গুরুত্বপূর্ণ এই প্রকল্পের জন্য, একটি ডিআইওয়াই বুক স্ক্যানার যেতে পারে, কিছু নকশা এমনকি স্পোর্ট পৃষ্ঠার টার্নারগুলিও - http://www.diybookscanner.org/ এই ব্যক্তি ওসিআর স্থানীয়ভাবে সমর্থন করে না , তবে একটি ঘন্টা 600 পৃষ্ঠাগুলি অঙ্কুরিত করে এবং আপনি ওসিআরের মাধ্যমে এটি চালাতে পারেন http://hackaday.com/2011/07/18/diy-book-scanner-processes-600-pageshour/



0

আমি ক্রিসের দ্বারা উল্লিখিত বই স্ক্যানিংয়ের জন্য রিগড ফ্ল্যাটবেড স্ক্যানার বা পুরো বুক স্ক্যানারের সুপারিশ করব।

যদি আপনি পারেন তবে আপনার চিত্রগুলি একটি টিআইএফএফ ফর্ম্যাটে সংকলন করুন এটি শিল্পের মান হিসাবে যখন ডকুমেন্ট ম্যানেজমেন্ট সিস্টেমগুলির কথা আসে।

ওসিআর করার জন্য, আমি পরীক্ষামূলক ওসিআর সুপারিশ করব কারণ এটি গুগল তাদের বই প্রকল্পের জন্য ব্যাখ্যা করা ফ্রেমওয়ার্ক।


0

প্রক্রিয়াটি স্বয়ংক্রিয় করার প্রবণতাজনক মনে হলেও আপনি এই সময়টি নির্দিষ্ট সময়ে ব্যক্তিগত বিষয় হওয়ায় আপনি আরও বেশি সময় এবং কাজ করতে চাইতে পারেন। ওসিআর বাল্কটি করবে কিন্তু আপনাকে পৃষ্ঠায় প্রুফেরড পৃষ্ঠা করতে হবে এবং মূলটির সাথে তুলনা করতে হবে। মনে রাখবেন, লেখকের ভুলগুলি ডিলের অংশ, সেগুলি সংশোধন করবেন না (যদি আপনি এত ঝোঁক বোধ করেন তবে পাদটীকাগুলি তৈরি করুন)। আপনার সময় নিন, নিজেকে চাপের মধ্যে রাখবেন না, বুক স্ক্যানিং গাধার কাজ তবে পুরোপুরি অর্থ প্রদান করে এবং আপনি আপনার পরিবারের দীর্ঘস্থায়ী একটি সূক্ষ্ম ডিজিটাল অনুলিপি সহ শেষ করবেন। আপনার প্রচেষ্টার সাথে শুভকামনা :)


আসলে, এটি একটি সত্যিই ভাল পয়েন্ট। আমি বইটির মূল বিষয়বস্তু ডিজিটালি উপলভ্য করার বিষয়টি বিবেচনা করি নি, তবে যতক্ষণ আমার কাছে রয়েছে, আমি পাশাপাশি একটি পিডিএফ সংস্করণও তৈরি করতে পারি।

পিডিএফ কেন? এইচটিএমএল ভাবেন। এবং আপনি পাশাপাশি মূল স্ক্যানগুলি রাখতে পারেন যদিও আপনার প্রচুর পরিমাণে ডেটা শেষ হবে।

আমার ধারণাটি ছিল একটি ডেটাবেজে সমস্ত জন্ম / বংশের তথ্য থাকা উচিত, তাই আমি একটি ওয়েব ফ্রন্টএন্ড তৈরি করতে পারি যা নেভিগেট / অনুসন্ধান / আপডেট করা আরও সহজ করে তুলবে। আমি এই সংস্করণটি বাইরে কোনও টাইপস কাজ করার পরিকল্পনা করছি। এছাড়াও, আমার কিছু কাজিনরা আছে যা সেখানে নেই এবং এগুলি যুক্ত করে ভালো লাগবে। আমি পিডিএফ ভাবছিলাম কারণ মূল পৃষ্ঠা নম্বর এবং এই জাতীয় অক্ষর সহ এমন মূল বইয়ের মতো দেখতে এমন কিছু ভাল লাগবে। এই সংস্করণটি আমি একা ছেড়ে বইয়ের সমস্ত টাইপগুলি রাখতাম keep

0

কর্মক্ষেত্রে আমরা একটি প্লাসটেক অপটিবুক 3600 বুক স্ক্যানার ব্যবহার করি যা প্রায় 250 ডলার
এটি মূলত একটি স্ট্যান্ডার্ড ফ্ল্যাটের বিছানা স্ক্যানার তবে কাচের প্লেটটি স্ক্যানারের প্রান্তে ডানদিকে যাচ্ছে যাতে বইয়ের পৃষ্ঠাটি প্লেটে ফ্ল্যাট স্থাপন করতে পারে। এটি মেরুদণ্ডের ছায়া সরিয়ে দেয় এবং ক্ষতিকারক বইগুলি এড়ায়।

এখানে চিত্র বর্ণনা লিখুন


আপনি কি কখনও সত্যিই ঘন বইয়ের সাহায্যে এটি ব্যবহার করার চেষ্টা করেছেন? এটি 3 ইঞ্চি পুরু মত।

আপনি যদি পৃষ্ঠাটি যুক্তিসঙ্গতভাবে ফ্ল্যাট সহ 90 open এটি খুলতে পারেন তবে এটি ঠিক আছে। একটি টেবিল প্রান্ত চেষ্টা করুন।
পেলগুলি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.