আমি .one
ফাইল এক্সটেনশনের জন্য একটি পার্সার তৈরি করছি , যা শেষ হয়ে গেলে আমি অ্যাপাচি টিকা প্রকল্পে যুক্ত করব।
এপিএল ২.০ লাইসেন্সবিহীন মুক্ত উত্স প্রকল্পটি আমি এখানে তৈরি করছি: https://github.com/nddipiazza/onenote-parser-java
আমি এখানে স্পেসিফিকেশন ডকুমেন্টটি ব্যবহার করেছি: https://docs.microsoft.com/en-us/openspecs/office_file_formats/ms-one/73d22548-a613-4350-8c23-07d15576be50
একটি শুরুর পয়েন্ট হিসাবে, আমি এই ওপেন সোর্স সি ++ প্রকল্পের কোডটিতে পোর্ট করেছি: https://github.com/DPbox/onenote-parser
দস্তাবেজগুলির বিশ্লেষণে আমি দীর্ঘ পথ পাড়ি দিয়েছি, তবে আমি একটি রাস্তা ব্লক করেছি।
পার্স করার জন্য আমি ওয়ান নোট ফাইলটি ব্যবহার করছি: https://drive.google.com/file/d/1uROTEnKeBKU08CG_K5zdDTGHa178LgBK/view?usp=sharing
আমি আমার পার্স করা ফলাফলগুলিতে বিভাগ 1 পাঠ্যআরিয়া 1 এবং বিভাগ 1 পাঠ্যআরিয়া 2 দেখতে অক্ষম। সুতরাং আমি কিছু ধরণের কী ডেটা পার্সিং উপাদান বা কিছু অনুপস্থিত।
এটি অবশ্যই ওয়ান নোট ফাইলে রয়েছে। আমি এটি হেক্স ভিউয়ারে দেখতে পাচ্ছি:
এখানে জেএসএন পার্স আউটপুটটি রয়েছে: https://gist.github.com/nddipiazza/02d2252d357b3b02a6b9ab1050474267
আমি অনুভব করি যে অনুমিত দলিলটি এই মালিকানাধীন ফর্ম্যাটটি বিশ্লেষণের জন্য প্রয়োজনীয় কিছু খুব গুরুত্বপূর্ণ তথ্য অনুপস্থিত।
আমার আসল পাঠ্য সামগ্রীটি না পাওয়ার ফলে আমি কোন প্রধান উপাদান (গুলি) নিখোঁজ করছি?