একটি দস্তাবেজ নিয়ে সমস্যা: 3-বাইট UTF-8 অনুক্রমের অবৈধ বাইট 3


2

আমি একটি এক্সএমএল ডকুমেন্টটি ব্যবহার করার চেষ্টা করছি তবে এই ত্রুটিটি নিয়ে চলছে:

Invalid byte 3 of 3-byte UTF-8 sequence

আমার দস্তাবেজটি নীচে এর মতো দেখতে আরও কিছু ট্যাগ এবং সামগ্রী রয়েছে। দয়া করে নীচের দস্তাবেজটিতে ফোকাস করবেন না। আমি এই ফর্ম্যাটটি সহ বেশ কয়েকটি নথি ব্যবহার করি। আমি বিশ্বাস করি এটি আমার দস্তাবেজের একটি অক্ষর যা অবৈধ but তবে এটি সন্ধানের সর্বোত্তম উপায়টি আমি জানি না কারণ এটি এত বড়।

আমি ব্যবহার করতে পারে কোন ধারণা বা সরঞ্জাম? ধন্যবাদ।

ধন্যবাদ!

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd">
<map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/">
    <title>Overview of the Commercial General Liability (CGL) Insurance Coverages  </title><moreTagsHere><!-- more tags here... --></moreTagsHere>
</map>

আপনি নথিটি তৈরি করতে কোন অ্যাপ্লিকেশন ব্যবহার করছেন? আপনি নথিটি "ব্যবহার" করতে কোন অ্যাপ্লিকেশন ব্যবহার করছেন?
ভারী

উত্তর:


1

আমার এক্সএমএলে একটি অবৈধ কোঁকড়ানো উদ্ধৃতি ছিল।


আমিও. সম্ভাব্য উত্তর হিসাবে পোস্ট করার জন্য ধন্যবাদ।
ম্যাট ফেলজানি

0

আমি এক্সএমএল স্টারলেট চেষ্টা করতাম :

[...] XMLStarlet কমান্ড লাইন ইউটিলিটি (টুলস) যা রুপান্তর, ক্যোয়ারী, ব্যবহার করা যেতে পারে একটি সেট যাচাই এটি ব্যবহার প্লেইন টেক্সট ফাইলে সম্পন্ন হলে, এবং সম্পাদনা এক্সএমএল দস্তাবেজ এবং ফাইলে একই ভাবে শেল কমান্ড সহজ সেট ব্যবহার ইউনিক্স গ্রেপ, সেড, অ্যাজক, ডিফ, প্যাচ, জয়েন ইত্যাদি কমান্ড। [...]
[ আমার উপর জোর দিন ]


0

আপনি মাইক্রোসফ্ট দ্বারা একটি সরঞ্জাম ব্যবহার করা হতে পারে আমার একটি সন্দেহজনক সন্দেহ আছে।

আমার অভিজ্ঞতায় এক্সপ্রেশন ওয়েব তাদের যে কোনও ফর্ম্যাট হিসাবে চিহ্নিত করার জন্য পাঠ্য ফাইলগুলিতে শিরোনামের তথ্য রাখত - অন্য কিছুই তাদের চিনতে পারেনি এবং এলোমেলো অক্ষর হিসাবে তারা প্রদর্শিত হয়েছিল। এটি পিএইচপি-র বিশেষত একটি সমস্যা ছিল কারণ এটি ভেঙেছে।


0

এটি এক্সএমএল সত্যটি ভুলে যান, আপনার ইউটিএফ -8 যাচাই করতে হবে। ফায়ারফক্সে কেবল খোলার জন্য এবং চরিত্রটি অনুসন্ধান করবেন? অন্যথায় স্ট্যাক ওভারফ্লোতে ইউটিএফ -8 বৈধতা দেখুন ।


0

আপনি সম্ভবত এমন একটি সম্পাদক ব্যবহার করেছেন যা ফাইলটিতে একটি বাইট অর্ডার চিহ্ন (বিওএম) যুক্ত করে। অনেক / সর্বাধিক এক্সএমএল সম্পাদক / ওয়েবসাইট সম্পাদক আপনাকে বোম দিয়ে / ছাড়াই দস্তাবেজটি সংরক্ষণ করতে দেয়। আপনি যেই সম্পাদক ব্যবহার করছেন তার মধ্যে সংরক্ষণের বিকল্পগুলি পরীক্ষা করুন।

ত্রুটি এড়াতে আপনাকে সম্ভবত বিওএম অপসারণ করতে হবে।

যদি আপনার সম্পাদক সেই বিকল্পটি সমর্থন না করে তবে আমি দুর্দান্ত নোটপ্যাড ++ সুপারিশ করতে পারি


এক্সএমএল স্পেস দ্বারা নিষিদ্ধ ইউটিএফ -8 বিওএম আমি কখনও দেখিনি (এবং অবশ্যই অন্যান্য বিওএমগুলি পুরোপুরি ভাল আছে)) প্রকৃতপক্ষে, কোনও বিওএম ব্যবহারের অনুমতি দেওয়ার জন্য স্বতঃ-সনাক্তকরণ নথিভুক্ত করা হয়েছে, যদিও পার্সার হিসাবে এটির প্রথম <xml?সিকোয়েন্সটি কীভাবে সনাক্ত করা উচিত তা জানা উচিত - w3.org/TR/2006/REC-xML-20060816/#sec-guessing
আরজান

আমার খারাপ, ভুল তথ্য সরাতে পোস্ট আপডেট করেছে। বোমটিতে ত্রুটি পাওয়ার স্মৃতি আমার আছে have এটি কি এক্সএইচটিএমএল চশমা যা এটিকে অস্বীকার করতে পারে?
প্যাক্স্সি

আপনার কিছু সত্যিকারের ইউনিকোড স্ট্রিংয়ের মান নিজেই থাকতে পারে? বা একটি ডাটাবেস মান? অথবা কনটেন্ট-টাইপ টেক্সট / এক্সএমএল ব্যবহার করে এইচটিটিপি-র মাধ্যমে স্থানান্তরিত করার সময় (প্রামাণিক) চারসেটটি ডিফল্ট ইউএস-এএসসিআইআই প্রতি ietf.org/rfc/rfc2046 এর জন্য , সুতরাং কোনও প্রসেসরের উপেক্ষা করা উচিত (অথবা এমনকি অনুমতিও দেওয়া হবে না; দেখুন ietf.org/rfc/ rfc2376 ) চারসেট নির্দিষ্ট না করা হলে একটি বিওএম। (টেক্সট / এক্সএমএল এর পরিবর্তে অ্যাপ্লিকেশন / এক্সএমএল ব্যবহারের ফলে ডিফল্ট মার্কিন-এএসসিআইআই সলভ হয় তবে অবশ্যই শুরু করার জন্য চারসেটটি সুনির্দিষ্টভাবে উল্লেখ করা উচিত))
আরজান

0

আপনি যদি টমক্যাট ব্যবহার করছেন তবে সম্ভবত আপনার এনকোডিংটি সেটআপ করা দরকার, আমি উইন্ডোজ এবং কনফিগারেশন বিকল্পগুলিতে একটি পরিষেবা হিসাবে টমক্যাটটি ব্যবহার করছি নিম্নলিখিত কম্যান্ডটি আমার জন্য কৌশলটি করেছে:

Dfile.encoding=UTF-8

আশা করি এটা সাহায্য করবে.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.