আপনি সিএসভিতে যোগ করতে পারেন এমন "সেপ =" মেটাডেটা কী?


24

স্প্যানিশ পিসিতে (গ্রাহকের অন্তর্গত) এক্সেলের মধ্যে কীভাবে সিএসভিগুলি সঠিকভাবে খুলতে হবে তা জানার চেষ্টা করার সময় আমি sep=,ফাইলের উপরের অংশে ব্যবহার করার পরামর্শ দিয়ে অনেক উত্তর পেয়েছি :

দেখিবামাত্র, এই পদ্ধতির কাজ করে কিন্তু যারা উত্তর কেউ উপর কোনও তথ্য দিতে যেখানে এই মেটাডাটা বিকল্প থেকে আসে। আমি এর অর্থ কী তা অনুসন্ধান করার চেষ্টা করেছি (এবং সেজন্য এই সমস্ত উত্তরগুলি খুঁজে পেয়েছে) তবে বিশেষত এই যে বিরামচিহ্নগুলি অনুসন্ধান করা খুব কঠিন, সে সম্পর্কে আরও কোনও তথ্য পেতে অক্ষম হয়েছি।

আমার প্রাথমিক উদ্বেগ হ'ল এটি কোনও এক্সেল-নির্দিষ্ট বৈশিষ্ট্য কিনা । আমি সন্দেহ করি এটি তবে এটির সত্যতা নিশ্চিত করার মতো কিছুই খুঁজে পাইনি।

সম্পর্কিত কিছু প্রশ্ন হ'ল:

  • এই সেটিংয়ে কোন অক্ষর ব্যবহার করা যেতে পারে?
  • অন্যান্য কি সেটিংস উপলভ্য (যেমন লাইন সমাপ্তি অক্ষর, উদ্ধৃতি অক্ষর, ইত্যাদি)।
  • এই বৈশিষ্ট্যটি আনুষ্ঠানিকভাবে সমর্থন করে এমন কি অন্য কোনও সরঞ্জাম রয়েছে?

আমি আশা করছি কোথাও ডকুমেন্টেশনের টুকরো আছে যে কেউ আমাকে এই বিষয়টির সব প্রশ্নের উত্তর দেবে এবং তার আরও বেশি উত্তর দেবে; আমি এটি সন্ধান করতে সক্ষম হইনি।

কিছু স্পষ্টতা:

sep=একটি পার্সার সময়ে একটি মাপদণ্ড নয়। এটি সিএসভির ভিতরে রাখা বোঝানো হয়েছে । উদাহরণ:

sep=|
"LETTER"|"ANIMAL"
"a"|"aardvark"
"b"|"bear"
"c"|"cow"

4
হ্যাঁ, এটি এক্সেল নির্দিষ্ট
রায়স্টাফেরিয়ান

2
আপনি কি এতে কিছু পেতে পেরেছিলেন? আমি একই প্রশ্নে স্ট্যাম্পড হয়েছি এবং এই বৈশিষ্ট্যটি বর্ণনা করে এমন কোনও এমএস স্পক্স আমি এখনও খুঁজে পাচ্ছি না। এই বৈশিষ্ট্যটি যদি এমএস দ্বারা স্বতঃসংশ্লিষ্ট হয়, তবে কীভাবে হ্যাকটি প্রথম স্থানে চলে এসেছিল?
toddlermenot

পুনঃটুইট করুন আমি যা পাই তা হ'ল লোকেরা এই দৃ making় প্রতিবেদন করে যে এটি দৃ Excel়বিশ্বাসের সাথে ব্যাক আপ করার কোনও কিছুই ছাড়াই এক্সেল নির্দিষ্ট।
বুরহান আলী

উত্তর:


7

আরএফসি 4180 সাধারণত সিএসভি ফর্ম্যাটের মান হিসাবে স্বীকৃত, এবং এই জাতীয় কোনও বৈশিষ্ট্য উল্লেখ করে না।

ওয়েবে ট্যাবুলার ডেটা এবং মেটাডেটার জন্য ডাব্লু 3 সি মডেল এটিকে তাদের ক্ষেত্রের মধ্যে নয় এমন বৈশিষ্ট্য হিসাবে উল্লেখ করেছে:

অনেকগুলি "সিএসভি" ফাইলগুলি মেটাডেটা এম্বেড করে, উদাহরণস্বরূপ, সিএসভি ডকুমেন্টের শিরোনামের আগের লাইনে। এই স্পেসিফিকেশনটি শিরোনাম সারিটির কলামগুলির নাম বাদে CSV ফাইলের মধ্যে মেটাডেটা এম্বেড করার জন্য কোনও বিন্যাস সংজ্ঞায়িত করে না।

সুতরাং আমি এই বৈশিষ্ট্যটি এক্সেল-নির্দিষ্ট বলে কোনও প্রত্যক্ষ প্রমাণ পাইনি, তবে এখনও পর্যন্ত এই বৈশিষ্ট্যটি এমনটি বলে মনে হচ্ছে যে সেই বৈশিষ্ট্যটি প্রচ্ছদ করার কোনও মানক দলিল নেই।


গুড সোর্সিং একটা কথা আমার বলা উচিত সে সেপ = | এক্সেল ব্যবহারের জন্য পাইপ চরিত্র ('|') হিসাবে পৃথককে সংজ্ঞায়িত করে। এটি ব্যাপকভাবে ব্যবহৃত হয় না তবে এক্সেলের সাথে একচেটিয়া নয়। এটি একটি পৃথক দিকনির্দেশনা। এক্সেল আইরিকের আন্তর্জাতিক সংস্করণগুলিতে আলাদা আলাদা অক্ষর রয়েছে, উদাহরণস্বরূপ, এক্সেল চলমান মেশিনে ইউরোপীয় ভাষা সেমিকোলন ব্যবহার করে।
var firstName

1
আমি ব্যবহার সম্পর্কে সচেতন (সম্ভবত এটি আমার উত্তর থেকে সম্পূর্ণ পরিষ্কার ছিল না)। আমি কেবল ইঙ্গিত করছিলাম যে দেখে মনে হচ্ছে এক্সেল সেই বৈশিষ্ট্যটি প্রবর্তন করেছে, এটি কোনও ধরণের (জনসাধারণের) মানের ভিত্তিতে রয়েছে।
স্টেফান কেগল

0

আপনার একটি প্রশ্নের উত্তরের অবদানের জন্য: "এই বৈশিষ্ট্যটি আনুষ্ঠানিকভাবে সমর্থন করে এমন কোনও অন্য সরঞ্জাম রয়েছে কি?"

এটি অ্যাপল নম্বর দ্বারা সমর্থিত নয় (আমি সংখ্যা সংস্করণ 3.6.2 ব্যবহার করে পরীক্ষা করেছি)।

এটি সিএসভি 2 জসন ( https://www.npmjs.com/package/csv2json ) বা সিএসভিটোজসন দ্বারাও সমর্থিত নয় ( https://www.npmjs.com/package/csvtojson )।


-1

ইতালির মতো দশমিক বিস্ময়কর হিসাবে কমা ব্যবহার করা হয় এমন সমস্ত দেশে নির্দেশিকা সেপ = ব্যবহার করা হয়। এক্সেল যেহেতু সেসব দেশে কমা পরিবর্তে সেমিকোলন ব্যবহার করে সিএসভি রফতানি করে, আপনি যদি নিশ্চিত হন যে ফাইলটি মার্কিন যুক্তরাষ্ট্র বা অন্যান্য দেশে পড়তে পারে তবে আপনি প্রয়োজন

সেপ্টেম্বর =;

ফাইলের শীর্ষে। এটি এক্সেল-নির্দিষ্ট এবং এটি অন্যান্য অ্যাপ্লিকেশন দ্বারা উপেক্ষা করা হতে পারে।


-2

.Csv ফাইলগুলি থেকে আমদানি করতে পারে এমন কোনও সরঞ্জাম সম্পর্কে স্বীকৃতি দেয় যে কমা একমাত্র সম্ভাব্য বিভাজক নয়, উদাহরণস্বরূপ ট্যাবগুলি দীর্ঘকাল ধরে সাধারণ ছিল। আমি মনে করি এটি এমনকি পাঞ্চ কার্ডের দিনগুলিতে ফিরে এসেছে, এমন কিছু অক্ষর থাকা দরকার যা ডেটা ফিল্ডের শেষ হিসাবে স্বীকৃত হয় - সিস্টেমগুলি ব্যতীত যেগুলি নির্দিষ্ট প্রস্থ ক্ষেত্র বা দৈর্ঘ্য উপসর্গযুক্ত ক্ষেত্রগুলি ব্যবহার করে প্রতিটি সিস্টেমের প্রায় প্রয়োজন হয় কম্পিউটারের আবির্ভাবের পর থেকে।

3 প্রয়োজনীয়গুলি ক্ষেত্রের বিভাজক, একটি রেকর্ড বিভাজক এবং ডেটা মার্কার এর সমাপ্তি, সিএসভি ডিফল্টরূপে এই জন্য যথাক্রমে কমা, নিউলাইন এবং ফাইলের সমাপ্তি ব্যবহার করে তবে কোনও বৈধ ইনপুট ব্যবহার করা যেতে পারে, তবে আপনাকে অবশ্যই একটি ব্যবস্থা দরকার বিশেষ চিহ্নকারীদের যদি আপনার বৈধ ডেটাতে ঘটে তবে তারা পালাতে পারে।

একটি historicতিহাসিক সিস্টেম আমি ফিল্ডের শেষের জন্য নতুন লাইন, রেকর্ডের *!*!* END *!*!*শেষে এবং ডেটা শেষ করার জন্য 2 টি ফাঁকা রেখা ব্যবহার করেছি । আমি ,\t|:বিভিন্ন কন্ট্রোল ক্যারেক্টার সহ ফিল্ড বিভাজক হিসাবে সাধারণত ব্যবহৃত হয়ে এসেছি ।

সাবধান হওয়ার একটি বিষয় হ'ল ফরাসী এবং অন্যান্যরা দশমিক পয়েন্ট হিসাবে কমা ব্যবহার করে - এটি সমস্ত ধরণের মজা এবং গেমগুলির কারণ হতে পারে। Rfc4180 তে সিএসভি ফাইলগুলির জন্য মানককরণের একটি ডিগ্রী রয়েছে তবে এমন একটি সময় রয়েছে যখন একটি প্রোগ্রাম থেকে রফতানি করা এবং অন্যটিতে আমদানি করার সময় আপনাকে ম্যানুয়ালি ফাইলগুলি সম্পাদনা করতে হবে।

আপনার প্রশ্নের দ্বিতীয় অংশটির উত্তর দেওয়ার জন্য পাইথন উদাহরণস্বরূপ, সিএসভি পাঠক / লেখককে স্ট্যান্ডার্ড লাইব্রেরিগুলির মধ্যে একটি হিসাবে অন্তর্ভুক্ত করে যা নিম্নলিখিত বিকল্পগুলি সরবরাহ করে:

  • delimiter- এটি ক্ষেত্র বিভাজক, (যদি না পালানো হয়)।
  • doublequote- যদি সত্য হয় তবে ক্ষেত্রের " মধ্যে একটি হিসাবে এটি উপস্থাপন করা হবে""
  • escapechar- নিম্নলিখিত কোনও চরিত্র থেকে কোনও বিশেষ অর্থ সরিয়ে দেয়, উদাহরণস্বরূপ যদি এটি সেট করা থাকে \তবে উদ্ধৃতি হিসাবে প্রদর্শিত হতে পারে\"
  • lineterminator- সাধারণত এক \n, \r, \r\nবা\n\r
  • quotechar- স্ট্রিং উদ্ধৃত করতে ব্যবহৃত চরিত্রটি সাধারণত "বা'
  • quoting - এর মধ্যে একটি হিসাবে পতাকা:
    • ALL - প্রতিটি ক্ষেত্র উদ্ধৃতিতে থাকে, অর্থাত: "1","Free Beer","ASAP"
    • MINIMAL - কেবলমাত্র বিশেষ অক্ষর রয়েছে এমন ক্ষেত্রগুলি উদ্ধৃত করুন, যেমন: 1,"Beer, (Free)", Now, Please
    • QUOTE_NONNUMERIC - এমন কোনও কিছু উদ্ধৃত করুন যা কোনও সংখ্যা নয়, যেমন: 1,"Beer, (Free)", "Now", "Please"
    • NONE - পরিবর্তে উদ্ধার উদ্ধৃতি করবেন না, অর্থাত: 1,Beer\, (Free), Now, Please
  • skipinitialspace- প্রতিটি ক্ষেত্রের যে কোনও শীর্ষস্থানীয় স্থানটি এড়িয়ে চলুন যাতে আপনি , কেবল ,ক্ষেত্র বিভাজক হিসাবে ব্যবহার করতে পারেন ।

সিএসভি ফাইলগুলি আমদানি করতে পারে এমন একটি সরঞ্জাম সাধারণত আরও নমনীয় এবং সুচিন্তিত চিন্তাভাবনা হ'ল এই বিকল্পগুলির মধ্যে আরও বেশি (সম্ভবত পৃথক পৃথক নাম এবং / অথবা প্রক্রিয়া সহ) থাকতে পারে।


2
এটি আমার প্রশ্নের উত্তর দেয় না। এটি সিএসভি কী, যা সম্পর্কে আমি ইতিমধ্যে সচেতন তা ব্যাখ্যা করে। আমার প্রশ্নটি সিনট্যাক্সের একটি নির্দিষ্ট অংশ সম্পর্কে। বিষয়গুলি স্পষ্ট করার জন্য আমার প্রশ্নটিতে আমি কি যুক্ত করতে পারি এমন কোনও পটভূমি রয়েছে?
বুরহান আলী

1
ধন্যবাদ তবে এটি এখনও সাহায্য করে না। sep=কোনও পার্সারের প্যারামিটার নয়। আমি আমার প্রশ্নের সাথে কিছু স্পষ্টতা যোগ করেছি।
বুরহান আলী

1
@ স্টিভবার্নস কিন্তু কোনও সরঞ্জাম যেমন উদাহরণস্বরূপ পাইথন লাইব্রেরিটি ফাইলের সামগ্রীর অংশ হিসাবে বিকল্পগুলির অনুমতি দেয়? এটি, আমি মনে করি, প্রশ্নের মূল বিষয়।
র্যান্ডি অরিসন

1
"কারণ তারা অনেকগুলি অদ্ভুত অদ্ভুততার মধ্যে একটি।" কি এটা যদিও? আমি যে কাজটি করার চেষ্টা করছি তারই অংশ। আমি সিএসভি কী তা জানতে চাই না। আমি কীভাবে কোনও সিএসভি পার্স করতে হয় তা জানতে চাই না। আমি জানতে চাই যে sep=কী এবং কোথা থেকে এসেছে।
বুরহান আলী

2
সেপ = একটি মাইক্রোসফ্ট এক্সেল নির্দিষ্ট ইঙ্গিত পদ্ধতি যা আমি খুঁজে পেতে পারি এমন কোনও নন-মাইক্রোসফ্ট স্পেসিফিকেশনে আচ্ছাদিত নয়। এটি মাইক্রোসফ্টের একটি অংশ থেকে এসেছে।
স্টিভ বার্নেস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.