বিভাগীয় ডেটা হিসাবে সরাসরি সিএসভি কলামগুলি পড়া কি সম্ভব?


10

আমাকে একটি সিএসভিতে আসা একটি মেডিকেল জরিপ (100+ কোডযুক্ত কলাম সহ) থেকে ডেটা বিশ্লেষণ করতে হবে। আমি কিছু প্রাথমিক বিশ্লেষণের জন্য রটল ব্যবহার করব তবে পর্দার আড়ালে এটি এখনও আর।

আমি যদি ফাইলটি সিএসভি () পড়ে থাকি তবে সংখ্যাসূচক কোড সহ কলামগুলি সংখ্যাসূচক ডেটা হিসাবে গণ্য হবে। আমি সচেতন আমি তাদের থেকে ফ্যাক্টর () দিয়ে শ্রেণীবদ্ধ কলাম তৈরি করতে পারি তবে এটি 100+ কলামের জন্য করা ব্যথা।

আমি আশা করি কারণগুলি হিসাবে সরাসরি কলামগুলি আমদানি করতে আর কে বলার আরও ভাল উপায় আছে। বা পরে অন্তত তাদের জায়গায় রূপান্তর করতে।

ধন্যবাদ!


উত্তর:


15

আপনি colClassesআপনার ডেটা কলামগুলির ক্লাস নির্দিষ্ট করতে আর্গুমেন্টটি ব্যবহার করতে পারেন । উদাহরণ স্বরূপ:

data <- read.csv('foo.csv', colClasses=c('numeric', 'factor', 'factor'))

প্রথম কলামে সংখ্যাসূচক এবং দ্বিতীয় এবং তৃতীয়টি ফ্যাক্টর নির্ধারণ করবে। যেহেতু আপনার অনেক কলাম রয়েছে তাই একটি শর্টকাট হতে পারে:

data <- read.csv('foo.csv', colClasses=c('numeric', rep('factor', 37), 'character'))

বা এরকম কিছু প্রকরণ (যেমন প্রথম কলামে সংখ্যাসূচক নির্ধারণ করুন, পরবর্তী ৩ col টি কলামের ফ্যাক্টর, তারপরে শেষটির অক্ষর)।


আপনি যদি ভেরিয়েবল নামের দ্বারা ক্লাস নির্দিষ্ট করতে চান (যেমন, শুধুমাত্র একটি ভেরিয়েবলের জন্য শ্রেণি নির্ধারণের জন্য): এটি স্ট্যাকওভারফ্লো.
com

3

অথবা আপনি ডেটা পড়ার পরে এটি করুন

dat <- read.csv("kdfjdkf")
apply(dat, 2, factor)

যদিও এই ধরণের কিউ স্ট্যাক ওভারফ্লোয়ের জন্য সম্ভবত আরও ফিট

সম্পাদনা করুন : নীচে দেখুন।


1
মেটা.স্ট্যাটস.স্ট্যাকেক্সেঞ্জারএইচশনস / সেকশনস / ২৫২২/২ দেখুন বর্তমান sensকমত্যটি এটি একটি উপযুক্ত প্রশ্ন, যদি আপনি মেটাতে চিমের সাথে একমত নন তবে নতুন প্রশ্নকারীকে জিজ্ঞাসাবাদ করবেন না।
রাসেলপিয়ার্স

1
ঠিক আছে, তবে খাঁটি আর প্রশ্নের (কমপক্ষে আপাতত) এর জন্য প্রতিক্রিয়া পেতে আপনার কাছে সম্ভবত আরও বড় শ্রোতা থাকবে - সুতরাং, সম্ভবত "সম্ভবত"। "যন্ত্রণা" কি শক্ত শব্দ? :)
এপিসকেপ

1
অবশ্যই, আযাব কিছুটা শক্তিশালী; আমি ওই বিষয়ের দুঃখিত. আমি কেবল পুনরাবৃত্তি অপরাধী ব্যবহারকারীদের সাথে হতাশ হয়ে পড়েছি (যার মধ্যে আপনি একজন নন) যারা মেটা সম্পর্কে কোনও মন্তব্য না করেই প্রশ্ন জিজ্ঞাসকদের পুনঃনির্দেশ করতে অবিচল রয়েছেন (যেখানে sensকমত্যটি বেশ পরিষ্কার বলে মনে হচ্ছে)।
রাসেলপিয়াস

এটি আপনার সমস্যার সমাধান করতে পারে যেখানে আপনার 0-প্যাডযুক্ত সংখ্যার সাথে কলাম রয়েছে, সংখ্যার মিশ্রণ এবং মূল্যবোধের মিশ্রণ রয়েছে, বা কেবলমাত্র এর মান রয়েছে 'T'এবং 'F'(যৌক্তিক রূপান্তরিত হবে)।
ম্যাক্স ক্যান্ডোসিয়া
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.