কমা বিভাজিত মান (সিএসভি) ফাইল সম্পাদনা করার কৌশল


18

আমি ডেটা বিশ্লেষণ প্রকল্পগুলিতে কাজ করার সময় আমি প্রায়শই কমা বা ট্যাব-ডিলিমেটেড (সিএসভি, টিএসভি) ডেটা ফাইলগুলিতে ডেটা সঞ্চয় করি। যদিও ডেটা প্রায়শই ডেডিকেটেড ডেটাবেজ ম্যানেজমেন্ট সিস্টেমে থাকে। আমার অনেক অ্যাপ্লিকেশনগুলির জন্য, এটি অতিরিক্ত পরিমাণে জিনিস হবে be

আমি এক্সেলে সিএসভি এবং টিএসভি ফাইলগুলি সম্পাদনা করতে পারি (বা সম্ভবত অন্য একটি স্প্রেডশিট প্রোগ্রাম)। এর সুবিধা রয়েছে:

  • স্প্রেডশিটগুলি ডেটা প্রবেশ করা সহজ করে

এছাড়াও বেশ কয়েকটি সমস্যা রয়েছে:

  • সিএসভি এবং টিএসভি ফাইলগুলির সাথে কাজ করার ফলে বিভিন্ন বৈশিষ্ট্যগুলি হারিয়ে যাওয়া এবং কীভাবে কেবল সক্রিয় পত্রকটি কীভাবে সংরক্ষণ করা হবে এবং আরও কীভাবে সে সম্পর্কে বিস্তৃত সতর্কতা বার্তা নিয়ে যায়। আপনি কেবল ফাইলটি খুলতে এবং কিছুটা পরিবর্তন করতে চাইলে এটি বিরক্তিকর।
  • এটি অনেকগুলি "অনুমিত বুদ্ধিমান" রূপান্তর করে। উদাহরণস্বরূপ, আপনি যদি 12/3 লিখেন তবে এটি মনে করে যে আপনি কোনও তারিখ প্রবেশ করতে চান। আপডেট: আমার উল্লেখ করা উচিত ছিল যে তারিখের উদাহরণটি অনেক উদাহরণের মধ্যে একটি; বেশিরভাগ সমস্যা অনুচিত রূপান্তর সম্পর্কিত বলে মনে হচ্ছে। বিশেষত, সংখ্যা বা তারিখের মতো দেখতে পাঠ্য ক্ষেত্রগুলি সমস্যার কারণ হতে পারে।

বিকল্পভাবে, আমি একটি প্রমিত পাঠ্য সম্পাদকের পাঠ্য ফাইলের সাথে সরাসরি কাজ করতে পারি। এটি নিশ্চিত করে যে আমি যা প্রবেশ করি তা যা রেকর্ড করা হয়। তবে ডেটা প্রবেশের এটি একটি অত্যন্ত বিশ্রী উপায় (কলামগুলি লাইন দেয় না; কেবল একাধিক কোষে ডেটা প্রবেশ করা কঠিন etc. ইত্যাদি)।

প্রশ্ন

  • সিএসভি বা টিএসভি ডেটা ফাইলগুলির সাথে কাজ করার জন্য একটি ভাল কৌশল কী? অর্থাত্, কোন কৌশলটি প্রবেশ করানো এবং ডেটা ব্যবহারের কৌশলটিকে সহজ করে তোলে এবং এটি নিশ্চিত করে যে আপনি যা প্রবেশ করেছেন তা আসলে সঠিকভাবে ব্যাখ্যা করা হয়েছে?

1
ফাইলগুলিতে আপনি আসলে কী ধরণের অপারেশন করেন? আমার মনে, এটি নাটকীয়ভাবে গ্রহণযোগ্য বিকল্পগুলির ব্যাপ্তিকে প্রভাবিত করে। এছাড়াও, আমার কাছে মনে হয় যে আপনি একটি ওয়ার্ড প্রসেসরে টিএসভি ডেটা সম্পাদনা করতে এবং কলামগুলি সংরক্ষণের জন্য ট্যাবগুলি লাইন করতে পারেন - যতক্ষণ আপনার ওয়ার্ড প্রসেসরটি "স্মার্ট" রূপান্তর না করার জন্য সেট করা যেতে পারে এবং প্লেইন টেক্সট হিসাবে সংরক্ষণ করতে পারে, যা অনেকগুলিই পারে ।
ওয়েইন

@ ওয়েইন গুড পয়েন্ট আমি স্প্রেডশিট প্রোগ্রামগুলির সাথে বড় হয়েছি বলে অনেকগুলি শর্টকাট রয়েছে যার সাথে আমি পরিচিত (ফাংশন, অনুলিপি এবং আটকানো, একটি অতিরিক্ত কলাম যুক্ত করা এবং আরও অনেক কিছু)। দ্রষ্টব্য, আমি এখানে ডেটা বিশ্লেষণ সম্পর্কে কথা বলছি না, তবে কেবল একটি সাধারণ টেবুলার ডেটা ফাইল তৈরি করছি (যেমন, আমার আর কোড প্রক্রিয়া করার জন্য কিছু মেটা তথ্য প্রয়োজন)) যদিও আমি আর এ সমস্ত বুনিয়াদি টেবিলের ম্যানিপুলেশনগুলি করতে পারি, এটি আমার পক্ষে ততটা স্বজ্ঞাত নয়। সম্ভবত সময়ের সাথে সাথে, আরএসে একটি সিএসভি খোলার মাধ্যমে, কিছুটা পরিবর্তন আনতে হবে এবং এটিকে পুনরায় সাশ্রয় করা আমার পছন্দসই বিকল্পে পরিণত হবে।
জেরোমি অ্যাংলিম

উত্তর:


14
  1. আপনি যদি আর এর সাথে স্বাচ্ছন্দ্য বোধ করেন তবে আপনি নিজের বুনিয়াদি ডেটা তৈরি করতে পারেন ra ফ্রেম এবং তারপরে ডেটা ইনপুট করতে এতে ফিক্স () ফাংশনটি ব্যবহার করতে পারেন। # 5 হিসাবে একই লাইন বরাবর, একবার আপনি ডেটা সেট আপ করুন ফ্রেম আপনি আপনার ডেটা প্রবেশের জন্য, এটি বৈধ করে তোলার জন্য একটি সিরিজ রিডলাইনস (এন = 1) (বা যাই হোক না কেন) ব্যবহার করতে পারেন, এবং পরবর্তীটি যুক্ত করার সুযোগ সরবরাহ করুন সারি। তারপরে ঠিক করার জন্য ফিক্সিংটি ছেড়ে দিন ()। স্ক্যান () ব্যবহার করে নীচে বাস্তবায়িত উদাহরণ দেখুন।

  2. এক্সেলের আরেকটি বিকল্প অগোছালো হবে তবে আপনি 12/9 টাইপ করতে পারেন, তারপরে আর একটি কলামের মূল্যায়ন করুন = IFERROR (MONTH (DateEntryCell) / DAY (DataEntryCell), DataEntryCell)। তবে তারপরে আপনাকে এক্সেল শিট এবং সিএসভি শিটটি বজায় রাখতে হবে এবং সিএসভি লেখার সাথে সাথে সমস্ত অভিযোগ করা অবিরত থাকবে।

  3. বিকল্পভাবে, আপনার ক্ষেত্রগুলি তুলনামূলকভাবে সংক্ষিপ্ত এবং লম্বা দৈর্ঘ্য হিসাবে একটি নিয়মিত পাঠ্য সম্পাদক আপনাকে টিএসভি দিয়ে ভাল পরিবেশন করা উচিত। আপনার কাজ শেষ হয়ে গেলে আপনি সর্বদা এটি এক্সলে লোড করতে পারেন এবং নিশ্চিত করতে পারেন যে প্রতিটি সারির কলামের সংখ্যাটি এটির প্রত্যাশাটি is
  4. ইমাকস বেশ কয়েকটি প্ল্যাটফর্মে উপলভ্য এবং সম্ভবত এর জন্য কিছু রয়েছে, যেমন: http://www.emacswiki.org/emacs/CsvMode
  5. আপনি যদি হৃদয়বান আত্মী হন তবে ডেটা এন্ট্রি করতে প্রোগ্রামিং ভাষায় কিছু দ্রুত করার প্রোগ্রামিং তুচ্ছ, ডেটা সম্পাদনা অনেক বেশি শক্ত হবে।
  6. একটি দ্রুত গুগল অনুসন্ধান কেবলমাত্র এই উদ্দেশ্যে সফ্টওয়্যার প্রদর্শন করে তবে কোনও নিখরচায় সফ্টওয়্যারই ভাল লাগেনি।
  7. এটি উন্মাদ শোনায়, তবে সুপারভাইজারের কেউ অ্যাক্সেসে টেবিলগুলি সম্পাদনা করার পরামর্শ দেয় এবং তারপরে সেগুলিকে CSV হিসাবে রফতানি করে ... যা কাজ করার পক্ষে যথেষ্ট পাগল।
  8. আপনি .csv হিসাবে সংরক্ষণ করার সাথে সাথে অভিযোগ করা থেকে এক্সেল থামবে না, তবে আপনি আপনার ডেটা এন্ট্রি ফিল্ডের আগে একটি একক অ্যাডাস্ট্রোফ টাইপ করতে পারেন এবং এটি স্বয়ংক্রিয়-বিন্যাসের ক্ষেত্রে এটি একা রেখে দেয়। সুন্দরভাবে, এটি (কমপক্ষে অফিস 2007 এ) সিএসভি ফাইলে অ্যাডাস্ট্রোফ ছেড়ে যায় না।

আপডেট: আমি এই সমস্যাটি নিয়ে প্রচুর ঝাঁকুনি দিচ্ছি কারণ এটি আমার একটি সমস্যাও। এখন পর্যন্ত ডেটা-এন্ট্রির জন্য সবচেয়ে ভাল / সহজ সমাধানটি হ'ল কিলিংকসিএসভি । এটি "ফ্রি" সফ্টওয়্যার নয়, এটি 30 দিনের পরীক্ষার সময়কাল এবং যুক্তিসঙ্গত দাম (share $ 27) সহ শেয়ারওয়ার। বিদ্যমান সিএসভিগুলি সম্পাদনা করার জন্য আমি তার উপর কতটা বিশ্বাস করি তা নিশ্চিত নই - যদিও আমি এটিকে একটি অত্যন্ত বড় (এবং সম্ভবত ভাল ফর্ম্যাট করা) সিএসভি দিয়েছি এবং এটি সারিগুলির সমস্তটি পড়তে ব্যর্থ হয়েছিল। তবে মনে হয় এটির পক্ষে যথেষ্ট পরিমাণে (20 মেগাবাইট) বড় হয়ে গেছে এবং বড় ফাইলের সমস্যাটি আমার পক্ষে ব্যবহারকারীর ত্রুটি হতে পারে।

আর উদাহরণ:

#This function takes a what argument like in scan, 
#a list with the types to be used, see usage example 
#at the end of this code block
#dataEntry will keep reading in values until 
#the values it reads in matches what is in 
#"terminateon".
#limitations: Many
dataEntry <- function(what,terminateon)
{
  CONTINUE <- TRUE #Make sure we start the loop
  data <- NULL #Create empty data so that the data.frame can define itself
  ti <- NULL
  while(CONTINUE)
  {
    ti <- NULL    
    ti <- tryCatch(
      {as.data.frame(scan(what=what, nlines=1, multi.line=FALSE, comment.char="",quiet=TRUE))},
      error=function (e) {print("Error in data entry! Line not stored.")
                          return(NULL)},
      warning=function(w) {print("Error in data entry! Line not stored.")
                           return(NULL)},
      finally={ti <- NULL}
    ) #Try getting the data according to the parameters in 'what' one row at a time.
    if (!is.null(ti))
    {
      if ((ncol(ti)==length(what)) & (nrow(ti)==1)) {
        data <- rbind(data,ti) #If there wasn't an error, add ti to the previous value  
      } else {
        print("Too many or not enough values on previous entry.")
        print("Tail of current data:")
        print(tail(data))
      }
    }
    if (!is.null(ti) & all(ti == terminateon)) 
    {
      CONTINUE <- FALSE
      data <- data[-c(nrow(data)),]
    } #if we've recieved the final value we won't continue and the last row is invalid so we remove it
  }
  return(data)
}

dataEntry(list(x=integer(), y=numeric(), z=character()),terminateon=c(999,999,"Z"))

হ্যাঁ, এবং দেখা যাচ্ছে যে আমি ইতিমধ্যে দেবিয়ান / উবুন্টু - ঝরঝরে প্যাকেজটির csv-mode.elজন্য ধন্যবাদ ইনস্টল করেছি emacs-goodies-el
ডার্ক এডেলবুয়েটেল

1
+1, পয়েন্ট # 1 এর জন্য আমি সমস্ত স্টেট সফটওয়্যার (আর, স্টাটা, এসপিএস এবং এসএএস ছাড়াও) কাজ করেছি যা এই ধরণের কার্যকারিতা সরবরাহ করে। সুতরাং আপনার পরামর্শ যে কোনও সফ্টওয়্যার দিয়ে কাজ করতে চায় তার সাথে সাধারণীকরণ করে।
অ্যান্ডি ডব্লু

5

আপডেট: [আর-সহায়তা থেকে ইমেলের একটি বিশাল ব্যাকলগ পেরিয়ে যাওয়ার পরে] " আচরণread.csv() " এর থ্রেডটি মনে করিয়ে দেওয়া হচ্ছে । এতে ডানকান মুরডোক উল্লেখ করেছেন যে জেরোমি উল্লেখ করেছেন যে কারণে তিনি সিএসভির পরিবর্তে ডেটা ইন্টারচেঞ্জ ফর্ম্যাট (ডিআইএফ) ফাইল ব্যবহার করতে পছন্দ করেন । আমি কেবল এটি চেষ্টা করেছি এবং জিনুমারিক এটি ভুল হয়ে যায় (একটি তারিখ হিসাবে 12/3 লোড করা হয়), তবে ওপেনঅফিস.আরোগ্রাফি এটি সঠিকভাবে পড়ে এবং 12/3 তথ্য অক্ষত সংরক্ষণ করে। (এমএস এক্সেলে এটি যাচাই করার জন্য কেও যত্নশীল?)

ডিআইএফ ফাইলগুলি সরল পাঠ্য এবং স্প্রেডশিট এবং আর দ্বারা পড়া যায় (যতক্ষণ আপনি সাম্প্রতিক আর রিভিশনটি ব্যবহার করেন (SVN রিভিশন> = r53778)) সঠিক ফর্ম্যাটে ডেটা পড়বে will


আসল : আমি যখনই সম্ভব ডেটা সম্পাদনা / হেরফেরের জন্য একটি স্প্রেডশিট ফুল স্টপ ব্যবহার এড়াতে চেষ্টা করব। একটি বিদ্যমান ডেটা সেটটিতে আপনার যে কোনও পরিবর্তন ডকুমেন্ট করা অবিশ্বাস্যরূপে কঠিন, যদি এটি পুনরুত্পাদনযোগ্য গবেষণা দৃষ্টিকোণ থেকে একে একে নিয়ন্ত্রণ করে দেয়। সর্বাধিকত, আমি বিদ্যমান ডেটা দ্রুত দেখতে একটি স্প্রেডশিট ব্যবহার করি।

ডেটা প্রসেসিংয়ের জন্য, আমি একটি আর স্ক্রিপ্ট লিখতে চাই যা কাঁচা সিএসভি ফাইল নেবে এবং প্রয়োজনীয় সমস্ত প্রসেসিং পদক্ষেপগুলি প্রয়োগ করবে। আমি প্রতিটি পর্যায়ে ঠিক কী করছি এবং কেন তা ব্যাখ্যা করার জন্য আমি সেই স্ক্রিপ্টটি ভারীভাবে মন্তব্য করছি। আমার ডেটা অ্যানালাইসিস স্ক্রিপ্টটি তখন ডেটা প্রসেসিং স্ক্রিপ্টকে কল করবে যা ডেটা লোড করে এবং প্রক্রিয়া করে।

ডেটা প্রবেশের জন্য, কোনও পাঠ্য সম্পাদক বা স্প্রেডশিটে ডেটা প্রবেশ করা আরও ঝামেলা? আমি সন্দেহ করি যে আপনি পরবর্তী সমস্যার জন্য উল্লিখিত সমস্যাগুলি কোনও পাঠ্য সম্পাদককে সিএসভি ডেটা প্রবেশ করার চেষ্টা করার চেয়ে বেশি নয় not

আপনি আরও ভাল স্প্রেডশিট চেষ্টা করতে পারেন; ওপেনঅফিস.আর.জি 12/3 তারিখ হিসাবে ফর্ম্যাট করা থামাতে অস্বীকৃতি জানায় (বা এটি এটি সংখ্যার উপস্থাপনায় রূপান্তর করে) এমনকি যদি কোনও কলামটি প্রথমে "সংখ্যাসূচক" হিসাবে ফর্ম্যাট করে। Gnumeric অন্যদিকে 12/3 ত্যাগ করব, যেমনটি হয় যদি আপনি "সাংখ্যিক" কলামে ফরম্যাট প্রথম।

আপনি ওপেনঅফিস.আর.আরোগুলিকে 12/3 তারিখ হিসাবে পুনরায় ফর্ম্যাট করতে বাধ্য করতে পারেন 'যাতে এন্ট্রিগুলিতে প্রি-.েন্ড করা হয়, অর্থাৎ '12/3স্প্রেডশিটে 12/3 হিসাবে প্রদর্শিত হবে এবং পাঠ্য হিসাবে সংরক্ষণ করা হবে। এটি সম্ভবত ব্যবহার করা বেশ নিরাপদ।

আপনি কেন 12/3 পাঠ্য ফাইলে 12/3 হিসাবে সংখ্যায় সঞ্চিত থাকতে চান তা নিশ্চিত নন - আর এর মতো কিছু কীভাবে এটি পড়তে হবে?

বৈশিষ্ট্যগুলি হারাতে বা শুধুমাত্র সক্রিয় শীটটি সংরক্ষণ করার বিষয়ে সতর্কতার বিষয়ে আপনার মন্তব্যটি আসলেই সমস্যা নয়? (যদি সেগুলি হয় তবে আমি আমার জীবনে আপনার সমস্যাগুলি চাই ;-)


পুনরুত্পাদনযোগ্য গবেষণার ক্ষেত্রে, ফাইল ফর্ম্যাটটি যদি সিএসভি হয়, তবে সিএসভি ফাইলটি পরিবর্তনগুলি করা হলে কমিটের সাহায্যে সহজেই সংস্করণ নিয়ন্ত্রণে রাখা যেতে পারে। এটি কি পুনরুত্পাদনযোগ্য গবেষণার জন্য যথেষ্ট? ডেটা এন্ট্রি সম্পর্কিত, আমি প্রায়শই দক্ষতা সর্বাধিকীকরণের জন্য অন্যকে স্থির প্রস্থ বিন্যাসে কাঁচা ডেটা এন্ট্রি করতে বা করি; তবে আমি সিএসভি বা টিএসভিতে ডেটা সঞ্চয় করতে পছন্দ করি (আমি এটি আরও স্বচ্ছ মনে করি); সংখ্যারূপে একটি কলাম ফর্ম্যাট করার ক্ষেত্রে। এই তথ্যটি সম্ভবত সংরক্ষণে হারিয়ে যাবে।
জেরোমি অ্যাংলিম

12/3 এর সাথে আমার একাধিক পছন্দের পরীক্ষার উদাহরণ রয়েছে যেখানে এটি 12 টি 3 দ্বারা বিভক্ত করে উপস্থাপন করেছে তবে, আমি এটি চিত্রের উদাহরণ হিসাবে আরও ব্যবহার করি। আমার যখন একটি বড় সিএসভি ফাইল থাকে তখন আমি একটিও অনুপযুক্ত রূপান্তর চাই না। সতর্কবার্তা সম্পর্কিত, আমি যদি দিনে 10 বার সিএসভি ফাইল খুলি তবে সতর্কতা ক্লান্তিকর হয়ে উঠবে। আমি আসলে CSV ফাইলটি সংরক্ষণ করেছি কিনা তা তারা এটিকেও কম স্পষ্ট করে দেয়। অভিমানের জন্য দুঃখিত।
জেরোমি অ্যাংলিম

@ জারোমি হ্যাঁ, যদি আপনি অবিলম্বে সংরক্ষণ এবং প্রতিশ্রুতিবদ্ধ একটি একক পরিবর্তন (বা একক ডেটা প্রক্রিয়াকরণ পদক্ষেপ) নিয়ে কঠোর হন it আমি স্ক্রিপ্ট ব্যবহার করে আর (যেমন এটি আমার পছন্দের ভাষা) তে প্রক্রিয়াকরণ করার বিষয়ে একটি নোট অন্তর্ভুক্ত করার অর্থ চাই না। এইভাবে আমি ডেটা সহকর্মীদের সাথে কাজ করি আমাকে প্রেরণ; আমার কোনও স্প্রেডশিটে দ্রুত নজর থাকতে পারে, তারপরে সিএসভিটি আর এ পড়ুন এবং একটি স্ক্রিপ্ট লিখুন যাতে আমার প্রয়োগ করতে হবে এমন সমস্ত ডেটা প্রসেসিং পদক্ষেপ অন্তর্ভুক্ত রয়েছে। আমি তখন সেই স্ক্রিপ্টটি মন্তব্য করি যাতে আমি কী করেছি এবং কেন করেছি এবং এর মূল রেকর্ড আমার কাছে আছে এবং আমি মূল ডেটা ফাইলটি মোটেই পরিবর্তন করি নি।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

@ জারোমি: সতর্কবাণীগুলির ন্যায্য পয়েন্ট। আমি দীর্ঘদিন তাদের শব্দ হিসাবে ফিল্টার করেছি যাতে তারা আমাকে বিরক্ত না করে। আমি কেবল জ্নুমারিক এবং ওপেনঅফিস.আরোগুলি.র পরীক্ষা করেছি এবং তারা 12/3 এর সাথে একটি সিএসভিকে স্বয়ংক্রিয়ভাবে ডেটে রূপান্তর করে - এটি আবর্জনা! সুতরাং আমি আপনাকে বলতে চাইছি কি। থামানোর একমাত্র উপায় হ'ল সেই ডেটাগুলি পাঠ্য হিসাবে সংরক্ষণ করা এবং সেই ডেটাটি লোড / আমদানিতে টাইপ করা বাধ্য করা।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

@ জারোমি: পুনরায়: সংখ্যার ফর্ম্যাটিং হারাতে - হ্যাঁ, এটি যদি না হয়, যদি না আপনি আমদানির পরে কলামের প্রকারটিকে "সংখ্যাসূচক" (জেনুমারিক) বা "ওপেনঅফিস.গ্রাগ.অর্গ" তে "পাঠ্য" হিসাবে নির্দিষ্ট করেন না। রূপান্তরটি এড়ানোর জন্য এটি পাঠ্য হিসাবে (আমার সম্পাদিত উত্তর দেখুন) হিসাবে সংরক্ষণ করা ভাল - আপনার এখনও আমদানির সময় ডেটা টাইপ নির্দিষ্ট করতে হবে ...
পুনর্নির্মাণ মনিকা - জি। সিম্পসন

3

আমি আপনাকে গুগল পরিমার্জন (http://code.google.com/p/google-refine/) সন্ধান করার পরামর্শ দিই। আমার মনে হয় সিএসভি ফাইলগুলি সম্পাদনা করার জন্য এটি একটি খুব ভাল সরঞ্জাম


আপনি দয়া করে ব্যাখ্যা করতে পারেন যে এটি কীভাবে প্রশ্নের কৌশলটির অনুরোধটির প্রতিক্রিয়া জানায় ?
whuber

3

আমি সমস্ত একসাথে সিএসভি এবং টিএসভি ফাইলগুলির সাথে কাজ করা এড়াতে চাই। পরিবর্তে এসকিউএল ব্যবহার করতে শিখুন এবং কেবল আপনার ডেটার ডেটামার্ট বা ডাটাবেস (ডিবি) অনুলিপিতে অপারেট করুন বা আপনি আপনার ডাটাবেসের সাথে পাস্ত্র্রু সংযোগ সহ এসএএস বা আর ব্যবহার করতে পারেন। এই পদ্ধতিতে আপনি এক্সেল (বা আপনি যে কোনও স্প্রেডশিট প্রোগ্রাম ব্যবহার করছেন) বা অনুলিপি হতে পারে যা অনুলিপি করা এবং কাস্টিংয়ের পরিবর্তে ভয়ঙ্কর অনুসন্ধান এবং প্রতিস্থাপনের পরিবর্তে আপনার ডেটাতে বাল্ক আপডেট করতে পারেন। ডিবি সিস্টেম ব্যবহার করার সুবিধাটি হ'ল আপনি লগিং সক্ষম করতে পারেন এবং তা ত্রুটিযুক্ত হয়ে থাকলে আপনার করা দ্রুত রোলব্যাক পরিবর্তন করতে পারে এবং সমস্ত পরিবর্তন নিরীক্ষণ করা যায়। এছাড়াও, আপনার ডিবি টেবিলগুলিতে অখণ্ডতার সীমাবদ্ধতাগুলি আপনি ভুলভাবে ভ্রিয়েবল / কলামটি অপ্রয়োজনীয় বলে মনে করেন না বা পরিবর্তন করেন না তা নিশ্চিত করার জন্য (উদাহরণস্বরূপ তারিখগুলি তারিখের মতোই থাকে এবং অন্যান্য তথ্য যথাযথভাবে টাইপ করা হয়) ensure আমি জিতেছি'

আপনি যদি স্প্রেডশিটগুলি পছন্দ করেন কারণ এটি কোনওভাবে আপনার ডেটা এন্ট্রির সুবিধার্থ করে, যা গ্রাফিকাল ইউজার ইন্টারফেস সরঞ্জাম / আইডিই ব্যবহার করে ডেটাবেসগুলির (যেমন মাইক্রোসফ্টের ম্যানেজমেন্ট স্টুডিও) ব্যবহার করে বা কোনও লিঙ্কযুক্ত সংস্করণে টান দিয়ে আপনি ব্যবহার করেছেন এমন প্রতিটি ডাটাবেসে পারা যায় আপনার ডেটাবেসটি এমন কোনও সিস্টেমে বিশেষভাবে আপনার ডেটা প্রবেশের জন্য এবং ডেটা সীমাবদ্ধতাগুলি প্রয়োগ করার জন্য তৈরি করা হয়েছে (যেমন অ্যাক্সেসে লিঙ্কযুক্ত টেবিল ফর্ম বা একটি কাস্টম ওয়েব ইন্টারফেস)। আপনি এমন অন্যান্য প্রোগ্রামগুলিও ব্যবহার করতে পারেন যা আপনাকে এক্সেল-এ উভয় দুনিয়ার সেরাটি পেতে এবং ডেটা আপডেট করার অনুমতি দেয় এবং সেই পরিবর্তনগুলি আপনার ডাটাবেসে প্রচার করতে পারে ( উদাহরণস্বরূপ https://www.youtube.com/watch?v=5iyuF_mDSac দেখুন ) ।


2

আমি এই প্রশ্নটি জিজ্ঞাসা করার পরে, আমি CSVedএকবার দেখতে শুরু করি

ওয়েবসাইট থেকে:

সিএসভিড একটি সহজ এবং শক্তিশালী সিএসভি ফাইল সম্পাদক, আপনি যে কোনও সিএসভি ফাইল, যে কোনও বিভাজক দ্বারা পৃথক করে ম্যানিপুলেট করতে পারেন।

কারও সাথে এটির অভিজ্ঞতা আছে কিনা তা আমি নিশ্চিত নই।


আমি এটি ইনস্টল করার চেষ্টা করেছি। তাত্ক্ষণিক চেষ্টা করার পরে মনে হয়েছিল ডেটা প্রবেশের জন্য আবর্জনার মতো; সম্ভবত আমি যদি এটির বেশি চেষ্টা করে থাকি তবে কীভাবে এটি কার্যকরভাবে ব্যবহার করতে হয় তা আমি বুঝতে সক্ষম হব, তবে আমার সন্দেহ নেই।
রাসেলপিয়ার্স

আপনি দয়া করে ব্যাখ্যা করতে পারেন যে এটি কীভাবে প্রশ্নের কৌশলটির অনুরোধটির প্রতিক্রিয়া জানায় ?
whuber

2

এক্সেল খুব বেশি সিএসভি বান্ধব নয়। উদাহরণস্বরূপ, আপনি যদি এক্সেলের মধ্যে "1,300" প্রবেশ করান এবং এটি কমা দ্বারা পৃথক করা মান হিসাবে সংরক্ষণ করেন, এটি আপনাকে দেয়! এটি একটি বড় সমস্যা হতে পারে (অন্যের কাছ থেকে ফাইল গ্রহণের সময় আমি নিয়মিতভাবে এটির মুখোমুখি হয়েছি)।

আমি ব্যক্তিগতভাবে ওপেনঅফিস.আর.সি. ক্যালক ব্যবহার করি, আমি উপরের তালিকাভুক্ত অনেকগুলি সমাধানও ব্যবহার করি, তবে এর মধ্যে বেশিরভাগের কার্যকারিতা এবং নিয়মিত সম্পাদনার জন্য প্রয়োজনীয় ব্যবহারের সহজতা নেই। ওও ক্যালকুল এক্সেলের চেয়ে অনেক বেশি বুদ্ধিমান, যদিও একটি স্প্রেডশিট প্রোগ্রাম হওয়া সত্ত্বেও, আপনাকে "12/3" এর পরিবর্তে "= 12/3" লিখতে হবে অন্যথায় আপনি গণনার পরিবর্তে কোনও মান লিখবেন।

এটিকে ঘূর্ণি দিন, আপনি হতাশ হবেন না।


1

আমি গনুমারিকে পছন্দ করি কারণ এটি অন্যের মতো বোকা-প্রতিরোধী হওয়ার চেষ্টা করে না (এটি হারিয়ে যাওয়া কার্যকারিতা সম্পর্কে চিৎকার করে না) এবং বড় ডেটা নিয়ে কাজ করে ... তবুও আমি মনে করি এটি কেবল লিনাক্স is


1
এই প্রশ্নের অনুসরণ করে, আমি একটি শিকার করেছি: উইন্ডোজ সংস্করণ প্রজেক্ট রয়েছে
gngnome.org/gnumeric/downloads.shtml

1
এটি কেবলমাত্র বর্তমান শীটটি সংরক্ষণ করার বিষয়ে সতর্ক করে দেয় (যা জেরোমের বাগ-ভাল্লগুলির মধ্যে একটি ছিল), এবং এতে সঠিকভাবে সংরক্ষিত 12/3 সংখ্যাকে তারিখগুলিতে রূপান্তর করার বিরক্তিকর বৈশিষ্ট্যটি রয়েছে যদি না আপনি ম্যানুয়ালি নির্দিষ্ট করে দেন যে তারা আমদানিতে সংখ্যাসূচক নয় (তথ্য> পান বাহ্যিক ডেটা> পাঠ্য ফাইল আমদানি করুন ...) লোড হয় না।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

আপনি দয়া করে ব্যাখ্যা করতে পারেন যে এটি কীভাবে প্রশ্নের কৌশলটির অনুরোধটির প্রতিক্রিয়া জানায় ?
whuber

1

শুধু রনের সম্পাদক ব্যবহার করুন । এটি 'সহায়তা' ছাড়া এক্সেলের মতোই।

সাইট থেকে:

রনের সম্পাদক একটি শক্তিশালী টবুলার পাঠ্য বা সিএসভি, সম্পাদক। এটি স্ট্যান্ডার্ড কমা এবং ট্যাব বিচ্ছিন্ন ফাইল (সিএসভি এবং টিএসভি) সহ পৃথক পৃথক পাঠ্যের যে কোনও বিন্যাস খুলতে পারে এবং তাদের সামগ্রী এবং কাঠামোর উপর সম্পূর্ণ নিয়ন্ত্রণের অনুমতি দেয়।

কেবল টেবুলার পাঠ্য ফাইলগুলিই সম্পাদনা করা যায় না, তবে এগুলি সহজেই ফিল্টার করা যায় এবং প্রয়োজনীয় সংখ্যক অতিরিক্ত ভিউগুলিতে সংক্ষিপ্তসার করা যায়, শক্তিশালী বিশ্লেষণ কার্যকারিতা যুক্ত করে।

  • লাইসেন্স: ব্যক্তিগত ব্যবহার / মূল্যায়নের জন্য নিখরচায়
  • চলমান: উইন্ডোজ 32/64-বিট 2000 / এক্সপি / 2003 / ভিস্তা /

আপনি দয়া করে ব্যাখ্যা করতে পারেন যে এটি কীভাবে প্রশ্নের কৌশলটির অনুরোধটির প্রতিক্রিয়া জানায় ?
whuber

1

আমি ব্যক্তিগতভাবে সিএসভি ফাইলগুলি পরিচালনা করতে "রিলেশনাল ডাটাবেস" ধারণাটি ব্যবহার করতে চাই। সিএসভি ফাইলগুলি এক্সচেঞ্জ ডেটার জন্য ভাল তবে এতে কোনও ব্যবসায়িক যুক্তি নেই। সিএসভির সাথে আমার কাজ করার অভিজ্ঞতাটি হল "বিশ্লেষণটি পরিমার্জন করার জন্য ব্যবসার সাথে অনেকগুলি পুনরাবৃত্তি রয়েছে"। কেবল সরল পাঠ্য ফাইল (সিএসভি) দিয়ে কাজ করা অনেক চ্যালেঞ্জের মুখোমুখি হবে। উদাহরণস্বরূপ, CSV ফাইলটি "কী ডেটাটিকে অনন্য করে তোলে", অর্থাত্ "প্রতিটি সারির প্রাথমিক কী" কী তা দেখায় না। এটি পরে যখন আমাদের কাছে অন্যান্য ডেটা উত্স যোগদানের জন্য বড় সমস্যা তৈরি করে।

এসএসকিউাইট হ'ল সিএসভিকে রিলেশনাল ডাটাবেসে রূপান্তরিত করার জন্য ভাল সরঞ্জাম, এবং সিএসভির অনুরূপ, এটি এক্সচেঞ্জ করা সহজ, এবং কোনও সার্ভার সেট আপের প্রয়োজন হয় না। আরও গুরুত্বপূর্ণ বিষয়, এটি Rএবং অন্যান্য পরিসংখ্যান সংক্রান্ত সফ্টওয়্যারটি খুব ভালভাবে সমর্থন করে ।

আমার কৌশলটি সর্বদা সম্পর্কিত ডেটাবেজে একটি "ক্লিনড ডেটা" বজায় রাখা হয়। এবং এটি প্রতিটি টেবিলের প্রাথমিক কীতে পরিষ্কার রাখুন।

আসল কথায় কী ঘটতে পারে তার উদাহরণ এখানে রয়েছে (ধরুন আমরা বই বিক্রি করছি):

  • প্রথম দিন, আমি একটি সিএসভি ফাইল পেয়েছি যাতে গ্রাহকের সমস্ত তথ্য থাকে।
  • দ্বিতীয় দিন, আমি অন্য সিএসভি ফাইলটিতে সমস্ত পণ্য (পুস্তক) সম্পর্কিত তথ্য পেয়েছি reason কিছু কারণে, ব্যবসায় বলেছে যে কোনও আইএসবিএন উপলব্ধ নেই এবং বইয়ের নাম এবং লেখকের নামের সংমিশ্রণটি মূল কী।
  • তৃতীয় দিন, ব্যবসায়ের পাওয়া বইয়ের সংস্করণটির জন্য অ্যাকাউন্টিং করা দরকার, তারা দিন 2 এর সিএসভি "ওভাররাইট" করতে অন্য একটি সিএসভি প্রেরণ করে।
  • ৪ র্থ দিন, ব্যবসায়ের সন্ধানকারী গ্রাহকদের তথ্য আপডেট করা যেতে পারে (যেমন ঠিকানা পরিবর্তন), তারা গ্রাহকের তথ্যের একটি আপডেট সংস্করণ প্রেরণ করে।

এখন, আপনি পরিষ্কার ডেটার সুবিধা দেখতে এবং সেগুলি সম্পর্কিত ডেটাবেসে রাখতে পারেন। প্রাইমারি কী হিসাবে গ্রাহক আইডি এবং বইয়ের নাম, লেখক এবং প্রাথমিক কী হিসাবে সংস্করণ হিসাবে বলুন। ডেটা আপডেট করা এবং প্রয়োজন অনুসারে পরিবর্তনগুলি অন্তর্ভুক্ত করা খুব সহজ। এছাড়াও প্রাথমিক কীটি নতুন আগত ডেটার জন্য "সীমাবদ্ধতা" এবং "স্যানিটি চেক" দেয়।


0

আপনি যদি এক্সেলের "আমদানি ডেটা" বৈশিষ্ট্যটি ব্যবহার করেন তবে এটি আপনাকে প্রতিটি কলামের জন্য ডেটা ধরণের নির্বাচন করার বিকল্প দেবে। আপনি সমস্ত কলাম নির্বাচন করতে পারেন এবং "পাঠ্য" ডেটা টাইপ ব্যবহার করতে পারেন।


আপনি দয়া করে ব্যাখ্যা করতে পারেন যে এটি কীভাবে প্রশ্নের কৌশলটির অনুরোধটির প্রতিক্রিয়া জানায় ?
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.