কীভাবে আর আর পাইথন তথ্য বিজ্ঞানে একে অপরের পরিপূরক হয়?


54

অনেক টিউটোরিয়াল বা ম্যানুয়ালগুলিতে বর্ণনাকে বোঝা যায় যে বিশ্লেষণ প্রক্রিয়াটির পরিপূরক উপাদান হিসাবে আর এবং পাইথন সহাবস্থান করে। আমার প্রশিক্ষণপ্রাপ্ত চোখের কাছে অবশ্য মনে হয় উভয় ভাষা একই কাজ করে।

সুতরাং আমার প্রশ্নটি হল যে দুটি ভাষার জন্য যদি সত্যিই বিশেষায়িত কুলুঙ্গি থাকে বা এটি কেবল একটি ব্যক্তিগত পছন্দ যদি একটি বা অন্যটি ব্যবহার করবেন কিনা?


2
এটি সত্যিই সেই থ্রেডের সদৃশ বলে মনে হচ্ছে না। এটি কীভাবে পাইথনকে পরিসংখ্যানগুলি ব্যবহার করতে হয় তা নয়, এটি পাইথন কীভাবে আর পরিপূরক করতে পারে (স্পষ্টতই সংখ্যার বিশ্লেষণ করতে আর ব্যবহৃত হবে)।
গুং - মনিকা পুনরায়

4
আর যদি আপনি 10 বছর আগে একটি পরিসংখ্যানবিদ হন। পাইথন আপনি যদি নিজের কোডটি কোথাও কোথাও তৈরি করতে চান বা পুনরায় ব্যবহার করতে চান।
djechlin


3
এই Q. এর জনপ্রিয়তার কারণে এবং পতাকাগুলির মাধ্যমে অনুরোধের জবাবে, আমি এটিকে পুনরায় খুলেছি তবে এটি সিডব্লিউ করেছি।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

1
কি সবচেয়ে উত্তর ভুলে যাওয়া ঝোঁক যে তারা তুলনা হয় ভাষা থেকে পাইথন বাস্তবায়ন গনুহ-আর। আর এর অন্যান্য বাস্তবায়নও রয়েছে (দেখুন জাভাতে লেখা রেনজিন , মাইক্রোসফ্ট আর ওপেন , যা ইন্টেল এমকেএল , ফাস্টআর , পিকিআর , ইত্যাদি সহ সংকলিত আছে )। এগুলি জিএনইউ-আর এর সাথে আরও কিছু রক্ষণশীল বাস্তবায়ন নিয়ে কিছু সমস্যা সংশোধন করার চেষ্টা করে। এছাড়াও, মনে রাখবেন আর এর কোনও আনুষ্ঠানিক সংজ্ঞা নেই।
ফায়ারব্যাগ

উত্তর:


45

তারা পরিপূরক হয়। এটা সত্য যে উভয় পারেন একই জিনিস না, এখনো এই বেশির ভাগ ভাষায় বলা যেতে পারে। প্রত্যেকের এর শক্তি এবং দুর্বলতা রয়েছে। সাধারণ দৃষ্টিভঙ্গি থেকে মনে হয় যে পাইথন ডেটা সংগ্রহ এবং প্রস্তুতির পাশাপাশি পাঠ্য বিশ্লেষণের পক্ষে সেরা। তথ্য বিশ্লেষণের জন্য আরটিকে সেরা হিসাবে বিবেচনা করা হয়, কারণ এটি প্রথম এবং সর্বাগ্রে একটি পরিসংখ্যানের ভাষা।

আর আপনি যা ভাবতে পারেন তার জন্য একটি প্যাকেজগুলির স্মর্গাসর্ড রয়েছে তবে এর প্রধানটি পরিসংখ্যানগত বিশ্লেষণ - বুনিয়াদি চি-বর্গ থেকে ফ্যাক্টর বিশ্লেষণ এবং বিপদ মডেলগুলি, এটি সহজ এবং শক্ত। পরিসংখ্যানগুলির বৃহত্তম কিছু নাম আর প্যাকেজ তৈরি করে এবং এটি আপনার প্রতিটি প্রয়োজনে সহায়তা করার জন্য একটি প্রাণবন্ত সম্প্রদায় রয়েছে। ggplot2ডেটা ভিজ্যুয়ালাইজেশনের একটি মান (গ্রাফ ইত্যাদি)। আর একটি ভেক্টরাইজড ভাষা এবং দক্ষতার সাথে ডেটা লুপ করার জন্য নির্মিত। এটি র‌্যামে সমস্ত ডেটা সংরক্ষণ করে, যা দ্বি-তীরযুক্ত তরোয়াল - এটি ছোট ডেটা সেটগুলিতে চটজলদি (যদিও কিছু আমার সাথে তর্ক করতে পারে) তবে এটি বড় ডেটা ভালভাবে পরিচালনা করতে পারে না (যদিও এটি বাইপাস করার জন্য প্যাকেজ রয়েছে) যেমন ff)

পাইথন আর এর চেয়ে শেখা যথেষ্ট সহজ - বিশেষত যাদের পূর্ববর্তী প্রোগ্রামিং অভিজ্ঞতা রয়েছে তাদের ক্ষেত্রে। আর অদ্ভুত ... পাইথন ডেটা পুনরুদ্ধারে দুর্দান্ত এবং ওয়েব স্ক্র্যাপিংয়ের জন্য ব্যবহার করার ভাষা (আশ্চর্যজনক সহ beautifulsoup) is পাইথন স্ট্রিং পার্সিং এবং পাঠ্য ম্যানিপুলেশনের ক্ষেত্রে শক্তির জন্য পরিচিত। pandasডেটা ম্যানিপুলেশন, মার্জিং, ট্রান্সফর্মিং ইত্যাদি জন্য একটি দুর্দান্ত গ্রন্থাগার এবং এটি দ্রুত (এবং সম্ভবত আর দ্বারা অনুপ্রাণিত)।

পাইথন দুর্দান্ত হয় যখন আপনার কিছু প্রোগ্রামিং করা দরকার। এটি একটি সাধারণ-উদ্দেশ্যমূলক ভাষা হওয়ায় এটি আশ্চর্যজনক নয়। আর, তবে এর সমস্ত বর্ধনের সাথে পরিসংখ্যানবিদদের দ্বারা পরিসংখ্যানবিদরা এটি নির্মাণ করেছিলেন। সুতরাং পাইথন অনেকগুলি অ্যাপ্লিকেশনে সহজ ও উন্নত এবং দ্রুততর হতে পারে, তবে স্ট্যাটিস্টিকাল বিশ্লেষণের জন্য আর-তে যাওয়ার প্ল্যাটফর্ম হবে।


13
যে কেউ উভয়ই জানেন, আমি এর সাথে একমত; প্রচুর স্টাইলিস্টিক যুক্তি থাকতে পারে, তবে সবচেয়ে বড় পার্থক্যটি হ'ল একবার যখন বাস্তবিক কারণে স্ট্যাটিস্টিকাল মডেলগুলি চালানোর সময় পাইথন অনুন্নত হয়। Statsmodels প্যাকেজ আপনি কিছু বুনিয়াদি পায়, কিন্তু আর, Stata বা Sas বিভাগ কাছে না। একটি উল্লেখযোগ্য ব্যতিক্রম হ'ল মেশিন লার্নিং স্টাইল বিশ্লেষণ, যার জন্য পাইথনের সাইকিটলারন খুব ভাল মেলে। অন্য সমস্ত কিছুর জন্য আমি মনে করি ভাল যুক্তি তৈরি করা যেতে পারে যে পাইথন কমপক্ষে আর এর সমান এবং প্রায়শই উচ্চতর। উভয়ই শেখা কোনওভাবেই সময়ের খারাপ ব্যবহার নয়।
জেফ

2
আমি এর বেশিরভাগের সাথে একমত - তবে বিষয়গুলিকে আরও জোর দিয়ে দেব - আর বড় ডেটা সেটগুলির পক্ষে ভাল নয় এবং স্পার্স ডেটা সেটগুলি পরিচালনা করে না (বেশিরভাগ গ্রন্থাগার এটি সমর্থন করে না) খুব ভালভাবে (যা অনেকে মেশিন লার্নিং সম্পাদন করে) উদাহরণস্বরূপ 'শব্দের ব্যাগ' টাইপ মডেল যেখানে কোনও ফ্যাক্টর / শ্রেণিবদ্ধ ভেরিয়েবলের কার্ডিনালিটি m
seanv507

10
কোনও মন্তব্যের থ্রেডে কোনও যুক্তি শুরু করার জন্য নয়, তবে আর-এর data.tableপ্যাকেজটি বিশেষত বৃহত্তর ডেটা সেট, এবং বিতরণ প্রক্রিয়াজাতকরণ থেকে সূক্ষ্মভাবে প্লাগগুলিতে দক্ষ কাজের জন্য is
উজ্জ্বল তারা

3
আপনি যদি মনে করেন যে ডেটা পুনরুদ্ধার এবং স্ট্রিং পার্সিংয়ের ক্ষেত্রে পাইথন আর এর চেয়ে ভাল তবে আপনি পুরো সময়টি খুব খারাপ ব্যবহার করে চলেছেন। একই ঝুলিতে জন্য "আর অত্যধিক ডেটা সেটের জন্য ভাল নয় এবং বিক্ষিপ্ত ডেটা সেট হ্যান্ডেল নেই (সবচেয়ে লাইব্রেরি এটা সমর্থন না) খুব ভাল"

3
ট্রেভর এর উত্সাহ যোগ করুন data.table; আমি এও বলতে পেরে খুশি যে rvestবেশিরভাগ স্ক্র্যাপিংয়ের কাজগুলি পরিচালনা করার জন্য একটি দুর্দান্ত সরঞ্জাম, এবং তার থেকে উঠে আসা এবং চালানো অনেক সহজbeautifulsoup
মাইকেলচিরিকো

21

আমি মূল পয়েন্টগুলিতে একটি উত্তর তৈরি করার চেষ্টা করব যেখানে উভয় ভাষা ডেটা বিজ্ঞান / পরিসংখ্যান / উপাত্ত বিশ্লেষণ এবং এর মত, যেমন উভয়ই ব্যবহার করে play

ডেটা বিশ্লেষণের কার্যপ্রবাহে সাধারণত নিম্নলিখিত পদক্ষেপ থাকে:

  1. কিছু উত্স থেকে ডেটা আনয়ন (সম্ভবত একটি এসকিউএল / নোএসকিউএল ডাটাবেস বা .csv ফাইল)।
  2. একটি শালীন এবং যুক্তিসঙ্গত ফর্ম্যাটে (ডেটা ফ্রেম) ডেটা পার্স করা যাতে কোনও ব্যক্তি অপারেশন করতে পারে এবং তারপরে চিন্তা করতে পারে।
  3. ডেটাতে কিছু ফাংশন প্রয়োগ করা (গোষ্ঠীকরণ, মোছা, মার্জ করা, নামকরণ)।
  4. ডেটাতে কিছু ধরণের মডেল প্রয়োগ করা (রিগ্রেশন, ক্লাস্টারিং, নিউরাল নেটওয়ার্ক বা অন্য কোনও বা কম-বেশি জটিল তত্ত্ব)।
  5. আপনার ফলাফলকে কম বা কম প্রযুক্তিগত দর্শকের কাছে স্থাপন / উপস্থাপন করা।

তথ্য আনয়ন

সময়ের ৯৯%, ডেটা আনার প্রক্রিয়াটি এসকিউএল বা ইম্পাল ডাটাবেসকে জিজ্ঞাসাবাদে নেমে আসে: পাইথন এবং আর উভয়েরই নির্দিষ্ট ক্লায়েন্ট বা গ্রন্থাগার রয়েছে যা কোনও সময় এবং সমানভাবে কাজ করে না ( RImpala, RmySQLআর এবং MySQLdbপাইথনের জন্য মসৃণভাবে কাজ করুন, যুক্ত করার মতো খুব বেশি নয়)। বাহ্যিক .csv ফাইলগুলি পড়ার ক্ষেত্রে, আর এরdata.table জন্য প্যাকেজটি এমন কোনও ফাংশন সরবরাহ করে যা বিশাল এবং জটিল .csv ফাইলগুলিতে কোনও কাস্টম পার্সিং বিকল্প সহ কোনও সময়ই পড়ে না এবং ফলটি সরাসরি কলামের নাম এবং সারি সংখ্যা সহ ডেটা ফ্রেমে রূপান্তরিত করে।fread

ডেটা ফ্রেমগুলি সংগঠিত করা হচ্ছে

আমরা ডেটাটি কোনও ধরণের টেবিলের মধ্যে সঞ্চয় করতে চাই যাতে আমরা যে কোনও একক প্রবেশ, সারি বা কলাম সহজেই অ্যাক্সেস করতে পারি।

আর প্যাকেজ data.table, লেবেল নামান্তর, মুছে দিন এবং ডেটা অ্যাক্সেস অপরাজেয় উপায় প্রদান করে। স্ট্যান্ডার্ড সিনট্যাক্সটি এসকিউএল-এর মতো অনেকটা dt[i, j, fun_by], যেখানে এটির উদ্দেশ্য dt[where_condition, select_column, grouped_by (or the like)]; কাস্টম ব্যবহারকারী-সংজ্ঞায়িত ফাংশনগুলি পাশাপাশি সেই jধারাটিতে স্থাপন করা যেতে পারে , যাতে আপনি ডেটা ম্যানিপুলেট করতে এবং গ্রুপ বা উপগ্রহে কোনও জটিল বা অভিনব ফাংশন প্রয়োগ করতে সম্পূর্ণ স্বাধীন হন (যেমন আই-থ্রি সারি, কে-থ্রি উপাদানটি যোগ করুন এবং এটিকে (i-1) -th সারির (k-2) -th তম উপাদানের সাথে যোগ করুন এবং কেবলমাত্র যদি পুরো কলামটির মানক বিচ্যুতি যদি এটি হয় তবে সম্পূর্ণ কলাম দ্বারা সম্পূর্ণভাবে শ্রেণিবদ্ধ করা হয়। কটাক্ষপাত আছে benchmarks এবং এই অন্যান্য আশ্চর্যজনক এ তাই প্রশ্ন। কলাম এবং সারিগুলিকে বাছাই, মুছে ফেলা এবং পুনরায় নামকরণ তাদের যা করতে হবে তা করে এবং স্ট্যান্ডার্ড ভেক্টরাইজড আর পদ্ধতিগুলি apply, sapply, lapply, ifelseপ্রতিটি উপাদানকে লুপ না করে পুরোপুরি কলাম এবং ডেটা ফ্রেমে ভেক্টরাইজড ক্রিয়াকলাপ সম্পাদন করে (মনে রাখবেন যে যখনই আপনি আর এ লুপগুলি ব্যবহার করছেন) এটি খারাপভাবে করছেন)।

পাইথনের কাউন্টারওয়েপনটি pandasগ্রন্থাগার। এটি অবশেষে কাঠামোটি সরবরাহ করে pd.DataFrame(সেই স্ট্যান্ডার্ড পাইথনের অভাব রয়েছে, কিছু কারণে এখনও আমার অজানা) যা ডেটা তারা যেগুলির জন্য, যেমন ডেটা ফ্রেম (কিছু numpy array, numpy list, numpy matrixবা কিছু বাদে)) গ্রুপিং, পুনরায় নামকরণ, বাছাইকরণ এবং এর মতো অপারেশনগুলি সহজেই অর্জন করা যায় এবং এখানেও, ব্যবহারকারী পাইথন applyবা ব্যবহার করে কোনও গ্রুপযুক্ত ডেটাसेट বা ফ্রেমের সাবসেটটিতে যে কোনও কাস্টম ফাংশন প্রয়োগ করতে পারেন lambdadf[df.iloc(...)]এন্ট্রিগুলি অ্যাক্সেস করার জন্য আমি ব্যাকরণটি ব্যক্তিগতভাবে অপছন্দ করি তবে এটি কেবল ব্যক্তিগত স্বাদ এবং কোনও সমস্যা নেই। গোষ্ঠীকরণের ক্রিয়াকলাপগুলির মানদণ্ডগুলি আর এর চেয়ে কিছুটা খারাপ এখনও data.tableআপনি সংকলনের জন্য 0.02 সেকেন্ড সংরক্ষণ করতে না চাইলে কার্য সম্পাদনের ক্ষেত্রে কোনও বড় পার্থক্য নেই।

স্ট্রিংস

আর উপায় স্ট্রিং চিকিত্সা ব্যবহার করা stringrপ্যাকেজ যে কোনো টেক্সট ম্যানিপুলেশন, কোনো শব্দ বা শব্দগুচ্ছের অক্ষরগুলিকে এদিক-ওদিক করে গঠিত শব্দ বা শব্দগুচ্ছ , রেগুলার এক্সপ্রেশন পারবেন, সাদা স্পেস বা স্বচ্ছন্দে সঙ্গে অনুরূপ trailing। এটি JSON লাইব্রেরির সাথে মিশ্রণেও ব্যবহার করা যেতে পারে যা JSON অভিধানগুলি আনপ্যাক করে এবং তাদের উপাদানগুলি তালিকাভুক্ত করে, যাতে কোনওের একটি চূড়ান্ত ডেটা ফ্রেম থাকে যেখানে কলামের নাম এবং উপাদানগুলি তাদের হতে হবে, কোনও ইউটিএফ 8 অক্ষর বা সাদা স্থান ছাড়াই without সেখানে.

পাইথনের পান্ডস .str. নিয়মিত প্রকাশের সাথে খেলতে, পারা অনুসরণ করা বা তার প্রতিযোগী হিসাবে ভাল হিসাবে একই কাজ করে, তাই এখানেও স্বাদের কোনও বড় পার্থক্য নেই।

মডেল প্রয়োগ করা

আমার মতে, এখানে দুটি ভাষার মধ্যে পার্থক্য দেখা দেয়।

আরআজকের মতো গ্রন্থাগারগুলির একটি অপূরণীয় সেট রয়েছে যা ব্যবহারকারীকে এক থেকে দুই লাইনের কোডে প্রয়োজনীয় কিছু করার অনুমতি দেয়। স্ট্যান্ডার্ড ফাংশনাল বা বহুবর্ষীয় রিগ্রেশনগুলি এক-লাইনারে সম্পাদিত হয় এবং আউটপুট উত্পাদন করে যার সহগ সহজেই পঠনযোগ্য হয়, যার সাথে তাদের সম্পর্কিত আস্থা অন্তর এবং পি-মান বিতরণ থাকে। একইভাবে ক্লাস্টারিংয়ের জন্য, একইভাবে এলোমেলো বন মডেলগুলির জন্য, একইভাবে ডেনডোগ্রামগুলির জন্য, মূল উপাদান বিশ্লেষণ, একক মানের পচন, লজিস্টিক ফিট এবং আরও অনেক কিছুর জন্য। উপরের প্রত্যেকটির আউটপুট সম্ভবত একটি নির্দিষ্ট প্লটিং শ্রেণীর সাথে আসে যা আপনি সবেমাত্র যা করেছেন তার চিত্রকল্প তৈরি করে সহগ এবং পরামিতিগুলির জন্য রঙ এবং বুদবুদ। অনুমান পরীক্ষা, পরিসংখ্যান পরীক্ষা, শাপিরো,

পাইথন সঙ্গে যোগাযোগ রাখা চেষ্টা করছে SciPyএবং scikit-learn। বেশিরভাগ মানক বিশ্লেষণ এবং মডেলগুলি উপলভ্য, তবে সেগুলি কোডের জন্য কিছুটা দীর্ঘ এবং পড়তে কম স্বজ্ঞাত (আমার মতে)। আরও জটিল মেশিনারিজ অনুপস্থিত, যদিও কিছু ইতিমধ্যে বিদ্যমান লাইব্রেরির সংমিশ্রণে ফিরে পাওয়া যায়। আর এর চেয়ে পাইথনটিতে যে জিনিসটি আমি পছন্দ করি তা হ'ল দ্বি-গ্রাম, ত্রি-গ্রাম এবং উচ্চতর অর্ডার সহ ব্যাগ-অফ-ওয়ার্ড পাঠ্য বিশ্লেষণ।

ফলাফল উপস্থাপন

উভয় ভাষারই সুন্দর ষড়যন্ত্র সরঞ্জাম রয়েছে, ggplot2সর্বোপরি আর এবং এটি সম্পর্কিত পাইথন সমতুল্য। সত্যিই প্রতিযোগিতা করার মতো তেমন কিছু নয়, তারা কাজটি সুরক্ষিত ও সুরক্ষিত করে, যদিও আমি বিশ্বাস করি যে আপনি যদি ফলাফলগুলি উপস্থাপন করেন তবে আপনাকে অন্যান্য সরঞ্জামগুলি ব্যবহার করতে হতে পারে — সেখানে অভিনব রঙিন নকশার সরঞ্জাম রয়েছে এবং পাইথন বা আর উভয়ই অবাক করা বোঝায় না অভিনব লাল এবং সবুজ টানা এবং ড্রপ সহ শ্রোতা audience আর ই এর ইদানীং এর shiny appবৈশিষ্ট্যগুলিতে অনেক উন্নতি প্রকাশ করেছে যা মূলত এটি ইন্টারেক্টিভ আউটপুট উত্পাদন করতে দেয় । আমি কখনই এটি শিখতে চাইনি, তবে আমি জানি এটি সেখানে রয়েছে এবং লোকেরা এটি ভালভাবে ব্যবহার করে।


সাইড নোট

পার্শ্ব নোট হিসাবে আমি জোর দিয়ে বলতে চাই যে দুটি ভাষার মধ্যে প্রধান পার্থক্য হ'ল পাইথন হ'ল একটি সাধারণ উদ্দেশ্য প্রোগ্রামিং ল্যাঙ্গেজ যা কম্পিউটার বিজ্ঞান, বহনযোগ্যতা, মোতায়েনকরণ এবং আরও অনেক কিছু দ্বারা তৈরি। এটি কী করে তা অবাক করে এবং শিখতে সোজা হয়; অজগর পছন্দ করে না এমন কেউ নেই। তবে প্রোগ্রামিং করার জন্য এটি প্রোগ্রামিংয়ের ভাষা।

আরঅন্যদিকে, গণিতবিদ, পদার্থবিদ, পরিসংখ্যানবিদ এবং ডেটা বিজ্ঞানীদের দ্বারা এবং এটি আবিষ্কার করা হয়েছিল। আপনি যদি সেই ব্যাকগ্রাউন্ড থেকে আসেন তবে সবকিছুই সঠিক ধারণা দেয় কারণ এটি পরিসংখ্যান এবং গণিতে ব্যবহৃত ধারণাগুলি পুরোপুরি আয়না করে এবং পুনরুত্পাদন করে। তবে, পরিবর্তে, আপনি একটি কম্পিউটার বিজ্ঞানের পটভূমি থেকে এসে জাভা বা সি তে অনুকরণ করতে চান আর আপনি হতাশ হবেন; এটি স্ট্যান্ডার্ড অর্থে "অবজেক্টস" রাখে না (ভাল, এটি করে তবে এটি সাধারণত যা তারা মনে করে তা নয় ...), এটি স্ট্যান্ডার্ড অর্থে ক্লাস নেই (ভাল, এটি করে, তবে সাধারণত যা হয় না তা নয়) তারা মনে করে ...), এর "পয়েন্টার" বা অন্য সমস্ত কম্পিউটার বিজ্ঞানের কাঠামো নেই - তবে কেবল এটির প্রয়োজন হয় না বলে। শেষ কিন্তু সর্বনিম্ন নয়: ডকুমেন্টেশন এবং প্যাকেজগুলি তৈরি করতে এবং পড়ার জন্য সোজা (যদি আপনি রাস্তুডিও ব্যবহার করছেন); সেখানে একটি বিশাল এবং উত্সাহী সম্প্রদায় রয়েছে, এবং গুগলকে "কীভাবে আর-তে কীভাবে সন্নিবেশ-এলোমেলো-সমস্যাটি করবেন" এর অক্ষরে অক্ষরে পাঁচ সেকেন্ড সময় লাগে যার প্রথম এন্ট্রি আপনাকে সংশ্লিষ্ট কোড সহ সমস্যার (অন্য কারো দ্বারা সম্পন্ন) সমাধানে পুনঃনির্দেশ করে ts , কোন সময়।

বেশিরভাগ শিল্প সংস্থাগুলির পাইথন (বা পাইথন-বান্ধব পরিবেশ) এ তাদের অবকাঠামো তৈরি করা হয়েছে যা পাইথন কোডের সহজ সংহতকরণের অনুমতি দেয় (ঠিক import myAnalysisযে কোনও জায়গায় এবং আপনি মূলত সম্পন্ন করেছেন)। তবে যে কোনও আধুনিক প্রযুক্তি বা সার্ভার বা প্ল্যাটফর্ম সহজেই কোনও সমস্যা ছাড়াই ব্যাকগ্রাউন্ড আর কোড চালায়।


8
+6, এটি খুব ভাল উত্তর: বিস্তারিত, নির্ভুল এবং ভারসাম্যযুক্ত।
গুং - মনিকা পুনরায়

এখানে +1 সেরা উত্তর। এটি মজার বিষয়, আমি জাভা থেকে আরে এসেছি (যদিও সরাসরি রুটে নয়), এবং আমি এটির বেশ পছন্দ করেছিলাম। আমি অগত্যা মনে করি না যে আর এ লুপগুলি করার অর্থ আপনি এটি ভুল করছেন। আমি মাঝে মাঝে লুপগুলি ব্যবহার করে নিজেকে মাথা ছুঁড়ে ফেলার চেষ্টা করে দেখতে পেয়েছি তবে এর চারপাশে কোনও উপায় খুঁজে পেলাম না (যেমন আগের সারিগুলির অবস্থার উপর ভিত্তি করে একটি ডেটা সেটে নতুন পরিবর্তনশীল মান তৈরি করা এবং মাধ্যমিক ডেটা সেট থেকে ডেটা আনার মতো)।
যুবাল স্পিগলার

যদি কেবল এই প্যাকেজগুলির সূর্যের অধীনে কিছু করার থাকে তবে সেগুলি সমস্ত লোকেরা লিখেছিলেন যারা কীভাবে স্ট্যাটিস্টিকাল কম্পিউটিং করতে / নির্ভরযোগ্য এবং শক্তিশালী সংখ্যার গাণিতিক সফ্টওয়্যার লিখতে / সংখ্যার বিশ্লেষণ জানেন, ইত্যাদি লিখেছিলেন কিছু আর প্যাকেজগুলি খুব ভাল। প্রচুর সংখ্যক আর প্যাকেজ, এমনকি বিখ্যাত লেখকরা লিখেছেন এমনগুলি হ'ল মোট আবর্জনা - এবং অনেক ব্যবহারকারীরাই বুঝতে পারেন না যে তারা আবর্জনা পাচ্ছেন। ওহ, এটি ক্র্যানে রয়েছে, এটি অবশ্যই ভাল, বা কমপক্ষে সঠিক, বা নির্ভরযোগ্য ... ভুল !!!!!
মার্ক এল। স্টোন

"আর, আজ অবধি, গ্রন্থাগারগুলির একটি অপরিসীম সেট রয়েছে যা ব্যবহারকারীকে এক থেকে দুই লাইনের কোডে প্রয়োজনীয় কিছু করার অনুমতি দেয়।" আমি 100% এর সাথে সম্মত হই, যদি না সঠিক উত্তর না পাওয়া তবে ব্যবহারকারী যা চান তার মধ্যে একটি।
মার্ক এল স্টোন

8
@ মার্কএল.স্টোন আপনি কি বিখ্যাত ব্যবহারকারীদের দ্বারা লিখিত স্ট্যান্ডার্ড প্যাকেজগুলির উদাহরণ উপস্থাপন করতে আপত্তি করবেন?
10:25

15
  • পাইথন একটি সাধারণ প্রোগ্রামিং ল্যাঙ্গুয়েজ: অতএব, ডাটা বিশ্লেষণের পাশাপাশি আরও অনেক কাজ করা ভাল is উদাহরণস্বরূপ, আমরা যদি প্রোডাকশন সার্ভারে আমাদের মডেল এক্সিকিউশনটি স্বয়ংক্রিয় করতে চাই, তবে পাইথন সত্যিই ভাল পছন্দ। অন্যান্য উদাহরণগুলির মধ্যে রয়েছে ডেটা পড়ার জন্য হার্ডওয়্যার / সেন্সরগুলির সাথে সংযোগ স্থাপন, ডাটাবেসগুলির সাথে ইন্টারঅ্যাক্ট করা (JSON এর মতো সম্পর্কিত বা অ-কাঠামোগত ডেটা), পার্সিং ডেটা, নেটওয়ার্ক প্রোগ্রামিং (টিসিপি / আইপি), গ্রাফিক্যাল ইউজার ইন্টারফেস, শেলের সাথে ইন্টারঅ্যাক্ট করা ইত্যাদি Well ভবিষ্যদ্বাণীপূর্ণ মডেলগুলির সাথে খুব কম সম্পর্কযুক্ত কোনও ডেটা বিজ্ঞানী এত ধরণের কাজ কেন করতে চান? আমি মনে করি মানুষের বিভিন্ন সংজ্ঞা আছে ডেটা বিজ্ঞানী কী?কিছু সংস্থায় ডেটা পার্স করা এবং ড্যাশবোর্ডের সাথে বর্ণনামূলক বিশ্লেষণ করা ব্যবসায়ের পক্ষে যথেষ্ট ভাল এবং ভবিষ্যদ্বাণীমূলক মডেলগুলি করার জন্য ডেটা যথেষ্ট পরিপক্ক হয় না। অন্যদিকে, অনেক ছোট সংস্থায় লোকেরা ডেটা বিজ্ঞানীদের প্রচুর সফ্টওয়্যার ইঞ্জিনিয়ারিংয়ের প্রত্যাশা করতে পারে। অজগর জানা আপনাকে অন্যান্য সফ্টওয়্যার ইঞ্জিনিয়ারদের থেকে স্বাধীন করে তুলবে))

  • আর এর কাছে প্রচুর পরিসংখ্যান প্যাকেজ রয়েছে যা পাইথন বা ম্যাটল্যাবের চেয়ে অনেক ভাল। আর ব্যবহার করে, কেউ বাস্তবায়নের বিশদ স্তরের পরিবর্তে মডেল স্তরে ভাবতে পারে। এটি পরিসংখ্যানগত মডেলগুলি বিকাশে একটি বিশাল সুবিধা। উদাহরণস্বরূপ, অজগরটিতে অনেক মানুষ ম্যানুয়ালি নিউরাল নেটওয়ার্কগুলি প্রয়োগ করছেন; নিউরাল নেটওয়ার্ক কেন কাজ করে তা বুঝতে সাহায্য করতে পারে না, তবে অন্যের কাজটি কাজ করে কিনা তা যাচাই করার জন্য ডুপ্লিকেট করার রেসিপিটি অনুসরণ করে। আমরা যদি আরে কাজ করে থাকি তবে আমরা সহজেই বাস্তবায়নের বিশদটি পরিবর্তে মডেলের পিছনে গণিতে মনোনিবেশ করতে পারি।

অনেক ক্ষেত্রে লোকেরা সেগুলি একসাথে ব্যবহার করে। অট্টালিকাতে বিল্ডিং সফটওয়্যার করা সহজ, আর বিল্ডিং মডেলগুলি আর-তে আরও ভাল If যদি আপনার সংস্থার অনেকগুলি সফ্টওয়্যার ইঞ্জিনিয়ার রয়েছে, আপনার আরও বেশি আর দরকার পড়তে পারে And এবং আপনার সংস্থার অনেক গবেষণা বিজ্ঞানী থাকলে আপনার আরও অজগর লাগতে পারে।


2
নিস উত্তর কিন্তু আপনি পরিবর্তে 'তাদেরকে JSON' এর 'জেসন' লিখেছিলেন, আমাকে একটি ভাল মৃদুহাস্য দিতে হয়নি
সমাবস্থা

আমি পরিসংখ্যান বা "মেশিন-লার্নিং" সম্প্রদায়ের কোনও সদস্যই নই, তবে আমি মনে করি উন্নত প্যাকেজগুলির প্রাপ্যতা কিছুটা সম্প্রদায় নির্দিষ্ট। আমি বিশ্বাস করতে পারি যে অনেকগুলি নতুন এবং অত্যাধুনিক পরিসংখ্যান কৌশল আর কোড নিয়ে আসে। কিন্তু যখন আমি কম্পিউটার ভিশন / মেশিন লার্নিং / নিউরাল নেট পেপারগুলি দেখি যা ("উচ্চ-স্তরের") কোডগুলি নিয়ে আসে ... তারা মাতলাব বা পাইথন বলে মনে হয়।
জিওম্যাট 22 22

1
ভাষাগুলি কীভাবে কোনওভাবে ভাবতে পারে তা আলোচনার জন্য +1। আর এর একটি বিশাল সুবিধা হ'ল কারণ এটি পরিসংখ্যানবিদদের দ্বারা পরিসংখ্যানবিদরা তৈরি করেছেন, এটি কীভাবে মডেলিংয়ের ক্ষেত্রে চিন্তাভাবনাকে উত্সাহিত করে। প্রকাশ: আমি আরে সাবলীল, তবে পাইথনে কেবল ছিটকে পড়েছি।
আশে

উম ... কি হবে scikit-learn? scikit-learn.org/stable
যুদ্ধ জাহাজ

10

সমস্ত স্ট্রাইপের প্রোগ্রামাররা ভাষার পছন্দগুলি কতটা সাংস্কৃতিক তা অবমূল্যায়ন করে । নোড.জেএস এর মতো ওয়েব বিকাশকারী পাইথনের মতো বিজ্ঞানীরা। পলিগ্লট সফটওয়্যার ইঞ্জিনিয়ার হিসাবে যা জাভাস্ক্রিপ্টের তরলতা এবং জাভার অনমনীয়তা সব একইভাবে পরিচালনা করতে পারে, আমি বুঝতে পেরেছিলাম যে এই ভাষাগুলি একে অপরের কাজগুলিতে খারাপ না - কেবলমাত্র প্রচুর পরিমাণে প্যাকেজ, ডকুমেন্টেশন, সম্প্রদায়, বই, ইত্যাদি তাদের চারপাশে।

(স্বতন্ত্র কারণে একটি র্যান্ডম ভাষা অন্য কয়েকটি ভাষার চেয়ে ভাল, এই উত্তরের আগত মন্তব্যগুলি দেখুন see)

বরং বা, কি আর করতে পারে ডেডিকেটেড প্রোগ্রামারদের শূন্যস্থান পূরণ করার জন্য কাজ করছেন যথেষ্ট - - এবং একটি হল আমার ব্যক্তিগত ভবিষ্যদ্বাণী যে পাইথন ভবিষ্যতের পথ কারণ এটি সবকিছু আর করতে পারেন কি করতে পারেন হয় পর্যন্ত ভাল সফটওয়ার ইঞ্জিনিয়ারিং ভাষা। সফটওয়্যার ইঞ্জিনিয়ারিং একটি শৃঙ্খলা যা নিয়ে কাজ করে:

  • আপনার কোডের নির্ভরযোগ্যতার উপর নির্ভর করে এটিকে উত্পাদন করার পক্ষে যথেষ্ট (সুতরাং যেকোনো মেশিন লার্নিং মডেল যা ব্যবহারকারীদেরকে রিয়েল টাইমে পরিবেশন করে)
  • আপনার কোডটি পরিবর্তন এবং পুনরায় ব্যবহারের ফলে কাজ চালিয়ে যেতে পারে তা নিশ্চিত করা (ইউনিট টেস্টিং ফ্রেমওয়ার্কগুলি উদাহরণস্বরূপ)
  • অন্যের সুবিধার্থে এবং নিজের মতো করে 6 মাসের মধ্যে পড়ার পক্ষে মনোনিবেশ
  • সংস্করণ সহজ করার জন্য, পূর্ববর্তী কার্যকরী সংস্করণগুলিতে ব্যাকআউট এবং একাধিক পক্ষের সমবর্তী বিকাশের জন্য কোড সংস্থার উপর গভীর জোর
  • উন্নত ডকুমেন্টেশন সহ সরঞ্জাম এবং প্রযুক্তিগুলিকে অগ্রাধিকার দেওয়া, এবং সম্পত্তি হিসাবে আদর্শ হিসাবে যে তারা সঠিকভাবে ব্যবহার না করা হলে তারা আদৌ কাজ করবে না (মতলবের সাথে এটিই আমার সবচেয়ে বড় গ্রিপ ছিল - আমি একটি প্রশ্ন গুগল করেছিলাম এবং আমাকে তাদের বরং ভয়াবহ ফোরামগুলি পড়তে হবে) উত্তর খুঁজছেন)

প্লাস অকথ্য পাইথন শিখতে আরও সহজ।

বিজ্ঞানী এবং পরিসংখ্যানবিদরা বুঝতে পারবেন যে তারা ভাল সফটওয়্যার ইঞ্জিনিয়ারিং অনুশীলনের স্টেকহোল্ডার, কোনও স্বাধীন এবং উদ্বেগহীন পেশা নয়। কেবল আমার মতামত, তবে একাডেমিক কোডের ভঙ্গুরতা প্রমাণকারী কাগজপত্রগুলি এটি সমর্থন করবে।

এই উত্তরটি আমার সমস্ত মতামত - তবে আপনি একটি খুব মতামতযুক্ত প্রশ্ন জিজ্ঞাসা করেছেন, এবং এটি এতক্ষণে ভালভাবে গ্রহণ করা হয়েছে বলে আমি অনুভব করেছি যে আপনি প্রতিক্রিয়াতে একটি নজিরবিহীন, যুক্তিযুক্তভাবে অবহিত (আশা করি!) মতামতের প্রাপ্য। আর বোর্ড জুড়ে পাইথনের পক্ষে মারাত্মক যুক্তি রয়েছে এবং বাস্তবতা নিজেই যখন পক্ষপাতদুষ্ট হতে পারে তখন আমি নিরপেক্ষ উত্তর পোস্ট করার চেষ্টা করা থেকে বিরত হই।


জুলিয়া কি বড় হবে, পাইথনের চেয়ে ভাল বিকল্প হতে পারে?
কেজেটিল বি হালওয়ারসেন

1
@ কেজেটিভালভর্সেন "যখন এটি বড় হয়" একটি "যদি" হয় তবে এটি একটি "প্রতিষ্ঠিত ভাষা" দান করা খুব কঠিন এবং এটি মূলত একটি ব্যক্তিগত পছন্দ যে আপনি ঝুঁকিতে সীমান্ত প্রযুক্তিতে থাকতে চান কিনা তা দৃ firm়ভাবে কখনও গ্রহণ করা হবে না। আইএমও, পাইথনের এখন গতি আছে। আমি জুলিয়ার সাথে খুব বেশি পরিচিত নই যদিও এটি যদিও বেশ জেনেরিক মতামত।
djechlin

1
প্রথম বুলেট ব্যতীত, আমি দেখতে পাচ্ছি না যে পাইথন অন্য চারটি পয়েন্টের যে কোনওর মধ্যে সহজাতভাবে উন্নত।
ফায়ারব্যাগ

4
"পাইথন সমস্ত কিছু করতে পারে যা আর করতে পারে" মিথ্যা। "ডেডিকেটেড প্রোগ্রামাররা শূন্যস্থানগুলি পূরণ করার জন্য যা কাজ করছে" তার যথেষ্ট পরিমাণে " ভালভাবে, এটি বিশ্বের যে কোনও কিছুর জন্য সত্য হবে - যতক্ষণ না কেউ এতে কাজ করেন ততক্ষণ যে কোনও কিছু করা সম্ভব।
জেনেটে

2
পছন্দ করুন নির্ভরযোগ্যতার জন্য আপনার উদাহরণটি "তাই কোনও মেশিন লার্নিং মডেল যা ব্যবহারকারীদেরকে রিয়েল টাইমে পরিবেশন করে"। পাইথন এটিতে আরও ভাল কারণ এটি আর এর চেয়ে আরও সহজেই ডিপ্লোয়মেন্ট সমর্থন করে এবং কেবল এটিই। ইউনিট পরীক্ষা, পাঠযোগ্যতা, সংগঠন এবং ডকুমেন্টেশন সহজাত গুণাবলী নয় qualities আপনি নিজের পরীক্ষাগুলি প্রয়োগ করতে পারেন, আপনার কোডটি পড়ার পক্ষে সহজ করে তুলুন, এটি व्यवस्थित করুন এবং আর ডকুমেন্টেশনটি বোঝা সত্যিই সহজ।
ফায়ারব্যাগ

8

আমি একজন আর ব্যবহারকারী কিন্তু আমি পাই পাইথন ভবিষ্যত (আমার মনে হয় না এটি সিনট্যাক্স)

পাইথন ভবিষ্যত
পাইথনের সুবিধা যেমন অন্যান্য লোকেরা ইতিমধ্যে আরও বিস্তৃত সমর্থন এবং প্রোগ্রামারদের জন্য আরও লজিক্যাল সিনট্যাক্সের কথা উল্লেখ করেছেন।
এছাড়াও আপনি যে বিশ্লেষণ থেকে ফলাফলগুলি একটি উত্পাদন ব্যবস্থায় অনুবাদ করতে পারবেন সেই ক্ষমতাটি আরও সহজবোধ্য।
এটি পাইথনের সাধারণ উদ্দেশ্য হওয়ায় এবং আর হয় না তবে আমি যখন প্রোডাক্টযুক্ত আর পাইপলাইন দেখি তখনও আমি ভ্রু বাড়াতে পারি।
তবে কেবল তা-ই নয়, এমনকি উন্নত অ্যাপ্লিকেশনগুলির জন্য পাইথনও দ্রুত ধরা পড়ছে (সাইকিট-লার্ন, পাইব্রাইন, টেনস্রোফ্লো ইত্যাদি) এবং যখন এখনও আর স্ট্যাটিসটিকাল পদ্ধতিগুলি বাস্তবায়নের বিষয়ে শিক্ষাবিদদের মধ্যে লিঙ্গুয়া ফ্র্যাঙ্কা পেশাগত খাতে পাইথনটি বিশাল আকার ধারণ করেছে। উন্নত বিশেষায়িত লাইব্রেরির আবির্ভাব।

তবে আর মন্দ নয়
অনেকের কাছে "আরজে খারাপ সিনট্যাক্স" ব্যান্ডওয়্যাগনে ঝাঁপিয়ে পড়া পছন্দ হয়।
আমি আর এর বাক্য গঠনটি একটি ভাল জিনিস হিসাবে প্রস্তাব করতে চাই!
আর ব্যবহার করার সময় অ্যাসাইনমেন্ট ফাংশন, অলস মূল্যায়ন, অমিত মানের মূল্যায়ন এবং সূত্রগুলি বিপুল উপকারিতা
It সাথে নামগুলি তাকান names()এবং তারপরে যুক্ত করে নতুন নাম নির্ধারণ করুন <- c("A", "B", "C")
লোকেরা আর এর অদ্ভুত বাক্য গঠন সম্পর্কে অভিযোগ করলে তারা এটিকে একটি প্রোগ্রামিং ভাষা হিসাবে দেখায়, কোনও ডেটা বিজ্ঞানের সরঞ্জাম হিসাবে নয়।
আর কেউ এসে ডিপিপ্লায়ারকে ভালবাসে এবং আমি পান্ডের সিনট্যাক্সের তুলনায় কিছুটা আনাড়ি খুঁজে পাই।
হ্যাঁ এটি কিছুটা নমনীয়, তবে বেশিরভাগ কাজের জন্য আপনি আর এর চেয়ে সাধারণ কমান্ড সম্পাদন করতে অনেক বেশি কী-স্ট্রোক গ্রহণ করেন যা কেবল পাইথনের পার্সার সন্তুষ্ট করার জন্য, আপনার ধারণা প্রকাশ করার জন্য নয়।

সংক্ষিপ্তসার
অবশ্যই অবশ্যই উভয়ই জানা উচিত এবং পাইথন সেখানে পৌঁছে যাওয়ার সময় এর ডোমেনের নির্দিষ্ট নকশার পছন্দগুলি এডহক কাজের জন্য আরও সহজ করে তোলে। আর এর বিশাল অপূর্ণতা হ'ল এটির ডোমেনটি ছেড়ে দেওয়া কঠিন, যা আপনি একবারে নিজের অনুসন্ধানগুলি টেকসই উপায়ে বাস্তবায়নের চেষ্টা করার পরে মূলত আপনাকে করতে হয়।


4

আপনি যদি আর একটি পরিসংখ্যান সরঞ্জাম হিসাবে এবং প্রোগ্রামিং ভাষা হিসাবে না তাকান, এটি সত্যিই দুর্দান্ত। এটি স্টাটা বা এসপিএসএসের চেয়ে অনেক বেশি নমনীয়তা রয়েছে তবে তারা যা কিছু করতে পারে তা করতে পারে। আমি কলেজের সময় স্টাটা শিখেছিলাম, আর আর এটি দেখার পক্ষে যথেষ্ট সহজ ছিল কারণ আমার কাছে ইতিমধ্যে পরিসংখ্যানের সরঞ্জামের দৃষ্টিভঙ্গি ছিল এবং অন্যেরা থাকতে পারে এমন কোনও শুদ্ধ প্রোগ্রামিং ভাষার অভিজ্ঞতা নয়।

আমি মনে করি যে যখন প্রোগ্রামাররা তারা আর শিখতে এবং বোঝার চেষ্টা করে তখন আর নিয়ে হতাশা বাজতে শুরু করে; তবে এটি একটি পরিসংখ্যান ব্যাকগ্রাউন্ডের মাধ্যমে আর এ আসে তাদের পক্ষে দুর্দান্ত সরঞ্জাম।

আপনি যদি ইতিমধ্যে দুর্দান্ত প্রোগ্রামার হন তবে পাইথন দুর্দান্ত is তবে কলেজের বাইরে প্রোগ্রামিং এবং পরিসংখ্যানের সূচনাকারী হিসাবে আমার কাছে আর অনেক ভাল পছন্দ ছিল। কোনটি আপনার স্কিলসেটে ফিট করে এবং আরও বেশি আগ্রহী সেটির পক্ষে এটি কেবলমাত্র অগ্রাধিকার।


3

পূর্বের কয়েকটি উত্তর যুক্ত করা:

আমার অভিজ্ঞতায়, আর এর dplyr + tidyr, ggplot এবং Rmarkdown কে কাঁচা তথ্য থেকে উপস্থাপনযোগ্য ফলাফল পাওয়ার ক্ষেত্রে ব্যবহার করার চেয়ে সহজ আর কিছুই নেই। পাইথন প্রচুর অফার করে এবং আমি এটিকে আরও বেশি করে ব্যবহার করছি তবে আমি নিশ্চিত হ্যাডলির প্যাকেজগুলি যেভাবে এক সাথে বেঁধে নিয়েছি love


2

পাইথনের বিজ্ঞানের বাইরের বিস্তৃত গ্রহণ রয়েছে, সুতরাং আপনি সেগুলি থেকে উপকৃত হন। "অ্যাংরি গাইড টু আর" উল্লেখ করে, আর একটি সম্প্রদায় দ্বারা বিকাশ করা হয়েছিল, যার প্রথম শূন্য সফ্টওয়্যার বিকাশকারীকে ছিল।

আমি বলব যে আজ আর এর দুটি প্রধান শক্তি রয়েছে: কিছু কিছু অঞ্চলে সত্যিই পরিপক্ক অত্যন্ত বিশেষ প্যাকেজগুলি এবং অত্যাধুনিক প্রজননযোগ্য গবেষণা প্যাকেজ নাইটার।

পাইথন অন্য যে কোনও কিছুর জন্য উপযুক্ত বলে মনে হয়।

এটি অবশ্যই একটি মতামত, প্রায় এই থ্রেড হিসাবে। আমি এক ধরণের অবাক হই যে এই থ্রেডটি এখনও জীবিত।


2

অন্যান্য উত্তরে বর্ণিত হিসাবে পাইথন একটি ভাল সাধারণ উদ্দেশ্যমূলক প্রোগ্রামিং ভাষা, যেখানে আর প্রোগ্রামিং ভাষা হিসাবে গুরুতর ত্রুটি রয়েছে তবে ডেটা-অ্যানালাইসিস লাইব্রেরির আরও সমৃদ্ধ সেট রয়েছে। সাম্প্রতিক বছরগুলিতে, পাইথন সাইকিট-লার্নের মতো পরিপক্ক ডেটা-অ্যানালাইসিস লাইব্রেরির বিকাশ নিয়ে আর-তে ধরা পড়েছে, আর আর কখনও ঠিক করা যায় না। অনুশীলনে, আমি পাইথন (প্রকৃতপক্ষে, হাই ) প্রায় সব কিছুর জন্য ব্যবহার করি এবং কেবলমাত্র কোয়ান্টাইল রিগ্রেশন (যেমন পাইথনের স্ট্যাটাসমোডেলগুলির প্রয়োগটি ভেঙে গেছে বলে মনে হয়) এর মতো অপেক্ষাকৃত মূল পদ্ধতিগুলির জন্য আর এর দিকে ফিরে যাই। পাইথন থেকে আর কল করার বিভিন্ন উপায় রয়েছে; পাইপআর হ'ল এটি যথেষ্ট সহজ যে আমি উইন্ডোজ সার্ভারের মতো প্রতিকূল পরিবেশে কাজ করতে পেরেছি।

সম্পাদনা : আমি যে কাউকে এই বিষয়ে আরও তর্ক করতে চান উত্সাহিত করছি লিখিত রচনাটির লেখকদের সাথে এই উত্তরে মন্তব্য করার পরিবর্তে কথা বলতে।


8
আরআরএই গাইডটি আমি আর সম্পর্কে সবচেয়ে বেশি নিখুঁত সমালোচনা পড়েছি (এবং আমি অনেকগুলি পড়েছি)।
ফায়ারব্যাগ

10
"ডকুমেন্টেশন অবিচ্ছিন্নভাবে খারাপ", এটি অজ্ঞাতসই। আর শক্তি হ'ল নন-প্রোগ্রামারগুলির কাছে এর সরলতা এবং এর বিশাল ডকুমেন্টেশন। "এমনকি আর এর নামও বোকা, দরকারী উপায়ে আর জিনিসগুলি গুগল করা সত্যিই কঠিন Sorry দুঃখিত, আর আপনাকে স্বাগতম!", এটি অজ্ঞাতসই। আশেপাশের সর্বাধিক অস্পষ্ট প্যাকেজগুলিতে ডকুমেন্টেশন সন্ধান করার জন্য আমি কোনও সমস্যায় পড়িনি। "আপনি স্বতঃস্ফূর্তভাবে নামগুলি (ফ্রেম) দিয়ে কলামগুলির নাম পরিবর্তন করেছেন how কীভাবে এবং কেন এটি কাজ করে তা আপনি জানেন? দয়া করে আমাকে শিক্ষিত করুন" ", চিত্কার, এমনকি তিনি চেষ্টাও করছেন না।
ফায়ারব্যাগ

8
গুগল করা সি এর চেয়ে আর শক্ত কী? গুগল স্মার্ট। এটি শিখেছে যে আপনি প্রোগ্রামিং ভাষার প্রতি আগ্রহী R. আর বেশিরভাগই অন্যান্য প্রোগ্রামিং ভাষার পটভূমির লোকেরা দ্বারা সমালোচিত হন। দুঃখিত, তবে এই ভাষার বিকল্প হিসাবে এটি বিকশিত হয়নি। এটি পরিসংখ্যানবিদদের জন্য এবং দ্বারা তৈরি করা হয়েছিল। ফলস্বরূপ, কিছু ডিজাইনের সিদ্ধান্তগুলি অনুকূল ছিল না, তবে গুরুতর ত্রুটি রয়েছে বলে কিছুটা শক্তিশালী। প্রতিটি প্রোগ্রামিং ভাষা এর শক্তি এবং দুর্বলতা পেয়েছে।
রোল্যান্ড

5
প্যাকেজ তৈরি করা আসলে খুব সহজ। এটি কেবল জটিল হয়ে যায় যদি আপনি সিআরএএন দ্বারা আরোপিত নিয়মগুলি (যথাযথভাবে) মেনে চলেন। আপনি যদি প্যাকেজ তৈরি করেন তবে আপনি প্যাকেজগুলি থেকে নির্বাচন করে আমদানি করতে পারেন। ভেক্টর পুনর্ব্যবহারযোগ্যতা আসলে একটি শক্তি। সাবসেটিং তালিকা এবং ভেক্টরগুলির মধ্যে কোনও অসঙ্গতি নেই। বাকী কিছু সত্যই ত্রুটি হিসাবে বিবেচনা করা যেতে পারে।
রোল্যান্ড

6
স্পষ্টভাবে warts আছে, কিছু অক্ষম "ওয়াট" বিভিন্ন (স্ট্রিংএফ্যাক্টর)। তবে এটিতে পরিসংখ্যানের গ্রন্থাগারগুলিও রয়েছে যা অন্য কোনও ভাষায় সমান্তরাল নয়, এমনকি দূর থেকেও নয় এই গ্রন্থাগারগুলি তৈরি করার জন্য প্রয়োজনীয় প্রোগ্রামিংটি আমাদের বৃহত সংখ্যাগরিষ্ঠের চেয়ে বেশি গুরুতর। একটি কম্বল বিবৃতি হিসাবে, "আর কোনও গুরুতর ভাষা নয়" কোথাও ক্লুভলেস, হতাশহীনভাবে প্যারোকিয়াল, অশিক্ষিত এবং টক আঙ্গুর মধ্যে রয়েছে। এবং আমি এটি এমন কেউ হিসাবে বলছি যে R মূলত আর এর লাইব্রেরি সহ পাইথন ছিল।
পল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.