ডেটা সায়েন্সে নোএসকিউএল ডাটাবেসের ব্যবহার


16

ডেঙ্গু বিশ্লেষণের জন্য মঙ্গোডিবি-র মতো নোএসকিউএল ডাটাবেসগুলি কীভাবে ব্যবহার করা যেতে পারে? এগুলির মধ্যে কী কী বৈশিষ্ট্য যা ডেটা বিশ্লেষণকে দ্রুত এবং শক্তিশালী করতে পারে?


2
প্রধান ব্যবহার হ'ল ডেটা সংরক্ষণ এবং ডেটা পুনরুদ্ধার। আসলে, এটি কোনও এনএসকিউএল ডাটাবেস, বা কোনও ডাটাবেসের জন্য কেবলমাত্র ব্যবহার সম্পর্কে। আপনার প্রশ্ন আরও ভাল করতে চান?
স্পেসডম্যান

হ্যাঁ, ডেটাবেস মূলত ডেটা সঞ্চয় এবং পুনরুদ্ধারের জন্য ব্যবহৃত হয়। কীভাবে সেগুলি ডেটা বিশ্লেষণের জন্য ব্যবহার করা যেতে পারে? মংডব্বের মতো এনওএসকিউএল ডেটাবেজে তৈরি সরঞ্জামগুলি কী কী যা তথ্য বিশ্লেষণকে সহজ এবং শক্তিশালী করে?
jithinjustin

1
মন্তব্যগুলিতে যুক্ত না করে আপনার প্রশ্নটিকে সম্পাদনা করে উন্নত করুন।
স্পেসডম্যান

উত্তর:


23

পুরোপুরি সত্যি বলতে, বেশিরভাগ নোএসকিউএল ডাটাবেসগুলি বড় ডেটার অ্যাপ্লিকেশনগুলির পক্ষে খুব ভালভাবে উপযুক্ত নয়। সব বড় তথ্য অ্যাপ্লিকেশন বেশীরভাগ জন্য, কর্মক্ষমতা MongoDB তুলনায় মত একটি রিলেশনাল ডাটাবেস মাইএসকিউএল হয় উল্লেখযোগ্যভাবে পরোয়ানা দরিদ্র যথেষ্ট MongoDB সম্পূর্ণরূপে ভালো কিছু থেকে দূরে থাকার নয়।

সঙ্গে বলেন যে, সেখানে NoSQL ডেটাবেসের সত্যিই দরকারী বৈশিষ্ট্য একটি দম্পতি আছে যে অবশ্যই আপনার পক্ষে কাজ যখন আপনি অত্যধিক ডেটা সেট সাথে এসেছেন পরিশ্রমী, যদিও ঐ সুবিধা NoSQL এর সাধারণত মন্দ outweighing সম্ভাবনা তুলনায় এসকিউএল জন্য read- নিবিড় ক্রিয়াকলাপ (সাধারণত বড় ডেটা ব্যবহারের ক্ষেত্রে একই রকম) কম)

  • কোনও স্কিমা নেই - আপনি যদি অনেকগুলি অনঠিত ডেটা নিয়ে কাজ করছেন তবে বাস্তবে সিদ্ধান্ত নেওয়া এবং কঠোরভাবে কোনও স্কিমা প্রয়োগ করা কঠিন হতে পারে। নোএসকিউএল ডেটাবেসগুলি সাধারণভাবে এটির পক্ষে সমর্থন করে এবং আপনাকে ফ্লাইতে স্কিমা-কম ডকুমেন্টগুলি সন্নিবেশ করতে দেয়, এটি অবশ্যই কোনও এসকিউএল ডাটাবেস সমর্থন করবে না।
  • জেএসন - আপনি যদি সিএসভি ফাইলগুলিরপরিবর্তে জেএসওন-স্টাইলের নথি নিয়ে কাজ করছেন বলে মনে করেনতবে আপনি ডেটাবেস-স্তরের জন্য মঙ্গোডিবি জাতীয় কিছু ব্যবহার করার ক্ষেত্রে অনেক সুবিধা পাবেন। সাধারণত ওয়ার্কফ্লো সঞ্চয়গুলি বর্ধিত ক্যোয়ারী-বারের চেয়ে বেশি নয়।
  • ব্যবহারের সহজতা - আমি বলছি না যে এসকিউএল ডেটাবেসগুলি সর্বদা ব্যবহার করা শক্ত, বা ক্যাসান্দ্রা বিশ্বের সবচেয়ে সহজ জিনিস, তবে সাধারণভাবে নোএসকিউএল ডাটাবেসগুলি এসকিউএল ডাটাবেসগুলির চেয়ে সেটআপ এবং ব্যবহার করা সহজ। মঙ্গোডিবি এটির একটি শক্তিশালী উদাহরণ, এটি ব্যবহারের জন্য সবচেয়ে সহজ ডেটাবেস স্তর হিসাবে পরিচিত ( এসকিউএলাইটের বাইরে )। এসকিউএল অনেকগুলি সাধারণীকরণের সাথেও ডিল করে এবং এসকিউএল সেরা অনুশীলনের একটি বৃহত্তর উত্তরাধিকার রয়েছে যা সাধারণত সাধারণত উন্নয়ন প্রক্রিয়াটিকে ছাঁটাই করে।

ব্যক্তিগতভাবে আমি আপনাকে পরামর্শ দিতে পারি যে আপনি Neo4j এর মতো গ্রাফ ডাটাবেসগুলিও পরীক্ষা করে দেখুন যা কিছু নির্দিষ্ট ধরণের প্রশ্নের জন্য সত্যই ভাল পারফরম্যান্স দেখায় যদি আপনি আপনার ডেটা বিজ্ঞান অ্যাপ্লিকেশনগুলির জন্য ব্যাকএন্ড বাছাই করে দেখছেন।


তুমি ঠিক. এনওএসকিউএল ডাটাবেসগুলি মূলত জসসনের মতো কাঠামোগত বা আধা-কাঠামোগত ডেটা সংরক্ষণ করার জন্য ব্যবহৃত হয়। আমরা কীভাবে তাদের সাথে ডেটা বিশ্লেষণ করতে পারি সেগুলির কিছু ধরণের বর্ণনা দিতে পারি। ডেঙ্গু বিশ্লেষণের জন্য মঙ্গোডবিতে তৈরি এমন কী কী সরঞ্জামগুলি ব্যবহার করা যেতে পারে?
jithinjustin

1
@ জিথিনজেডে মঙ্গো বা সত্যই কোনও ডাটাবেস-এ ডেটা বিশ্লেষণের সরঞ্জামগুলি তৈরি করা নেই। এছাড়াও, jsonসম্পূর্ণ কাঠামোগত ডেটা। আপনি এটিতে প্রযুক্তিগতভাবে কোনও ধরণের ডেটা বিশ্লেষণ করতে পারেন, কোনও এনওএসকিউএল ডাটাবেস ব্যবহার করা আসলে সম্পর্কিত নয়। মঙ্গোর উপরে যেমন অ্যানালিটিকা রয়েছে তেমন সরঞ্জামগুলি রয়েছে ।
ইন্দো

1
আমি সে সব সম্পর্কে জানি না। মঙ্গোডিবি মাইএসকিউএল এর চেয়ে আরও ভাল পারফর্ম করতে পারে। আপনি পোস্টগ্র্রেএসকিউএল (যা, JSON কে গ্রহণ করতে পারে) বললে আপনার আরও ভাল যুক্তি থাকতে হবে। যেভাবেই হোক, আমি নোএসকিউএল না ব্যবহারের কারণ হিসাবে কিছু সালিশী "পারফরম্যান্স" (ব্যবহারের ক্ষেত্রে কী তা আমরা জানি না) বিবেচনা করব না। একাধিক ডাটাবেস ব্যবহার করে ছাড় করবেন না। মনে রাখবেন, মঙ্গোডিবিতে আশ্চর্যজনক সমষ্টি বৈশিষ্ট্য রয়েছে যা এসকিউএল নেই।
টম

1
@ টম কর্মক্ষেত্রে, আপনি দেখতে পাবেন যে মঙ্গো আসলে মাইএসকিএলকে ছাড়িয়ে যায় কেবলমাত্র সন্নিবেশগুলি ( মোরদেবস.রো / মাইএসকিএল-ভিএস- মংগডব-পারফরম্যান্স-বেঞ্চমার্ক ), যা ডেটা বিশ্লেষণের তুলনামূলকভাবে ছোট অংশ। এসকিউএলের সমষ্টি বৈশিষ্ট্যগুলি মঙ্গোর চেয়ে আরও পরিপক্ক। MYSQL বনাম পোস্টগ্রিসের হিসাবে, সংখ্যাগুলি খুব সাময়িকভাবে স্কিউড এবং উভয়ই একইরকম পারফরম্যান্স সরবরাহ করে। এমওয়াইএসকিউএলটি বেশি সাধারণ, যার কারণে আমি উল্লেখ করেছি এর পরিবর্তে, তবে দুটি বেশ একই রকম।
সূচক 21

জিনিসগুলি স্মৃতিতে মাপসই হলে আমি সবসময় মঙ্গোডিবিতে আরও ভাল অভিনয় দেখেছি। আমি নুনের লাভের সাথে বেঞ্চমার্কগুলি গ্রহণ করি কারণ আপনি যদি গুগল করেন তবে আপনি মংগোডিবিকে আরও দ্রুত দেখানোর জন্য একগুচ্ছ মানদণ্ড খুঁজে পাবেন। এটি সত্যই আপনার প্রয়োজনের উপর নির্ভর করে। এটি বলেছিল, আসল প্রশ্নের উত্তর দিতে সহায়তা করতে - আমি মনে করি বড় ডেটা বিজ্ঞান এবং বিশ্লেষণে নোএসকিউএল এর প্রচুর ব্যবহার রয়েছে।
টম

4

স্কিমা-মুক্ত নোএসকিউএল পদ্ধতির একটি সুবিধা হ'ল আপনি অকাল বদ্ধপরিকর করবেন না এবং আপনি অ্যাপাচি ড্রিলের মতো উপযুক্ত সরঞ্জাম ব্যবহার করে ক্যোয়ারির সময় সঠিক স্কিমা প্রয়োগ করতে পারেন । বিশদ জন্য এই উপস্থাপনা দেখুন । মাইএসকিউএল কোনও বড় ডেটা সেটিং-এ আমার প্রথম পছন্দ হবে না।


এখানে নোএসকিউএল, জেএসওএন এবং ড্রিল সম্পর্কিত একটি সম্পর্কিত প্রশ্ন এখানে রয়েছে: ডেটাসায়েন্স.স্ট্যাকেক্সেঞ্জঞ্জ
প্রশ্নগুলি

4

বিবেচনা করুন, চেষ্টা করুন এবং সম্ভবত একাধিক ডাটাবেসও ব্যবহার করুন। এটি এখানে খেলার সময় কেবল "পারফরম্যান্স" ইস্যু নয়। এটি সত্যিই আপনার প্রয়োজনীয়তা নেমে যাচ্ছে। আপনি কত তথ্য নিয়ে কথা বলছেন? কি ধরনের তথ্য? তোমার কত দ্রুত দরকার? আপনি আরও ভারী পড়া বা ভারী লিখছেন?

এসকিউএল ডাটাবেসে আপনি যা করতে পারবেন না তার একটি এখানে: অনুভূতি গণনা করুন। http://www.slideshare.net/shift8/mongodb-machine-learning

অবশ্যই এই ক্ষেত্রে গতি আপনার প্রয়োজনের জন্য পর্যাপ্ত দ্রুত নাও হতে পারে, তবে এটি এমন কিছু যা সম্ভব। নির্দিষ্ট সামগ্রিক মানগুলির কিছু ক্যাচিংয়ের সাথে এটি এমনকি বেশ গ্রহণযোগ্য ছিল। কেন আপনি এই করবেন? কনভেনিয়েন্স।

সুবিধাটি আসলে এমন একটি জিনিস যা আপনি দ্বারা প্ররোচিত হবেন। ঠিক এই কারণেই (আমার মতে) নোএসকিউএল ডাটাবেস তৈরি হয়েছিল। পারফরম্যান্স অবশ্যই, তবে আমি বেঞ্চমার্ক ছাড় এবং অন্যান্য উদ্বেগের দিকে আরও ফোকাস করার চেষ্টা করছি।

মঙ্গোডিবি (এবং কিছু অন্যান্য নোএসকিউএল) ডাটাবেসে কিছু খুব শক্তিশালী বৈশিষ্ট্য রয়েছে যেমন বিল্ট-ইন ম্যাপ / হ্রাস। এটি হাদুপের মতো কিছু ব্যবহার করে ব্যয় এবং সময় উভয়ই সঞ্চয় করতে পারে। অথবা এটি একটি বৃহত ব্যবসা শুরু করার জন্য একটি প্রোটোটাইপ বা এমভিপি সরবরাহ করতে পারে।

গ্রাফ ডাটাবেস সম্পর্কে কি? তারাও "নোএসকিউএল"। ওরিয়েন্টডিবির মতো ডেটাবেসগুলি দেখুন। আপনি যদি পারফরম্যান্স নিয়ে তর্ক করতে চান ... আমি মনে করি না আপনি খুব দ্রুত এসকিউএল ডাটাবেস দেখিয়ে যাবেন = =) ... এবং গ্রাফ ডাটাবেসে আপনার যা করা দরকার তার উপর ভিত্তি করে কিছু সত্যই আশ্চর্যজনক অ্যাপ্লিকেশন রয়েছে।

প্রযুক্তির নিয়ম (এবং ইন্টারনেট) একটি জিনিস নিয়ে খুব স্বাচ্ছন্দ্য বোধ করবেন না। আপনি সীমাবদ্ধ থাকবেন এবং ব্যর্থতার জন্য নিজেকে প্রস্তুত করবেন।


1
আমি সেই লিঙ্কটিতে বা এখানে এমন কিছু দেখতে পাচ্ছি না যা প্রমাণ করে যে আপনি কোনও এসকিউএল ডাটাবেসে অনুভূতি বিশ্লেষণ করতে পারবেন না। মোঙ্গোডিবি উদাহরণগুলি ডিবিতে জাভাস্ক্রিপ্ট থেকে উপকৃত হয়, যাতে আপনি কোনও এসকিউএল ডাটাবেসে কোনও এম্বেড থাকা ভাষা ব্যবহার করতে পারেন। উদাহরণস্বরূপ Postgres + R.
স্পেসডম্যান

আপনি সেই ডেটাবেসগুলিতে কোথায় কোড এবং মানচিত্র প্রয়োগ করতে / হ্রাস করতে পারবেন তা দেখতে পছন্দ করবে। সমস্ত গুরুত্বের সাথে (বিশেষত Postgres)। ... এবং এমনকি যদি আপনি পারতেন তবে এখনও উত্তরটি কোনওভাবেই বৈধ করে তুলবে না। একটি কেবলমাত্র NoSQL ব্যবহার করতে চাইবে। এটা কাজ করে।
টম

1
পোস্টগ্র্যাস + সি, পাইথন, পার্ল, আর, আপনার পোস্টগ্রিস ডিবিকে সর্বশেষতম মেশিন লার্নিং অ্যালগরিদমে ফিড করে। সহজ: postgresql.org/docs/9.0/static/xplang.html
স্পেসডম্যান

খুশী হলাম। আমাকে কিছু সময় চেষ্টা করে দেখতে হবে। মাইএসকিউএল সম্পর্কে কীভাবে?
টম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.