এটি কি আরডিবিএমএস কার্যকর করার সময়টির সাথে নিও 4j তুলনা সঠিক?


10

পটভূমি: গ্রাফ ডেটাবেসস বইটি নীচে দেওয়া হয়েছে , যা নিও 4 জে বইয়ে উল্লিখিত একটি পারফরম্যান্স টেস্ট কভার করে :

কোনও গ্রাফের মধ্যে সম্পর্ক প্রাকৃতিকভাবে পথ তৈরি করে। অনুসন্ধান, বা ট্র্যাভারিং, গ্রাফের সাথে নিম্নলিখিত পথগুলি জড়িত। ডেটামোডেলের মৌলিকভাবে পথ-কেন্দ্রিক প্রকৃতির কারণে, বেশিরভাগ পাথ-ভিত্তিক গ্রাফ ডাটাবেস ক্রিয়াকলাপগুলি যেভাবে ডেটা বিভক্ত করা হয় তার সাথে অত্যন্ত সমন্বিত হয়, যাতে এগুলি অত্যন্ত দক্ষ করে তোলে। তাদের নিও 4j ইন অ্যাকশন বইয়ে, অংশীদার এবং ভুকোটিক একটি রিলেশনাল স্টোর এবং নিও 4 জ ব্যবহার করে একটি পরীক্ষা করে।

তুলনাটি দেখায় যে গ্রাফ ডাটাবেসটি কোনও সম্পর্কিত স্টোরের তুলনায় সংযুক্ত ডেটার জন্য যথেষ্ট দ্রুত হয় art এলোমেলোভাবে বেছে নেওয়া দু'জনকে দেওয়া হলেও, এমন কোনও পথ রয়েছে যা তাদের সংযোগ দেয় যা সর্বাধিক পাঁচটি সম্পর্কের দীর্ঘ? 100,000 লোকের সমন্বিত একটি সামাজিক নেটওয়ার্কের জন্য, যার প্রায় 50 জন বন্ধু রয়েছে, ফলাফলগুলি দৃ strongly়ভাবে সুপারিশ করে যে গ্রাফ ডাটাবেসগুলি সংযুক্ত ডেটার জন্য সেরা পছন্দ, যেমন আমরা সারণী 2-1 তে দেখি।

সারণী 2-1। নিও 4 জে দক্ষ সন্ধানের বিপরীতে একটি সম্পর্কের ডাটাবেজে প্রসারিত বন্ধুদের সন্ধান করা

Depth   RDBMS Execution time (s)    Neo4j Execution time (s)     Records returned
2       0.016                       0.01                         ~2500    
3       30.267                      0.168                        ~110,000 
4       1543.505                    1.359                        ~600,000 
5       Unfinished                  2.132                        ~800,000

গভীরতায় দুই (বন্ধুবান্ধব বন্ধু) উভয় আপেক্ষিক ডাটাবেস এবং গ্রাফ ডাটাবেস একটি অনলাইন সিস্টেমে সেগুলি ব্যবহার করার বিষয়ে বিবেচনা করার জন্য আমাদের যথেষ্ট ভাল সম্পাদন করে। নিও 4 জের ক্যোরিয়ালটি রিলেশনাল ওয়ানের সময় দুই-তৃতীয়াংশে চলতে থাকে, একজন শেষ ব্যবহারকারী দু'জনের মধ্যে মিলিসেকেন্ডের পার্থক্য সবেমাত্র লক্ষ্য করতে পারে। আমরা গভীরতা তিনটি পৌঁছানোর সময় (বন্ধু-বান্ধব-বন্ধু-বান্ধব), তবে, এটি স্পষ্ট যে সম্পর্কের ডাটাবেসটি আর কোনও যুক্তিসঙ্গত সময়সীমার সাথে ক্যোয়ারির সাথে মোকাবেলা করতে পারে না: ত্রিশ সেকেন্ড এটি পুরোপুরি গ্রহণযোগ্য হবে না একটি অনলাইন সিস্টেমের জন্য। বিপরীতে, Neo4j এর প্রতিক্রিয়া সময় তুলনামূলকভাবে সমতল: ক্যোরিটি সম্পাদন করার জন্য এক সেকেন্ডের কেবলমাত্র একটি ভগ্নাংশ an একটি অনলাইন সিস্টেমের জন্য অবশ্যই যথেষ্ট দ্রুত।

গভীরতার চারটে আপেক্ষিক ডাটাবেস পঙ্গু হওয়া বিলম্ব দেখায়, এটি একটি অনলাইন সিস্টেমের জন্য ব্যবহারিকভাবে অকেজো করে তোলে। নিও 4 জয়ের সময়গুলি কিছুটা অবনতি হয়েছে, কিন্তু এখানে অলসতা একটি প্রতিক্রিয়াশীল অনলাইন সিস্টেমের জন্য গ্রহণযোগ্য হওয়ার পরিধি। পরিশেষে, পাঁচ নম্বরে, সম্পর্কিত সম্পর্কিত ডাটাবেসটি কোয়েরিটি সম্পূর্ণ করতে খুব বেশি সময় নেয়। বিপরীতে Neo4j প্রায় দুই সেকেন্ডের মধ্যে একটি ফলাফল দেয়। পাঁচ নম্বরে, এটি প্রায় পুরো নেটওয়ার্কটি ট্রান্সপোর্ট করে আমাদের বন্ধু: অনেকগুলি বাস্তব-বিশ্ব ব্যবহারের ক্ষেত্রে, আমরা সম্ভবত ফলাফলগুলি এবং সময়গুলিকে ছাঁটাই করব।

প্রশ্নগুলি হ'ল:

  • সামাজিক নেটওয়ার্কে সন্ধান ছাড়া যা কিছু হতে পারে তা অনুকরণ করার পক্ষে কি এই যুক্তিসঙ্গত পরীক্ষা? (অর্থ প্রকৃত সামাজিক নেটওয়ার্কগুলিতে সাধারণত প্রায় 50 জন বন্ধু সহ নোড থাকে উদাহরণস্বরূপ; " ধনী ব্যক্তি আরও সমৃদ্ধ হন " মডেলটি সামাজিক নেটওয়ার্কগুলির পক্ষে আরও স্বাভাবিক হবে, যদিও এটি ভুল হতে পারে))
  • অনুকরণের প্রাকৃতিকতা নির্বিশেষে, ফলাফলগুলি বন্ধ, বা অদম্য উত্পাদনযোগ্য বিশ্বাস করার কোনও কারণ আছে কি?

উত্তর:


8

ফেসবুকের অ্যানাটমি নামক এই ডকুমেন্টটির দিকে তাকিয়ে আমি নোট করছি যে গড়টি 100 টি। সংশ্লেষিত ফাংশন প্লটের দিকে তাকিয়ে আমি বাজি ধরতে পারি যে গড় 200 এর কাছাকাছি। সুতরাং 50 এখানে সেরা নম্বর বলে মনে হচ্ছে না। তবে আমি মনে করি এটি এখানে মূল সমস্যা নয়।

মূল বিষয়টি হ'ল ডাটাবেস কীভাবে ব্যবহৃত হয়েছিল সে সম্পর্কে তথ্যের অভাব।

এটি যুক্তিসঙ্গত বলে মনে হয় যে গ্রাফ স্ট্রাকচারের জন্য বিশেষভাবে ডিজাইন করা একটি ডেটা স্টোরেজ traditionalতিহ্যবাহী আরডিবিএমগুলির চেয়ে বেশি দক্ষ হতে পারে। তবে, আরডিবিএমগুলি পছন্দের ডেটা স্টোরেজ হিসাবে সর্বশেষতম ট্রেন্ডগুলিতে না থাকলেও এই সিস্টেমগুলি ডেটা সেটের মাত্রা সহ এক দৌড়ে অবিচ্ছিন্নভাবে বিকশিত হয়েছিল। বিভিন্ন ধরণের সম্ভাব্য নকশাগুলি, ইনডেক্সিংয়ের বিভিন্ন উপায়ে, সম্মতির সাথে সম্পর্কিত উন্নতি এবং আরও অনেক কিছু রয়েছে।

উপসংহারে আমি মনে করি প্রজননযোগ্যতার বিষয়ে, গবেষণায় ডেটাবেস স্কিমা কীভাবে ডিজাইন করা হয়েছিল তার সঠিক বর্ণনার অভাব রয়েছে। আমি জিজ্ঞাসা করি না যে এই জাতীয় জিজ্ঞাসাবাদের রাজাগুলির উপর কোনও ডাটাবেস প্রভাব ফেলবে, তবে আমি আশা করব যে একটি সুরক্ষিত নকশার মাধ্যমে পার্থক্যগুলি এত বড় হবে না not


4

আরডিবিএমএসে গ্রাফগুলি মডেল করার জন্য ভাল / দ্রুত উপায় এবং বোবা / ধীরগতির উপায় রয়েছে।

  • কিছু দ্রুত চৌম্বক পুনরুদ্ধার গতির জন্য র‌্যাম ডিস্কে চালিত সূচক এবং সঞ্চিত প্রোকস, ট্রেডিং সিপিইউ লোড এবং সুরযুক্ত টেম্প টেবিল ব্যবহার করে।

  • কিছু প্রাক্পম্পিউড গ্রাফ পাথ ব্যবহার করে (এটি সোশ্যাল নেটওয়ার্কের দৃশ্যে কম সম্ভাব্য হতে পারে তবে বেশিরভাগ নোডের পাতা গাছের নোডের গাছের মধ্যে এটি বেশ ভাল ট্রেড অফের জন্য স্থান

  • কিছু অন-টিউন ইন-ইনডেক্সড টেম্প টেবিল ব্যবহার করে কেবল একটি লুপে গণনা করে comp নিবন্ধে নিক্ষিপ্ত # টি থেকে, তারা যা করেছে তার মতো গন্ধ পাওয়া যায় (মোটামুটি ছোট ছোট ডেটা-সেট-এর ক্ষেত্রে 30 সেকেন্ডের পারফরম্যান্স)

    উদাহরণস্বরূপ, আমার নিজের গাছের গণনা রয়েছে।

    • এটি একটি উচ্চ-সুরযুক্ত সঞ্চিত প্রকোপগুলিতে আবদ্ধ হয়

    • এটি যখন একটি এন্টারপ্রাইজ-আকারের-হার্ডওয়্যার সিবাজ এএসই 15 ডেটাসেভারে চলছে, সেই সার্ভারটি অন্য সমস্ত এন্টারপ্রাইজ অ্যাপ্লিকেশন থেকে কয়েক টেরাবাইট ডেটার সাথে ভাগ করা হয়েছে , যা আমার চেয়ে আরও কিছু বেশি ক্ষুধার্ত ডেটা রয়েছে; এবং শুধুমাত্র আমার অনুসন্ধানগুলি সম্পাদন করার জন্য উত্সর্গীকৃত নয়।

    • আমি হয়নি না প্রধান speedup টুল, র্যাম ডিস্ক একটি টেম্প টেবিল এক্সেস আছে।

    • প্রতিনিধি ডেটা আমি পুনরুদ্ধার করছিলাম যা দেখে মনে হয় কিছুটা মিলেছে তাদের 2.5 মিল নোড ফুল ফরেস্ট ডেটাসেটের বাইরে 150,000 নোড সাবট্রি পেয়েছে (গাছের সীমাহীন গভীরতা, যা 5 থেকে 15 এর মধ্যে পরিবর্তিত হয়, তবে প্রদত্ত নোডের চেয়ে কম গড় গড়তা পাওয়া যায়) পরীক্ষায় তালিকাভুক্ত 50 জন বন্ধু)

    • আমি এটি এটিকে টিউন করেছিলাম যে এই কোয়েরিটি 30-45 সেকেন্ড। এটি অবশ্যই তাত্পর্যপূর্ণ মন্দা প্রদর্শন করে না যা প্রশ্নের আর্টিকাগুলি তাদের আরডিবিএমএসের কার্যকারিতাটিতে ইঙ্গিত করে বলে মনে হচ্ছে, ফলাফলের সেটটিতে কোনও তাত্পর্যপূর্ণ বৃদ্ধি না পেয়ে এটি অতিরিক্ত দ্বিগুণ is ব্যক্তিগত অভিজ্ঞতা থেকে টেম্প টেবিল)।

সুতরাং, এই তুলনাটি সম্ভবত ভুল এবং দুর্বল আরডিবিএমএস পার্শ্ব নকশার উপর ভিত্তি করে, যদিও পূর্ববর্তী উত্তর হিসাবে উল্লেখ করা হয়েছে, তাদের কোড এবং টেবিলের সংজ্ঞাগুলির 100% ওপেন সোর্সিং ছাড়া এটি নির্ধারণ করা অসম্ভব।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.