হাডোপ ইনস্টল করবেন কীভাবে?


26

আমি উবুন্টু 12.04 সংস্করণে হ্যাডোপ ইনস্টল করার চেষ্টা করছি। Http://michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/ এর নির্দেশাবলী অনুসরণ করে আমি java-6-openjdkউবুন্টু সফটওয়্যার কেন্দ্র থেকে ইনস্টল করেছি । আমি সেট করা java_homeআছে .bashrcjava_homeহাদোপে সেটও করুন conf/env.sh। নাম নোড ফর্ম্যাট করার সময়, আমি নিম্নলিখিত ত্রুটি পাচ্ছি:

usr/lib/jvm/java-6-openjdk/bin/java no such file or directory.

ধন্যবাদ. তবে এটি একটি bit৪ বিট ওএস।


1
ব্যবহারকারী যখন সমাধানটি পেয়েছে তখন কেন কোনও অনুগ্রহ হয়? কী ধরণের উত্তর আশা করা যায়?
সবুজ

1
@ গ্রীন 7 উদ্দেশ্যটি এমন কোনও উত্তর খুঁজে পাওয়া যা আসলে গ্রহণযোগ্য হিসাবে চিহ্নিত, অত্যন্ত বিশদযুক্ত এবং পছন্দগুলি বলে। যেহেতু এটি একটির মতো বলে মনে হচ্ছে না, তাই আমি জর্জি অনুগ্রহ যোগ করার বিষয়টি বুঝতে পারি।
টমাস ওয়ার্ড

@ দ্য লর্ডাফটাইম প্রশ্নটি খুব স্থানীয়করণের কারণে বিস্তারিত উত্তরে কমপক্ষে 5 টি লাইন থাকবে। এবং যদি হাদুপের জন্য ইনস্টলেশন সংক্রান্ত নির্দেশাবলী সম্বলিত কোনও উত্তর আশা করা হয়, তবে প্রশ্নটিতে উল্লিখিত লিঙ্কটি আশ্চর্যরূপে ব্যাখ্যা করার কারণে এটি অতিরিক্ত কাজ হবে। তবুও যেহেতু উত্তরটি, সবচেয়ে বেশি ভোট দিয়ে, তাকে প্রশ্নকর্তা পোস্ট করেছিলেন, এটি খুব কমই সম্ভবত তিনি অন্য কোনও উত্তর গ্রহণ করবেন accept
সবুজ

@ গ্রীন 7 যদি প্রশ্নটি খুব স্থানীয় হয় তবে এটিকে বন্ধ করার জন্য ভোট দিন?
থমাস ওয়ার্ড

উত্তর:


39

আমার যখন ১২.০৪ ছিল তখন আমি যে গাইডগুলি অনুসরণ করেছি:

আমি আসলে মাইলিয়ার্নিংয়ের বিরোধী ছিলাম কারণ প্রথম যে বিষয়টি এটি সুপারিশ করেছিল সেটি ছিল ওপলজ্যাভা 7 এর পরিবর্তে ওপেনজেডকে 7, তবে এটি চেষ্টা করার সময় আমার ওপেনজেডকে 7 নিয়ে কিছু সমস্যা ছিল তাই আমাকে ওরাকলের সাথে যেতে হয়েছিল।

গাইড বেশিরভাগ সোজা এগিয়ে এবং এখানে এটি:

  1. জাভা ইনস্টল করুন

    sudo add-apt-repository ppa:webupd8team/java  
    sudo apt-get update && sudo apt-get upgrade  
    sudo apt-get install oracle-java7-installer  
    
  2. হ্যাডোপ ব্যবহারকারী তৈরি করুন

    sudo addgroup hadoop  
    sudo adduser --ingroup hadoop hduser
    

    হুডুসার হ্যাডোপ ব্যবহারকারী যেখানে আপনি থাকতে চান।

  3. এসএসএইচ কনফিগার করা হচ্ছে

    su - hduser   
    ssh-keygen -t rsa -P ""
    cat .ssh/id_rsa.pub >> .ssh/authorized_keys
    

    এসএসএইচ ইনস্টলেশনটি ভাল হয়েছে কিনা তা নিশ্চিত হওয়ার জন্য, আপনি একটি নতুন টার্মিনাল খুলতে পারেন এবং hduserনিম্নলিখিত কমান্ডটি ব্যবহার করে ssh সেশন তৈরি করার চেষ্টা করতে পারেন :

    ssh localhost
    

    লোকালহোস্ট সংযুক্ত না হলে ssh পুনরায় ইনস্টল করুন (আপনাকে hduserনীচের পদক্ষেপের মতো সুডোতে যুক্ত করতে হতে পারে )

    sudo apt-get install openssh-server
    
  4. Sudoers সম্পাদনা করুন

    sudo visudo
    
  5. Sudoers মধ্যে hduser যোগ করতে শেষে লাইন যুক্ত করুন

    hduser ALL=(ALL:ALL) ALL
    

    CTRL+ টিপুন সংরক্ষণ করতে Xটাইপ করে YটিপুনENTER

  6. আইপিভি 6 অক্ষম করুন

    sudo gedit /etc/sysctl.conf
    

    অথবা

    sudo nano /etc/sysctl.conf
    

    ফাইলের শেষে নিম্নলিখিত লাইনগুলি অনুলিপি করুন:

    #disable ipv6  
    net.ipv6.conf.all.disable_ipv6 = 1  
    net.ipv6.conf.default.disable_ipv6 = 1   
    net.ipv6.conf.lo.disable_ipv6 = 1  
    

    যদি আপনাকে বলতে কোনও সমস্যার মুখোমুখি হয়, আপনার অনুমতি নেই, কেবলমাত্র পূর্ববর্তী কমান্ডটি রুট অ্যাকাউন্ট দিয়ে চালান (ক্ষেত্রে সুডো যথেষ্ট নয় me আমার ক্ষেত্রে এটি ছিল)

  7. এখন রিবুট করুন।

    আপনি এটি করতে পারেন sudo sysctl -pতবে আমি বরং পুনরায় বুট করব।

    রিবুট করার পরে, আইপিভি 6 বন্ধ রয়েছে তা নিশ্চিত করে দেখুন:

    cat /proc/sys/net/ipv6/conf/all/disable_ipv6
    

    এটি 1 বলা উচিত । যদি এটি 0 বলে , আপনি কিছু মিস করেছেন।

  8. হ্যাডোপ ইনস্টল করা হচ্ছে

    এটি করার বিভিন্ন উপায় রয়েছে, গাইডের পরামর্শ অনুসারে একটি হ'ল অ্যাপাচি হ্যাডোপ সাইট থেকে ডাউনলোড করুন এবং আপনার hduserহোম ফোল্ডারে ফাইলটি সংক্ষেপিত করুন । নিষ্কাশিত ফোল্ডারটির নাম পরিবর্তন করুন hadoop

    অন্য উপায়টি হল পিপিএ ব্যবহার করা যা 12.04 এর জন্য পরীক্ষা করা হয়েছিল:

    sudo add-apt-repository ppa:hadoop-ubuntu/stable  
    sudo apt-get update && sudo apt-get upgrade  
    sudo apt-get install hadoop  
    

    দ্রষ্টব্য: পিপিএ কারও কারও জন্য কাজ করতে পারে এবং অন্যরা তা করবে না। আমি যেটি চেষ্টা করেছিলাম তা হল অফিসিয়াল সাইট থেকে ডাউনলোড করা কারণ আমি পিপিএ সম্পর্কে জানতাম না।

  9. হালনাগাদ $HOME/.bashrc

    আপনি আপডেট করতে হবে .bashrcজন্য hduser(এবং আপনি Hadoop এর পরিচালনা প্রয়োজন প্রত্যেক ব্যবহারকারীর জন্য)। .bashrcফাইল খোলার জন্য আপনাকে এটিকে মূল হিসাবে খুলতে হবে:

    sudo gedit /home/hduser/.bashrc  
    

    অথবা

    sudo nano /home/hduser/.bashrc  
    

    তারপরে আপনি .bashrcফাইলের শেষে নীচের কনফিগারেশন যুক্ত করবেন

    # Set Hadoop-related environment variables   
    export HADOOP_HOME=/home/hduser/hadoop  
    
    # Set JAVA_HOME (we will also configure JAVA_HOME directly for Hadoop later on)`
    export JAVA_HOME=/usr/lib/jvm/java-7-oracle  
    

    এখন, যদি আপনার ওপেনজেডিকে 7 থাকে তবে এটি দেখতে এরকম কিছু দেখাচ্ছে:

    export JAVA_HOME=/usr/lib/java-7-openjdk-amd64  
    

    এখানে যে জিনিসটি নজর রাখতে হবে তা হ'ল ফোল্ডারটি যেখানে জাভা AMD64 সংস্করণে থাকে। উপরেরটি যদি কাজ না করে তবে আপনি সেই নির্দিষ্ট ফোল্ডারটি সন্ধান করতে বা জাভাটি সেট করতে চেষ্টা করতে পারেন যা ব্যবহার করা হবে:

    sudo update-alternatives --config java  
    

    এখন কিছু সহায়ক ওরফে জন্য:

    # Some convenient aliases and functions for running Hadoop-related commands  
    unalias fs &> /dev/null   
    alias fs="hadoop fs"    
    unalias hls &> /dev/null  
    alias hls="fs -ls"  
    
    # Add Hadoop bin/ directory to PATH  
    export PATH=$PATH:$HADOOP_HOME/bin  
    
  10. হ্যাডোপ কনফিগার করা হচ্ছে

    নিম্নলিখিতটি সঠিকভাবে কনফিগারেশন করতে আমরা কনফিগারেশন ফাইলগুলি ব্যবহার করতে পারি। আপনি হাদুপের সাথে যে ফাইলগুলি ব্যবহার করবেন সেগুলির মধ্যে কয়েকটি হ'ল ( এই সাইটের আরও তথ্য ):

    start-dfs.sh- হ্যাডোপ ডিএফএস ডেমন, নামনাম এবং ডেটানডগুলি শুরু করে। Start-mapred.sh এর আগে এটি ব্যবহার করুন

    stop-dfs.sh - হডোপ ডিএফএস ডেমন থামায়।

    start-mapred.sh - হ্যাডোপ ম্যাপ / জেমট্র্যাকার এবং টাস্ক ট্র্যাকারদের ডেমনগুলি হ্রাস করুন।

    stop-mapred.sh - হ্যাডোপ ম্যাপ / ডিমনগুলি হ্রাস করে।

    start-all.sh- সমস্ত হ্যাডোপ ডেমন, নামনাম, ডেটানডস, জব ট্র্যাকার এবং টাস্ক ট্র্যাকার শুরু করে। অননুমোদিত; start-dfs.sh ব্যবহার করুন তারপরে start-mapred.sh ব্যবহার করুন

    stop-all.sh- সমস্ত হডোপ ডেমন থামায়। অননুমোদিত; স্টপ- mapred.sh ব্যবহার করুন তারপর স্টপ- dfs.sh

    তবে সেগুলি ব্যবহার শুরু করার আগে আমাদের /confফোল্ডারে বেশ কয়েকটি ফাইল সংশোধন করতে হবে ।

    hadoop-env.sh

    ফাইলটির সন্ধান করুন hadoop-env.sh, আমাদের কেবল এই ফাইলটিতে জাভাআহোম ভেরিয়েবলটি আপডেট করতে হবে:

    sudo gedit /home/hduser/hadoop/conf/hadoop-env.sh
    

    অথবা

    sudo nano /home/hduser/hadoop/conf/hadoop-env.sh
    

    বা সর্বশেষ সংস্করণে এটি হবে

    sudo nano /etc/hadoop/conf.empty/hadoop-env.sh
    

    অথবা

    sudo nano /etc/hadoop/hadoop-env.sh
    

    তারপরে নিম্নলিখিত লাইনটি পরিবর্তন করুন:

    # export JAVA_HOME=/usr/lib/j2sdk1.5-sun
    

    থেকে

    export JAVA_HOME=/usr/lib/jvm/java-7-oracle
    

    দ্রষ্টব্য: Error: JAVA_HOME is not setপরিষেবাগুলি শুরু করার সময় আপনি যদি ত্রুটি পান তবে আপনি পূর্ববর্তী লাইনে কোনও অসুবিধা করতে ভুলে গেছেন (কেবল # টি মুছে ফেলুন)।

    কোর-site.xml

    এখন হ্যাডোপ ফ্রেমওয়ার্কের জন্য আমাদের একটি অস্থায়ী ডিরেক্টরি তৈরি করতে হবে। আপনার যদি এই পরিবেশের পরীক্ষা করার জন্য বা দ্রুত প্রোটোটাইপের প্রয়োজন হয় (যেমন আপনার ব্যক্তিগত পরীক্ষার জন্য সহজ হ্যাডোপ প্রোগ্রামগুলি বিকাশ করুন ...), আমি এই ফোল্ডারটি /home/hduser/ডিরেক্টরিতে তৈরি করার পরামর্শ দিই , অন্যথায়, আপনি এই ফোল্ডারটি ভাগ করা ফোল্ডারের নীচে একটি ভাগ জায়গায় তৈরি করতে হবে ( পছন্দ করুন / usr / স্থানীয় ...) তবে আপনি কিছু সুরক্ষা সমস্যার মুখোমুখি হতে পারেন। তবে সুরক্ষা (java.io.IOException এর মত) ব্যতিক্রমগুলি কাটিয়ে উঠতে আমি hduser স্পেসের নীচে tmp ফোল্ডার তৈরি করেছি।

    এই ফোল্ডারটি তৈরি করতে, নিম্নলিখিত কমান্ডটি টাইপ করুন:

    sudo mkdir /home/hduser/tmp   
    

    দয়া করে নোট করুন যে আপনি যদি অন্য কোনও প্রশাসক ব্যবহারকারী (উদাহরণস্বরূপ হডুপ গ্রুপে hduser2) বানাতে চান তবে আপনাকে নিম্নলিখিত কমান্ডগুলি ব্যবহার করে এই ফোল্ডারে তাকে পড়ার এবং লেখার অনুমতি প্রদান করতে হবে:

    sudo chown hduser:hadoop /home/hduser/tmp  
    sudo chmod 755 /home/hduser/tmp  
    

    এখন, আমরা hadoop/conf/core-site.xmlhadoop.tmp.dir এন্ট্রি সম্পাদনা করতে খুলতে পারি । আমরা পাঠ্য সম্পাদক ব্যবহার করে কোর-সাইট.xML খুলতে পারি:

    sudo gedit /home/hduser/etc/hadoop/core-site.xml  
    

    অথবা

    nano /home/hduser/etc/hadoop/core-site.xml
    

    তারপরে এক্সএমএল উপাদানগুলির মধ্যে<configure> নিম্নলিখিত কনফিগারেশনগুলি যুক্ত করুন :

    <property>
      <name>hadoop.tmp.dir</name>
      <value>/home/hduser/tmp</value>
      <description>A base for other temporary directories.</description>
    </property>
    
    <property>
      <name>fs.default.name</name>
      <value>hdfs://localhost:54310</value>
      <description>The name of the default file system.  A URI whose
      scheme and authority determine the FileSystem implementation.  The
      uri's scheme determines the config property (fs.SCHEME.impl) naming
      the FileSystem implementation class.  The uri's authority is used to
      determine the host, port, etc. for a filesystem.</description>
    </property>
    

    এখন সম্পাদনা করুন mapred-site.xml

    <property>
      <name>mapred.job.tracker</name>
      <value>localhost:54311</value>
      <description>The host and port that the MapReduce job tracker runs
      at.  If "local", then jobs are run in-process as a single map
      and reduce task.
      </description>
    </property>
    

    এখন সম্পাদনা করুন hdfs-site.xml

    <property>
      <name>dfs.replication</name>
      <value>1</value>
      <description>Default block replication.
      The actual number of replications can be specified when the file is created.
      The default is used if replication is not specified in create time.
      </description>
    </property> 
    
  11. নেমনোড ফর্ম্যাট করা

    এখন আপনি নোডে কাজ শুরু করতে পারেন। প্রথম ফর্ম্যাট:

    ~/hduser/hadoop/bin/hadoop namenode -format
    

    অথবা

    ./home/hduser/hadoop/bin/hadoop namenode -format
    

    আপনার এইচডিএফএসে নেমনোডটি ফর্ম্যাট করা উচিত। সিস্টেমটি চলাকালীন আপনার এই পদক্ষেপটি করা উচিত নয়। এটি সাধারণত আপনার ইনস্টলেশনের প্রথম সময়ে একবার করা হয়।

  12. হাদুপ ক্লাস্টার শুরু হচ্ছে

    আপনাকে হ্যাডোপ / বিন ডিরেক্টরিতে নেভিগেট করতে হবে এবং ./start-all.shস্ক্রিপ্টটি চালাতে হবে ।

    cd ~/hduser/hadoop/bin/  
    start-all.sh  
    

    গাইডগুলিতে প্রদর্শিত সংস্করণটির থেকে যদি আপনার আলাদা সংস্করণ থাকে (পিপিএ বা আরও নতুন সংস্করণ দিয়ে এটি করার ক্ষেত্রে আপনার সবচেয়ে বেশি সম্ভাবনা রয়েছে) তবে এটি চেষ্টা করে দেখুন:

    cd ~/hduser/hadoop/bin/   
    start-dfs.sh  
    start-mapred.sh   
    

    এটি আপনার মেশিনে একটি নেমনেড, ডেটানোড, জবট্র্যাকার এবং একটি টাস্কট্রেকার শুরু করবে।

  13. হাডোপ চলছে কিনা তা পরীক্ষা করা হচ্ছে

    একটি সুন্দর সরঞ্জাম বলা হয় jps। সমস্ত পরিষেবা শেষ হয়েছে তা নিশ্চিত করতে আপনি এটি ব্যবহার করতে পারেন। আপনার হাদুপ বিন ফোল্ডারে টাইপ করুন:

    jps
    

    এটি আপনাকে হ্যাডোপ সম্পর্কিত সমস্ত প্রক্রিয়া প্রদর্শন করবে।

    দ্রষ্টব্য: যেহেতু এটি আমার জন্য প্রায় 6 মাস আগে করা হয়েছিল, কোনও অংশ যদি কাজ না করে তবে আমাকে জানান।

হডুপ জুজু (হাদুপের জন্য একটি জুজু আকর্ষণীয়) ব্যবহার করে

কমনীয় হাদুপ থেকে নেওয়া

আমি ধরে নেব যে নিম্নলিখিতগুলি ইতিমধ্যে সেট আপ হয়েছে:

  • আপনার কাছে জুজুর একটি সার্ভার ইতিমধ্যে সেট রয়েছে
  • আপনার সার্ভারটিতে অ্যাক্সেস রয়েছে (স্থানীয়ভাবে বা দূরবর্তীভাবে)
  • আপনি জুজু কনফিগার করেছেন এবং কমনীয়তা যুক্ত শুরু করতে প্রস্তুত
  • আপনি 12.04 ব্যবহার করছেন (এটি কারণ আমি 12.04 দিয়ে এই সমস্ত পরীক্ষা করেছি)
  • আপনি ~/.juju/environments.yamlপিপিএ উত্স সহ যে সার্ভারটি ব্যবহার করবেন সে সম্পর্কিত তথ্য আপনি ইতিমধ্যে কনফিগার করেছেন।

হ্যাডোপ পরিষেবা চলতে এখন এই পদক্ষেপগুলি অনুসরণ করুন:

  1. হাদুপের জন্য পরিবেশ বুটস্ট্র্যাপ করুন

    juju bootstrap
    

    এটি শেষ না হওয়া পর্যন্ত অপেক্ষা করুন এবং এটি সঠিকভাবে সংযোগ করছে কিনা তা পরীক্ষা করে দেখুন:

    juju status
    
  2. হ্যাডোপ স্থাপন করুন (মাস্টার এবং স্লেভ)

    juju deploy --constraints="instance-type=m1.large" hadoop hadoop-master   
    
    juju deploy --constraints="instance-type=m1.medium" -n 5 hadoop hadoop-slave
    
  3. সম্পর্ক তৈরি করুন

    juju add-relation hadoop-master:namenode hadoop-slave:datanode  
    
    juju add-relation hadoop-master:jobtracker hadoop-slave:tasktracker
    
  4. হাদুপকে প্রকাশ করুন (যেহেতু আপনি ইতিমধ্যে স্থাপনা তৈরি করেছেন এবং সম্পর্ক তৈরি করেছেন সেবার পরিষেবাটি চালানো উচিত)

    juju expose hadoop-master
    

    এবং এটি সঠিকভাবে কাজ করছে কিনা তা দেখতে স্থিতি পরীক্ষা করুন:

    juju status hadoop-master
    

এখন অবধি আপনার চলমান হাডোপ রয়েছে। আপনি করতে পারেন এমন আরও অনেকগুলি জিনিস রয়েছে যা সরবরাহিত লিঙ্কটিতে বা হাদুপের জন্য সরকারী জুজু আকর্ষণে পাওয়া যেতে পারে

আপ টু ডেট জন্য জুজু চার্মস (সেটআপস, স্টেপ বাই স্টেপ গাইড এবং আরও অনেকগুলি) আপনি দেখতে পারেন: জুজু চার্মস এবং আপনার নিজের জুজু পরিবেশ তৈরি করুন এবং প্রতিটি ফাইল কীভাবে সেটআপ হয় এবং প্রতিটি পরিষেবা কীভাবে সংযুক্ত হয় তা দেখুন।



hduser (ALL)=(ALL:ALL) ALL সিনট্যাক্স ত্রুটি ছুড়ে ফেলে ...
টুটুকা

চেষ্টা করুন hduser ALL=(ALL:ALL) ALL, প্রথম বন্ধনী বন্ধনীর সরিয়ে ফেলুন
সোসোটো

1
@ এসোটো সবেমাত্র যাচাই করা হয়েছে এবং হ্যাঁ। সম্ভবত তারা এটি সর্বশেষতম সংস্করণগুলিতে পরিবর্তন করেছে।
লুইস আলভারাডো

1
.bachrc- জোহান সেবাস্তিয়ান এটি শুনতে পারা পর্যন্ত অপেক্ষা করুন । ওহ অপেক্ষা কর, সে পারে না… কারণ সে বধির। :-D
ডেভিড ফোস্টার

6

আমি সফলভাবে পথ সেটিং দ্বারা Hadoop এর ইনস্টল JAVA_HOMEহিসাবে usr/lib/jvm/java-6-openjdk-amd64


আপনি কি আরও কিছু বর্ণনামূলক হতে পারেন?
প্যান্থার

3

@ লুইস আলভারাডোর উত্তর থেকে প্রাপ্ত , উবুন্টু ১৪.০৪ এবং হ্যাডোপ ২.২.১ এর জন্য আমার সংস্করণটি এখানে

সংক্ষেপে

  1. জাভা ইনস্টল করুন
  2. একটি প্রস্তুত নির্বাহী ব্যবহারকারী Hadoop এর জন্যhduser
  3. hduserএখন থেকে স্যুইচ করুন
  4. hduserপাস-বাক্যাংশ-কম দিয়ে এসএসএসের মাধ্যমে রিমোটের অনুমতি দিন
  5. আইপিভি 6 অক্ষম করুন
  6. হ্যাডোপ প্যাকেজটি ডাউনলোড এবং কনফিগার করুন
  7. সিস্টেমের পাথ প্রস্তুত করুন $ HADOOP_Home এবং $ জাভাহোম
  8. হাদুপের পরিষেবাগুলি কনফিগার করুন
  9. হাদুপের পরিষেবাগুলি শুরু করুন

সম্পন্ন. শুভকামনা!

বিশদ পদক্ষেপ

জাভা ইনস্টল করুন

ডাউনলোড এবং ইন্সটল

$ sudo add-apt-repository ppa:webupd8team/java    
$ sudo apt-get update && sudo apt-get upgrade    
$ sudo apt-get install oracle-java7-installer

নিশ্চিত হয়ে নিন যে আপনার কাছে জাভা 7 ইনস্টলড আছে

$ which java
$ ls -l /usr/bin/java
$ ls -l /etc/alternatives/java

আমরা থাকা উচিত javaবিন্দু/usr/lib/jvm/java-7-oracle/jre/bin/java

একটি প্রস্তুত নির্বাহী ব্যবহারকারী Hadoop এর জন্যhduser

hduserগ্রুপে ব্যবহারকারী তৈরি করুনhadoop

$ sudo addgroup hadoop  
$ sudo adduser --ingroup hadoop hduser

মঞ্জুর উবুন্টু বিশেষাধিকারhduser

Sudo সম্পাদনা করুন

$ sudo visudo

এই লাইনটি শেষে যুক্ত করুন

hduser ALL=(ALL:ALL) ALL

hduserএখন থেকে স্যুইচ করুন

$ su - hduser

hduserপাস-বাক্যাংশ-কম দিয়ে এসএসএসের মাধ্যমে রিমোটের অনুমতি দিন

ওপেনশ ইনস্টল করুন

$ sudo apt-get install openssh-server

এসএসএইচ সংযোগের জন্য আরএসএ পাবলিক / প্রাইভেট কী তৈরি করুন; পাসফ্রেজ হিসাবে খালিparameter -P ""

$ ssh-keygen -t rsa -P ""
$ cat .ssh/id_rsa.pub >> .ssh/authorized_keys

নিশ্চিত হয়ে নিন যে hduserকোনও পাসওয়ার্ড ছাড়াই স্থানীয়ভাবে দূরবর্তীটিতে এসএসএস করতে পারে

$ ssh localhost

আইপিভি 6 অক্ষম করুন

কনফিগারেশন ফাইলটি সম্পাদনা করুন

$ sudo nano /etc/sysctl.conf

শেষ পর্যন্ত অনুলিপি করুন

#disable ipv6
net.ipv6.conf.all.disable_ipv6 = 1
net.ipv6.conf.default.disable_ipv6 = 1   
net.ipv6.conf.lo.disable_ipv6 = 1

নিশ্চিত হয়ে নিন যে আইপিভি 6 রিবুট বা কল দ্বারা বন্ধ রয়েছে

$ sudo sysctl -p 

তারপরে ফোন করুন

$ cat /proc/sys/net/ipv6/conf/all/disable_ipv6

এটি 1 বলতে হবে যার অর্থ ঠিক আছে ^^

হ্যাডোপ প্যাকেজটি ডাউনলোড এবং কনফিগার করুন

অ্যাপাচি হ্যাডোপ সাইট থেকে হ্যাডোপ 2.5.1 প্যাকেজ ডাউনলোড করুন

এই প্যাকেজের সরাসরি ইউআরএল এই লিঙ্ক

http://www.eu.apache.org/dist/hadoop/core/hadoop-2.5.1/hadoop-2.5.1.tar.gz

সুতরাং আসুন এর hduserহোম ফোল্ডারে ডাউনলোড করুন , এটিকে এক্সট্রাক্ট করুন এবং এর নতুন নাম দিনhadoop

$ wget http://www.eu.apache.org/dist/hadoop/core/hadoop-2.5.1/hadoop-2.5.1.tar.gz
$ tar -xvzf hadoop-2.5.1.tar.gz
$ mv hadoop-2.5.1 hadoop

আমাদের hduserবাড়িতে হ্যাডোপ রয়েছে তা নিশ্চিত করুন

$ ls /home/hduser/hadoop

সিস্টেমের পাথ প্রস্তুত করুন $ HADOOP_Home এবং $ জাভাহোম

hduserএর .bashrc ফাইলটি সম্পাদনা করুন

$ nano .bashrc

জন্য শেষ মান রাখুন $HADOOP_HOMEএবং$JAVA_HOME

# Set Hadoop-related environment variables   
export HADOOP_HOME=/home/hduser/hadoop  

# Set JAVA_HOME (we will also configure JAVA_HOME directly for Hadoop later on)
export JAVA_HOME=/usr/lib/jvm/java-7-oracle 

binaryসিস্টেমে হডুপ ফোল্ডার যুক্ত করুন$PATH

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

একটি নতুন টার্মিনাল খুলুন, হিসাবে লগ ইন করুন এবং hduserউপলভ্য কমান্ড সহ আপনার $ HADOOP_Home আছে তা নিশ্চিত করুন

$ echo $HADOOP_HOME
$ which start-all.sh
$ which start-dfs.sh
$ which start-yarn.sh

আমাদের এই নামের পুরো পথটি দেখতে হবে।

হাদুপের পরিষেবাগুলি কনফিগার করুন

হাদুপের প্রতিটি উপাদান একটি এক্সএমএল ফাইল ব্যবহার করে কনফিগার করা হয়েছে।

  • সাধারণ বৈশিষ্ট্যগুলি কোর-সাইট.xML এ যায়

  • এইচডিএফএসের বৈশিষ্ট্যগুলি hdfs-site.xML এ যায়

  • মানচিত্রের বৈশিষ্ট্যগুলি ম্যাপ্রেড -সাইট.xml এ যায়

এখানে চিত্র বর্ণনা লিখুন

এই ফাইলগুলি সমস্ত ফোল্ডারে $ HADOOP_HOME / etc / hadoop এ রয়েছে

আবার hadoop-env.shলাইনটি সম্পাদনা করে JAVA_HOME এ সংজ্ঞা দিন

export JAVA_HOME=/usr/lib/jvm/java-7-oracle

কোর-সাইট.xMLহাদুপtemp folder এবং file systemনাম নির্ধারণ করুন

<configuration>
  ...
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/hduser/tmp</value>
    <description>A base for other temporary directories.</description>
  </property>

  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:54310</value>
    <description>The name of the default file system.  A URI whose
    scheme and authority determine the FileSystem implementation.  The
    uri's scheme determines the config property (fs.SCHEME.impl) naming
    the FileSystem implementation class.  The uri's authority is used to
    determine the host, port, etc. for a filesystem.</description>
  </property>
  ...
</configuration>

temp folderএটিকে কনফিগার করা হিসাবে আমাদের প্রস্তুত করতে হবে/home/hduser/tmp

$ cd /home/hduser
$ mkdir tmp
$ chown hduser:hadoop tmp
$ chmod 755 tmp

নির্ধারণ করুন file system's block replicationমধ্যে hdfs-site.xml

<configuration>
  ...
  <property>
    <name>dfs.replication</name>
    <value>1</value>
    <description>Default block replication.
    The actual number of replications can be specified when the file is created.
    The default is used if replication is not specified in create time.
    </description>
  </property>
  ...
</configuration>

নির্ধারণ map-reduce jobমধ্যে mapred-site.xml

<configuration>
  ...
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:54311</value>
    <description>The host and port that the MapReduce job tracker runs
    at.  If "local", then jobs are run in-process as a single map
    and reduce task.
    </description>
  </property>
  ...
</configuration>

বিন্যাস name node

$ hdfs namenode -format

হ্যাডোপ পরিষেবা শুরু করুন

কল

$ start-dfs.sh && start-yarn.sh

এই দুটি কমান্ড $ HADOOP_HOME / sbin এ রয়েছে যা আমরা এর আগে সিস্টেম $ PATH এ যুক্ত করেছি।

নিশ্চিত করুন যে হ্যাডোপ পরিষেবাগুলি সঠিকভাবে শুরু হয়েছে

$ jps

আমাদের দেখা উচিত

এখানে চিত্র বর্ণনা লিখুন


1
অনুসরণ করতে খুব সুন্দর গাইড। একটি ছোট্ট ভুল আছে: mapred-site.xmlশুরুতে নেই। এটি তৈরি করা উচিতcp mapred-site.xml.template mapred-site.xml
র‌্যাটার

1

কমান্ডটি sun-javaদিয়ে ইনস্টল করতে সক্ষম হতে apt-getআপনাকে কল করা কোনও ফাইলের সাথে একটি লাইন যুক্ত করতে হবে sources.list। এই ফাইলটি পাওয়া যাবে /etc/apt/sources.list

এই কমান্ডটি ব্যবহার করে ফাইলটি খুলুন:

sudo nano /etc/apt/sources.list

তারপরে সেই ফাইলটির (নীচে) একেবারে শেষে, আপনি লাইনটি অনুলিপি / আটকান:

deb http://us.archive.ubuntu.com/ubuntu/ hardy multiverse

এখন প্রস্থান করতে এবং সংরক্ষণের জন্য Ctrl+ টিপুন ।Xy


এখন কমান্ডটি টাইপ করুন:

sudo apt-get update 

এবং এটি হয়ে গেলে, আপনি সফলভাবে কমান্ডটি চালাতে পারেন:

sudo apt-get install sun-java6-jdk

0

আরও বেশি আপ টু ডেট টিউটোরিয়াল (পার্থক্যগুলিতে নিশ্চিত নয়) এর জন্য হ্যাডোপ স্ক্রিনকাস্ট ভিডিও টিউটোরিয়ালগুলি দেখুন। তারা নীচে ইনস্টল করার জন্য ভিডিও এবং আসল কমান্ড সরবরাহ করে। এছাড়াও আপনি যদি লেখককে ইমেল করেন তবে তিনি প্রতিক্রিয়া জানাতে খুব খুশি হন এবং আপনি কোনও কিছুতে আটকে থাকলে আপনাকে সহায়তা করেন help

এই নির্দেশাবলী @ লুইস যার প্রতিক্রিয়া জানিয়েছে তার সাথে অনেকটাই মিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.