mongodb高可用集群部署
mongodb是最常用的nosql数据库,在数据库排名中已经上升到了前六。这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群。
在搭建集群之前,需要首先了解几个概念:路由,分片、副本集、配置服务器等。 相关概念
从图中可以看到有四个组件:mongos、config server、shard、replica set。
1.mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。
2.config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!
3.shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。
4.replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。
5.仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点作为投票,否则primary不能运行时不会自动切换primary。
简单了解之后,我们可以这样总结一下,应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失同步在副本集中存储了一份,仲裁在数据存储到分片的时候决定存储到哪个节点。 环境准备
系统系统 Ubuntu 18.04.1 LTS 三台服务器:10.20.71.135/10.20.73.182/10.20.70.61 安装包:mongodb-org-server_4.0.6_amd64.deb 服务器规划
端口分配: mongos:20000 config:21000 shard1:27017 shard2:27017 shard3:27017集群搭建
1. mongodb源配置 sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4 echo "deb [ arch=amd64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-4.0.list sudo apt-get update 会安装对应源的mongo所有依赖包,此处不执行 # sudo apt-get install -y mongodb-org echo "mongodb-org hold" | sudo dpkg --set-selections echo "mongodb-org-server hold" | sudo dpkg --set-selections echo "mongodb-org-shell hold" | sudo dpkg --set-selections echo "mongodb-org-mongos hold" | sudo dpkg --set-selections echo "mongodb-org-tools hold" | sudo dpkg --set-selections # 安装依赖 apt install -y mongodb-org-mongos mongodb-org-shell mongodb-org-tools
参考
2. mongodb安装 wget https://repo.mongodb.org/apt/ubuntu/dists/bionic/mongodb-org/4.0/multiverse/binary-amd64/mongodb-org-server_4.0.6_amd64.deb dpkg -i mongodb-org-server_4.0.6_amd64.deb
分别在每台机器建立conf、mongos、config、shard1、shard2、shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。 mkdir -p /usr/local/mongodb/conf mkdir -p /usr/local/mongodb/mongos/log mkdir -p /usr/local/mongodb/configsvr/{data,log} mkdir -p /usr/local/mongodb/shard1/{date,log} mkdir -p /usr/local/mongodb/shard2/{data,log} mkdir -p /usr/local/mongodb/shard3/{data,log}准备集群间通信使用的加密key
创建mongod、mongos之间通信所使用的key文件,在任意一台服务器上执行: openssl rand -base64 756 > /etc/mongodb/conf/key chmod 400 /data/mongodb/conf/key # 将/data/mongodb/conf/key文件拷贝到其它服务器上,保持文件权限不变connfig server配置服务器
mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。添加配置文件 root@mgo-db01cn-p001:/data/mongodb/conf# cat configsrv.conf storage: dbPath: /data/mongodb/config/data journal: enabled: true systemLog: destination: file logAppend: true path: /data/mongodb/config/log/configsrv.log net: port: 21000 bindIp: 0.0.0.0 processManagement: timeZoneInfo: /usr/share/zoneinfo security: keyFile: /data/mongodb/conf/key authorization: enabled replication: replSetName: configs sharding: clusterRole: "configsvr"
分别启动三台服务器的config server 方式一: mongod -f /data/mongodb/conf/configsrv.conf
方式二: root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongosrv.service [Unit] Description=MongoDB Database Config Server After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongodb Group=mongodb EnvironmentFile=-/etc/default/mongod ExecStart=/usr/bin/mongod --config /data/mongodb/conf/configsrv.conf PIDFile=/data/mongodb/config/log/configsrv.pid # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.targetsystemctl daemon-reload systemctl start mongosrv.service systemctl enable mongosrv.service
登录任意一台配置服务器,初始化配置副本集 #连接 mongo --port 21000 #config变量 config = { _id : "configs", members : [ {_id : 0, host : "10.20.71.135:21000" }, {_id : 1, host : "10.20.73.182:21000" }, {_id : 2, host : "10.20.70.61:21000" } ] } #初始化副本集 rs.initiate(config)
其中,"_id" : "configs"应与配置文件中配置的 replicaction.replSetName 一致,"members" 中的 "host" 为三个节点的 ip 和 port 配置分片副本集(三台机器)设置第一个分片副本集(shard1)
1. 配置文件 root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard1.conf storage: dbPath: /data/mongodb/shard1/data journal: enabled: true systemLog: destination: file logAppend: true path: /data/mongodb/shard1/log/shard1.log net: port: 27017 bindIp: 0.0.0.0 processManagement: timeZoneInfo: /usr/share/zoneinfo security: keyFile: /data/mongodb/conf/key authorization: enabled replication: replSetName: shard1 sharding: clusterRole: "shardsvr"
2. 制作服务启动文件 root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard1.service [Unit] Description=MongoDB Shard1 Database Server After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongodb Group=mongodb EnvironmentFile=-/etc/default/mongod ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard1.conf PIDFile=/data/mongodb/shard1/log/shard1.pid # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.target
启动方式一: root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard1.service root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard1.service
启动方式二: mongod -f /data/mongodb/conf/shard1.conf
登陆任意一台服务器,初始化副本集: 在任意一台服务上初始化复制集配置: mongo --port 27017 #使用admin数据库 use admin #定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。 config = { _id : "shard1", members : [ {_id : 0, host : "10.20.71.135:27017" }, {_id : 1, host : "10.20.73.182:27017" }, {_id : 2, host : "10.20.70.61:27017", arbiterOnly: true } ] } #初始化副本集配置 rs.initiate(config); rs.status() rs.conf()设置第二个分片副本集(shard2)
1. 配置文件 root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard2.conf storage: dbPath: /data/mongodb/shard2/data journal: enabled: true systemLog: destination: file logAppend: true path: /data/mongodb/shard2/log/shard2.log net: port: 27018 bindIp: 0.0.0.0 processManagement: timeZoneInfo: /usr/share/zoneinfo security: keyFile: /data/mongodb/conf/key authorization: enabled replication: replSetName: shard2 sharding: clusterRole: "shardsvr"
2. 制作服务启动文件 root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard2.service [Unit] Description=MongoDB Shard2 Database Server After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongodb Group=mongodb EnvironmentFile=-/etc/default/mongod ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard2.conf PIDFile=/data/mongodb/shard2/log/shard2.pid # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.target
启动方式一: root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard2.service root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard2.service
启动方式二: mongod -f /data/mongodb/conf/shard2.conf
登陆任意一台服务器,初始化副本集: 在任意一台服务上初始化复制集配置: mongo --port 27018 #使用admin数据库 use admin #定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。 config = { _id : "shard2", members : [ {_id : 0, host : "10.20.71.135:27018" }, {_id : 1, host : "10.20.73.182:27018", arbiterOnly: true }, {_id : 2, host : "10.20.70.61:27018" } ] } #初始化副本集配置 rs.initiate(config);设置第二个分片副本集(shard3)
1. 配置文件 root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard3.conf storage: dbPath: /data/mongodb/shard3/data journal: enabled: true systemLog: destination: file logAppend: true path: /data/mongodb/shard3/log/shard3.log net: port: 27019 bindIp: 0.0.0.0 processManagement: timeZoneInfo: /usr/share/zoneinfo security: keyFile: /data/mongodb/conf/key authorization: enabled replication: replSetName: shard3 sharding: clusterRole: "shardsvr"
2. 制作服务启动文件 root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard3.service [Unit] Description=MongoDB Shard3 Database Server After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongodb Group=mongodb EnvironmentFile=-/etc/default/mongod ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard3.conf PIDFile=/data/mongodb/shard3/log/shard3.pid # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.target
启动方式一: root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard3.service root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard3.service
启动方式二: mongod -f /data/mongodb/conf/shard3.conf
登陆任意一台服务器,初始化副本集: mongo --port 27019 use admin #定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。 config = { _id : "shard3", members : [ {_id : 0, host : "10.20.71.135:27019",arbiterOnly: true }, {_id : 1, host : "10.20.73.182:27019" }, {_id : 2, host : "10.20.70.61:27019" } ] } #初始化副本集配置 rs.initiate(config);配置路由服务器 mongos
先启动配置服务器和分片服务器,后启动路由实例:(三台机器) 1. 配置文件 systemLog: destination: file logAppend: true path: /data/mongodb/mongos/log/mongos.log net: port: 20000 bindIp: 0.0.0.0 processManagement: timeZoneInfo: /usr/share/zoneinfo security: keyFile: /data/mongodb/conf/key clusterAuthMode: keyFile replication: localPingThresholdMs: 15 sharding: #监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字 configDB: "configs/10.20.71.135:21000,10.20.73.182:21000,10.20.70.61:21000"
2. 制作服务启动文件 root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongos.service [Unit] Description=MongoDB Mongos Database Server After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongodb Group=mongodb EnvironmentFile=-/etc/default/mongod ExecStart=/usr/bin/mongos --config /data/mongodb/conf/mongos.conf PIDFile=/data/mongodb/mongos/log/mongos.pid # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.target
启动方式一: root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload root@mgo-db01cn-p001:/data/mongodb/conf# systemctl enable mongos root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongos.service root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongos.service
启动方式二: mongod -f /data/mongodb/conf/shard3.conf
3. 启用分片 目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。 mongo --port 20000 #使用admin数据库 use admin #串联路由服务器与分配副本集 sh.addShard("shard1/10.20.71.135:27017,10.20.73.182:27017,10.20.70.61:27017") sh.addShard("shard2/10.20.71.135:27018,10.20.73.182:27018,10.20.70.61:27018") sh.addShard("shard3/10.20.71.135:27019,10.20.73.182:27019,10.20.70.61:27019") #查看集群状态 sh.status()
⚠️ : 集群服务启动顺序 mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos. configsvr->shard->mongos 至此,整个mongodb高可用集群就搭建好了。 部署测试
1. 先建一个database及user创建数据 # 创建一个admin用户 $ mongo --port 20000 > use admin > db.createUser({ user: "weadmin", pwd: "123456",roles: [{ role: "userAdminAnyDatabase", db: "admin" },{ role: "clusterManager", db : "admin"}],passwordDigestor: "server"}) > exit # 创建一个database的访问用户 $ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin > use test > db.createUser({user: "test",pwd: "123456",roles: [{ role: "dbOwner", db: "test" }],passwordDigestor: "server"}); > exit # 使用该用户访问database,并插入数据,创建索引 $ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test #插入测试数据 > for (var i = 1; i <= 5000; i++){db.table1.save({id:i,"name":"shuke"})}; > exit
2. 分片生效 目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。 $ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin > use admin # 认证 > db.auth("weadmin", "123456") #指定testdb分片生效 db.runCommand( { enablesharding :"test"}); #指定数据库里需要分片的集合和片键 db.runCommand( { shardcollection : "test.table1",key : {id: 1} } )
我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!
3. 测试分片配置结果: $ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test > use test > db.auth("test", "123456") #查看分片情况 > db.table1.stats();总结
手工部署mongodb集群还是比较麻烦的,所以如果图省事儿,还是使用云厂商提供的PaaS服务好了,比如云数据库 MongoDB。如果一定要自己搭建,还是建议用现成的ansible-mongodb-cluster脚本好了。 refs
mongodb高可用集群部署 - jeremy的技术点滴 mongodb 3.4 集群搭建:分片+副本集 - 纯洁的微笑博客 搭建 MongoDB分片(sharding) / 分区 / 集群环境 - 云+社区 - 腾讯云 MongoDB副本集配置 - 个人文章 - SegmentFault 思否 三个节点的复制集 — MongoDB Manual 3.4 在Ubuntu上安装MongoDB社区版 | 静水流深
后面会分享更多运维方面的内容,感兴趣的朋友可以关注下!
*特别声明:本文为【 赵峰峰 】投稿,仅代表作者观点。马哥教育仅提供信息发布平台。