Menu

  • Home
  • Work
    • Cloud
      • Virtualization
      • IaaS
      • PaaS
    • Java
    • Go
    • C
    • C++
    • JavaScript
    • PHP
    • Python
    • Architecture
    • Others
      • Assembly
      • Ruby
      • Perl
      • Lua
      • Rust
      • XML
      • Network
      • IoT
      • GIS
      • Algorithm
      • AI
      • Math
      • RE
      • Graphic
    • OS
      • Linux
      • Windows
      • Mac OS X
    • BigData
    • Database
      • MySQL
      • Oracle
    • Mobile
      • Android
      • IOS
    • Web
      • HTML
      • CSS
  • Life
    • Cooking
    • Travel
    • Gardening
  • Gallery
  • Video
  • Music
  • Essay
  • Home
  • Work
    • Cloud
      • Virtualization
      • IaaS
      • PaaS
    • Java
    • Go
    • C
    • C++
    • JavaScript
    • PHP
    • Python
    • Architecture
    • Others
      • Assembly
      • Ruby
      • Perl
      • Lua
      • Rust
      • XML
      • Network
      • IoT
      • GIS
      • Algorithm
      • AI
      • Math
      • RE
      • Graphic
    • OS
      • Linux
      • Windows
      • Mac OS X
    • BigData
    • Database
      • MySQL
      • Oracle
    • Mobile
      • Android
      • IOS
    • Web
      • HTML
      • CSS
  • Life
    • Cooking
    • Travel
    • Gardening
  • Gallery
  • Video
  • Music
  • Essay

MinIO学习笔记

3
Jan
2020

MinIO学习笔记

By Alex
/ in PaaS
0 Comments
简介

对象存储在云环境下是一种基础设施,在大数据、AI领域可以将它作为基本的存储方式。Spark、TensorFlow都可以使用对象存储,它也可以作为HDFS的代替者。

MinIO是一个开源的对象存储解决方案,特点包括:

  1. 高性能:作为高性能对象存储,在标准硬件条件下它能达到55GB/s的读、35GG/s的写速率
  2. 可扩容:不同MinIO集群可以组成联邦,并形成一个全局的命名空间,并跨越多个数据中心
  3. 云原生:容器化、基于K8S的编排、多租户支持
  4. 兼容性:兼容S3 API这一事实上的对象存储标准,最先支持S3 Select
  5. 简单:这一设计原则让MinIO不容易出错、更快启动
  6. 支持纠删码:MinIO使用纠删码、Checksum来防止硬件错误和静默数据污染。在最高冗余度配置下,即使丢失1/2的磁盘也能恢复数据
安装配置
单实例
物理机
Shell
1
2
3
wget https://dl.min.io/server/MinIO/release/linux-amd64/MinIO
chmod +x MinIO
./MinIO server /data
Docker

MinIO需要一个卷来存储配置、数据。默认需要开启9000端口:

Shell
1
2
                                                          # 运行服务器,以 /data为存储目录
docker run -p 9000:9000 --name MinIO1 -v /mnt/data:/data  MinIO/MinIO server /data
纠删码

MinIO使用纠删码、Checksum来防止(多个)硬件错误和静默数据污染(Bit Rot,在没有任何信号的情况下磁盘发生数据错误)。在最高冗余度配置下,即使丢失1/2的磁盘也能恢复数据。

纠删码是一种数学手段,用于重构出丢失/污染的数据。MinIO使用Reed-Solomon来将对象分片到若干数据块(Data block)和校验块(Partity block)中。对于12磁盘组成的存储,一个对象可以分片到最多6个校验块+6个数据块中,最少2个校验块+10个数据块中。

默认情况下,对象分片到N/2的数据盘、N/2的校验盘中。你可以使用Storage Class修改此配置。

Docker

8磁盘组成的MinIO服务器:

Shell
1
2
3
4
5
6
7
8
9
10
docker run -p 9000:9000 --name minio \
  -v /mnt/data1:/data1 \
  -v /mnt/data2:/data2 \
  -v /mnt/data3:/data3 \
  -v /mnt/data4:/data4 \
  -v /mnt/data5:/data5 \
  -v /mnt/data6:/data6 \
  -v /mnt/data7:/data7 \
  -v /mnt/data8:/data8 \
  minio/minio server /data1 /data2 /data3 /data4 /data5 /data6 /data7 /data8
Kubernetes

将MinIO部署到K8S中的途径有多种:

  1. MinIO-Operator:无缝的创建、更新高可用MinIO集群
  2. 通过Helm Chart
  3. 使用YAML文件
Operator

启用MinIO Operator需要K8S 1.15+,安装以下K8S资源:

YAML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
apiVersion: v1
kind: Namespace
metadata:
  # 安装到的命名空间
  name: minio
---
apiVersion: apiextensions.k8s.io/v1beta1
kind: CustomResourceDefinition
metadata:
  name: minioinstances.miniocontroller.min.io
spec:
  group: miniocontroller.min.io
  version: v1beta1
  scope: Namespaced
  names:
    kind: MinIOInstance
    singular: minioinstance
    plural: minioinstances
  # 去掉下面这行则1.13也可以用
  preserveUnknownFields: true
  validation:
    openAPIV3Schema:
      type: object
      properties:
        spec:
          type: object
          properties:
            replicas:
              type: integer
              minimum: 1
              maximum: 32
            version:
              type: string
            mountpath:
              type: string
            subpath:
              type: string
  additionalPrinterColumns:
    - name: Replicas
      type: integer
      JSONPath: ".spec.replicas"
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
  name: minio-operator-role
rules:
- apiGroups:
  - ""
  resources:
  - namespaces
  - secrets
  - pods
  - services
  - events
  verbs:
  - get
  - watch
  - create
  - list
  - patch
- apiGroups:
  - apps
  resources:
  - statefulsets
  verbs:
  - get
  - create
  - list
  - patch
  - watch
- apiGroups:
  - "certificates.k8s.io"
  resources:
  - "certificatesigningrequests"
  - "certificatesigningrequests/approval"
  - "certificatesigningrequests/status"
  verbs:
  - update
  - create
  - get
- apiGroups:
  - miniocontroller.min.io
  resources:
  - "*"
  verbs:
  - "*"
- apiGroups:
  - min.io
  resources:
  - "*"
  verbs:
  - "*"
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: minio-operator-sa
  namespace: minio
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
  name: minio-operator-binding
  namespace: minio
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: minio-operator-role
subjects:
- kind: ServiceAccount
  name: minio-operator-sa
  namespace: minio
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: minio-operator
  namespace: minio
spec:
  replicas: 1
  selector:
    matchLabels:
      name: minio-operator
  template:
    metadata:
      labels:
        name: minio-operator
    spec:
      serviceAccountName: minio-operator-sa
      containers:
        - name: minio-operator
          # Operator镜像
          image: docker.gmem.cc/minio/k8s-operator:1.0.4
          imagePullPolicy: IfNotPresent

要创建一个MinIO集群,创建如下CR:

YAML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
apiVersion: v1
kind: Secret
metadata:
  name: minio-creds-secret
type: Opaque
data:
  #          minio
  accesskey: bWluaW8=
  #          minio123
  secretkey: bWluaW8xMjMK
---
apiVersion: miniocontroller.min.io/v1beta1
kind: MinIOInstance
metadata:
  name: minio
## 可以指定使用的Pod调度器
# scheduler:
#  name: my-custom-scheduler
spec:
  ## 由StatefulSet创建的Pod的元数据
  metadata:
    labels:
      app: minio
    annotations:
      prometheus.io/path: /minio/prometheus/metrics
      prometheus.io/port: "9000"
      prometheus.io/scrape: "true"
  ## MinIO服务器镜像
  image: docker.gmem.cc/minio/minio:RELEASE.2019-12-17T23-16-33Z
  ## MinIO示例使用的凭证
  credsSecret:
    name: minio-creds-secret
  ## 副本份数,如果设置为1则为单实例模式,不支持从单实例模式升级为分布式模式
  ## 如果要运行分布式模式,最少设置为4,必须偶数
  replicas: 4
  ## StatefulSet 使用的PodManagement policy,可选值"OrderedReady"、"Parallel"(默认)
  ## 如果设置为"OrderedReady"则会禁用Readiness checks
  podManagementPolicy: Parallel
  ## 启用基于K8S的证书生成和签名,参考https://kubernetes.io/docs/tasks/tls/managing-tls-in-a-cluster
  requestAutoCert: false
  ## 证书关键信息
  certConfig:
    commonName: ""
    organizationName: []
    dnsNames: []
 
  ## 可以指定容忍配置
  # tolerations:
  #  - effect: NoSchedule
  #    key: dedicated
  #    operator: Equal
  #    value: storage
  ## MinIO容器的环境变量
  env:
    - name: MINIO_BROWSER
      value: "on"
    # - name: MINIO_STORAGE_CLASS_RRS
    #   value: "EC:2"
 
  resources:
    requests:
      memory: 512Mi
      cpu: 250m
  liveness:
    httpGet:
      path: /minio/health/live
      port: 9000
    initialDelaySeconds: 120
    periodSeconds: 20
  ## Readiness check仅在PodManagementPolicy 为 "Parallel"时工作
  readiness:
    httpGet:
      path: /minio/health/ready
      port: 9000
    initialDelaySeconds: 120
  volumeClaimTemplate:
    metadata:
      name: data
    spec:
      accessModes:
        - ReadWriteOnce
      resources:
        requests:
          storage: 10Gi
Helm Chart
Shell
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
helm repo update
helm search minio
# NAME            CHART VERSION   APP VERSION     DESCRIPTION                                                                                                                              
# kube/minio      5.0.1           master          MinIO is a high performance data infrastructure for machi...
 
 
kubectl create ns minio
kubectl -n minio create sa minio
kubectl -n minio patch sa minio -p '{"imagePullSecrets": [{"name": "gmemregsecret"}]}'
 
helm install kube/minio --name=minio --namespace=minio \
  # 设置访问凭证,注意secretkey至少8字符           分布式            副本份数    每个节点PV个数
  --set accessKey=minio,secretKey=minio123,mode=distributed,replicas=4,drivesPerNode=1 \
  --set fullnameOverride=minio,image.repository=docker.gmem.cc/minio/minio,image.tag=RELEASE.2019-12-17T23-16-33Z \
  --set serviceAccount.name=minio,serviceAccount.create=false,clusterDomain=k8s.gmem.cc
命令行

MinIO提供了可以操控任何S3兼容对象存储的命令行mc。

安装

下载:https://dl.min.io/client/mc/release/linux-amd64/mc放到$PATH下即可。

子命令
子命令 说明
ls

列出桶和对象

Shell
1
2
3
4
5
6
7
8
9
mc ls rgw
# [2020-01-03 16:14:45 CST]      0B test/
 
# 递归的列出
mc ls --recursive s3
 
 
# 列出没有完整上传的对象
mc ls --incomplete s3/mybucket 
tree

以树形结构列出桶和对象

Shell
1
2
3
4
5
6
7
mc tree rgw
# rgw
# └─ test
#    └─ test1
mc tree rgw/test
# rgw/test
# └─ test1
mb

创建一个桶,或创建目录结构

Shell
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 在主机rgw中创建桶test
mc mb rgw/test
 
#      在指定的区域创建桶    启用对象锁
mc mb --region=us-west-2  --with-lock  s3/myregionbucket
 
 
# 创建一个目录结构,自动创建缺失的父目录
mc mb /tmp/this/new/dir1
# 创建多个
mc mb /mnt/sdb/mydisk /mnt/sdc/mydisk /mnt/sdd/mydisk
 
# 如果桶或目录已经存在,则忽略
mc mb --ignore-existing myminio/mynewbucket 
rb

移除一个桶

Shell
1
2
3
4
5
# 强制删除,即使路径不为空
mc rb --force rgw/test
 
# 删除s3上所有桶和对象
mc rb --force --dangerous s3
cat 查看对象内容
head 显示对象的前N行
pipe 将标准输入写入STDIN
share 创建一个用于临时访问对象的URL
cp 复制对象
mirror 和远程站点同步对象
find 查找对象
sql 针对对象执行SQL查询
stat 对象内容的统计信息
diff 列出桶之间的差异,包括对象名、尺寸、日期
rm 移除对象
event 管理对象通知
watch 监控对象事件
policy 管理对对象的匿名访问
admin 管理MinIO服务器
session 为cp命令管理已保存的会话
config

管理mc配置文件

mc config host,管理可用的S3服务:

Shell
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 添加Ceph Radosgw网关
#                                               access_key           secret_key
mc config host add rgw https://rgw.gmem.cc:7480 IN01UCU1M1996LK6OM88 AuuAbroSUlWLykbQHCbFLVO6RU2ozUEjIFkYeoqc
 
 
# 添加MinIO服务器
mc config host add minio https://minio.k8s.gmem.cc minio minio123
#    API 版本      基于DNS的桶查找    
     --api "s3v4" --lookup "dns"
 
 
# 列出所有主机,默认有gcs、local、play、s3
mc config host list
 
 
# 移除主机
mc config host remove gcs
update 检查软件更新

 

← Octave知识集锦
Galera学习笔记 →

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

Related Posts

  • CRIU和Pod在线迁移
  • Kustomize学习笔记
  • 扩展Envoy
  • Kubernetes端到端测试
  • Kubernetes学习笔记

Recent Posts

  • Investigating and Solving the Issue of Failed Certificate Request with ZeroSSL and Cert-Manager
  • A Comprehensive Study of Kotlin for Java Developers
  • 背诵营笔记
  • 利用LangChain和语言模型交互
  • 享学营笔记
ABOUT ME

汪震 | Alex Wong

江苏淮安人,现居北京。目前供职于腾讯云,专注容器方向。

GitHub:gmemcc

Git:git.gmem.cc

Email:gmemjunk@gmem.cc@me.com

ABOUT GMEM

绿色记忆是我的个人网站,域名gmem.cc中G是Green的简写,MEM是Memory的简写,CC则是我的小天使彩彩名字的简写。

我在这里记录自己的工作与生活,同时和大家分享一些编程方面的知识。

GMEM HISTORY
v2.00:微风
v1.03:单车旅行
v1.02:夏日版
v1.01:未完成
v0.10:彩虹天堂
v0.01:阳光海岸
MIRROR INFO
Meta
  • Log in
  • Entries RSS
  • Comments RSS
  • WordPress.org
Recent Posts
  • Investigating and Solving the Issue of Failed Certificate Request with ZeroSSL and Cert-Manager
    In this blog post, I will walk ...
  • A Comprehensive Study of Kotlin for Java Developers
    Introduction Purpose of the Study Understanding the Mo ...
  • 背诵营笔记
    Day 1 Find Your Greatness 原文 Greatness. It’s just ...
  • 利用LangChain和语言模型交互
    LangChain是什么 从名字上可以看出来,LangChain可以用来构建自然语言处理能力的链条。它是一个库 ...
  • 享学营笔记
    Unit 1 At home Lesson 1 In the ...
  • K8S集群跨云迁移
    要将K8S集群从一个云服务商迁移到另外一个,需要解决以下问题: 各种K8S资源的迁移 工作负载所挂载的数 ...
  • Terraform快速参考
    简介 Terraform用于实现基础设施即代码(infrastructure as code)—— 通过代码( ...
  • 草缸2021
    经过四个多月的努力,我的小小荷兰景到达极致了状态。

  • 编写Kubernetes风格的APIServer
    背景 前段时间接到一个需求做一个工具,工具将在K8S中运行。需求很适合用控制器模式实现,很自然的就基于kube ...
  • 记录一次KeyDB缓慢的定位过程
    环境说明 运行环境 这个问题出现在一套搭建在虚拟机上的Kubernetes 1.18集群上。集群有三个节点: ...
  • eBPF学习笔记
    简介 BPF,即Berkeley Packet Filter,是一个古老的网络封包过滤机制。它允许从用户空间注 ...
  • IPVS模式下ClusterIP泄露宿主机端口的问题
    问题 在一个启用了IPVS模式kube-proxy的K8S集群中,运行着一个Docker Registry服务 ...
  • 念爷爷
      今天是爷爷的头七,十二月七日、阴历十月廿三中午,老人家与世长辞。   九月初,回家看望刚动完手术的爸爸,发

  • 6 杨梅坑

  • liuhuashan
    深圳人才公园的网红景点 —— 流花山

  • 1 2020年10月拈花湾

  • 内核缺陷触发的NodePort服务63秒延迟问题
    现象 我们有一个新创建的TKE 1.3.0集群,使用基于Galaxy + Flannel(VXLAN模式)的容 ...
  • Galaxy学习笔记
    简介 Galaxy是TKEStack的一个网络组件,支持为TKE集群提供Overlay/Underlay容器网 ...
TOPLINKS
  • Zitahli's blue 91 people like this
  • 梦中的婚礼 64 people like this
  • 汪静好 61 people like this
  • 那年我一岁 36 people like this
  • 为了爱 28 people like this
  • 小绿彩 26 people like this
  • 彩虹姐姐的笑脸 24 people like this
  • 杨梅坑 6 people like this
  • 亚龙湾之旅 1 people like this
  • 汪昌博 people like this
  • 2013年11月香山 10 people like this
  • 2013年7月秦皇岛 6 people like this
  • 2013年6月蓟县盘山 5 people like this
  • 2013年2月梅花山 2 people like this
  • 2013年淮阴自贡迎春灯会 3 people like this
  • 2012年镇江金山游 1 people like this
  • 2012年徽杭古道 9 people like this
  • 2011年清明节后扬州行 1 people like this
  • 2008年十一云龙公园 5 people like this
  • 2008年之秋忆 7 people like this
  • 老照片 13 people like this
  • 火一样的六月 16 people like this
  • 发黄的相片 3 people like this
  • Cesium学习笔记 90 people like this
  • IntelliJ IDEA知识集锦 59 people like this
  • Bazel学习笔记 38 people like this
  • 基于Kurento搭建WebRTC服务器 38 people like this
  • PhoneGap学习笔记 32 people like this
  • NaCl学习笔记 32 people like this
  • 使用Oracle Java Mission Control监控JVM运行状态 29 people like this
  • Ceph学习笔记 27 people like this
  • 基于Calico的CNI 27 people like this
Tag Cloud
ActiveMQ AspectJ CDT Ceph Chrome CNI Command Cordova Coroutine CXF Cygwin DNS Docker eBPF Eclipse ExtJS F7 FAQ Groovy Hibernate HTTP IntelliJ IO编程 IPVS JacksonJSON JMS JSON JVM K8S kernel LB libvirt Linux知识 Linux编程 LOG Maven MinGW Mock Monitoring Multimedia MVC MySQL netfs Netty Nginx NIO Node.js NoSQL Oracle PDT PHP Redis RPC Scheduler ServiceMesh SNMP Spring SSL svn Tomcat TSDB Ubuntu WebGL WebRTC WebService WebSocket wxWidgets XDebug XML XPath XRM ZooKeeper 亚龙湾 单元测试 学习笔记 实时处理 并发编程 彩姐 性能剖析 性能调优 文本处理 新特性 架构模式 系统编程 网络编程 视频监控 设计模式 远程调试 配置文件 齐塔莉
Recent Comments
  • qg on Istio中的透明代理问题
  • heao on 基于本地gRPC的Go插件系统
  • 黄豆豆 on Ginkgo学习笔记
  • cloud on OpenStack学习笔记
  • 5dragoncon on Cilium学习笔记
  • Archeb on 重温iptables
  • C/C++编程:WebSocketpp(Linux + Clion + boostAsio) – 源码巴士 on 基于C/C++的WebSocket库
  • jerbin on eBPF学习笔记
  • point on Istio中的透明代理问题
  • G on Istio中的透明代理问题
  • 绿色记忆:Go语言单元测试和仿冒 on Ginkgo学习笔记
  • point on Istio中的透明代理问题
  • 【Maven】maven插件开发实战 – IT汇 on Maven插件开发
  • chenlx on eBPF学习笔记
  • Alex on eBPF学习笔记
  • CFC4N on eBPF学习笔记
  • 李运田 on 念爷爷
  • yongman on 记录一次KeyDB缓慢的定位过程
  • Alex on Istio中的透明代理问题
  • will on Istio中的透明代理问题
  • will on Istio中的透明代理问题
  • haolipeng on 基于本地gRPC的Go插件系统
  • 吴杰 on 基于C/C++的WebSocket库
©2005-2025 Gmem.cc | Powered by WordPress | 京ICP备18007345号-2