k8s部署Kubeflow v1.7.0

news2024/10/6 4:12:41

文章目录

      • 环境介绍
      • 部署
      • 访问kubeflow ui
      • 问题记录

环境介绍

K8S版本:v1.23.17,需要配置默认的sc
参考:https://github.com/kubeflow/manifests/tree/v1.7.0

部署

#获取安装包
wget  https://github.com/kubeflow/manifests/archive/refs/tags/v1.7.0.tar.gz
 
#解压
tar -zxvf manifests-1.7.0.tar.gz
 
#获取需要的镜像
cd manifests-1.7.0
kustomize build example |grep 'image: '|awk '$2 != "" { print $2}' |sort -u

镜像源调整
find /kubeflow/manifests-1.7.0/ -type f -name "*.yaml" | xargs sed -i 's#gcr.io#gcr.dockerproxy.com#g'
find /kubeflow/manifests-1.7.0/ -type f -name "*.py" | xargs sed -i 's#gcr.io#gcr.dockerproxy.com#g'

部署:
while ! kustomize build example | awk '!/well-defined/' | kubectl apply -f -; do echo "Retrying to apply resources"; sleep 10; done

检查Pod是否正常?
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n cert-manager
NAME                                       READY   STATUS    RESTARTS   AGE
cert-manager-b4b465456-cqpmd               1/1     Running   0          12h
cert-manager-cainjector-64d74f9c8f-h8sbd   1/1     Running   0          12h
cert-manager-webhook-66fff58cdf-lh7tc      1/1     Running   0          12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n istio-system
NAME                                     READY   STATUS    RESTARTS   AGE
authservice-0                            1/1     Running   0          12h
cluster-local-gateway-7f55dcfff7-lnht5   1/1     Running   0          12h
istio-ingressgateway-869ccf7495-bd547    1/1     Running   0          12h
istiod-69d59d9787-gzqxh                  1/1     Running   0          12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n auth
NAME                   READY   STATUS    RESTARTS   AGE
dex-86c6ff6df8-fkk4c   1/1     Running   0          12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n knative-eventing
NAME                                   READY   STATUS    RESTARTS   AGE
eventing-controller-7889878c4f-zpp5w   1/1     Running   0          12h
eventing-webhook-67f458d8dc-wzsw5      1/1     Running   0          12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n knative-serving
NAME                                     READY   STATUS    RESTARTS      AGE
activator-5b8f844df6-bcbz7               2/2     Running   7 (12h ago)   12h
autoscaler-db588db95-lwx9v               2/2     Running   0             12h
controller-67cf9bbc8-nx29h               2/2     Running   0             12h
domain-mapping-5cdc99c95c-mstvm          2/2     Running   0             12h
domainmapping-webhook-7b6c4fccbd-69xpg   2/2     Running   0             12h
net-istio-controller-8468c9f8d5-dn92x    2/2     Running   0             12h
net-istio-webhook-6d55c8b86c-xnjlb       2/2     Running   0             12h
webhook-85c77fccfc-7ncdp                 2/2     Running   0             12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n kubeflow
NAME                                                     READY   STATUS    RESTARTS      AGE
admission-webhook-deployment-657697f86-nd82z             1/1     Running   0             12h
cache-server-666dbc749-twpsz                             2/2     Running   0             12h
centraldashboard-554fbb8f9d-lqwb4                        2/2     Running   0             12h
jupyter-web-app-deployment-787c9ccf46-zjkf4              2/2     Running   0             12h
katib-controller-6df466949b-d9tfh                        1/1     Running   0             12h
katib-db-manager-6c7cdd865d-cs42k                        1/1     Running   0             12h
katib-mysql-6975d6c6c4-rxrq8                             1/1     Running   0             12h
katib-ui-cd5f5fbd6-hbk7h                                 2/2     Running   1 (25m ago)   24m
kserve-controller-manager-5fc9cbcdf8-vccnk               2/2     Running   0             12h
kserve-models-web-app-7d99fdb-jz6jr                      2/2     Running   0             12h
kubeflow-pipelines-profile-controller-558b7678d8-trqpt   1/1     Running   0             12h
metacontroller-0                                         1/1     Running   0             12h
metadata-envoy-deployment-5788595668-87z64               1/1     Running   0             12h
metadata-grpc-deployment-75fb876c4b-pmmpk                2/2     Running   1 (25m ago)   24m
metadata-writer-56b4c57949-7vzqk                         2/2     Running   0             12h
minio-88f9db94d-nzwcl                                    2/2     Running   0             12h
ml-pipeline-5f974c9879-6pgkk                             2/2     Running   7 (12h ago)   12h
ml-pipeline-persistenceagent-548958c9-nrk95              2/2     Running   0             12h
ml-pipeline-scheduledworkflow-8699d58b74-xwz9x           2/2     Running   0             12h
ml-pipeline-ui-84f68c8899-hmkl6                          2/2     Running   0             12h
ml-pipeline-viewer-crd-67f995fd8c-c94bn                  2/2     Running   1 (12h ago)   12h
ml-pipeline-visualizationserver-564586897b-dgwqc         2/2     Running   0             12h
mysql-77ff498954-bb74m                                   2/2     Running   0             12h
notebook-controller-deployment-7d6df9f67c-fv9q5          2/2     Running   1 (22m ago)   21m
profiles-deployment-c46c4fb9f-gk8pf                      3/3     Running   1 (12h ago)   12h
tensorboard-controller-deployment-649d96556f-hgmdn       3/3     Running   2 (12h ago)   12h
tensorboards-web-app-deployment-64b8b6b9cc-2rg9s         2/2     Running   0             12h
training-operator-64c4cfc8bb-hsqpx                       1/1     Running   0             12h
volumes-web-app-deployment-8b6b8f49d-2chwz               2/2     Running   0             12h
workflow-controller-6b6495dd65-whnss                     2/2     Running   2 (12h ago)   12h
root@ser-compute-07:/srv/k8s_yaml/kubeflow/manifests-1.7.0# kubectl get pods -n kubeflow-user-example-com
NAME                                               READY   STATUS    RESTARTS   AGE
ml-pipeline-ui-artifact-755fbf99d-4phbh            2/2     Running   0          18m
ml-pipeline-visualizationserver-75c845688d-5hxqn   2/2     Running   0          18m

访问kubeflow ui

Login with the default user's credential. The default email address is user@example.com and the default password is 12341234.

kubectl patch service istio-ingressgateway -n istio-system -p '{"spec":{"type":"NodePort"}}'

问题记录

1、创建Notebook失败
在这里插入图片描述

kubectl edit deployments.apps -n kubeflow jupyter-web-app-deployment 
......
        - name: APP_SECURE_COOKIES
          value: "false"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1648108.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【方法】如何创建RAR格式压缩文件?

为了方便存储或者传输文件,我们经常会把文件打包成不同格式的压缩包,那如果想创建的是RAR格式的压缩包,要如何做呢? RAR是WinRAR软件独有的压缩格式,所以我们可以通过WinRAR软件来创建RAR格式压缩包。下面分享两种创建…

5000亿参数来了:微软将推出 MAI-1 模型硬刚谷歌和OpenAI|TodayAI

美国的科技巨头微软公司,正在积极扩展其人工智能(AI)技术的领域。最新消息显示,微软将推出一款名为MAI-1的全新AI模型,其规模巨大,预计将拥有5000亿个可调参数。这一开发工作由Inflection AI的CEO穆斯塔法苏…

cmake进阶:变量的作用域说明三(从函数作用域方面)

一. 简介 前一篇文章从函数作用域方面学习了 变量的作用域。文章如下: cmake进阶:变量的作用域说明一(从函数作用域方面)-CSDN博客cmake进阶:变量的作用域说明二(从函数作用域方面)-CSDN博客…

在Node.js(express 框架)中使用 JWT 进行身份认证

文章目录 一、JWT 认证机制二、安装 JWT 相关的包三、基本使用1、生成 JWT 字符串2、添加中间件,解析 JWT 字符串3、获取管理员信息(admin) 一、JWT 认证机制 JWT 认证机制(图片来源于网络,侵权删除): 关于 JWT 原理可…

Wish、Newegg、Allegro卖家如何做测评补单 快速提升产品权重与销量

大部分主流平台卖家都会使用测评补单来增加产品权重、提高销量。经常会有一些平台的卖家咨询我其他平台能否像亚马逊一样通过测评补单来提升曝光。 其实大部分跨境电商都是可以通过补单来增加店铺权重提升产品排名。其实亚马逊相对来说风控是最严的,风控点多达几十…

Pytorch基础:内置类type的用法

相关阅读 Pythonhttps://blog.csdn.net/weixin_45791458/category_12403403.html?spm1001.2014.3001.5482 在python中,一切数据类型都是对象(即类的实例),包括整数、浮点数、字符串、列表、元组、集合、字典、复数、布尔、函数、…

Telnet的三种配置和SSH配置

Telnet的三种配置 实验配置思路: 配置接口IP地址: R1——配置接口IP地址 R2——配置接口IP地址 认证模式为none的配置 R1——认证模式配置为none R2——测试Telnet连接R1设备 认证模式为passwrd的配置 R1——认证模式配置为password R2——测试Telnet连…

C语言例题35、判断一个数是否是回文数

题目要求&#xff1a;输入一个5位数&#xff0c;判断它是不是回文数。即12321是回文数 #include <stdio.h>int main() {int x;int ge, shi, qian, wan;printf("请输入一个5位数&#xff1a;");scanf("%d", &x);ge x % 10; //个sh…

嵌入式硬件中PCB走线与过孔的电流承载能力分析

简介 使用FR4敷铜板PCBA上各个器件之间的电气连接是通过其各层敷着的铜箔走线和过孔来实现的。 由于不同产品、不同模块电流大小不同,为实现各个功能,设计人员需要知道所设计的走线和过孔能否承载相应的电流,以实现产品的功能,防止过流时产品烧毁。 文中介绍设计和测试FR4敷…

图解HTTP(2、简单的 HTTP 协议)

HTTP 协议用于客户端和服务器端之间的通信 请求访问文本或图像等资源的一端称为客户端&#xff0c;而提供资源响应的一端称为服务器端。 通过请求和响应的交换达成通信 请求必定由客户端发出&#xff0c;而服务器端回复响应报文 请求报文是由请求方法、请求 URI、协议版本、…

Baidu Comate 智能编码助手:编程新伙伴,效率新飞跃

作者简介&#xff1a;一名云计算网络运维人员、每天分享网络与运维的技术与干货。 公众号&#xff1a;网络豆云计算学堂 座右铭&#xff1a;低头赶路&#xff0c;敬事如仪 个人主页&#xff1a; 网络豆的主页​​​​​ 目录 写在前面 一、Baidu Comate智能编码助手简介…

vue快速入门(五十七) 作用域插槽

注释很详细&#xff0c;直接上代码 上一篇 新增内容 作用域插槽实现表格删除数据 源码 App.vue <template><div id"app"><!-- 向子组件传值 --><MyTable :tableData"tableData"><!-- 接收子组件的传值&#xff0c;默认是对象格…

金三银四面试题(二十四):享元模式知多少?

什么是享元模式 享元模式&#xff08;Flyweight Pattern&#xff09;是一种结构型设计模式&#xff0c;旨在通过共享对象来减少内存使用&#xff0c;从而提高性能。它主要用于处理大量细粒度对象的情况&#xff0c;通过将这些对象的可共享部分&#xff08;内部状态&#xff09…

“A”分考试经验分享:云计算HCIE考试请注意这几点...

大家好&#xff0c;我是誉天云计算HCIE的王同学&#xff0c;于4月2日"A"分通过了云计算3.0 HCIE的认证考试。 首先感谢誉天教育对我的辅导&#xff0c;感谢苗苗老师和石老师对我的帮助&#xff0c;通过这次考试让我对华为云计算有了一定的了解。接下来我就与大家分享…

嵌入式C语言教程:实现气压监测系统

气压监测在气象学、航空和户外活动装备中非常重要。本教程将介绍如何在STM32微控制器上使用数字气压传感器实现实时气压监测系统。 一、开发环境准备 硬件要求 微控制器&#xff1a;STM32L476RG&#xff0c;具备低功耗特性和足够的处理能力。开发板&#xff1a;STM32L4 Disc…

“40法则”视角下的中国网络安全公司

“40法则”视角下国内网安上市公司2023年业绩表现 采用“40法则”衡量&#xff0c;首先需要考虑的是营收增长和利润水平的衡量指标&#xff0c;在上一篇文章中已经详细说明&#xff0c;在此不再赘述。 增长速度的衡量指标&#xff0c;可以选择公司的营业收入的同比增长率。 …

软考 系统架构设计师系列知识点之软件可靠性基础知识(11)

接前一篇文章&#xff1a;软考 系统架构设计师系列知识点之软件可靠性基础知识&#xff08;10&#xff09; 所属章节&#xff1a; 第9章. 软件可靠性基础知识 第2节 软件可靠性建模 9.2.3 软件可靠性模型模型分类 一个有效的软件可靠性模型应尽可能地将前文所述的因素在软件可…

deepin 社区月报 | 2024年4月,多款应用更新,还有线下相见!

deepin&#xff08;深度&#xff09;社区4月总览 2024年4月&#xff0c;有1131位小伙伴加入了deepin&#xff08;深度&#xff09;社区大家庭&#xff0c;目前共有论坛伙伴153,910位&#xff1b; 在4月&#xff0c;deepin V23 Beta3共进行了2次内测更新&#xff0c;共新增与更…

十七岁少女夸小沈阳:我瞅你长得有一种大海的感觉呢!

十七岁少女夸小沈阳&#xff1a;我瞅你长得有一种大海的感觉呢&#xff01; ——小品《超级大明星》&#xff08;上&#xff09;的台词 小沈阳&#xff1a;THANK YOU 哦了 不用拍 感谢大家 非常的感谢所有的好朋友们 把你们热情而洋溢的掌声呢 送给我们所有的演员 这…

手把手教你上手开源性能监控神器Arthas

前言 在日常的工作中&#xff0c;对于商业项目尤其是并发量较高的项目&#xff0c;系统在一些情况下会莫名其妙把CPU打满并且导致服务宕机&#xff0c;虽然90%的情况下&#xff0c;是迭代发版的代码有bug&#xff0c;但是既然有这个情况&#xff0c;线上出现事故了&#xff0c…