AIGC: 10 AI转文服务器的搭建过程记录

news2024/11/17 9:31:42

file

上图是台风席卷城市,现在企业的服务基本都是混合部署,云计算厂商的机房往往可以提供比较好的保护,一般在地下,扛多少级地震,扛多少级台风,而自建机房,往往写字楼经常停电,网络运营上经常断网。

那么怎么防护这种意外,保证服务在线,或者最短时间恢复?

答案就是多地备份,快速切换。

背景

飓风袭击亚特兰大,我们的转文服务器放在这个城市,担心断电或者断网。所以需要有一个备用的服务器来处理语音数据。

计划是在云计算厂商相对安全,距离又近的地方买一个服务器,重新搭建,来处理语音转文,左右声道拆分和角色识别。

然后是做完之后,需要通过配置能切换,同时保证功能正常。

目标

购买一个最低成本的带GPU的服务器,在阿里云上。做备用,在极端天气情况下使用备用的服务器。极端天气过后,切换到自建IDC的服务器。兼顾成本和高可用。

下面是操作步骤。记录下来,方便后续查看或者交给运维。

搭建步骤

1 购买机器

带GPU的,默认安装驱动;

file

选择的ubuntu系统。 设置账号密码,安全组端口全部关闭。 vpc选择跟产线环境互通,可以节约流量加快速度,进一步提高安全性。

2 查看gpu显卡信息

需要先安装工具。这将显示有关图形设备的信息。来看看买的GPU的资源是否给够了,当前的版本是什么,方便排查问题。

sudo apt-get install inxi
sudo inxi -G

然后查看GPU信息:

sudo nvidia-smi

file

这张图片显示了NVIDIA GPU的状态信息,使用了nvidia-smi命令。下面是对各个字段的解释,以及一些类比和例子:

主要信息解释

  1. NVIDIA-SMI 550.90.07:
    • 这是NVIDIA系统管理接口的版本号。就像软件的版本号,指示你正在使用哪个版本的驱动程序。
  2. Driver Version 550.90.07:
    • 这是当前安装的GPU驱动程序版本。如果驱动程序不更新,可能会影响GPU性能和兼容性,就像手机应用需要定期更新以修复漏洞。
  3. CUDA Version 12.4:
    • CUDA是NVIDIA的并行计算平台和编程模型,版本指示支持的CUDA功能。可以类比为操作系统的版本,决定了你可以使用哪些新特性。
  4. GPU Name: Tesla T4:
    • 显示了GPU的型号。在这张图中,使用的是NVIDIA的Tesla T4,适用于深度学习和高性能计算。
  5. Fan Temp 44C:
    • 风扇的温度,44摄氏度。可以类比于计算机的CPU温度,帮助监控硬件是否过热。
  6. Power Usage/Cap (10W / 70W):
    • 当前功耗为10瓦,最大功耗为70瓦。这表明GPU在有效使用功率,类似于电器的功率消耗。
  7. Memory Usage (1MiB / 16384MiB):
    • 当前使用的内存为1 MiB,总可用内存为16,384 MiB(即16 GB)。这一点可以与计算机的内存使用情况做类比。
  8. GPU Utilization (0%):
    • 目前GPU的利用率为0%,表示没有正在运行的计算任务。可以看成汽车的油门,0%意味着完全没有加速。
  9. Processes:
    • 该部分显示当前正在运行的进程。这里显示“没有正在运行的进程”,意味着没有任务占用GPU资源。

类比说明

可以把这整个信息看作一辆汽车的仪表盘:

  • 版本号(NVIDIA-SMI, Driver, CUDA)类似于汽车的型号和生产年份。
  • 温度(Fan Temp)类似于发动机的温度表,确保它在正常范围内运行。
  • 功耗(Power Usage/Cap)就像油表,显示当前油量和油箱的容量。
  • 内存使用(Memory Usage)就像后备箱的空间,显示了当前使用和可用的存储空间。
  • 利用率(GPU Utilization)则像车速表,表示汽车当前的运行状态。
  • 进程信息就像车内的乘客,显示当前有哪些人(进程)在使用这辆车(GPU)。

通过这些信息,用户可以有效监控和管理GPU的性能,确保其在最佳状态下运行。

3 安装sftp 修改开启端口

sudo apt-get update
sudo apt-get install openssh-server

sudo vi /etc/ssh/sshd_config
# 修改端口
Port 9222
sudo systemctl restart ssh

安全组放开9222

同时IP开白,限定只有 prod ,qa环境的出网ip, 深圳 ,岳阳办公环境才能访问 .

file

因为最近安全问题频发,所以这块必须要保证,任何开放到公网的端口都有被攻击的风险。

4 挂载NAS盘 到/sftp

sudo apt-get update && sudo apt-get install nfs-common

sudo chmod  777  -R  /etc/modprobe.d

sudo echo "options sunrpc tcp_slot_table_entries=128" >>  /etc/modprobe.d/sunrpc.conf 
sudo echo "options sunrpc tcp_max_slot_table_entries=128" >>  /etc/modprobe.d/sunrpc.conf

sudo mkdir /sftp

sudo mount -t nfs -o vers=4,minorversion=0,rsize=1048576,wsize=1048576,hard,timeo=600,retrans=2,noresvport 13e6xxxx7-ojm48.us-east-1.nas.aliyuncs.com:/ /sftp


df -h | grep aliyun

进去可以看到NAS远程存储已经挂到了对应的 /sftp目录

防止录音文件太多导致爆盘。所以使用了远程存储。 还有一个原因就是远程存储价格便宜,低频的可以自动沉降。

5 安装whipser并测试

sudo apt update && sudo apt install ffmpeg

pip install setuptools-rust

pip install -U openai-whisper

whisper --help

file

测试转文指令:

whisper  /sftp/deskqa/mp3/test2.mp3  --model small --output_format json --output_dir /sftp/deskqa/mp3j --word_timestamps True

file

测试声道分离指令:

ffmpeg -i  /sftp/deskqa/mp3/a.wav -map_channel 0.0.0 -threads 4 /sftp/deskqa/mp3/a_l.wav -map_channel 0.0.1 -threads 4 /sftp/deskqa/mp3/a_r.wav

file

java程序所需的基本底层能力测试通过。

6 安装wis-biz程序

安装java运行环境。

在Ubuntu上安装Java 8可以通过以下步骤完成。以下是详细的安装指令:

1. 更新包列表

首先,更新你的包列表以确保你获取到最新的软件包信息:

sudo apt-get update

2. 安装Java 8

使用以下命令安装Java 8:

sudo apt-get install openjdk-8-jdk

3. 验证安装

安装完成后,可以通过以下命令验证是否成功安装了Java 8:

java -version

你应该看到类似以下的输出,表示Java 8已成功安装:

openjdk version "1.8.0_292"
OpenJDK Runtime Environment (build 1.8.0_292-b10)
OpenJDK 64-Bit Server VM (build 25.292-b10, mixed mode)

4. 设置默认Java版本(可选)

如果你有多个Java版本安装在你的系统上,并且希望将Java 8设置为默认版本,可以使用 update-alternatives 命令:

sudo update-alternatives --config java

你会看到一个列表,显示所有已安装的Java版本。输入对应Java 8的选择编号,然后按Enter键。

5. 设置JAVA_HOME环境变量(可选)

为方便起见,你可能还希望设置 JAVA_HOME 环境变量。编辑你的 .bashrc 文件:

nano ~/.bashrc

在文件末尾添加以下行:

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export PATH=$JAVA_HOME/bin:$PATH

保存并退出(在Nano中,按 Ctrl+O 保存,按 Ctrl+X 退出),然后使更改生效:

source ~/.bashrc

6. 验证环境变量设置(可选)

你可以通过以下命令验证 JAVA_HOME 环境变量是否设置正确:

echo $JAVA_HOME

输出应为 /usr/lib/jvm/java-8-openjdk-amd64

通过这些步骤,你就可以在Ubuntu系统上成功安装并配置Java 8。

上传jar包。

添加配置文件。放在 gitops下。 wis/qa wis/prod 分别放对应的配置文件,存档,方便后面做程序更新;

目录设计:

sudo mkdir -p /sftp/deskprod/mp3 /sftp/deskprod/mp3j /sftp/deskprod/mp32 /sftp/deskprod/config /sftp/deskprod/logs

sudo touch  /sftp/deskprod/logs/wis.log

启动脚本:

/sftp/deskprod/start.sh
#!/bin/bash
sudo touch ./logs/wis.log | true
sudo mkdir -p ./logs | true

(
    until java -Xms4096m -Xmx8096m -Djava.security.egd=file:/dev/./urandom -Dlogging.config=./config/logback-spring.xml -jar wis.jar; do
                    echo "MyApp prod  wis.jar crashed with exit code $?.  Respawning... " >&2
                            sleep 5
                                done
                        ) &

7 本地测试/qa测试/产线测试

打电话,看看是不是转文成功。

下面是日志信息。

file

标识是已经按照逻辑处理了。

找测试同学分别在qa, prod ,hk环境都测试了,可以正常的转文。 所以这块没问题了。

更新采用修改配置的方式,重新出镜像包部署。

8 监控观察

4C的cpu基本跑满了,没有浪费,内存有空闲,也接近满载,利用率很高。

file

gpu使用率没有满的情况,因为限制了并发数,升级了whisper的版本,使用的小模型。高峰期有录音积压,平峰期可以消化掉。

file

小结

一步一步的安装完环境,并做了测试和监控。有记录,方便重新安装的时候查阅和交割。

告警可以加上,比如GPU的利用率如果超过95%,时间超过5分钟,则告警。

CPU ,内存等也可以告警出来。

处理可以加快一些。 最好可以根据GPU的负载来,或者增加并发度,买更高级的GPU ,内存更大,处理能力更强。。

原创不易,关注诚可贵,转发价更高!转载请注明出处,让我们互通有无,共同进步,欢迎沟通交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2172407.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MapBox Android版开发 6 关于Logo

MapBox Android版开发 6 关于Logo Logo的显示查看源码及思路(Logo)第一步第二步 隐藏Logo示例查看源码及思路(Info)第一步第二步 隐藏Logo和Info示例 看到有网友留言问如何移除Logo,今天看了下V9源码,发现M…

ThreeJs绘制圆柱体

上一章节实现了圆锥体的绘制,这节来绘制圆柱体,圆柱体就是矩形旋转获得,如上文一样,先要创建出基础的组件,包括场景,相机,灯光,渲染器。代码如下: initScene() {this.sce…

【LeetCode】每日一题 2024_9_27 每种字符至少取 K 个(双指针)

前言 每天和你一起刷 LeetCode 每日一题~ LeetCode 启动! 题目:每种字符至少取 K 个 代码与解题思路 func takeCharacters(s string, k int) int {// 核心思路:// 题目要求字符串 s 中,每种字符都取至少 k 个// 而且可以从头取…

使用 LlamaIndex 进行 CRAG 开发用来强化检索增强生成

提升AI模型的准确性与可靠性 ©作者|Ninja Geek 来源|神州问学 介绍 检索增强生成(RAG)彻底改变了使用大语言模型和利用外部知识库的方式。它允许模型从文档存储的相关索引数据中获取信息用以增强其生成的内容,使其更加准确和信息丰富…

en造数据结构与算法C# 之 二叉排序树的删除

en造数据结构与算法C# 之 二叉排序树的增/查-CSDN博客 删除方法比起添加和查找就稍显复杂了 &#xff0c;所以单独拿出来写一篇 分析 输入 1.根节点&#xff0c;用于从根上查找你要删除的节点 2.需要删除的值 public Node<T> Delete(Node<T> root, T data) {if (…

数据结构及基本算法

目录 第一章 概论 第一节 引言 第二节 基本概念和常用术语 第三节 算法的描述与分析 第二章 线性表 第一节 线性表定义和基本运算个 一、线性表的逻辑定义 二、线性表的基本运算 第二节 线性表的顺序存储和基本运算的实现 一、线性表的顺序存储 二、顺序表上基本运算…

自动驾驶电车难题的康德式道德决策

摘 要 自动驾驶电车难题是检验人工智能伦理可行性的一块试金石 , 面对不同情境 , 其计算程序既要作出可决定的、 内在一致的判断决策 , 又要与人类的普遍道德常识相兼容 。 康德义务论给出了具有普遍性与一致性的理论框架。 自动驾驶电车的道德决策可视为由计算程序执行的第…

Linux学习之路 -- 线程 -- 条件变量与生产消费模型

前面我们已经提过线程互斥的相关概念&#xff0c;但是我们在前文的抢票逻辑中&#xff0c;我们其实很容易发现一个问题。那就是票可能被一直被一个人抢&#xff0c;这里我们就需要引入条件变量的概念。 目录 1、条件变量 <1>线程同步 <2>相关概念 <3>相…

pycharm2024版 搭配Anaconda创建pytorch项目

pycharm2024版 搭配Anaconda创建pytorch项目 ​ 刚接触anaconda和pytorch&#xff0c;b站看的教学视频中博主使用的是2019版的pycharm&#xff0c;所以在创建pytorch项目时有些懵&#xff0c;在多次摸索后大概明白了一些 上图中是2024版pycharm的新项目创建界面 Project venv…

计算机毕业设计 基于Python的广东旅游数据分析系统的设计与实现 Python+Django+Vue Python爬虫 附源码 讲解 文档

&#x1f34a;作者&#xff1a;计算机编程-吉哥 &#x1f34a;简介&#xff1a;专业从事JavaWeb程序开发&#xff0c;微信小程序开发&#xff0c;定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事&#xff0c;生活就是快乐的。 &#x1f34a;心愿&#xff1a;点…

部分监督多器官医学图像分割中的标记与未标记分布对齐|文献速递--基于多模态-半监督深度学习的病理学诊断与病灶分割

Title 题目 Labeled-to-unlabeled distribution alignment for partially-supervised multi-organ medical image segmentation 部分监督多器官医学图像分割中的标记与未标记分布对齐 01 文献速递介绍 多器官医学图像分割&#xff08;Mo-MedISeg&#xff09;是医学图像分析…

vscode开发uniapp安装插件指南

安装vuets的相关插件 首先是vue的相关插件&#xff0c;目前2024年9月应该是vue-offical 安装uniapp开发插件 uni-create-view &#xff1a;快速创建 uni-app 页面 安装uni-create-view之后修改插件拓展设置 勾选第一个选择创建视图时创建同名文件夹 选择第二个创建文件夹中生…

node.js npm 安装和安装create-next-app -windowsserver12

1、官网下载windows版本NODE.JS https://nodejs.org/dist/v20.17.0/node-v20.17.0-x64.msi 2、安装后增加两个文件夹目录node_global、node_cache npm config set prefix "C:\Program Files\nodejs\node_global" npm config set prefix "C:\Program Files\nod…

zabbix 软件监控

一、zabbix基本概念与组件和原理 1.1 zabbix概述 Zabbix 是一款可监控网络的众多参数以及服务器、虚拟机、应用程序、服务、数据库、网站、云等的健康状况和完整性。Zabbix 使用灵活的通知机制&#xff0c;允许用户为几乎任何事件配置基于电子邮件的警报。这允许对服务器问题做…

酒店智能门锁SDK接口通用转换函数对接酒店收银-SAAS本地化-未来之窗行业应用跨平台架构

一、通用转换代码 public class CyberWin_LocakAPP{// public static byte[] bufCard new byte[128 1];public static string 未来之窗_美萍_getsign(byte[] bufCard){int i;string 酒店标识, s, s2;// 先读卡string 未来之窗 Encoding.ASCII.GetString(bufCard);// edt_Ca…

回归预测|基于蜣螂优化长短期记忆网络的数据回归预测Matlab程序DBO-LSTM 多特征输入单输出 含基础LSTM

基于蜣螂优化长短期记忆网络的数据回归预测Matlab程序DBO-LSTM 多特征输入单输出 含基础LSTM 文章目录 一、基本原理DBO-LSTM 多特征输入单输出回归预测的原理和流程2.1 蜣螂优化&#xff08;DBO&#xff09;2.2 长短期记忆网络&#xff08;LSTM&#xff09;3.1 数据准备3.2 模…

ubuntu 开启root

sudo passwd root#输入以下命令来给root账户设置密码 sudo passwd -u root#启用root账户 su - root#要登录root账户 root 开启远程访问&#xff1a; 小心不要改到这里了&#xff1a;sudo nano /etc/ssh/ssh_config 而是&#xff1a;/etc/ssh/sshd_config sudo nano /etc/ssh…

C++:采用模板封装顺序表,栈,队列

1.顺序表&#xff1a; list.hpp #ifndef LIST_HPP #define LIST_HPP #include <iostream>using namespace std;template <class L>class Seqlist { private:L *ptr;L size;L len0;public:void init(L n){//堆区申请空间&#xff08;大小为n&#xff09;this->…

饿了么 ui表单 有滚动条的时候 右上角多一节

// 当没有滚动条的时候 :deep(.el-table__body-wrapper.is-scrolling-none~.el-table__fixed-right) {right: 0px !important;}// 当有滚动条的时候 默认偏移距离:deep(.el-table--scrollable-y .el-table__fixed-right) {right: 13px !important;}修改完 不显示滚动条

localhost 自动被 redirect 到 https 地址的问题

不知道为什么, 前端项目启动以后自动将 http://localhost 重定向到了 https://localhost, 我并没有添加任何 hsts 的中间件, 所以并不是这个原因, 而且代码之前是好使的, 但是由于我安装了某个证书后, 导致出现了这个问题。 在edge浏览器中输入edge://net-internals/#hsts 或是…