[S2] Challenge 25 心脏病预测

news2024/11/22 15:57:32

问题

您是一家医疗保健公司的数据科学家,试图创建患者是否患有心脏病的预测因子。目前,您正在试验 11 种不同的特征(潜在心脏病指标)和 XGBoost 分类模型,您注意到它的性能可能会根据其调整方式而发生很大变化。在此挑战中,您将实现超参数调整,以找到 XGBoost 的 Boosting Rounds 数、最大树深度和学习率超参数的最佳值。使用公制 F-Measure 作为调整的目标函数。

尝试 KNIME AI Assistant

我在这次挑战中尝试使用了2023年9月14日发布的KNIME Analytics Platform 5.1.1,并尝试了一下 5.1 中引入的新扩展,KNIME AI Assistant。

这个扩展分为两个主要功能,一个是QA,另一个是Build。QA部分类似于ChatGPT中的问答部分,你可以通过对话的方式询问问题。而Build部分允许你描述你想要完成的工作,然后该插件会为你构建相应的工作流。这个扩展似乎是在今年4、5月份提出的,只是一个非常初步的插件,所以不应对其期望过高。但是,通过这个插件,我们可以窥见未来。

alt

在准备好数据之后,我直接使用了Build功能。

以下是我对问题进行的简单描述:

use the current csv reader's data, help me to implement hyperparameter tuning to find the best values for XGBoost's Number of Boosting Rounds, Max Tree Depth, and learning rate hyperparameters. Use metric F-Measure as the objective function for tuning

在简要描述问题之后,它开始构建工作流。在添加了两个节点之后,它遇到了一些问题并停止工作。我注意到节点也不对。

alt

我再试一次,这次我调整了描述如下:

use the current csv reader's data

  1. partition the data
  2. use hyperparameter tuning node, focusing on "Number of Boosting Rounds, Max Tree Depth, and learning rate", then send the variables to XGBoost node, and get the score
  3. find the best hyperparameters

遗憾的是,仍然没有成功。但值得注意的是,它对SVM 节点增加了相对详细的注释。

alt

我只好自己动手了。突然我发现,其实我还没有安装需要的xgboost等扩展... 难道是因为没有安装扩展导致AI Assistant效果不佳?安装扩展之后,我发现可能是 KNIME 选择的 AI 模型有点弱鸡...

最终,我只能自己解决这个问题。这个问题相对简单,只要了解流变量和Parameter Optimization Loop 节点的使用,就没有什么好说的了。

alt

其他想法

  • 每次我重新启动KNIME都需要登录"KNIME AI Assistant",这有点烦人。
  • OpenAI已经提供了自定义数据的训练,我预计KNIME AI在不久的将来会变得更好。
  • 对于KNIME文档来说,使用一个不那么强大的LLMs模型并利用RAG来检索答案可能会有益处。
  • 如果有人想要使用更高级的模型,比如GPT4,允许用户输入自己的密钥并承担相关费用,可以增强该扩展的功能。
  • QA界面不太理想,聊天界面并不是最好的一种AI使用形式,需要进一步改进。

总之,未来充满了希望。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1022236.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Git学习笔记3

Git分支管理: 先来考虑一个问题: 开发者A开发软件的某一个功能模块, 还没有开发完成,但害怕进度丢失就提交。假设另一位开发者B并不知道A没有完成, 而直接使用了A开发的文件,这造成了问题。 解决方法: 开发者A创建一个属于自己的分支,这个分…

vite+react 使用 react-activation 实现缓存页面

对应的版本 "react": "^18.2.0", "react-activation": "^0.12.4", "react-dom": "^18.2.0", "react-router-dom": "^6.15.0",react-activation 这是一个npm包,在react keep alive…

Linux服务器查看CPU相关信息

文章目录 一、基本概念cpu个数cpu核数超线程技术 二、查看命令查看CPU型号查看物理CPU个数(物理层面)查看每个物理CPU中core个数(核数)查看逻辑CPU个数(逻辑层面) 三、以上概念的关系参考资料 一、基本概念 cpu个数 物理cpu个数…

图神经网络系列之序章

文章目录 一、为什么需要图神经网络?二、图的定义1.图的定义和种类2.一些关于图的重要概念2.1 子图2.2 连通图2.3 顶点的度、入度和出度2.4 边的权和网2.5 稠密图、稀疏图 3.图的存储结构3.1 邻接矩阵3.2 邻接表3.3 边集数组3.4 邻接多重表3.5 十字链表3.6 链式前向…

华为云HECS云服务器docker环境下安装mysql

华为云HECS云服务器,已经安装了docker环境,准备下docker环境下安装mysql。 一、HECS云服务器安装docker 登录华为HECS云服务器,安装docker环境。 安装docker参考如下文章: 华为云HECS安装docker并安装mysql-CSDN博客 二、拉取…

Linux下的Docker安装,以Ubuntu为例

Docker是一种流行的容器化平台,它能够简化应用程序的部署和管理。 Docker安装 1、检查卸载老版本Docker(为保证安装正确,尽量在安装前先进行一次卸载) apt-get remove docker docker-engine docker.io containerd runc 2、Dock…

【栈与队列面试题】用队列实现栈(动图演示)

两个队列实现一个栈 前言: 💥🎈个人主页:​​​​​​Dream_Chaser~ 🎈💥 ✨✨刷题专栏:http://t.csdn.cn/UlvTc ⛳⛳本篇内容:力扣上栈与队列的面试OJ题目 目录 两个队列实现一个栈 队列的实现&#xf…

Java毕业设计-基于SpingBoot的网上图书商城

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 文章目录 1. 简介2 技术栈3.1系统功能 4系统设计4.1数据库设计 5系统详细设计5.1系统功能模块5.1系统功能…

Python 图像处理库PIL ImageOps笔记

# 返回一个指定大小的裁剪过的图像。该图像被裁剪到指定的宽高比和尺寸。 # 变量size是要求的输出尺寸,以像素为单位,是一个(宽,高)元组 # bleed:允许用户去掉图像的边界(图像四个边界&#xff…

APP产品经理的职责(合集)

APP产品经理的职责1 职责: 1、根据部门发展规划、主动发掘业务需求,独立负责线上用户产品线的完整业务规划、产品设计、产品管理等工作; 2、负责协调BD、运营、研发、市场等各部门,共同推进新产品开发,确保产品能够保质按时上线…

C语言指针,深度长文全面讲解

指针对于C来说太重要。然而,想要全面理解指针,除了要对C语言有熟练的掌握外,还要有计算机硬件以及操作系统等方方面面的基本知识。所以本文尽可能的通过一篇文章完全讲解指针。 为什么需要指针? 指针解决了一些编程中基本的问题。…

linus调试器---gdb的操作介绍

目录 一.背景 二.gdb的常用的操作介绍 小技巧:gdb会记住上一次的命令,按回车即可打出上次的命令。 1.看代码 2.打断点 3.删断点 4.禁用与开启断点 5.查看断点信息 6.调试 7.调试 8.查看变量 9.运行至某行 10.打印变量值 11.从一断点直接运行…

《深入浅出OCR》第一章:OCR技术导论

✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程,具体章节如导图所示,将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开详细介绍。 👨‍&…

github 网页显示不全?

问题 解决 1、检查网页,打开 network,重新刷新 github 网页 2、查看无法加载的资源(如 css 文件) 3、查看域名地址 https://tool.chinaz.com/dns/,github.githubassets.com(检查网页元素,点击无…

奥威BI系统,BI界便宜大碗国货

奥威BI系统(软件)是BI行业高性价比典范,不仅是因为“BI方案”极大地降低项目周期、实施成本,也是因为奥威BI系统具备先进的技术和架构和卓越的性能,有简单易用的特点,也提供了丰富的功能。 1、先进的技术和…

linux系统报“INFO: task java:xxx blocked for more than 120 seconds.”解决办法

1、问题描述 linux系统,输入dmesg -T,报“INFO: task java:xxx blocked for more than 120 seconds.”,如下 一般情况下,linux会把可用内存的40%的空间作为文件系统的缓存。当缓存快满时,文件系统将缓存中的数据整体同…

基于SSM的民宿管理系统设计与实现

末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:采用JSP技术开发 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目&#x…

安达发|APS排单软件中甘特图的应用

近几年来,企业对生产效率和管理水平的要求越来越高。为了提高生产效率,降低生产成本,许多企业开始引入先进的生产计划与调度系统(APS),实现生产过程的自动化、智能化管理。APS排产软件是一种能够根据企业的…

【JDK 8-集合框架】5.1 Stream 实战

一、什么是 stream 二、操作步骤 三、概览stream接口源码 四、实战 执行结果: 一、什么是 stream Stream 中文称为“流” 通过将集合转换为“流”的元素队列 通过声明性方式,能够对集合中的每个元素进行一系列并行或串行的流水线操作 元素是特定类…

为何消费者宁愿买iPhone14,也不买国产5G手机?差距太大了

随着iPhone15的上市,国产5G手机与苹果的较量也正式展开,让人意外的是不仅是iPhone15备受追捧,连带着旧款的iPhone14Pro也取得了销量的上涨,与国产5G手机形成了鲜明的对比。 一、iPhone的优势 苹果的A系处理器在性能方面遥遥领先毋…