论文阅读U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation

论文阅读U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation

news2026/3/3 3:14:33

作为一种非常有潜力的代替MLP的模型，KAN最终获得了学术界极大的关注。在我昨天的博客里，解读了最近的热门模型KAN：

论文阅读KAN: Kolmogorov–Arnold Networks-CSDN博客

KAN的原文作者提到了很多不足。本文算是对其中两个现有不足的回应，也就是:1)KAN不仅只能用于特定结构和深度，2）KAN不仅能用于小规模AI+Science任务，还可以用于更大规模或更复杂的任务。

本文将KAN融入了U-Net网络结构中，并运用在医学图像分割任务上。

1，U-KAN架构

整体结构如图，是个U-Net经典的对称编解码器结构。编解码器都有卷积部分和token化KAN模块部分组成。卷积部分如U-Net一样，不赘述。

Token化的KAN模块：

1）token化：首先对特征进行重塑，得到一系列扁平化的二维patch。接着进行线性投影，线性投影是通过一个核大小为3的卷积层实现的。卷积层足以编码位置信息，并且其性能实际上优于标准的位置编码技术。

2）KAN块：在获取到token之后，我们将它们传入一系列的KAN层（N=3）。在每个KAN层之后，特征会通过一个高效的深度卷积层（DwConv）、一个批量归一化层（BN）和一个ReLU激活函数。此外，还是用了残差连接。

2，消融实验

1）KAN层层数影响

2）KAN层换成MLP的话，结果会下降（在我看来本文最重要的结论也就是这个）

3）模型规模的影响

3，与SOTA对比

4，本文的缺陷与不足

本文在我看来有两个主要不足：

1）训练难度：KAN至关重要的训练难度问题没有提及。将KAN结构嵌入U-Net是否会导致训练变得不稳定或难以收敛呢？训练速度会慢多少呢？

2）实验对比不充分，结果可能不SOTA：

本文的对比实验，完全没有对比基于Transformer的图像分割模型，对比的几个模型要么是纯卷积模型，要么是卷积+MLP模型。那么我们是否可以认为U-KAN的结果逊于主流的Transformer分割模型？

5总结

在我看来，虽然本文模型大概率并不SOTA，但是也不是非要SOTA的模型和实验才有价值。

本文的价值在于验证了KAN可以用于更广泛的数据集，并且在更多场景下展现了超越和取代MLP的潜力。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1812539.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于蚁群算法的二维路径规划算法(matlab)

基于蚁群算法的二维路径规划算法(matlab)

微♥关注“电击小子程高兴的MATLAB小屋”获得资料一、理论基础 1、路径规划算法路径规划算法是指在有障碍物的工作环境中寻找一条从起点到终点、无碰撞地绕过所有障碍物的运动路径。路径规划算法较多，大体上可分为全局路径规划算法和局部路径规划算法两大类。其…

阅读更多...

java之IO流和集合框架的笔记

java之IO流和集合框架的笔记

1 File类的使用 1.1 概述 File类及本章下的各种流，都定义在java.io包下。一个File对象代表硬盘或网络中可能存在的一个文件或者文件目录（俗称文件夹），与平台无关。（体会万事万物皆对象） File 能新建、删…

阅读更多...

网工使用频率最高的6款软件，都有的绝对是资深打工人

网工使用频率最高的6款软件，都有的绝对是资深打工人

号主：老杨丨11年资深网络工程师，更多网工提升干货，请关注公众号：网络工程师俱乐部晚上好，我的网工朋友。有不少朋友问到，深耕网络工程师需要哪些软件？ 其实网工行业需要的软件还挺多的&…

阅读更多...

JavaSE 实战五子棋中国象棋（单机简易版）

JavaSE 实战五子棋中国象棋（单机简易版）

介绍 JavaSE实践五子棋和中国象棋游戏，棋盘，棋子绘制，输赢判定重置棋盘，单机博弈。五子棋棋盘中国象棋棋盘使用说明启动类 Main.java， 面板类 Panel.java绘制棋盘和玩法，实体类 ChessPiecesNode.jav…

阅读更多...

新增多种图表类型，新增视频、流媒体、跑马灯组件，DataEase开源数据可视化分析工具v2.7.0发布

新增多种图表类型，新增视频、流媒体、跑马灯组件，DataEase开源数据可视化分析工具v2.7.0发布

2024年6月11日，人人可用的开源数据可视化分析工具DataEase正式发布v2.7.0版本。这一版本的功能变动包括：图表方面，新增对称条形图、桑基图、流向地图、进度条等图表类型，并对已有的仪表盘、指标卡、明细表、汇总表、水波图、象限…

阅读更多...

芯片验证分享6 —— 激励开发4

芯片验证分享6 —— 激励开发4

大家好，我是谷公子，上节课跟大家分享了黑盒设计的几种常用方法。今天我们来讲激励的白盒设计和灰盒设计。白盒设计允许我们检查芯片的内部结构。这种验证策略对芯片的逻辑结构进行检查，从中获取验证数据，遗憾的是，这…

阅读更多...

IINA for Mac v1.3.5 安装教程（保姆级）

IINA for Mac v1.3.5 安装教程（保姆级）

Mac分享吧文章目录效果一、准备工作二、开始安装1、双击运行软件，将其从左侧拖入右侧文件夹中，等待安装完毕2、应用程序显示软件图标，表示安装成功三、运行测试1、打开软件，测试2、查看版本号 **安装完成！&#xf…

阅读更多...

js之简单轮播图

js之简单轮播图

今天给大家封装一个简单的轮播图,可以点击下一张上一张以及自动轮播 <!DOCTYPE html> <html><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>走马…

阅读更多...

【雷丰阳-谷粒商城】【分布式基础篇-全栈开发篇】【08】【商品服务】Object划分_批量删除

【雷丰阳-谷粒商城】【分布式基础篇-全栈开发篇】【08】【商品服务】Object划分_批量删除

持续学习&持续更新中… 守破离【雷丰阳-谷粒商城】【分布式基础篇-全栈开发篇】【08】【商品服务】Object划分_批量删除 Object划分批量删除/添加参考 Object划分数据库中对于一张表的数据，由于拥有隐私字段、多余字段、字段过少等原因，不应该直…

阅读更多...

IP服务器代理如何设置使用？

IP服务器代理如何设置使用？

IP服务器代理（通常称为代理IP或代理服务器）的设置和使用方法可以根据不同的需求和场景而有所不同。以下是一个清晰的步骤指南，帮助你设置和使用IP服务器代理： 1. 选择合适的代理IP类型根据使用目的的不同，可以选择不…

阅读更多...

Echarts 绘制地图（中国、省市、区县），保姆级教程！

Echarts 绘制地图（中国、省市、区县），保姆级教程！

前言：大家好呀，这篇讲述 VueEcharts 绘制地图（中国、省市、区县），保姆级教程！话不多说，上干货： 先安利两个网址，是制作地图的资源： DataV.地图GeoJSON数据 Ap…

阅读更多...

微软将于 2024 下半年开始淘汰 VBScript

微软将于 2024 下半年开始淘汰 VBScript

微软将于 2024 下半年开始淘汰 VBScript 微软宣布将从 2024 年下半年开始弃用 VBScript，使其成为一项按需功能 (Features on Demand，FOD)，直至完全删除。按需功能是 Windows 操作系统中的可选功能，如 .NET Framework&#xff…

阅读更多...

算法金 | D3blocks，一个超酷的 Python 库

算法金 | D3blocks，一个超酷的 Python 库

大侠幸会，在下全网同名[算法金] 0 基础转 AI 上岸，多个算法赛 Top [日更万日，让更多人享受智能乐趣] 1 选武入道 - 概况速览库简介：D3Blocks是一个基于d3 javascript (d3js)的图形库，通过只需少量的Python代码就能…

阅读更多...

安全相关的一些基础知识（持续更新）

安全相关的一些基础知识（持续更新）

目录 1. TRNG真随机数生成 2. 对称加密和非对称加密及其区别 3. Hash算法（摘要算法） 4. HTTPS、TLS、SSL、HTTP区别和关系 HTTPS的基本原理 5. PSS 1. TRNG真随机数生成 True Random Number Generator 在真随机数的生成里，把随机数的生…

阅读更多...

MySQL学习（2）：数据库相关概念及windows环境下安装

MySQL学习（2）：数据库相关概念及windows环境下安装

1.数据库、数据库管理系统、SQL 主流的关系型数据库有4种：oracle、mysql、SQLserver、PostgreSQL，它们都是SQL语言控制的 2.windows系统安装mysql 2.1下载安装包 mysql分为社区版（免费）和商业版（30天试用&#xff09…

阅读更多...

面试题：ArrayList和LinkedList的区别

面试题：ArrayList和LinkedList的区别

ArrayList和LinkedList都是Java中实现List接口的集合类，用于存储和操作对象列表，但它们在内部数据结构、性能特性和适用场景上有所不同： 1.内部数据结构： ArrayList：基于动态数组实现。这意味着它在内存中是连续存储…

阅读更多...

NodeJS体育用品销售管理系统-计算机毕业设计源码88807

NodeJS体育用品销售管理系统-计算机毕业设计源码88807

摘要 21世纪的今天，随着社会的不断发展与进步，人们对于信息科学化的认识，已由低层次向高层次发展，由原来的感性认识向理性认识提高，管理工作的重要性已逐渐被人们所认识，科学化的管理，使信息存…

阅读更多...

BDD100k

BDD100k

摘要数据集推动视觉进步，但现有的驾驶数据集在视觉内容和支持任务方面都很贫乏，以研究自动驾驶的多任务学习。研究人员通常被限制在一个数据集上研究一小部分问题，而现实世界的计算机视觉应用需要执行各种复杂的任务。我们构建了一个包含10…

阅读更多...

一张试卷

一张试卷

目录问题 1: 1.时间题目描述1 输入1 输出1 样例输入1 样例输出1 提示1 代码1 问题 2: 超酷的电话号码题目描述2 输入2 输出2 样例输入2 样例输出2 提示2 代码2 问题 3:3.爸爸的数学题题目描述3 输入3 输出3 样例输入3 样例输出3 提示3 代码3 问题 4: 4. 营养膳食题目描述4…

阅读更多...

c# 学习 3

c# 学习 3

显示转换异常捕获语法

阅读更多...

推荐文章

最新文章