手机上无处不在的AI,原来还藏有这么多秘密

news2024/11/18 13:26:22

目录

一、AI在拍照中的应用

二、AI在日常生活中的应用

三、手机上AI的来自哪?


尽管2023年才过完了一半,但来自AI领域的科技震撼却没有要结束的意思。回顾过往,AI从没像今天这般那样受人瞩目,似乎一夜之间,它就成了新的科技方向。

当然,眼下大家所谈及的AI,更多是以Chat GPT为代表的,一种基于人工智能技术驱动的自然语言处理工具。它能对话,能画图,能胜任各种工作;它懂逻辑,擅推理,甚至可以解读人的情绪和态度,如此种种,一步步填补了我们对真实AI的向往。 

一、AI在拍照中的应用

其实聊到AI,大部分用户都不会陌生。我们每天手机不离手,而大家最开始接触AI应用,很多都是来自智能手机,其中最具代表的当属手机影像了。

在手机拍照过程,AI的作用称得上立竿见影。以小米13为例,当我们进入到相机界面,在下拉菜单项中,会有一个“AI相机”字样的选项。 

开启AI功能后,我们会发现照片的色彩更明艳,饱和度更高,亮度也有所变化。有了这个功能,当你按下快门的那一刻,手机就会根据此时此刻的拍摄场景自动计算出最优方案,从而直接“P”出一张成片,省去了后期的步骤。

如果只是做到这一点,显然是不够的。随着智能手机AI能力的变化,在手机影像上,有AI参与的场景可以说是越来越深入,越来越频繁。

其中,夜景就是一个十分典型的场景。众所周知,CMOS的面积越大,进光量就越多,夜景照片成像质量自然就越好。但受限于机身的尺寸,手机内部很难塞下更大尺寸的传感器和光学镜头,光线越复杂,图像就容易产生噪点,看上去很模糊,手机拍夜景就会显得愈发力不从心。

但事实上,我们发现手机拍摄夜景其实是很能打的,甚至不输一些专业设备。为什么会这样呢?答案一目了然,自然还是与AI有关。

有了AI参与之后,手机拍摄的夜景照片就不再是单次曝光所得,而是连续拍摄多张不同参数下的照片,然后进行堆栈,进而合并成一张样张。这个过程还是比较复杂的,但利用AI可以快速找出样张中的特征点进行校准,再将多帧画面进行合成,有效去除噪点以及提升画面细节。

除了AI模式、夜景模式等基本应用外,随着AI能力的提升,也衍生出了万物追焦、疾速抓拍、魔法换天、背景虚化等进阶应用,大大丰富了手机相机的玩法,提升了拍摄体验。

万物追焦

就比如万物追焦,稳定精准智能可持续地追焦能力特别适合拍摄运动中的物体,如果家中有活泼好动的小孩子或者宠物,这个功能简直不要太好用。

魔法换天

还有魔法换天,你可以给相册中的照片编辑各式各样的天空效果,拍不出星轨没关系,可以后期一键生成,拍不到圆月也没关系,一键生成一个就完事了,甚至还能一键加入闪电、落日、极光、银河……不仅玩法新颖,看上去也是毫无违和感。

二、AI在日常生活中的应用

那么除了在拍照时,在日常使用时,又有哪些场景会用到AI呢?

其实还真不少,就比如在小米手机中,有一个很有意思的AI应用,可以说是我自己的最爱之一,它就是AI通话。

当有电话打进来时,我们无法接听,但又不想错过,或者总被营销电话骚扰不胜其烦,遇到这种情况,“小爱通话”就可以帮助我们很好完成“接听”工作。

对于MIUI用户来说,大家对小爱同学并不陌生,但应该很少有人知道它还有这种用途。简单来说,这就是一个基于AI技术的自动通话功能,接听后,小爱会识别对方所说的内容,用AI语音进行回复,在通话结束后,还会把对话过程通过文本形式记录下来,方便我们后期查看。

当大家追剧时,如果看到自己很喜欢的英剧美剧,却发现没有翻译字幕,肯定就要遗憾错过了。

同样在小米手机中,用户可以开启“小爱翻译”,找到“实时字幕”功能,这样在观看视频就会实时生成双语字幕。


实时翻译

从实际体验来看,它的翻译速度和准确性都很高,基本不影响理解。而且不仅仅追剧,在线直播、视频会议等场景都有不错的表现,可以说是AI在实际用机过程中颇具代表性的一个应用场景。

其实AI在手机中的使用场景还有很多,比如AI辅助信号增强,通过AI侦测用户手部使用习惯,可以更准确地侦测使用场景,从而实现更低的通话掉线率、更快的数据传输速率、更广的网络覆盖和更长电池续航;还有智能语音助手、照片分类整理、AI视频剪辑、面部解锁等等,满足了用户用机过程中的各种需求。

三、手机上AI的来自哪?

不过,AI这么强大实用,但它也不是凭空而来的。我们前面谈到的一系列AI用例都来自小米13,那么小米13的AI能力又来自哪里呢?

这就要说到它所搭载的第二代骁龙8移动平台了,第二代骁龙8移动平台搭载了一颗专门面向AI计算的Hexagon处理器,和以往不同,这次高通不但为Hexagon处理器设计了独立的供电系统,它的架构也有所变化,使其能够更好支持Transformer网络在终端侧的推理能力。

大家还记得小米13上的实时字幕功能吗,它之所以能够在本地呈现出快速准确的翻译效果。也正是凭借Hexagon处理器硬件性能的提升,使得第二代骁龙8移动平台成为了业内最先达到INT4精度的移动平台,与INT8精度相比,INT4带来的是90%的AI推理性能提升以及60%的能效提升,这使得第二代骁龙8,在自然语言处理用例下,能够实现4.35倍的AI性能提升。

除了Hexagon处理器外,在第二代骁龙8移动平台中,传感器中枢能力同样得到加强,实现AI性能的翻倍。一般来说,传感器中枢主要承担一些低功耗轻负载的任务,如大家熟悉的语音助手、视觉唤醒和图片分类之类的。

而在第二代骁龙8中,厂商能够围绕传感器中枢打造更为丰富的应用场景,比如息屏状态下也能快速扫二维码,或者实时监测是不是有陌生人正在偷窥你的手机屏幕,并及时关闭消息通知等等。

在影像方面,第二代骁龙8移动平台在Hexagon处理器和ISP之间,增加了一个名为“Hexagon直连”的物理连接,打造了移动行业首创的“认知ISP”,并带来了“实时语义分割”技术。

“语义分割”可以对画面中不同区域、不同元素进行单独的渲染处理,比如区分拍摄主体和不同的背景,或者在人像拍摄中,对被拍摄者的皮肤和五官进行单独修饰,它的处理过程是实时的,而且速度非常快,用户按下快门后,就能立马得到想要的照片,不用等待。

最后:

AI作为近年来最火热的一个领域,吸引了包括高通在内的许许多多科技公司的关注。如今,高通在AI领域已经走在了行业的最前沿,以骁龙移动平台为代表的一系列产品正不断刷新着移动端AI算力的新纪录,并且除了智能手机外,高通在XR、汽车、PC、物联网等领域同样有着广泛的布局,可以预见,终端侧AI即将迎来新一轮的巨大变革,直至彻底改变用户的使用体验。

值得一提的是,高通在6月16日正式发布了《混合AI是AI的未来》白皮书,明确表示在云端和终端进行分布式处理的混合AI才是AI的未来。另外,高通也谈到随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增长,前景可以说是十分光明。

总的来说,无论从实际体验上,还是白皮书中所阐述的,高通在终端侧AI方面确实有很大优势,而且要知道,全世界搭载骁龙和高通平台的已上市用户终端有几十亿台,每年还有数亿终端产品涌入。也正是得益于高通AI技术的支持,今天的手机、汽车、XR等等智能设备已经表现得非比寻常,假以时日,随着终端AI能力不断提升,打造一个触手可及的AI世界,似乎也没那么遥远。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/726922.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

速览6月更新|EasyV产研团队带来产品功能优化

EasyV产研团队在6月份为您带来了一系列令人期待的产品功能优化,让数字化管理更加轻松高效!话不多说,快来看看都有哪些新变化吧~ 速览6月更新内容: 01 平台升级|工作台功能优化 02 模板上新|能…

LeetCode打卡 day58--单调栈

一个人的朝圣 — LeetCode打卡第58天 知识总结 Leetcode 739. 每日温度题目说明代码说明 Leetcode 496. 下一个更大元素 I题目说明代码说明 知识总结 单调栈的应用, 就是需要构建一个单调递增或者单调递减的栈, 去解决下一个大(小)的元素的问题 Leetcode 739. 每日温度 题目链…

网络安全面试题(含答案)

防范常见的 Web 攻击 什么是SQL注入攻击 攻击者在HTTP请求中注入恶意的SQL代码,服务器使用参数构建数据库SQL命令时,恶意SQL被一起构造,并在数据库中执行。 用户登录,输入用户名 lianggzone,密码 ‘ or ‘1’’1 &a…

JavaScript 之【事件循环】机制的深入浅出解读

前言: JavaScript 作为一种单线程的开发语言,在执行的时候会有特定的风格,本章节以 JS 单线程的特点为引入,详细分析讲解了 JS 的事件循环机制 目录 什么是【进程】什么是【线程】浏览器拥有哪些进程和线程【渲染主线程】的工作模…

冒泡排序(思路+代码)

冒泡排序: 变量: flag 如果没有交换过就终止循环就是flase,终止外层循环 第二层循环:n个数比较n-1次 第一层循环: 第一趟,比较n-1次 第二趟,比较n-2次 ... ... 代码: import…

展望“智”造未来|深眸科技以AI+机器视觉,夯基产业新发展格局

近日,2023昆山元宇宙国际装备展在昆山国际会展中心落下帷幕。展会期间,各大展商携新技术、新产品、新概念纷纷亮相,为现场参展观众和嘉宾呈现如梦似幻的元宇宙盛会。 此次展会,深眸科技认识了诸多工业元宇宙领域的优质产品及企业…

Spring Boot3入门快速体验-Developing Your First Spring Boot Application

一、进入Getting Started https://spring.io/ 点击Spring Boot点击LEARN,再点击Reference Doc.: 再点击Getting Started Introducing Spring Boot, System Requirements, Servlet Containers, Installing Spring Boot, and Developing Your First Spring Boot App…

前端Vue组件之仿京东拼多多领取优惠券弹出框popup 可用于电商商品详情领券场景使用

随着技术的发展,开发的复杂度也越来越高,传统开发方式将一个系统做成了整块应用,经常出现的情况就是一个小小的改动或者一个小功能的增加可能会引起整体逻辑的修改,造成牵一发而动全身。通过组件化开发,可以有效实现单…

痞子衡嵌入式:从功耗测试角度了解i.MXRTxxx系列片内SRAM分区电源控制

大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家介绍的是从功耗测试角度了解i.MXRTxxx系列片内SRAM分区电源控制。 我们知道配合 MCU 一起工作的存储器包含 ROM(Flash) 和 RAM 两类,前者主要放 RO 代码和数据,后者放 RW …

文件系统考古4:如何支持多个文件系统

Steve Kleiman 在 1986 年撰写了《Vnodes: An Architecture for Multiple File System Types in Sun UNIX》一文。这篇论文幅较短,大部分内容是数据结构的列举,以及 C 语言结构之间相互指向的图表。 Steve Kleiman是分布式文件系统领域的专家&#xff0c…

selenium 浏览器托管

selenium 浏览器托管,是启动一个浏览器,调试代码,可以运行当前调试代码,不用从启动浏览器开始从头执行 在谷歌浏览器chrome.exe 目录中打开cmd 输入下面目录,启动器浏览器 chrome.exe --remote-debugging-port9222 -…

cesium 控件 风格 白色 亮色 模式 组件变白

在要白色风格的控件的任意父级的class加上cesium-lighter即可, 如图黄色圈出来的

redis实现伪集群

主从复制配置 主从复制时只需要配置从库即可,其默认为主库模式. 打开 redis 客户端登录,使用命令 info replication 查看. 主从复制可以搭建真集群,也可以搭建伪集群 真集群就是有多台主机,每台主机 安装一个 redis.伪集群就是在一台主机上复制多份配置,修改其端口,运行多个…

ja3指纹

问题: 请求失效,带上抓包软件却可以->检测ja3浏览器指纹 方法,python 安装curl_cffi库 pip install curl_cffi 查看浏览器指纹 https://tls.browserleaks.com/json python 原生request 缺少两个指纹 使用curl_cffi之后 可以看到结果…

【计算机网络】第三章 数据链路层(可靠传输)

文章目录 第三章 数据链路层3.4 可靠传输3.4.1 可靠传输的基本概念3.4.2 可靠传输的实现机制——停止-等待协议3.4.2 可靠传输的实现机制——回退N桢协议3.4.3 可靠传输的实现机制——选择重传协议3.4.4 可靠传输的意义 第三章 数据链路层 3.4 可靠传输 可靠传输是指在数据通…

Java中可以使用哪些系统架构?怎样选择?

架构,又名软件架构,是有关软件整体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计。 Java企业级的应用根据业务的复杂程度,通常使用的系统架构有应用架构、垂直应用架构、面向服务的架构(Service-Oriented Architectu…

在外远程访问NAS威联通(QNAP) - 免费内网穿透

文章目录 前言1. 威联通安装cpolar内网穿透2. 内网穿透2.1 创建隧道2.2 测试公网远程访问 3. 配置固定二级子域名3.1 保留二级子域名3.2 配置二级子域名 4. 使用固定二级子域名远程访问 转载自cpolar极点云文章:无需公网IP,在外远程访问NAS威联通QNAP【内…

1688按关键字搜索工厂数据,商品详情页数据的采集

item_search_factory-按关键字搜索工厂数据 公共参数 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)​注册​Key获取appsecret和appkey;​secretString是调用密钥api_nameString是API接口名称(包括在请求地址中…

认知网络原理

目录 一、网络发展史 1.1、独立模式 1.2、网络互连 1.3、局域网 二、网络通信 2.1、IP地址 2.2、端口号 三、认识协议 3.1、五元组 3.2、协议分层 3.3、分层的作用 3.4、OSI七层模型 3.5、TCP/IP五层(或四层)模型 3.6、网络设备所在分…