将Apple Vision Pro和visionOS与计算机视觉结合使用

news2024/12/29 9:10:41

在2023年6月5日的WWDC大会上,苹果宣布推出多年来最大规模的硬件和软件组合产品。今年的“One more thing”(“还有一件事”)发布是苹果视觉专业版(Apple Vision Pro),这是一款集成了苹果生态系统的新型空间计算头戴式设备。

苹果视觉专业版是一个垂直整合的硬件和软件平台,将以全新的硬件先进技术和革命性的软件功能,于2024年推向市场,带来之前可能被称为增强现实(AR)或混合现实(MR)的空间计算体验。这次发布将包括如何将这一新的计算平台和计算机视觉技术结合起来,为用户带来全新的应用场景和应用程序。让我们开始吧!

苹果视觉专业版是什么?

苹果视觉专业版利用眼球追踪、手势和语音作为输入方式,打造出完全沉浸式的体验。

这款计算机配备了一个拥有2300万像素的微OLED显示系统(参考一下,Vision Pro将64个像素放入了1个iPhone像素的空间中!),搭载了运行visionOS的M2芯片以及一款新的R1芯片,用于实时处理12个摄像头、5个传感器和6个麦克风的数据。R1芯片用于处理摄像头、传感器和麦克风的输入,并在12毫秒内将图像传输到显示屏上。

在这里插入图片描述
在这里插入图片描述

什么是visionOS?

visionOS是苹果视觉专业版计算机的新操作系统。这个全新的visionOS将使开发人员可以使用熟悉的苹果开发工具,如Xcode、SwiftUI、RealityKit和ARKit,以及对Unity和全新的3D内容准备应用程序Reality Composer Pro的支持,为这款新设备创建定制的应用程序。

在这里插入图片描述
人们可以在保持与周围环境连接的同时与应用程序进行交互。visionOS SDK将于本月末与Xcode、visionOS模拟器、Reality Composer Pro、文档、示例代码、设计指南等一起发布。目前,您可以了解有关如何为visionOS做准备以及开发针对空间计算设备应用程序的细节。

visionOS和ARKit将虚拟内容与现实世界相融合。

苹果视觉专业版、visionOS和计算机视觉从平台上来看,Vision Pro似乎已经具备了本地的计算机视觉功能,我们期待在开发人员开始为该平台构建应用程序时能了解更多关于这款头戴式设备的信息。以下是一些关于在苹果发布会上头戴式设备使用计算机视觉的方式的总结。

手势识别

手势识别是用户与Vision Pro进行交互的核心方式。用户可以用拇指和食指捏合来展开应用程序、移动应用程序和滚动浏览应用程序。Vision Pro似乎能够广泛识别手势,帮助用户在与应用程序进行舒适交互时,即使双手不在画面中。

在这里插入图片描述

手势识别在头戴式设备的空间性质中起着关键作用。不需要额外的设备(控制器等)来控制头戴式设备,用户可以使用双手和眼睛与应用程序进行交互。

人体检测

一个重要的信息是,这款头戴式设备具备确保用户与周围人群保持连接的功能。在发布会上,苹果表示:“[Apple Vision Pro]无缝地将数字内容与物理世界融合,同时让用户保持存在感并与他人保持连接”。视频亮点显示,当检测到用户附近有人时,人体将通过显示的内容进行聚焦。
在这里插入图片描述

设备检测

与其他苹果产品无缝交互是商业用户在不中断工作流程的情况下切换设备的重要卖点。演示展示了Vision Pro将如何识别您的MacBook,并将笔记本电脑中的内容传输到头戴式设备中。

正如您所看到的,苹果已经在界面中原生地构建了高价值的物体识别功能,因为计算机视觉是用户与周围世界互动的关键部分。

在这里插入图片描述

计算机视觉与苹果视觉专业版入门指南

预计visionOS SDK将于2023年6月发布,今天您可以做很多准备,以便构建利用计算机视觉的visionOS应用程序。如需了解WWDC23的机器学习和计算机视觉内容,请访问ML & Vision页面。

如果您想快速入门,请阅读有关Create ML和Core ML的内容,了解如何利用苹果机器学习功能为视觉、自然语言、语音和声音构建智能应用程序。一旦您有了概览,可以通过机器学习API和机器学习资源进行更详细的探索。然后深入研究视觉文档和可用的Core ML模型。

在了解了可行性的基础上,开始尝试一些应用程序,比如现金计数器,看看这些组件如何共同工作,为移动设备提供增强和混合现实体验。现金计数器利用Roboflow SDK、开源示例应用程序存储库和开源数据集,将自定义计算机视觉模型直接部署到iOS应用程序中。

当您准备好开始时,可以按照这个逐步视频教程,将自定义模型部署到移动应用程序中。

苹果视觉专业版在企业中的应用场景

视觉专业版为企业的计算机视觉应用场景开辟了全新的领域。硬件和软件的进步使得以前不可能实现的新应用成为可能,为各种应用场景提供了令人兴奋的新机会。

M2和R1提供了广泛应用于企业的强大能力和多模态功能。视觉专业版的超高分辨率显示系统能够提供真正的无需使用双手的体验,用于构建增强企业环境中工作人员的应用程序。让我们探索一下企业可以如何利用苹果视觉专业版。

制造业的质量保证和检验

利用计算机视觉的智能增强可以充当人工质量保证或产品检验工作的个人助手。视觉专业版可以为工人提供额外的支持,帮助他们识别制造过程中的质量问题或异常情况。借助计算机视觉的增强功能,可以减少错误或加快流程以提高生产效率。

例如,考虑这样一种情况:一个工人正在接受有关制造流程中标记的缺陷的培训。视觉专业版可以用于提供关于不同缺陷的沉浸式培训,为工人提供互动反馈,帮助他们了解错误以及如果出现缺陷时该如何处理。

现场服务中的组装、安装和维修

将计算机视觉与视觉专业版结合使用,可以为任何个别现场服务员工提供更详细的视觉指导,从而扩大其专业知识。

在派遣员工或承包商时,企业可以为他们提供明确的视觉指导,并允许服务专业人员提高他们所能服务的产品数量。每个员工不仅能够处理更多产品,由于视觉提示和警报的存在,质量也会提高,这些指导和警示会在员工工作时给予引导。

跨行业的培训、信息和辅助

视觉专业版的一个广泛好处是为员工在各种任务或情境下提供培训、信息和辅助。

借助计算机视觉的帮助,员工可以更快地掌握各种场景下的任务完成方式。员工可以在新任务中得到指导,在以前没有经验的独特环境中请求信息,并利用摄像系统在需要人工指导的情况下呼叫专家。计算机视觉将帮助新员工更快地适应他们的角色,并减少在入职期间的错误。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/622977.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mybatis多数据源的SQL兼容

背景 最近公司要求支持国产数据库达梦,但达梦与PostgreSQL的语法有一些差异,需要做一些兼容操作。 操作步骤 本文采用dynamic-datasource-spring-boot-starter框架处理多数据源,多数据源配置如下spring:datasource:dynamic:primary: dm #设…

华为OD机试真题B卷 Java 实现【进制转换】,附详细解题思路

一、题目描述 写出一个程序,接受一个十六进制的数,输出该数值的十进制表示。 二、输入描述 输入一个十六进制的数值字符串。 三、输出描述 输出该数值的十进制字符串。不同组的测试用例用\n隔开。 四、解题思路 读取输入的十六进制数值字符串&…

Selenium Python教程第2章

2. Selenium 编程入门 2.1 简单用例 如果你已经安装好了selenium,你可以把下面的python代码拷贝到你的编辑器中 from selenium import webdriver from selenium.webdriver.common.keys import Keysdriver webdriver.Firefox() driver.get("http://www.pytho…

AUTOSAR DoIP介绍

DoIP是什么 DoIP全称是Diagnostic Over IP,顾名思义就是基于IP的诊断,即下图所关联的ISO13400规范,也就是说如果大家想了解DoIP可以详细阅读ISO13400。 根据下图(来自于ISO14229-1),我们可以得到以下两点关系: UDS协议(规范是ISO14229)是统一诊断服务,作为应用层协议…

浏览器相关前端开发事项

文章目录 存储浏览器持久化存储(F12->应用->存储)浏览器缓存(F12->内存)浏览器存储管理单位(域名/IP为单位)区别localStorage VS 浏览器缓存localStorage VS cookies 存储 浏览器持久化存储&…

机器视觉陶瓷板表面划痕丝印检测方法

随着陶瓷制品在建筑、电子、医疗等领域的应用越来越广泛,对陶瓷制品的质量要求也越来越高。而陶瓷制品表面的划痕和丝印等缺陷会降低产品的美观度和质量,甚至会影响产品的安全性和使用寿命。传统的陶瓷板检测方式主要依赖人工目视检测,效率低…

FL Stuido21中文版水果编曲软件下载

FL stuido水果编曲软件做舞曲以及电子乐的利器,即便是在IPAD或者电脑端上操作,都非常的简便。界面逻辑非常友好,做rnb也是很可以的东西。可以作半成品的内容,声音采样方面还行,同样需要接口卡支持。钢琴卷帘操作还算便…

华为OD机试真题 Java 实现【字符串序列判定】【2022Q4 100分】,附详细解题思路

一、题目描述 输入两个字符串a和b&#xff0c;都只包含英文小写字母。a长度<100&#xff0c;b长度<500,000。 判定a是否是b的有效子串。 判定规则&#xff1a; a中的每个字符在b中都能找到&#xff08;可以不连续&#xff09;&#xff0c;且a在b中字符的前后顺序与a中…

FTL潜规则:调优,才是算法精华

前言 在存储领域中有一个FTL的概念&#xff0c;这是一种Flash的内存管理算法&#xff0c;属于各个厂商的核心机密&#xff0c;每个厂商的处理方式不同&#xff0c;有的处理简单&#xff0c;有的处理复杂。 FTL&#xff0c;即Flash Translations layer&#xff0c;也就是闪存转…

wayland浅析之EGL、Opengles、GBM

本文针对不同的compositor&#xff0c;浅析eglopenglesgbm搭配使用情况&#xff1b; 文章目录 1. 前言1.1 问题一&#xff1a;是不是调用eglSwapBuffers函数以后图像就直接显示到屏幕上了&#xff1f;1.2 问题二&#xff1a;EGL基本使用流程&#xff0c;EGL搭配GBM上屏显示基本…

JavaSE06_面向对象之封装

JavaSE-06 [面向对象OOP 封装] 第一章 面向对象思想 1.1 面向过程和面向对象 面向过程&#xff1a; 面向过程就是分析出解决问题所需要的步骤&#xff0c;然后用函数把这些步骤一步一步实现&#xff0c;使用的时候一个一个依次调用就可以了面向对象&#xff1a; 面向对象是…

Servlet、JSP

一、web服务器 1.1 常用服务器产品 Tomcat&#xff08;Apache开源&#xff0c;主流的web服务器之一&#xff0c;多用于javaweb项目开发&#xff09; jetty&#xff08;效率高于Tomcat&#xff09; WebLogic&#xff08;Oracl 收费&#xff09; WebSpera&#xff08;IBM&#xf…

cesium学习之旅1:cesium 基本介绍以及 cesium 的 hello world 程序

一&#xff1a;什么是Cesium Cesium 是一个跨平台、跨浏览器的展示三维地球和地图的 javascript 库。Cesium 使用WebGL 来进行硬件加速图形&#xff0c;使用时不需要任何插件支持&#xff0c;但是浏览器必须支持WebGL。Cesium是基于Apache2.0 许可的开源程序。它可以免费的用于…

代码随想录二刷 day16 | 二叉树之104.二叉树的最大深度 559.n叉树的最大深度 111.二叉树的最小深度 222.完全二叉树的节点个数

day16 104.二叉树的最大深度559.n叉树的最大深度111.二叉树的最小深度222.完全二叉树的节点个数 104.二叉树的最大深度 题目链接 解题思路&#xff1a;本题中根节点的高度就是最大深度 二叉树节点的深度&#xff1a; 指从根节点到该节点的最长简单路径边的条数或者节点数&…

TensorFlow项目练手——天气预测

项目介绍 通过以往的天气数据和实际天气温度&#xff0c;做一次回归预测&#xff0c;模型的输入是当前的所有特征值&#xff0c;而模型的输出是当天的实际天气温度 字段分析 目前已有的数据有348条svc数据&#xff0c;他们的字段分别代表 year&#xff1a;年month&#xff…

美客多卖家攻略:养号技巧分享

在跨境电商平台上成功运营并建立起具有竞争力的店铺并不容易。美客多作为一个颇具影响力的平台&#xff0c;更需要卖家们仔细研究和精心运营。在这里&#xff0c;我将分享一些秘诀&#xff0c;这些秘诀是在我自养号过程中总结出来的&#xff0c;有助于增加销量并提升店铺的排名…

高级数据分析师岗位的职责描述

高级数据分析师岗位的职责描述1 职责&#xff1a; 1.搭建和完善数据中心的数据指标体系与监控预测体系&#xff0c;并推动系统化实现; 2.负责对市场、行业、竞争对手、产品、客户、业务运营等方面数据的收集、分析&#xff0c;完成整理出分析报告、提供数据支持、分析建议; 3.对…

AI 写的高考作文,你打几分?

又是一年高考时&#xff0c;高考真的是人生的一件大事&#xff0c;毕业这么多年&#xff0c;每次看到高考相关信息&#xff0c;还是会不由自主的点进来&#xff0c;其中语文的作文是每年大伙津津乐道的话题。 树先生今天就收到了某条小秘书的【邀请函】&#xff0c;邀请参与「…

Elasticsearch:实用指南

我们将更多地讨论使用 Elasticsearch 的最佳实践。这些做法是一般性建议&#xff0c;可以应用于任何用例。 让我们开始吧。 Bulk Requests 批量 API 使得在单个 API 调用中执行许多索引/删除操作成为可能。 这可以大大增加索引速度。 每个子请求都是独立执行的&#xff0c;因此…

Elasticsearch8.6.0安装

Elasticsearch 8.5.0 安装 Elasticsearch 简介Elasticsearch 8.6.0 安装创建网络拉取镜像运行镜像设置密码修改kibana配置绑定ES代码绑定&#xff1a;手动绑定&#xff1a; 配置ik分词器扩展词词典停用词词典 Elasticsearch 简介 Elasticsearch&#xff08;ES&#xff09; 是一…