2024 Google 开发者大会,沉浸式体验AI社会公益

news2024/11/15 1:43:10

文章目录

    • 一、现场打卡
    • 二、AI 社会公益
    • 三、Gemma 模型
    • 四、Gemini 模型
    • 五、Google Cloud
    • 六、现场体验
    • 七、带着问题逛展
    • 八、学习资源和活动
    • 九、结束 Happy Hour

一、现场打卡

大家好,我是小雨。

2024 Google 开发者大会,沉浸式体验AI社会公益

今天我们参加 2024 Google 开发者大会,本次的举办地也是久违的回到了北京,地址是国家会议中心。

会场外面的 Google 标识非常明显,我刚出地铁站就发现了。

在志愿者的引导下,签到完成,拿到了伴手礼,今年的袋子,里面还有一个扇子,看来 Google 官方还是很贴心的。

然后是拍照打卡,我在这里碰到了和我一起来的几何心凉和敬之,稍后也越到了哈哥和三掌柜。

我们五个人这次代表 CSDN 作为“智播领航团”,在现场一起探索Google开发者大会,直击 Google 技术的最前沿。

二、AI 社会公益

著名的科幻作家和科学普及作家艾萨克·阿西莫夫(Isaac Asimov)说过:“科技使生活更加便利,但它也必须用于服务人类的目的。” (“Technology makes life more convenient, but it must also be used to serve the purposes of humanity.”)

在这里,我看了Google在公益事业上的行动。

视障的孩子无法在复杂的环境下分辨生活中的事物,在之前,老师需要自己制作一些事物的卡片,帮助视障儿童去认识这个世界,但是因为老师的手动制作无法支持孩子们的学习,Google 开发了视障友好的教育内容生产平台。

手语村(中国手语版)网站基于 Google Project Shuwa 开源项目开发,包含了教学视频和手语词典,在为听障人士、手语爱好者和专业人士提供一个学习和交流手语的互动空间。

智引线是利用 TensorFlow 深度学习模型和 ARCore 空间识别技术,为视障跑者打造的 App ,只需用一部 Android 手机、一副耳机和地面上的引导线,帮助视障跑者实现自由奔跑。 我在现场体验了一下,通过耳机左右声道的提示,我可以知道自己是否偏移了方向,以及是否马上碰到墙壁。对于视障跑者来说,智引线可以带来完全不同的体验。

此外还有听语精灵、红原县、Galaxy Explorers ,这些项目都在使用Google技术解决社会问题,共同探索AI造福社会之路。

三、Gemma 模型

Gemma 是一系列先进的轻量级开放模型。

7月31日,Google 宣布,Gemma 2系列新增小模型Gemma 2B(20亿参数)。

目前为止 Gemma 2 总共有2、9和27B,三种尺寸。

如果你想尝试一下Gemma 2,可以访问这个链接 https://www.kaggle.com/models/google/gemma-2 ,你可以在这里下载使用。

此外 Gemma还有一些变种,针对不同使用场景进行优化:

  • 推荐 CodeGemma ,基于 Gemma 的开放代码模型,访问链接 https://www.kaggle.com/models/google/codegemma
  • PaliGemma ,适用于图片说明生成、短视频字幕配给、视觉问答、文本阅读以及对象检测和分割等多样化的视觉语言任务,访问链接 https://www.kaggle.com/models/google/paligemma

Responsible AI 工具包是一个用于以负责任的方式设计、构建和评估开放式 AI 模型的工具和指南。你可以把它理解为一个最佳实践,通过它帮助我们开发更加安全的AI模型以及应用。

四、Gemini 模型

Gemini 模型相比 Gemma 模型更加适合独立开发者,它的使用更加便捷。

Google 的 Gemini 模型针对不同的使用场景分为三种:

  • Gemini Nano,适合处理设备端任务
  • Gemini 1.5 Flash,适合处理高容量任务
  • Gemini 1.5 Pro,适合处理各种复杂任务

如果你正在做出海项目,那么可以尝试一下,Google AI Studio 可以很方便地使用Gemini 模型,并且使用 Gemini API 集成到自己的应用中。

五、Google Cloud

除了前面提到的我们可以在 Google AI Studio 中使用Gemini 模型,Google Cloud 也已经将AI能力融入其中。

如果你的目前正在从事出海应用,可以尝试下一站式 AI 平台 Vertex AI,它可以帮助我们完成整套模型选择、模型构建和 Agent 构建工作,提高我们的生产效率。

Vertex AI 在支持 Gemini 1.5 Pro 和 Gemini 1.5 Flash 的基础上,还集成了 Hugging Face 模型库 ,给大家带来更多选择。

Gemini 除了能够帮助出海产品在业务上的能力提升,还融入了 Google Cloud 产品中,从开发测试、交付运行到管理运维,全面使用AI能力提效。

六、现场体验

在展区现场,我分别体验了智趣蹴鞠、智引线、Gemini 高尔夫陪练,接下来带大家沉浸式体验一下。

智趣蹴鞠的目的是让我踢球踢进左侧或者右侧框内,每个人有三次机会,大家可以看到我的第三次踢球已经踢到了边框上。

踢球结束之后,通过设备的摄像头以及 Gemini 1.5 Pro 的分析,我们可以得到AI教练指导的说明,以便以后续的训练改进。设备采集很多动作,我可以选择一个喜欢的最佳瞬间,搭配风格,输出 Imagen 2 生成的个性化图像 ,生成自己的专属星卡。

智引线这个项目是前面提到AI 社会公益中的一个,基于TensorFlow 的深度视觉学习模型运作。

这里是我的第一人称视角,虽然当时带着眼罩看不到,大家可以跟我一起感受这种感觉。

当我偏离引导线的时候,两侧的耳机会发出声音,帮助我纠正方向。

一开始我理解错了,导致我偏移越来越远,在途中我纠正了回来,所以在最后很快回到了引导线上。

我戴上眼罩的时候,能感受到视障人群生活上的不易,同时也体会到了智引线这个项目给他们带来生活上不一样的体验。

Gemini 高尔夫陪练的人气一直很旺,需要排队。Gemini 高尔夫陪练结合了计算机视觉和 Google Cloud 上的模块和产品。

大家可以看到我是通过两次打击进洞的,在最后的成绩展示上,清晰地记录了两次击球的轨迹。基于 Vertex AI 上的多模态大语言模型 Gemini 1.5 Pro ,分析视频得到的结果,从而给出了评分结果和技术指导。

七、带着问题逛展

作为本次CSDN“智播领航团”的一员,我们在会前向开发者征集了对 Google 技术最感兴趣的问题。

在和专家对谈之后,我们一起回顾下其中的问题。

一个问题是关于大模型API的调用,当然这里指的是 Gemini API ,对于出海开发者,API的调用是否简单易操作,也是作为开发成本的一部分。

在 Google AI Studio 中,我们可以在左侧打开文档,这里非常详细地说明了API的调用示例,并且有官方的中文页面。所以在API调用上,大家不用担心。

另一个问题是关于 Flutter ,Material3的设计标准在 Flutter 官方组件中的实现进度如何?是否有具体的时间表或里程碑?

关于更新问题,大家可以关注一下 Material3 官网的 Blog 部分,这里可以看到官方的最新动态,比如现在我们可以看到关于今年Google开发者大会的更新的文章,持续关注即可。

八、学习资源和活动

如果你没有来到现场,或者来到现场之后还不过瘾,那么可以看下官方提供的中文资源。

  • Google 开发者在线课程链接:
    • https://developers.google.cn/learn?hl=zh-cn&utm_source=ioc24&utm_medium=kol
  • AI 专区中文页面
    • https://developers.google.cn/ai/

此外,还有其他合作方活动,欢迎大家参加

  • 智播领航团
    • https://marketing.csdn.net/p/4dbb3f8d1cce28214c8443a0b3722230?pId=2631
  • 智在畅想黑客马拉松
    • https://pages.segmentfault.com/google-hackathon-2024-2
  • 超级“码”力挑战赛
    • https://cloud.51cto.com/act/google/2024

如果你对AI改善未来充满兴趣,那么请你以“让世界变得更加美好”为出发点,围绕话题产出AI改善未来的创意,诠释智能技术如何惠及每个人,那么请你带上话题 #想象力智造局正式营业#,投稿大于30秒的视频参与活动。

如果你在本次 Google 开发者大会中有什么新奇发现和感受,欢迎投稿和发动态,还可以艾特我,并带上话题 #2024Google开发者大会 #BuildwithGoogle 。

九、结束 Happy Hour

最后,以 Happy Hour 作为2024 Google 开发者大会的结尾,让我们期待明年的 Google 开发者大会!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2047471.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ERD Online即将突破 4500 用户的喜悦与展望

亲爱的朋友们: 大家好! 今天,我怀着无比激动的心情,要与大家分享一个令人振奋的消息:我们的网站用户即将突破 4500 大关! 这一路走来,充满了挑战与艰辛,但每一次的困难都成为了我们前…

2024新型数字政府综合解决方案(十)

新型数字政府综合解决方案融合先进的人工智能、大数据、区块链及云计算技术,旨在通过数据共享、智能分析与自动化处理,打造高效、透明、安全的政务环境,优化服务流程,提升决策科学性,加强信息安全,实现政府…

java入门-成员内部类和静态内部类的访问

(一)成员内部类 package InnerClass;import javax.print.attribute.standard.MediaSize;public class Outer {//2外部类中的成员private int age99;public static String a;public class Inner{//普通的成员内部类//1.1成员变量public String name;priva…

删除镜像报子镜像依赖错误

1、删除镜像报子镜像依赖错误 出现这个错误的原因是因为有其他镜像依赖需要删除的镜像。 2解决方法 2.1首先查看无法删除的镜像被哪些镜像所依赖 docker image inspect --format{{.RepoTags}} {{.Id}} {{.Parent}} $(docker image ls -q --filter since${image_id}) # ${ima…

数据结构:线性结构之顺序表、链表篇

数据结构:顺序表、链表篇 线性表一、顺序表(一)顺序表的结构定义(二)顺序表的功能实现1、初始化2、销毁3、扩容4、插入5、删除 (三)顺序表例题分析1、删除有序数组中的重复项2、合并两个有序数组…

【Hot100】LeetCode—73. 矩阵置零

目录 1- 思路开辟额外两个一维数组 2- 实现⭐53. 最大子数组和——题解思路 3- ACM 实现 原题连接:73. 矩阵置零 1- 思路 开辟额外两个一维数组 1- 利用额外的两个一维数组 boolean 数组空间,遇到 0 则将当前位置的元素设置为 true 一维 row 数组&…

如何判断一个dll/exe是32位还是64位

通过记事本判断(可判断C或者C#) 64位、将dll用记事本打开,可以看到一堆乱码,但是找到乱码行的第一个PE,如果后面是d?则为64位 32位、将dll用记事本打开,可以看到一堆乱码,但是找到乱码行的第…

最好用的Linux发行版---WSL

使用debian开发半年,那个号称稳定的操作系统,ubuntu也是基于它的testing版本开发的,在一次设置testing更新后英伟达驱动掉了、引导区无法启动、bios损坏,现在老实了,换回了Window,并且激进的选择了win11&am…

c语言中的宏函数及c++的内联函数及auto及NULL

c的内联函数 使用内联函数可以减少函数栈帧的开销。 Swap(a, b); 00A516C8 mov eax,dword ptr [a] 00A516CB mov dword ptr [ebp-20h],eax 00A516CE mov ecx,dword ptr [b] 00A516D1 mov dword ptr [a],ecx 00A516D4 mov …

Linux登录后自动健康检查:一键掌握系统状态

Linux登录后自动健康检查:一键掌握系统状态 最近开始公众号文章也开始同步更新了,对Java、大数据、人工智能、开发运维相关技术分享,文章对您有用的话,辛苦您也关注下公众号,感谢! 引言 当我们登录到某些服…

rt-thread 打开flashdb若干问题

1、打开FAL和SFUD功能 2、打开FLASHDB时,想用utest测试工程,结果报错,缺少mkdir函数: 解决办法:打开DFS RT-Thread Components → DFS: device virtual file system 重新编译

大数据-87 Spark 集群 案例学习 Spark Scala 案例 手写计算圆周率、计算共同好友

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

windows重装系统后无法安装软件,Windows软件无法打开,缺少dll,缺少c++运行库

如果你使用Directx&#xff0c;要么识别不出来&#xff0c;要么装上之后更新会发现重复安装了很多运行库 装一个visual stiudio&#xff1a;<Visual Studio 2022 IDE - 适用于软件开发人员的编程工具> 选择使用C游戏开发、.Net桌面开发 然后安装即可

学习Java的日子 Day71 手写一个SpringMVC的框架(一)

手写一个SpringMVC的框架 1.理解为什么要写这样一个框架 SpringMVC 实际上跟Servlet是一样&#xff0c;都是 Controller的一个解决方案&#xff0c;也就是说我们手写这个框架的目的就是为了替换原来的 Servlet 注意&#xff1a; spring不是框架&#xff0c;springMVC才是框架&…

一文入门mysql 数据库

一、数据库概述 什么是数据库 数据库是一个用于存储和管理数据的仓库。数据按照特定的格式存储&#xff0c;可以对数据库中的数据进行增加、修改、删除和查询操作。数据库的本质是一个文件系统&#xff0c;按照一定的逻辑结构组织数据&#xff0c;以方便高效地访问和维护。 什…

使用Python创建LNK文件选择器并导出配置文件

在这篇博客中&#xff0c;我将介绍如何使用Python的wxPython库开发一个GUI应用程序&#xff0c;该应用程序可以选择文件夹中的.lnk&#xff08;快捷方式&#xff09;文件&#xff0c;并将选中的文件导出为特定格式的buttons.ini配置文件。这个工具非常适合用来快速生成配置文件…

使用Java调用Apache commons-text求解字符串相似性实战

目录 前言 一、字符串距离的几种计算方法 1、Levenshtein 距离 2、Overlap Coefficient计算 3、Q-gram Matching 4、余弦相似性计算 二、基于余弦相似性的基地名称对比 1、加载百科中的基地信息列表 2、设置忽略词列表 3、将数据库地名和Excel进行对比 三、总结 前言…

c语言音频.wav读写示例

1 .wav格式说明 一. RIFF 概念 在 Windows 环境下&#xff0c;大部分的多媒体文件都依循着一种结构来存放信息&#xff0c;这种结构称为"资源互换文件格式"(Resources lnterchange File Format)&#xff0c;简称 RIFF。例如声音的 WAV 文件、视频的 AV1 文件等等均…

EmguCV学习笔记 VB.Net 2.4 Image类

版权声明&#xff1a;本文为博主原创文章&#xff0c;转载请在显著位置标明本文出处以及作者网名&#xff0c;未经作者允许不得用于商业目的。 EmguCV学习笔记目录 Vb.net EmguCV学习笔记目录 C# 笔者的博客网址&#xff1a;VB.Net-CSDN博客 教程相关说明以及如何获得pdf教…

【图解秒杀系列】秒杀技术点——秒杀按钮点亮、削峰

【图解秒杀系列】秒杀技术点——秒杀按钮点亮、削峰 秒杀按钮点亮涉及的问题以及解决办法处理流程 削峰答题 & 验证码具体流程 排队 秒杀按钮点亮 在秒杀场景中&#xff0c;秒杀商品页面是需要处理按钮点亮的逻辑的。在秒杀未开始前&#xff0c;按钮置灰&#xff0c;不可点…