文章目录
- 一、现场打卡
- 二、AI 社会公益
- 三、Gemma 模型
- 四、Gemini 模型
- 五、Google Cloud
- 六、现场体验
- 七、带着问题逛展
- 八、学习资源和活动
- 九、结束 Happy Hour
一、现场打卡
大家好,我是小雨。
2024 Google 开发者大会,沉浸式体验AI社会公益
今天我们参加 2024 Google 开发者大会,本次的举办地也是久违的回到了北京,地址是国家会议中心。
会场外面的 Google 标识非常明显,我刚出地铁站就发现了。
在志愿者的引导下,签到完成,拿到了伴手礼,今年的袋子,里面还有一个扇子,看来 Google 官方还是很贴心的。
然后是拍照打卡,我在这里碰到了和我一起来的几何心凉和敬之,稍后也越到了哈哥和三掌柜。
我们五个人这次代表 CSDN 作为“智播领航团”,在现场一起探索Google开发者大会,直击 Google 技术的最前沿。
二、AI 社会公益
著名的科幻作家和科学普及作家艾萨克·阿西莫夫(Isaac Asimov)说过:“科技使生活更加便利,但它也必须用于服务人类的目的。” (“Technology makes life more convenient, but it must also be used to serve the purposes of humanity.”)
在这里,我看了Google在公益事业上的行动。
视障的孩子无法在复杂的环境下分辨生活中的事物,在之前,老师需要自己制作一些事物的卡片,帮助视障儿童去认识这个世界,但是因为老师的手动制作无法支持孩子们的学习,Google 开发了视障友好的教育内容生产平台。
手语村(中国手语版)网站基于 Google Project Shuwa 开源项目开发,包含了教学视频和手语词典,在为听障人士、手语爱好者和专业人士提供一个学习和交流手语的互动空间。
智引线是利用 TensorFlow 深度学习模型和 ARCore 空间识别技术,为视障跑者打造的 App ,只需用一部 Android 手机、一副耳机和地面上的引导线,帮助视障跑者实现自由奔跑。 我在现场体验了一下,通过耳机左右声道的提示,我可以知道自己是否偏移了方向,以及是否马上碰到墙壁。对于视障跑者来说,智引线可以带来完全不同的体验。
此外还有听语精灵、红原县、Galaxy Explorers ,这些项目都在使用Google技术解决社会问题,共同探索AI造福社会之路。
三、Gemma 模型
Gemma 是一系列先进的轻量级开放模型。
7月31日,Google 宣布,Gemma 2系列新增小模型Gemma 2B(20亿参数)。
目前为止 Gemma 2 总共有2、9和27B,三种尺寸。
如果你想尝试一下Gemma 2,可以访问这个链接 https://www.kaggle.com/models/google/gemma-2 ,你可以在这里下载使用。
此外 Gemma还有一些变种,针对不同使用场景进行优化:
- 推荐 CodeGemma ,基于 Gemma 的开放代码模型,访问链接 https://www.kaggle.com/models/google/codegemma
- PaliGemma ,适用于图片说明生成、短视频字幕配给、视觉问答、文本阅读以及对象检测和分割等多样化的视觉语言任务,访问链接 https://www.kaggle.com/models/google/paligemma
Responsible AI 工具包是一个用于以负责任的方式设计、构建和评估开放式 AI 模型的工具和指南。你可以把它理解为一个最佳实践,通过它帮助我们开发更加安全的AI模型以及应用。
四、Gemini 模型
Gemini 模型相比 Gemma 模型更加适合独立开发者,它的使用更加便捷。
Google 的 Gemini 模型针对不同的使用场景分为三种:
- Gemini Nano,适合处理设备端任务
- Gemini 1.5 Flash,适合处理高容量任务
- Gemini 1.5 Pro,适合处理各种复杂任务
如果你正在做出海项目,那么可以尝试一下,Google AI Studio 可以很方便地使用Gemini 模型,并且使用 Gemini API 集成到自己的应用中。
五、Google Cloud
除了前面提到的我们可以在 Google AI Studio 中使用Gemini 模型,Google Cloud 也已经将AI能力融入其中。
如果你的目前正在从事出海应用,可以尝试下一站式 AI 平台 Vertex AI,它可以帮助我们完成整套模型选择、模型构建和 Agent 构建工作,提高我们的生产效率。
Vertex AI 在支持 Gemini 1.5 Pro 和 Gemini 1.5 Flash 的基础上,还集成了 Hugging Face 模型库 ,给大家带来更多选择。
Gemini 除了能够帮助出海产品在业务上的能力提升,还融入了 Google Cloud 产品中,从开发测试、交付运行到管理运维,全面使用AI能力提效。
六、现场体验
在展区现场,我分别体验了智趣蹴鞠、智引线、Gemini 高尔夫陪练,接下来带大家沉浸式体验一下。
智趣蹴鞠的目的是让我踢球踢进左侧或者右侧框内,每个人有三次机会,大家可以看到我的第三次踢球已经踢到了边框上。
踢球结束之后,通过设备的摄像头以及 Gemini 1.5 Pro 的分析,我们可以得到AI教练指导的说明,以便以后续的训练改进。设备采集很多动作,我可以选择一个喜欢的最佳瞬间,搭配风格,输出 Imagen 2 生成的个性化图像 ,生成自己的专属星卡。
智引线这个项目是前面提到AI 社会公益中的一个,基于TensorFlow 的深度视觉学习模型运作。
这里是我的第一人称视角,虽然当时带着眼罩看不到,大家可以跟我一起感受这种感觉。
当我偏离引导线的时候,两侧的耳机会发出声音,帮助我纠正方向。
一开始我理解错了,导致我偏移越来越远,在途中我纠正了回来,所以在最后很快回到了引导线上。
我戴上眼罩的时候,能感受到视障人群生活上的不易,同时也体会到了智引线这个项目给他们带来生活上不一样的体验。
Gemini 高尔夫陪练的人气一直很旺,需要排队。Gemini 高尔夫陪练结合了计算机视觉和 Google Cloud 上的模块和产品。
大家可以看到我是通过两次打击进洞的,在最后的成绩展示上,清晰地记录了两次击球的轨迹。基于 Vertex AI 上的多模态大语言模型 Gemini 1.5 Pro ,分析视频得到的结果,从而给出了评分结果和技术指导。
七、带着问题逛展
作为本次CSDN“智播领航团”的一员,我们在会前向开发者征集了对 Google 技术最感兴趣的问题。
在和专家对谈之后,我们一起回顾下其中的问题。
一个问题是关于大模型API的调用,当然这里指的是 Gemini API ,对于出海开发者,API的调用是否简单易操作,也是作为开发成本的一部分。
在 Google AI Studio 中,我们可以在左侧打开文档,这里非常详细地说明了API的调用示例,并且有官方的中文页面。所以在API调用上,大家不用担心。
另一个问题是关于 Flutter ,Material3的设计标准在 Flutter 官方组件中的实现进度如何?是否有具体的时间表或里程碑?
关于更新问题,大家可以关注一下 Material3 官网的 Blog 部分,这里可以看到官方的最新动态,比如现在我们可以看到关于今年Google开发者大会的更新的文章,持续关注即可。
八、学习资源和活动
如果你没有来到现场,或者来到现场之后还不过瘾,那么可以看下官方提供的中文资源。
- Google 开发者在线课程链接:
- https://developers.google.cn/learn?hl=zh-cn&utm_source=ioc24&utm_medium=kol
- AI 专区中文页面
- https://developers.google.cn/ai/
此外,还有其他合作方活动,欢迎大家参加
- 智播领航团
- https://marketing.csdn.net/p/4dbb3f8d1cce28214c8443a0b3722230?pId=2631
- 智在畅想黑客马拉松
- https://pages.segmentfault.com/google-hackathon-2024-2
- 超级“码”力挑战赛
- https://cloud.51cto.com/act/google/2024
如果你对AI改善未来充满兴趣,那么请你以“让世界变得更加美好”为出发点,围绕话题产出AI改善未来的创意,诠释智能技术如何惠及每个人,那么请你带上话题 #想象力智造局正式营业#,投稿大于30秒的视频参与活动。
如果你在本次 Google 开发者大会中有什么新奇发现和感受,欢迎投稿和发动态,还可以艾特我,并带上话题 #2024Google开发者大会 #BuildwithGoogle 。
九、结束 Happy Hour
最后,以 Happy Hour 作为2024 Google 开发者大会的结尾,让我们期待明年的 Google 开发者大会!