机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving

news2024/12/24 2:49:15

腾讯推出的 AppAgent,是一个多模态智能体,通过识别当前手机的界面和用户指令直接操作手机界面,能像真实用户一样操作手机!

机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术

1、如何学习深度学习?

最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai 深度学习课程后,把每节课提到的学习建议和忠告都总结了下来:https://forums.fast.ai/t/things-jeremy-says-to-do/36682/1

我让ChatGPT、Claude、Gemini翻译并总结了这篇文章,Gemini完成的更加出色,给出了26条关于学习方法和一些细节的建议(强烈建议,如果时间允许,可以看原文):

  1. **倾听:**仔细注意老师在整堂课中的建议和提示。
  2. **不要被理论淹没:**专注于运行代码并对其进行实验,而不是一开始就陷入理论细节中。
  3. **选择一个项目并把它做得精彩:**选择一个你感兴趣的项目,并投入额外的精力,确保对其进行优化和改进。
  4. **探索不同的数据集:**不要局限于课程中提供的数据集;自己寻找数据集并对其进行实验。
  5. **不要使你的代码过于复杂:**保持你的代码简单和有条理,避免不必要的复杂性。
  6. **学习 Jupyter 快捷键:**熟悉 Jupyter 快捷键以提高你的效率。
  7. **运行代码并对其进行实验:**不要只阅读代码;运行它并尝试不同的输入和参数来观察会发生什么。
  8. **不要花几个小时试图立即理解所有理论:**可以先不理解所有内容;专注于实践方面,并随着时间的推移逐渐加深你的理解。
  9. **阅读比赛获胜者的论文:**通过阅读比赛获胜者的论文来学习他人的成功经验,注意他们的方法和见解。
  10. **使用你拥有的所有文本:**在处理 NLP 时,确保使用所有可用的文本,包括未标记的验证集,以增强模型的性能。
  11. **学会发音希腊字母:**熟悉深度学习论文中常用的希腊字母的发音。
  12. **非常习惯 PyTorch 张量:**培养对 PyTorch 张量和运算的扎实理解。
  13. **应用广播规则:**在处理更高秩张量时学习并应用广播规则。
  14. **不要假设库是正确的:**对库持怀疑态度;验证其正确性并了解其工作原理。
  15. **不要担心你是否跟上了所有内容:**感到不知所措是正常的;专注于你能理解的内容,并逐渐建立你的知识。
  16. **学会调试深度学习代码:**调试 DL 代码具有挑战性;确保你的代码简单,并检查中间结果以尽量减少错误。
  17. **用玩具问题进行实验:**创建并解决玩具问题以深入了解深度学习的概念和技术。
  18. **学习 Swift for TensorFlow:**抓住机会学习 Swift for TensorFlow,它为 DL 开发提供了优势。
  19. **为 Swift for TensorFlow 生态系统做出贡献:**通过为代码、文档或讨论做出贡献来参与 Swift for TensorFlow 社区。
  20. **使用 compose 进行函数组合:**使用 compose 函数熟悉函数组合的概念。
  21. **谨慎的数据增强:**在增强数据时,仔细考虑转换及其对数据完整性和标签准确性的影响。
  22. **尝试不同的架构:**尝试不同的神经网络架构以深入了解它们的性能特征。
  23. **不要冻结批归一化层:**避免在微调期间冻结批归一化层,以确保适当的权重更新。
  24. **尽可能以原始方式预处理数据:**作为一般规则,尽量减少对神经网络数据的预处理,以保留其原始信息和结构。
  25. **学习 Swift for TensorFlow:**抓住机会学习 Swift for TensorFlow,它为 DL 开发提供了优势。
  26. **自定义 Swift for TensorFlow:**Swift for TensorFlow 是完全可自定义的,允许你修改和扩展它以满足你的特定需求。

2、2024 年学习生成式 AI 路线图

项目地址:https://github.com/krishnaik06/Roadmap-To-Learn-Generative-AI-In-2024

这个项目总结了生成式AI学习路线,从Python、机器学习、NLP、深度学习、GPT-4、Langchain、向量数据库、LLM项目部署,非常顺畅。

3、机器学习调查

地址:https://github.com/metrofun/machine-learning-surveys

有关主动学习、生物信息学、分类、度量学习、蒙特卡罗、多视图学习等方面的调查、教程和书籍的精选列表。

Image

4、应用机器学习

地址:https://github.com/eugeneyan/applied-ml

这个项目分享了各公司在生产中数据科学和机器学习方面的论文和技术博客,已经更新了3年。

主要内容包括:

  • 如何构架问题 🔎(例如,将个性化视为推荐系统 vs. 搜索 vs. 序列)
  • 哪些机器学习技术有效 ✅(有时候,哪些不行 ❌)
  • 为什么它有效,背后的科学原理包括研究、文献和引用 📂
  • 实现了什么现实世界的结果(可以更好地评估投资回报率 ⏰💰📈)

Image

5、如何构建高效的RAG系统

Devv AI 是面向开发者的新一代 AI 搜索引擎

程序员Jiayuan (Forrest)在X上分享了开发者搜索工具 devv.ai 是如何构建RAG系统的过程,内容十分硬核。

这里是Treads汇总:https://typefully.com/Tisoga/PBB58Vu

6、MLC Chat

MLC Chat:在iPhone上离线运行7B最强LLM Mistral
中文不太行,速度很快,手机会发热
APP下载:https://apps.apple.com/gb/app/mlc-chat/id6448482937
Github:https://github.com/mlc-ai/mlc-llm

支持各种系统,能在各种设备上开发、优化和部署AI模型。包括iOS和安卓

7、Ollama

地址:https://ollama.ai/download

Ollama为那些在macOS、Linux(暂不支持Windows)上使用LLM的开发者提供了一种简便的解决方案,可以更轻松地将这些模型集成到自己的应用程序中。

Ollama目前支持了10余种大模型,安装后均可一个命令本地启动并运行

ModelParametersSizeDownload
Neural Chat7B4.1GBollama run neural-chat
Starling7B4.1GBollama run starling-lm
Mistral7B4.1GBollama run mistral
Llama 27B3.8GBollama run llama2
Code Llama7B3.8GBollama run codellama
Llama 2 Uncensored7B3.8GBollama run llama2-uncensored
Llama 2 13B13B7.3GBollama run llama2:13b
Llama 2 70B70B39GBollama run llama2:70b
Orca Mini3B1.9GBollama run orca-mini
Vicuna7B3.8GBollama run vicuna
LLaVA7B4.5GBollama run llava

8、DreaMoving

DreaMoving是一个基于扩散模型的人类舞蹈视频生成框架。能够根据指导序列和简单的内容描述(仅文本提示、仅图像提示或文本和图像提示)生成高质量、高保真度的视频。

体验地址:https://modelscope.cn/studios/vigen/video_generation/summary

9、苹果最新论文

论文: https://huggingface.co/papers/2312.11514

苹果发的这个论文《使用有限的内存实现更快的 LLM 推理》。通过将将模型参数保存在闪存里,根据需要移动到DRAM。 使得能够运行的模型大小是可用DRAM的两倍,与传统的CPU和GPU加载方法相比,推理速度分别提高了4-5倍和20-25倍

10、腾讯最新论文:《AppAgent: 多模态智能体,像真实用户一样操作手机》

项目首页:https://appagent-official.github.io
论文链接:https://arxiv.org/abs/2312.13771
项目地址:https://github.com/mnotgod96/AppAgent

论文通过引入一种基于大型语言模型(LLMs)的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。与传统的智能助手如 Siri 不同,AppAgent 不依赖于系统后端访问,而是通过模拟人类的点击和滑动等操作,直接与手机应用的图形用户界面(GUI)互动。这种独特的方法不仅提高了安全性和隐私性,还确保了智能体能够适应应用界面的变化和更新。

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1374211.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

信道编码理论【信息论安全】

目录 一. 信道编码模型 二. 信道编码速率与错误译码率 2.1 信道编码速率 2.2 平均错误率 三. 信道容量 四. 小结 一. 信道编码模型 (1)消息 假定消息集合为M,如下: (2)编码 将消息m映射成码字&…

spring cloud之集成sentinel

写在前面 源码 。 本文一起看下spring cloud的sentinel组件的使用。 1:准备 1.1:理论 对于一个系统来说,最重要的就是高可用,那么如何实现高可用呢?你可能会说,集群部署不就可以了,但事实并…

1.10 Unity中的数据存储 JSON

一、介绍 Json是最常用也是目前用的比较多的一种,超轻量级,可便捷性使用,平时用到比较多的都是解析Json和往Json中添加数据、修改数据等等JSON(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式,它基于ECMAScr…

Aloha 机械臂的学习记录3——AWE:Pycharm运行代码记录

之前的博客创作了三偏关于Aloha_AWE的liunx终端指令运行代码的示例: Aloha 机械臂的学习记录——AWE:Bimanual Simulation Suite: https://blog.csdn.net/qq_54900679/article/details/134889183?spm1001.2014.3001.5502 Aloha 机械臂的学习记录1——AWE&#x…

浅谈WPF之Popup弹出层

在日常开发中,当点击某控件时,经常看到一些弹出框,停靠在某些页面元素的附近,但这些又不是真正的窗口,而是页面的一部分,那这种功能是如何实现的呢?今天就以一个简单的小例子,简述如…

SpringIOC之support模块DelegatingMessageSource

博主介绍:✌全网粉丝5W+,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验✌ 博主作品:《Java项目案例》主要基于SpringBoot+MyBatis/MyBatis-plus+…

如何将后端带过来的字符串通过‘,’号作为判断依据,分割字符串然后生成数组

在实际开发工程中我们会遇到我们调用后端接口获取图片、文件、视频甚至选择的对象时,如果是这样的: 这种数据类型如果想渲染在html中的话就会很麻烦,我们可以通过","号为切割点将它放入数组中,通过列表进行渲染 由于实…

切分大文件sql为小份

数据库太大了,整个备份导入出问题或者慢,需要将整个库按照表分割(一个表一个sql文件) 环境 win10 工具:python3.7pycharm 要分割的文件大小:6G,sql文件import redbname with open(best**.sql,…

C++学习笔记(三十二):c++ 堆内存与栈内存比较

本节对堆和栈内存进行描述。 应用程序启动后,操作系统将整个程序加载到内存,分配相应的物理ram,确保程序可以正常运行。堆和栈是ram中存在的两个区域。栈通常是一个预定义大小的内存区域,一般是2M字节左右。堆也是预定了默认值的…

第五站:C++的内存解析

目录 C内存分布 变量的四种存储方式 函数返回值使用指针(指针函数) 动态分配内存空间 不能使用外部函数的普通局部变量的地址 通过指针函数返回静态局部变量的地址 动态内存 根据需要分配内存,不浪费(根据用户的需求设置内存的容量) 被调用函数之外需要使用被调用函数内…

柳胜勋:0.88秒!NineData数据库编程大赛的第二名,轻松完成百万级数据代码评测!!

数据库编程大赛:一条SQL计算扑克牌24点 12月27日,NineData和云数据库技术社区主办,华为云、火山引擎、开源中国、云和恩墨、TDengine、云猿生数据、DORIS、ITPUB等协办单位和媒体,共同举办了本次《数据库编程大赛》。大赛题目「用…

LeetCode-657/1275/1041

1.机器人能否返回原点(657) 题目描述: 在二维平面上,有一个机器人从原点 (0, 0) 开始。给出它的移动顺序,判断这个机器人在完成移动后是否在 (0, 0) 处结束。 移动顺序由字符串 moves 表示。字符 move[i] 表示其第 …

Python办公自动化 – 自动化文本翻译和Oracle数据库操作

Python办公自动化 – 自动化文本翻译和Oracle数据库操作 以下是往期的文章目录,需要可以查看哦。 Python办公自动化 – Excel和Word的操作运用 Python办公自动化 – Python发送电子邮件和Outlook的集成 Python办公自动化 – 对PDF文档和PPT文档的处理 Python办公自…

python统计分析——箱线图(df.boxplot)

资料来源:用python学统计学,帮助文档 使用pd.dataframe.boxplot()函数绘制箱线图 import numpy as np import pandas as pd from matplotlib import pyplot as pltdfpd.DataFrame({type:[A,A,A,A,A,A,A,A,A,A,B,B,B,B,B,B,B,B,B,B],value:[2,3,3,4,4,4…

门店管理系统驱动智慧零售升级

在当今数字化经济的大潮中,实体门店正在经历一场由内而外的深度变革。门店管理系统以其高效、便捷和全面的功能特性,为实体店提供了高效的运营解决方案。 门店管理系统拜托了传统零售业对本地化软件的依赖,它将复杂的信息技术转化为易于获取…

Redis性能大挑战:深入剖析缓存抖动现象及有效应对的战术指南

在实际应用中,你是否遇到过这样的情况,本来Redis运行的好好的,响应也挺正常,但突然就变慢了,响应时间增加了,这不仅会影响用户体验,还会牵连其他系统。 那如何排查Redis变慢的情况呢&#xff1f…

隧道自动化监测系统的主要产品和监测内容

一、背景 随着交通行业的不断发展,隧道作为交通基础设施的重要组成部分,其安全和稳定性对于保障人们的生命财产安全具有重要意义。隧道自动化监测系统作为一种先进的安全监测手段,能够实时监测隧道内部的各项参数,为隧道的安全运…

Kubernetes的动态pv

pv和pvc存储卷 存储卷: emptyDir:容器内部,随着pod销毁,emptyDir也会消失,不能做数据持久化 hostPath:持久化存储数据可以和节点上目录做挂载,pod被销毁了数据还在 NfS:一台机器,提供pod内容器所有的挂…

Elasticsearch 索引文档时create、index、update的区别【学习记录】

本文基于elasticsearch7.3.0版本。 一、思维导图 elasticsearch中create、index、update都可以实现插入功能,但是实现原理并不相同。 二、验证index和create 由上面思维导图可以清晰的看出create、index的大致区别,下面我们来验证下思维导图中的场景&…

2023年山东省职业院校技能大赛高职组信息安全管理与评估 理论题(正式赛)

2023年山东省职业院校技能大赛高职组信息安全管理与评估 理论题 理论技能与职业素养(100分) 2023年山东省职业院校技能大赛高职组信息安全管理与评估 理论题 【注意事项】 Geek极安云科专注技能竞赛技术提升,基于各大赛项提供全面的系统性…