试用Claude3

news2024/10/23 16:27:41

1 简介

好消息是,2024 年 3 月 4 日发布了 Claude3,据传比 GPT-4 更好,snooet 版本可以免费试用,坏消息是我们这儿不能用。

在官网注册时,需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了 API 密钥,免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证,网上说每个手机号只能注册一次,所以似乎也无法短信接收平台。(如果你找到了注册方法,请私信告诉我)

虽然无法通过 API 调用并将其添加到我们的工具中,但可以通过亚马逊云来免费体验一下。

2 Claude3

2.1 三个模型

Claude 3 共发布了三个模型:

  • Claude 3 Opus:最强大的模型,在高度复杂的任务上提供最先进的性能,并展示流畅性和类似人类的理解。
  • Claude 3 Sonnet:在智能和速度之间最平衡的模型,是企业工作负载和规模化 AI 部署的绝佳选择
  • Claude 3 Haiku:最快、最紧凑的模型,旨在实现近乎即时的响应能力和模仿人类交互的无缝 AI 体验

2.2 主要特点

这次升级的主要特点包含:

  • 多语言功能:Claude 3 提高了非英语语言的流利度,支持翻译服务和全球内容创建等用例。
  • 视觉和图像处理:所有 Claude 3 模型都可以处理和分析视觉输入、从文档中提取内容、处理 Web UI、生成图像元数据等。
  • 可操纵性和易用性:Claude 3 更擅长遵循提示。
  • 内容更新:Claude 3 系列将定期接收更新,以增强性能、扩展功能并解决任何已发现的问题。

2.3 价格

|400

|400

Claude 3 OpusClaude 3 SonnetClaude 3 HaikuClaude 2.1Claude 2Claude Instant 1.2
Cost (Input / Output per MTok^)15.00/75.003.00/15.000.25/1.258.00/24.08.00/24.00.80/2.40
Training data cut-offAug 2023Aug 2023Aug 2023Early 2023Early 2023Early 2023

2.4 资料

主页:https://www.anthropic.com/

文档:https://docs.anthropic.com/claude/docs/models-overview

3 使用方法

3.1 界面调用

Anthropic 的 Claude 3 Sonnet 模型在亚马逊 Bedrock 平台上可以免费试用,扫码登录:

https://portal.cloudassist-beta.sign-up.china.aws.a2z.com/demo/qrcode?trk=community

(顺便提一句:亚马逊的云实验环境实在很好用)

进入后,依次操作:

  • 点击:" 限时试用 "
  • 点击:尝试 RedRock" 入门 "
  • 点击:右侧 ANTHROPIC " 请求模型访问权限 "
  • 点击:右上 " 管理模型访问权限 "
  • 点击:ANITHROPIC 右侧“”提交应用场景详细信息”如下,填好后稍等刷新,可以看到成功获取到访问权限。

|300

|300

  • 点击:左侧聊天,把模型切换成 Claude3 sonnet 即可开始聊天

3.2 python 程序调用

用法非常简单,和 gemini,openai gpt 差不多,就不在此 demo 了。

4 测试

4.1 编写代码

  • 提问:给我写一段 android 音乐播放器的界面代码。
  • 回答:返回 layout xml 看着还行,没有 java 代码,还包含一些注意事项。
  • 讨论:如果细化一下需求,大问题拆成小问题再问,效果应该还不错。

4.2 知识性问题

  • 提问:请介绍一下莫言。
  • 回答:回答正确。
  • 讨论:还提问了另一些知识性问题,感觉知识性内容 Claude3 和 Genimi 比 GPT-4 明显更好。

4.3 翻译问题

  • 提问:将葳文翻译成中文:ང་རང་གིས་གཙོ་སྒྲུབ་བྱས་པའི་དབང་སྡུད་གསོལ་འདེབས་ཀྱི་ཚོམ་འདིར་ཕེབས་པར་དགའ་བསུ་ཞུ། ཁོམ་སྐབས་དང་བསྟུན་ནས་དབང་སྡུད་གསོལ་འདེབས་ཉུང་ཙམ་གསུང་རོགས་ཞ
  • 回答:基本正确,沟通方式很友好,可能由于使用大量人工标注 instruct 引导学习。
  • 分析:后来又翻译了一段颂词,藏文相对小语种,我觉得相比之下,Claude 和 Gemini 差不多,gpt4 略差一点,gpt3.5 几乎没法用。

4.4 阅读理解

  • 提问:请从原文中提取合同核心条款:“回购权”," 股权锁定 "," 优先认购权 ",....,对应的数据块,用原文回答。原文如下:……(上下文支持足够长,可以在聊天中加原文)
  • 回答:Claude3 答出了核心条款所在章节,但并没有用原文回答,试了几种问法,均没有用原文回答,可能是模型对输出量做了限制。如果问单个条款,在答案不太长的情况下,可用原文回答。
  • 提问:从原文找:" 股权锁定 " 对应的数据块,用原文回答。
  • 回答:返回了我想要的完整数据块,及一些总结性文本,总结得比我理解得还好呢。
  • 反馈时间:上传 2W 字,反馈时间 20-30 秒。
  • 讨论:提问内容属于相对专业领域,模型能理解:反摊薄条款=反稀释,优先清算权=优先分配权,以及正文内容与标题的关系,可见 Claude3 理解能力确实强;但没有完全按要求回答,偶尔会产生一些幻觉。相对 GPT3.5/4 好很多。
  • 分析:在这个应用场景里,推荐用规则提取能提取的内容,用模型处理比较复杂的内容,以平衡性价。



4.5 总结

个人体会,不一定对。

  • 我感觉 Gemini,Claude3,GPT-4 基本是一个层次的,效果比 GPT-3.5 好很多。
  • 未来可能不会再有一大独大的情况了。
  • 模型对比:
    • GPT-4 各方面比较均衡,生态完善,工具链太熟悉,切换也有成本。
    • Gemini 知识能力比较强,更深入专业领域,小伙伴拿他当百度百科用。
    • Claude 理解能力比较好,更深入专业领域,目前没法在程序中调用。
  • 最终选型还是要看价格,充值难度,易得性,响应时间,效果,取平衡。
  • 几个模型对单一问题的回答都还不错,但对于复杂问题可能还需要加思维链和 RAG 来做。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1498235.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

腾讯云学生服务器多少钱?怎么申请?

2024年腾讯云学生服务器优惠活动「云校园」,学生服务器优惠价格:轻量应用服务器2核2G学生价30元3个月、58元6个月、112元一年,轻量应用服务器4核8G配置191.1元3个月、352.8元6个月、646.8元一年,CVM云服务器2核4G配置842.4元一年&…

一周学会Django5 Python Web开发-Django5新增视图CreateView

锋哥原创的Python Web开发 Django5视频教程: 2024版 Django5 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 Django5 Python web开发 视频教程(无废话版) 玩命更新中~共计29条视频,包括:2024版 Django5 Python we…

12.WEB渗透测试-Linux系统管理、安全加固(下)

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于: 易锦网校会员专享课 上一个内容:11.WEB渗透测试-Linux系统管理、安全加固(上)-CSDN博客 Linux任务…

Numpy 数组转换为 Pandas DataFrame

参考:Convert Numpy Array to Pandas DataFrame Numpy 介绍 Numpy是Python中一个非常强大的科学计算库,它提供了许多高效的数组操作方法。Pandas是另一个重要的数据处理库,它基于Numpy,并提供了更高级别的数据分析和处理工具。在…

横琴正式封关运行,惟客数据都做了什么?

​作为中国实施高水平制度型开放的重大探索,位于珠海横琴岛的横琴粤澳深度合作区于2024年3月1日零时正式实施分线管理封关运行,共设1个“一线”口岸、7个“二线”海关作业现场,覆盖旅检、货运、通关、稽(核)查等多线条…

护眼台灯推荐,护眼台灯怎么选?口碑公认的5个品牌推荐

现在儿童青少年的近视率越来越高,所以儿童护眼台灯也是受到了越来越多的关注。护眼台灯凭借能提供舒适自然的照明,起到预防近视的作用,成为了许多家长为孩子选择的必备灯具!不过市场上始终存在护眼台灯质量差、不达到标准等各种负…

分段线性化问题探析

目录 1 使用0-1变量将分段函数转换为线性约束 2 连续函数采用分段线性化示例 3 matlab程序测试 4 matlab测试结果说明 5 分段线性化应用 1 使用0-1变量将分段函数转换为线性约束 2 连续函数采用分段线性化示例 3 matlab程序测试 clc;clear all; gn10;tn1; x_pfsdpvar(1, t…

前端技术研究越深入,越觉得技术不是决定录用唯一条件。

一、拒绝抬杠 我说技能不是唯一条件,不是说技能不重要,招聘前端条件是1X,其中1是技能,X是其他条件。 如果X条件很优秀,1这个条件可以降格为0.8、0.5,甚至更低。 有人就抬杠,那为啥不招聘清洁工来干前端&…

如何学习I2C协议

文章目录 学习I2C协议0 懒人直达1 了解协议开发者2 从恩智浦半导体公司下载官方技术文档3 翻译成中文4 资源下载 学习I2C协议 0 懒人直达 点击直达 1 了解协议开发者 I2C(Inter-Integrated Circuit)协议是由荷兰皇家飞利浦电子公司(现恩智…

【数据结构】哈希

在一个数据序列中查找某一个数据元素,是数据管理时经常涉及的,通常以比较的方式来完成,典型的案例有无序序列的暴力查找(O(N))、有序序列的二分查找(O(logN))、平衡搜索树(O(logN)&a…

如何在小程序中绑定身份证

在小程序中绑定身份证信息是一项常见的需求,特别是在需要进行实名认证或者身份验证的场景下。通过绑定身份证信息,可以提高用户身份的真实性和安全性,同时也为小程序提供了更多的个性化服务和功能。下面就介绍一下怎么在小程序中绑定居民身份…

记一次Flink任务无限期INITIALIZING排查过程

1.前言 环境:Flink-1.16.1,部署模式:Flink On YARN,现象:Flink程序能正常提交到 YARN,Job状态是 RUNNING,而 Task状态一直处于 INITIALIZING,如下图: 通过界面可以看到…

pycuda安装失败问题

pycuda安装失败问题 遇到一个pycuda安装失败的问题, 这里有一个合理的解释可以去尝试一下,看起来很有道理:

第三百八十八回

文章目录 概念介绍使用方法示例代码 我们在上一章回中介绍了DateRangePickerDialog Widget相关的内容,本章回中将介绍Radio Widget.闲话休提,让我们一起Talk Flutter吧。 概念介绍 我们在这里说的Radio Widget是指单选按钮,没有选中时是圆形边框&#x…

chatgpt与人类有何不同?

ChatGPT和人类之间存在多个显著的差异。 首先,ChatGPT是一种基于人工智能技术的计算机程序,通过机器学习和自然语言处理等技术,从大量的数据中获取知识并生成语言输出。它主要依赖于算法和数据进行工作,能够迅速处理和检索信息&a…

干货分享③:免费制作产品管理系统!

他来了,他来了,他带着码上飞CodeFlying走来了!今天继续为大家带来一期干货分享,教大家如何免费使用码上飞来的开发产品管理系统 ! 一、登陆官网 码上飞 CodeFlying | AI 智能软件开发平台! 点击立即体验注…

System Verilog学习笔记(十八)——线程控制

线程控制 发生器把激励传给代理时,环境类需要知道发生器什么时候完成任务,以便及时终止测试平台中还在运行的线程,这个过程就需要借助线程间的通信来完成。常用的线程间通信有事件控制、wait语句、SV信箱和旗语等。 Verilog对语句有两种分组…

LVGL如何创建页面并实现页面的切换

如何绘制一个页面 先搞清楚一个问题,那就是绘制一个页面,是直接创建一个新的屏幕,还是基于默认的屏幕创建一个一个的父类呢? 参考这篇文章 LVGL_多界面切换_lvgl 多页面建立-CSDN博客 可知通常是创建一个新的屏幕,每个…

洛谷P2233 公交车路线

本题题号特殊,相对简单。 题目描述 在长沙城新建的环城公路上一共有 88 个公交站,分别为 A、B、C、D、E、F、G、H。公共汽车只能够在相邻的两个公交站之间运行,因此你从某一个公交站到另外一个公交站往往要换几次车,例如从公交站…

Eclipse调试技巧 条件断点 监视

实验代码 import java.util.Scanner;public class Test {// 判断n是否为质数public static boolean isPrime(int n){if (n < 2)return false;for (int i 2; i < n; i){if (n % i 0)return false;}return true;}public static void main(String[] args){Scanner scanne…