当前位置: 首页 > news >正文

Cluade3干货:超越GPT,模型特点分析+使用教程|2024年3月更新

就在刚刚,Claude 发布了最新的大模型 Claude3,并且一次性发布了三个模型,分别是

  • Claude 3 Haiku:(日本俳句 )
  • Claude 3 Sonnet(英文十四行诗)
  • Claude 3 Opus(古典乐作品集)

其中他们的能力也是依次递进的,分别满足了不同人群的需求,官方对这三个模型的能力 评价用了一张图简单明了的表示出来了,简单理解 【haiku < sonnet < opus】,opus 直接用来对标 GPT4.

(ps.目前Claude3 的升级和 Openai 一样,都不支持国内用户使用信用卡支付,所以推荐大家可以试试用国内的虚拟银行卡 wildcard进行升级,我目前在用 GPT4,感兴趣的同学可以关注我的开通教程~ ChatGPT 3分钟升级 Plus快速教程

模型特点

这次一口气发布了三个模型,但是这三个模型都有下面几个能力,我们结合官方的一些例子进行说明

  • 图像识别能力
  • 响应速度非常快
  • 200K 的上下文窗口

图像识别

虽然 GPT4 也可以识别图像能力,但是可以从一个评测识别能力的榜单、以及官方演示视频可以看到,Cluade3 的表现很好,并且能够非常好的捕捉细节。

我们可以从下面的榜单看到,Claude3 Opus 的识别性能是和 GPT4V这个我们认为最厉害的视频/图片理解模型是相当的,并且在 「Science Diagrams」上大幅领先 GPT4V 。

个人感觉以后读论文,真的可以直接扔给 Cluade3 试试了,之前的识别无论是 GPT4 还是其他模型,对图表的能力都比较差,现在来看 Claude3 大概率做了不少功夫来优化

官网的例子中,他通过上网工具学会了看 us gdp 曲线,竟然能够理解,并且对接下来的 GDP 趋势做出预测和可视化描述,非常强大,而且最终的预测精度还是比较高的

Claude3 预测的例子:下面的图表完全通过 Claude3 的代码生成!

响应速度非常快

  • 目前 Haiku 模型可以在三秒内读取一篇 arxiv 的论文(10k token),并且是附带图片的论文(进一步说明了其图文理解的能力)
  • 相比于 2.1, Claude3 的模型比之前快了 2 倍以上

超大杯上下文

Claude3 会提供超过 20w 个上下文的窗口,并且【三个模型都可以接收 100w 的输入】!!!!

官网提出了一个名字叫「Needle In A Haystack」 的评测方法,用来衡量从一大堆语聊数据中准确提取相关文本的能力(ps:简单理解就是,只看和问题相关的信息,忽略不重要的信息)。

Claude3通过使用每个提示中的30个随机Needle/QUestion中的一个,并在一个多样化文档语料上进行测试,增强了这个基准的稳健性。

准确率最终可以达到 99%

img

评测指标全方面领先GPT4

官方列出了一张图表,分别从 编码,推理,数学,多语言,和文本理解上,基于现有的模型评测体系,全方面的和 GPT4进行了对比。

和我们之前国内某些厂商不同,之前的模型对比 GPT4 都是某个纬度的能力略胜或者接近 GPT4,但是从下表可以看出,**Cluade3 **的模型能力是「全面超越了 GPT4」,并且在数学问题上以及推理能力上做的非常好

如何使用

目前 Opus 和 Sonnet 都可以在官网使用了!Home \ Anthropic

但是 Opus,和 GPT plus 一样,收费是 20 美元/月

image-20240305032016229

目前Claude3 的升级和 Openai 一样,都不支持国内用户使用信用卡支付,所以我推荐大家可以试试用国内的虚拟银行卡 wildcard进行升级,我目前在用 GPT4,感兴趣的同学可以关注我的开通教程~ ChatGPT 3分钟升级 Plus快速教程

特点

  • 支付安全:支持支付宝和银联支付
  • 支持的服务非常齐全,支持 onlyfans, chatgpt,midjourney 的充值
  • 快速响应:右下角人工客服快速响应,客服回复比较及时
  • 网络优化:最近还推出了专门进行openai访问的浏览器

相关文章:

  • 数据库之Oracle数据导入导出
  • 99.qt qml-单例程序实现
  • 开发Chrome扩展插件
  • 【golang】二叉树的遍历
  • 基于cnn卷积神经网络的车辆颜色检测识别-图像去雾-图像去雨(改进yolo目标检测-附代码)
  • 短视频矩阵系统----矩阵系统源码搭建(技术门槛?)
  • 【JavaEE初阶】 JVM类加载简介
  • 第四届信息通信与软件工程国际会议(ICICSE 2024)即将召开!
  • 【金三银四的季节看下Java ORM的走向和性能对比】总结
  • SQL学习十八~十九
  • 用WSGI发布flask到centos7.9
  • 20240307-2-前端开发校招面试问题整理HTML
  • 初学者如何使用QT新建一个包含UI界面的C++项目
  • 数据结构——lesson7二叉树 堆的介绍与实现
  • 【工具】Raycast – Mac提效工具
  • Apache Zeppelin在Apache Trafodion上的可视化
  • Date型的使用
  • magento 货币换算
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • react-native 安卓真机环境搭建
  • React-Native - 收藏集 - 掘金
  • Vue 重置组件到初始状态
  • vue-loader 源码解析系列之 selector
  • Vue官网教程学习过程中值得记录的一些事情
  • win10下安装mysql5.7
  • 代理模式
  • 官方解决所有 npm 全局安装权限问题
  • 基于webpack 的 vue 多页架构
  • 马上搞懂 GeoJSON
  • 巧用 TypeScript (一)
  • 事件委托的小应用
  • 字符串匹配基础上
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • [Shell 脚本] 备份网站文件至OSS服务(纯shell脚本无sdk) ...
  • Salesforce和SAP Netweaver里数据库表的元数据设计
  • Spark2.4.0源码分析之WorldCount 默认shuffling并行度为200(九) ...
  • #数学建模# 线性规划问题的Matlab求解
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (12)目标检测_SSD基于pytorch搭建代码
  • (2)关于RabbitMq 的 Topic Exchange 主题交换机
  • (Bean工厂的后处理器入门)学习Spring的第七天
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (板子)A* astar算法,AcWing第k短路+八数码 带注释
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (十一)JAVA springboot ssm b2b2c多用户商城系统源码:服务网关Zuul高级篇
  • (转)Oracle 9i 数据库设计指引全集(1)
  • .Net CoreRabbitMQ消息存储可靠机制
  • .NET 除了用 Task 之外,如何自己写一个可以 await 的对象?
  • .Net 中Partitioner static与dynamic的性能对比
  • .NET/MSBuild 中的发布路径在哪里呢?如何在扩展编译的时候修改发布路径中的文件呢?
  • .NET程序员迈向卓越的必由之路
  • .net开发时的诡异问题,button的onclick事件无效
  • .NET设计模式(2):单件模式(Singleton Pattern)
  • @SentinelResource详解