前言
2024年5月14日凌晨,OpenAI发布最新多模态大模型 GPT-4o。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话中的响应时间相似。
知名大模型
OpenAI在全能大模型这一块,真是独一档的存在.
常用的大模型
最初,免费阶段用的是CHAT-GPT3.
如今,本人常用的大模型有通义千问(编程方面)和豆包(查资料挺靠谱的).我还试过让女儿和豆包聊天,挺有趣的.因此,个人还挺推崇豆包的聊天功能.
豆包的应用有哪些?
豆包的应用场景广泛,可以根据用户的不同需求和情境,提供多样化的帮助和服务。
- 知识解答:回答用户关于历史、科学、技术、文化、艺术等各种领域的问题,提供准确和详细的信息。
- 例如,用户询问“唐朝的政治制度有哪些特点”,豆包可以详细阐述三省六部制等内容。
- 语言学习:帮助用户学习和提高语言能力,包括语法、词汇、翻译、写作技巧等。
- 比如,为用户修改英语作文,指出语法错误并提供改进建议。
- 文本创作:协助用户进行文案写作,如广告文案、故事创作、诗歌写作等,提供创意和灵感。
- 比如,为用户构思一篇产品推广的广告文案。
- 日常交流:作为聊天伙伴,倾听用户的想法、感受和经历,提供陪伴和支持。
- 当用户分享自己的一天时,给予回应和交流。
- 工作辅助:在工作中,协助撰写报告、总结、策划方案等,提高工作效率。
- 比如,为用户生成一份项目策划的框架。
- 决策参考:在面临选择和决策时,通过分析利弊,为用户提供参考意见。
- 比如,用户纠结选择两个工作机会时,帮忙梳理每个选择的优缺点。
总结
大模型的发展日新月异. 国内的大模型随着资源的投入,将缩小与OpenAI的大模型之间的差距.
豆包的使用体验已经很不错了,查资料和对话的功能就靠谱的.相比较之下,这两个通过安装插件就可以直接使用,太方便了.