年
度
回
顾
- Jina AI -
2023 年,正如它所对应的生肖“兔”,充满活力和智慧。AI 技术在全球范围内的颠覆性发展,让 2023 年成为大家公认的人工智能元年。作为从四年前成立起,就专注于多模态 AI 技术研发的前沿科技公司,我们在 2023 年取得了长足的进展。在这辞旧迎新之际,我们希望通过回顾过去一年在技术、产品、品牌、社区方面积累的成果,和大家一起迎接充满力量和希望的龙年!
从 2020 年成立起,“开源”就存在于我们的 DNA 中。我们始终坚信开源技术之于创新、合作与社区力量的催化作用。时间来到 2023 年,在 GitHub 上,我们关注者数量达到了 50,000 人,Jina AI 已经成为开源社区中不可忽视的力量。
在 2022 年 11 月,我们正式将 DocArray 项目捐赠给 Linux 基金会,以打造一个中立、包容和通用的标准多模态数据模型。经由过去一年的发展,DocArray 将在本月迎来它的毕业季。
在培育开源社区文化的道路上,我们步履不停。2023 年,我们成为 Google Summer of Code(GSoC)项目的官方指导组织之一。GSoC 是一个全球性的在线指导计划,专注于为开源软件开发引入新的贡献者。在该项目中,我们发布的开源项目任务收到了近百份来自世界各地年轻开发者的积极申请和贡献,其中不乏来自中国的开发者们,他们的激情和才华为 Jina AI 开发者社区注入了新的活力。
2023 年底,思否技术社区发布围绕“开发者关系”主题的年度问卷,最后一道开放问答让大家自由填写年度印象最深刻的开发者社区。我们欣喜地发现,在调研结果的词云图里,Jina AI 作为为数不多的初创公司,与众多知名企业并肩,收获到了相当多的关注和好感,这是对我们技术实力和社区影响力的双重肯定。
2023年伊始,我们就敏锐的察觉到了“从生成式 AI 到 AI 生产力”这一变革所带来的机遇,并基于提示词工程在与大型语言模型(LLM)交流中日益显现的重要性,确立了我们的目标是引领这场技术变革,通过精通“提示词”这种新兴的“语言”,让先进的人工智能变得更加易于理解和应用。
于是,我们陆续在 2023 年推出了面向全球用户的提示词优化工具 PromptPerfect,图片内容文字解析及文案生产工具 SceneXplain,分析决策助手 Rationale,多模态互动 AI 助手 JinaChat 等一系列创新工具,这些工具已经惠及超过 400,000 名用户受益,满足了各式各样的业务需求。在过去一年的实践中,我们的工具通过方便的网页端入口和API接口,被广大用户和企业应用于内容创意、市场营销、咨询分析、产品开发等场景中,从而将AI作为生产力的价值落实到真实的业务里,体现在降本增效的工作路径中。
为了让大家能够第一时间感受到 AI 所带来的变革,我们在 2023 年发起了更为丰富的社区活动。我们先后在深圳、上海举办 Office Hours,组织工程师与社区用户面对面,分享最新的技术进展;在 2023 年 6 月份,作为技术合作伙伴,我们联合思否技术社区举办了 SegmentFault AI Hackathon,30 支参赛队伍中的28 支队伍自主选择使用了 Jina AIGC 装备加持,顺利完成了比赛;10 月份,我们组织了 PromptPerfect Agenthon 大赛,鼓励大家用 PromptPerfect 搭建属于自己的西部世界,活动发布当天就收到了社区的热烈反馈和参与;最近,我们先后举办了 PromptPerfect、SceneXplain 研讨会等活动,给大家带来更多实操案例和教程。
<<< 左右滑动见更多 >>>
2023 年的下半年,我们发布了自主研发的第二代文本向量模型系列:jina-embeddings-v2,这是 全球首个支持 8k 输入长度的开源向量模型系列,性能比肩 OpenAI 的商业闭源向量模型 ada002。自发布以来,该模型下载量已突破百万。 我们还拓展了中英双语、德英双语两款 8k 向量模型,并同步推出了 Embedding API。
Jina Embeddings 在业界和学术界都受到了高度评价。
我们的向量模型发布之后,得到了行业伙伴的广泛认可,被认为是构建 RAG 应用的优选向量模型。在短短的两个月内,数十家技术公司将我们的向量模型进行了集成。
🔗https://jina.ai/embeddings/
在业界,LLamaIndex 对于构建 RAG 系统所使用的最佳向量模型进行了专业评估。我们的开源模型 jina-embeddings-v2 荣获冠军,表现优于 Cohere 最新发布的闭源模型 Embed v3 以及 OpenAI 的经典闭源模型 ada002。这次评估结果进一步证明了我们在向量模型领域的专业领先地位。
在学术界,Jina Embeddings 论文被选入 EMNLP 顶会,EMNLP 是自然语言处理和人工智能领域的顶级会议,与 ACL 和 NAACL 并列为该领域的三大会议。我们受邀在 EMNLP 2023 会议现场展示我们的研究成果,并组织了向量模型茶话会。
<<< 左右滑动见更多 >>>
在分享前沿洞见方面,Jina AI 始终保持着开放与进取的姿态。2023 年,我们累计发表了 160 篇深入的技术博客,这些文章都是我们团队对技术的深入思考和探索。不仅如此,我们的创始人和资深工程师们还活跃在各大重要会议上,如 WAIC 人工智能大会、AWS 年度大会、Slush大会、EMNLP 以及 CVPR 等,与同行们交流并分享我们的专业知识与实践经验。
今年我们还获得了多项行业奖项的认可,这些荣誉不仅是对我们过去努力的肯定,也是对我们未来发展的鼓舞。无论是在国内的还是国际的舞台上,我们都积极展示了自己的创新成果,用实际行动持续为多模态 AI 领域的发展贡献力量,证明了我们推动该领域进步的坚定决心。
据美国知名市场调研公司 GrandView Research 发布的报告显示*,2023 年全球多模态 AI 市场规模已达 13.4 亿美元,并预计在未来几年内将以 35.8%的复合年增长率增长。报告中提到,Jina AI 与多家巨头企业共同位列市场领先者行列,引领着行业的趋势与发展。
Jina AI 的愿景是铺设通往多模态 AI 的未来之路。我们明确认识到,现存的机器学习与软件生态在处理多模态 AI 时的种种难题。回顾 2023 年,Jina AI 持续创新,与社区紧密合作,我们的技术不仅解决了行业面临的关键挑战,也为用户创造了巨大的价值。
未来,我们将全心全意研发前沿工具与平台,通过创新的向量模型和提示词技术,引领多模态 AI 的发展,助企业与开发者破茧成蝶。我们梦想成为助推全球挖掘多模态 AI 潜能,并彻底改变信息解读与交互方式的关键力量。
新春佳节之际!
Jina AI 龙年专属红包封面到!
祝您龙腾虎跃,龙马精神!
龙年行大运!
*资料来源:https://www.grandviewresearch.com/industry-analysis/multimodal-artificial-intelligence-ai-market-report