清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

news2024/11/19 14:31:40

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。

在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。

图片

图片

这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。

接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。

靠AI造字赚钱,提速10倍以上

首先,什么是字体生产?在传统的字体生产流程中,设计师通常需要手写完成整套字体的制作(最多近3万个字)。初稿完成后,还需逐字校对,这个过程往往需要数月,带来不小的成本开销。此外,由于依赖人工操作,字体的质量和风格一致性也难以保证。

正是在与客户交流时,图形起源团队发现了这一行业痛点,经过数月的研发,打造了一条全新的AI字体生产线。

但这不是简单套用大模型就能解决的。字体设计最大的挑战在于,它是一种矢量图形,能够在放大时保持清晰度。而现有的AI图像生成通常是位图,受像素限制。如何让AI生成矢量图,并理解字体的锚点和矢量曲线的含义,是其中的技术难点。

创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

首先,使用传统的扩散模型生成位图;
接着,利用超分辨率模型将位图分辨率提升到最高;
然后,通过一种独特的算法,让AI理解“优质矢量设计”的标准,并基于这一标准优化模型,将位图转化为矢量图;
最后,训练一个专门用于检查错别字和字形结构的模型。

此外,他们还计划开发笔画拆分模型,进一步提升精度。

基于这些技术,他们实现了超越人类的效率和质量。例如,通过AI超分技术和AI矢量化处理,字体的细节在各种尺寸下都保持清晰,设计师可以在海报等大幅面场景中自如应用。

图片

客户只需制作前199个字,AI便能在两天内生成数万个字,并且不局限于简体,还包括繁体字、生僻字、以及日文、韩文、拉丁字母等多种语言文字。

在准确度方面,简单字形(笔画少于15)单次生成的错误率低于1%,复杂字形(笔画多于15)错误率也不到5%,远高于人工审校的水平。

目前,他们还打造了一个SaaS平台,整个交付过程可以在线完成,客户可以随时查看进度,甚至自己完成字体的生产过程,无需图形起源的人工干预。

据透露,目前他们已经生成了346套字体,累计4680244个字。

来自图形起源

图形起源成立于2020年底,由清华大学车辆学院毕业生史海天在硕士休学期间创办。在此之前,他们主要研发3D创作引擎,并完成了三轮融资,获得了五源资本和真格基金等机构的支持。彼时,他们的愿景是打造一个大众化的3D内容创作工具及社交平台。

如今,大模型技术的突破为他们带来了全新的机遇。通过大量资金和时间的投入,图形起源最终成功训练了两个大模型——一个用于识别,另一个用于生成,其目标是让AI生成的字体与人工设计难以区分。

字体行业的一个优势在于,数据相对齐全。例如,AI可以从一套字形中学习一半字,进而生成剩余的部分。如今,他们已经达到了商用交付的水平,每周可完成超过40套字体的交付,效率提升了数百倍。

当前的主营业务

图形起源的业务主要集中在两个方面:

图片

中文字库扩展:客户提供参考字体文件后,图形起源的AI会进行学习,生成风格统一的字形,整个过程在SaaS平台上进行。平台还支持人工校对、二次学习、批量生成等功能,以进一步降低错字率。

图片

跨语种风格迁移:他们的AI能够根据任意语种的字体生成其他语种的字形。目前支持中日韩、拉丁字母、希腊字母等,且已在小米应用商店销售。藏文、阿拉伯文等小语种也在测试中。

尽管大厂们在生产力领域激烈竞争,但在具体的细分场景下,创业公司往往可以找到更为灵活的切入点。图形起源在字体和排版等强需求领域的成功就是一个例子。

大模型应用的关键在于能否解决实际问题,而图形起源已经用他们的创新回答了这一命题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2200044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网站优化门槛低了还是高了?

自从2015年刚接触网站时,从一无所知到现在无人指导,一直跌跌撞撞走过来,当年花了1500元找了广东一个网友用织梦CMS做了一个门户网站,记得那时一星期没下楼,把网站折腾的千疮百孔,而终逐步熟悉网站建设与搜索…

手机怎样改网络ip地址?内容详尽实用

随着网络技术的发展,更改手机IP地址已成为一种常见需求。本文将详细介绍如何在不同网络环境下更改手机IP地址,包括移动网络和WiFi网络,以及同时适用于两种网络的方法,内容详尽实用,干货满满。 一、适用于移动网络&…

sentinel微服务部署

一.启动nacos和redis 1.查看是否有nacos和redis docker ps -a2.启动nacos和redis docker start nacos docker start redis-6379 docker ps 二.使用openfeign项目 这里看我另一个博客OpenFeign微服务部署-CSDN博客,我把SpringSessiondemo复制后改为sentinel1…

钡铼技术R10工业4G路由在智能交通中的应用

随着物联网技术的迅猛发展,智能交通系统(Intelligent Transportation System, ITS)正逐渐成为现代城市交通管理的重要组成部分。智能交通系统通过集成先进的信息技术、通信技术、传感技术以及计算机处理技术,实现对交通信息的实时…

抖店API接口系列(商品详情数据),Json数据格式参考

抖店API接口系列中的商品详情数据接口允许第三方应用通过编程方式访问抖音小店的商品数据。这些数据通常包括商品的基本信息、价格、库存、用户评价等,并且会以JSON数据格式返回。以下是一个抖店商品详情数据JSON格式的参考示例: { "status":…

共享购模式:绿色积分引领消费新潮流

绿色消费浪潮席卷全球,绿色积分作为一种创新的激励机制,正受到越来越多消费者的青睐。在众多消费模式中,共享购模式凭借独特的绿色积分体系,不仅推动了绿色消费,还为消费者带来了更多实惠与额外收益,成为市…

解数独Python

怎样解数独? Python def setBoardFunc(puz): global grid print("Original Sudoku") for i in range(0, len(puz), 9): row puz[i:i9] temp [] for block in row: temp.append(int(block)) g…

简单理解程序地址空间:Linux 中的内存映射与页表解析

ps: Linux操作系统对于程序地址,物理地址的处理,对于源码,我也看不大懂,只是截取当我们进程发生正常缺页中断的时候的调用情况。本文中所有的源码都是进行截取过的,如果大家感兴趣可以去下载源码。 在Linux 操作系统 …

【Linux】wsl2安装ubuntu并移动安装位置

本文首发于 ❄️慕雪的寒舍 1.启用wsl 首先是启用你的wsl,参考本站wsl安装centos8中的教程; 启用wsl后,更新一下,并设置版本为2; wsl --update wsl --set-default-version 2 # 设置wsl版本为2,不然可能安装失败2.安…

【FPGA开发】Modelsim仿真精度的坑

问题所在 最近在使用黑金的AXU3EG板卡对着正点原子ZYNQ7020的例程进行移植学习。但在编写tb代码以及使用modelsim进行仿真时出了问题,发现我的实际波形与正点的对不上,仔细测量一下波形发现,我的系统时钟是6ns周期,而不是理想中的…

某象异形滑块99%准确率方案

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路 如有侵犯,请联系作者下架 该文章模型已经上线ocr识别网站,欢迎测试!!,地址:https://yxlocr.windy-rain.cn/ocr/slider/6 所谓的顶象异形滑块,是指没有采用常规的缺口,使用各种形状的…

20.安卓逆向-frida基础-hook分析调试技巧2-hookDES

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:图灵Python学院 本人写的内容纯属胡编乱造,全都是合成造假,仅仅只是为了娱乐,请不要盲目相信。 工…

MEMS 课本习题(1)

Chapter 5 Lump Modeling 为了将机械系统转换为等效电路,我们需要将各个机械元件转换为相应的电气元件。以下是机械元件和其电气等效元件的对照关系: 质量(m) - 转换为 电感(L)弹簧(k&#xff…

SD入门教程一:Stable Diffusion 基础(技术篇)

前言 在开篇的时候就大致讲了SD和VAE,那么今天我们具象化地再来讲讲Stable Diffusion(稳定扩散)。 严格说来它是一个由几个组件(模型)构成的系统,而非单独的一个模型。我以最常见的文生图为例,…

PCL 计算3DSC并可视化

目录 一、概述 1.1原理 1.2实现步骤 1.3应用场景 二、代码实现 2.1关键函数 2.1.1 法线计算 2.1.2 3DSC特征计算 2.1.3 可视化3DSC直方图 2.2完整代码 三、实现效果 PCL点云算法汇总及实战案例汇总的目录地址链接: PCL点云算法与项目实战案例汇总&#…

【C++】——继承【上】

P. S.:以下代码均在VS2019环境下测试,不代表所有编译器均可通过。 P. S.:测试代码均未展示头文件stdio.h的声明,使用时请自行添加。 博主主页:Yan. yan.                        …

MPLS解决BGP路由黑洞问题

文章目录 MPLS应用实验实验配置 MPLS应用实验 实验目的:解决BGP中IBGP邻居之间存在的问题 MPLS解决BGP路由黑洞问题实验 配置完基本的MPLS和BGP操作之后,只有R2和R5上面有两个私网的路由,中间的设备没有私网路由,这时候默认还是走…

Linux源码阅读笔记-USB驱动分析

基础层次详解 通用串行总线(USB)主要用于连接主机和外部设备(协调主机和设备之间的通讯),USB 设备不能主动向主机发送数据。USB 总线采用拓扑(树形),主机侧和设备侧的 USB 控制器&a…

IT招聘乱象的全面分析

近年来,IT行业的招聘要求似乎越来越苛刻,甚至有些不切实际。许多企业在招聘时,不仅要求前端工程师具备UI设计能力,还希望后端工程师精通K8S服务器运维,更有甚至希望研发经理掌握所有前后端框架和最新开发技术。这种招聘…

RAG测评关键指标

解读RAG测评:关键指标与应用分析 ©作者|CodeDan 来源|神州问学 一、RAG介绍 1.1 简介 RAG(Retrieval-Augmented Generation)是一种结合信息检索与文本生成的技术,旨在提高大型语言模型(LLM)在回答复…