大数据产业创新服务媒体
——聚焦数据 · 改变商业
关于字节跳动有一个所有人都知道的秘密,那就是他们正在想方设法地海外扩张,以全球市场来驱动企业的新增长。美国曾经是字节跳动的第二战场,但是随着华盛顿相关法案的出台,在各种不可抗力的干扰下,字节跳动被迫转向新的战场。目前,字节跳动瞄准了东南亚。
根据亚洲开发银行(ADB)2023年9月的《亚洲发展展望》预测,2023年东南亚地区GDP增速预计为4.6%,较2022年的5.6%有所下降,但仍高于全球3.0%、发达经济体1.5%、新兴与发展中经济体4.0%的增长预期。根据东盟主要经济体公布的最新数据,2023年印度尼西亚经济增长5.05%,越南经济增长5.05%,马来西亚经济增速为3.7%,泰国经济增长1.9%,新加坡经济增长1.1%,柬埔寨经济增速为5.6%。
同一时间,东盟国家同意加快启动DEFA的谈判,以促进数字贸易、跨境电子商务、网络安全和数字支付等领域的发展。旨在将东盟建设为一个由安全和变革性的数字服务、技术和生态系统支持的领先数字社区和经济集团。
此前,字节跳动在东南亚的扩张主要集中在电商领域,特别是通过其旗下平台TikTok。2023年,TikTok电商在东南亚市场取得了显著成绩,其全球商品交易总额(GMV)目标定在500亿美元,其中东南亚市场占据了重要份额。在东南亚的主要市场中,印尼、泰国、越南、菲律宾和马来西亚的GMV占比分别高达28%、22%、17%、12%和11%。
但是字节也感受到了压力与制裁,比如2023年9月底,印尼政府出台了新的电商规定,禁止社交媒体平台直接进行商品销售和交易,这直接影响了像TikTok Shop这样的平台。这些变化导致TikTok Shop等平台需要转型,推出独立的电商App来维持其电商交易业务。
在这样的大背景下,豆包,成为了字节跳动在东南亚扩张的新办法。
豆包的战略是什么?
6月11日,字节跳动计划在马来西亚投资约24亿美元用于扩建其数据中心和人工智能中心。这一投资计划预计将帮助马来西亚在2025年实现数字经济占GDP的22.6%。字节跳动计划投资100亿林吉特(约合21亿美元)在马来西亚建立一个区域人工智能中心,并额外追加15亿林吉特投资扩建其在马来西亚柔佛州的现有数据中心设施。
数据中心的落成,是大模型在当地的算力供给,并赋能于豆包。数据中兴能提高数据处理的效率,在海量的数据中,豆包大模型能够快速地找到有价值的信息,为用户提供更加精准的推荐和预测服务。同时,数据中心还能够提供强大的存储能力,保障数据的安全和可靠。
另外一方面,大模型团队也可以吸纳精通当地语言的开发人员。从技术上来说,大语言模型有很强的地缘性。这个语言越接近于开发大模型所用的语言,那么大模型生成的效果就会越好。东南亚是一个语言多样性极其丰富的地区,拥有数百种语言。这些语言分属于不同的语系,主要包括南岛语系、汉藏语系、 Austroasiatic(澳斯特罗-亚细亚语系)、以及印度-雅利安语系等。因此,从开发角度来说,非常需要熟悉当地语言的开发者。
这里也解释了标题种的“杨枝甘露”。杨枝甘露这种饮料使用芒果、西米、椰奶制成,这些材料都源自于东南亚。但杨枝甘露的发明人来自于中国香港的一家餐厅,杨枝甘露这道饮品,正是这家餐厅为了向东南亚进军而开发的。
2023年年末,在Hugging Face上有一个非常火的模型,叫做sailor。这是由SEA.AI开发,专门服务于印尼语、泰语、越南语、马来语、老挝语、英语和中文,这七种东南亚特色语言的大模型。其目的显而易见,依然是为了抢占东南亚市场。
无独有偶,看上东南亚这块风水宝地的可不只有字节跳动。
自从2024年微软撤离中国后,这家公司就计划在东南亚地区,包括泰国、印度尼西亚和马来西亚,投资建设新的数据中心和人工智能基础设施。这些投资的总金额接近50亿美元,其中在印度尼西亚的投资达到17亿美元,在泰国的投资约为10亿美元,在马来西亚的投资约为22亿美元。
微软在泰国的数据中心是其在该地区建设的首个数据中心,位于泰国东部经济走廊(EEC),投资估计为10亿美元。这个数据中心将成为全球约300个微软数据中心之一,并计划为泰国超过10万人提供人工智能技能培训机会。
谷歌则是承诺在马来西亚投资20亿美元,用于在该地区建设谷歌首个东南亚数据中心,同时将谷歌云业务铺设到整个东南亚。
字节多少胜算?
虽然从战略投资层面来看,谷歌、微软、字节,他们三家干的事情一模一样,不过细分业务就不难发现,三者之间可以说是毫无关联。其实只要业务不会发生正面冲突,盖楼拿地之间也不会存在竞争。
由于TikTok的成功,字节可以将其策略复制到豆包上。最直接有效的方式就是翻译。在多语言环境中,豆包大模型可以提供高效的语言翻译服务,帮助TikTok等平台更好地服务于不同语言的用户群体。这项业务可以说是为东南亚环境量身定做的。
第二点则是广告优化。在TikTok等平台上,豆包大模型可以帮助广告商更精准地定位潜在客户,通过分析用户数据来优化广告投放策略,提高广告效果和投资回报率。
最后一点是用户行为预测。通过分析用户的行为模式,豆包大模型可以预测用户的潜在兴趣和需求,从而提前调整内容策略,以提高用户参与度和平台粘性。这样的做法有助于改善字节跳动接下来在东南亚的扩张方式。
张一鸣本人目前已经移居到了新加坡,一方面他是为了享受热带雨林气候,作为胡润富豪榜排行白手起家的富豪排行第二名,张一鸣有权利放纵一下自己。但是另一方面,居住在当地,能够更敏锐地察觉东南亚市场环境的变化。被字节跳动收购的PICO员工就曾表示:“从今年10月份开始,负责人经常来到新加坡向张一鸣汇报工作。”
世界上,字节跳动真正要担心的,是国内同行们的厮杀。豆包并非国内大模型种性能最优越的,因此一旦国内友商同样进军东南亚,就免不了一场声势浩大的围追堵截。
国内大模型厂商普遍喜欢卷价格、卷上下文窗口,相互之间的竞争非常激励,“你死我活”成为常态。然而东南亚整体环境则和国内完全相反,不仅不卷,节奏还非常缓慢。例如在马来西亚,标准工作时间通常是每周44小时,超过这个时间通常需要支付加班费。但实际上,马来西亚每周能做满44个工时的企业并不多见。当地男性雇员的平均月薪约为3085林吉特,女性雇员为2968林吉特,合人民币约为4700多块钱。
诚然,东南亚各国的平均教育水平确实不如中国,对于AI这种高新技术行业来说这点不太友好,然而马来西亚和新加坡也有一些排名靠前的学府。马来亚大学在2022年QS世界大学排名中位列第65位,亚洲地区大学排名第8位,而新加坡国立大学和南洋理工大学在2021年QS世界大学排名中分别位列全球第11名和第13名。
综合看下来就AI行业而言,对各大企业来收还是存在一些挑战的。东南亚对于母语是英语或者汉语的人来说都是宜居的,也就意味着字节跳动可以从国内派遣一些开发者以及管理者,部署在当地,以维持数据中心的运作。
除了大模型之外,字节跳动还在东南亚测试“创作者市场”,以促进内容创作者和品牌之间的协作,并吸引该地区的中小型企业在其平台上投放广告。而该企业也在向新加坡政府申请数字银行许可证,未来可能会开展金融科技相关产品。
字节在东南亚的布局是多元化的,不会把所有鸡蛋都放在同一个篮子里。豆包可以赋能并连接所有的业务,这正是其重要性的体现。
文:火焰翼人 / 数据猿
责编:凝视深空 / 数据猿