字节跳动的丝绸之路,豆包或将成为赛博“杨枝甘露”

news2024/11/27 21:05:15

4127b709c0617d54c9823d67b75407f7.png

bda2e74a3d642ef0ea0de6c0dcd6316b.png

0d5df55a37547d66d6c80c1804f7664e.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


关于字节跳动有一个所有人都知道的秘密,那就是他们正在想方设法地海外扩张,以全球市场来驱动企业的新增长。美国曾经是字节跳动的第二战场,但是随着华盛顿相关法案的出台,在各种不可抗力的干扰下,字节跳动被迫转向新的战场。目前,字节跳动瞄准了东南亚。

根据亚洲开发银行(ADB)2023年9月的《亚洲发展展望》预测,2023年东南亚地区GDP增速预计为4.6%,较2022年的5.6%有所下降,但仍高于全球3.0%、发达经济体1.5%、新兴与发展中经济体4.0%的增长预期。根据东盟主要经济体公布的最新数据,2023年印度尼西亚经济增长5.05%,越南经济增长5.05%,马来西亚经济增速为3.7%,泰国经济增长1.9%,新加坡经济增长1.1%,柬埔寨经济增速为5.6%。

同一时间,东盟国家同意加快启动DEFA的谈判,以促进数字贸易、跨境电子商务、网络安全和数字支付等领域的发展。旨在将东盟建设为一个由安全和变革性的数字服务、技术和生态系统支持的领先数字社区和经济集团。

此前,字节跳动在东南亚的扩张主要集中在电商领域,特别是通过其旗下平台TikTok。2023年,TikTok电商在东南亚市场取得了显著成绩,其全球商品交易总额(GMV)目标定在500亿美元,其中东南亚市场占据了重要份额。在东南亚的主要市场中,印尼、泰国、越南、菲律宾和马来西亚的GMV占比分别高达28%、22%、17%、12%和11%。

但是字节也感受到了压力与制裁,比如2023年9月底,印尼政府出台了新的电商规定,禁止社交媒体平台直接进行商品销售和交易,这直接影响了像TikTok Shop这样的平台。这些变化导致TikTok Shop等平台需要转型,推出独立的电商App来维持其电商交易业务。

在这样的大背景下,豆包,成为了字节跳动在东南亚扩张的新办法。

豆包的战略是什么?

6月11日,字节跳动计划在马来西亚投资约24亿美元用于扩建其数据中心和人工智能中心。这一投资计划预计将帮助马来西亚在2025年实现数字经济占GDP的22.6%。字节跳动计划投资100亿林吉特(约合21亿美元)在马来西亚建立一个区域人工智能中心,并额外追加15亿林吉特投资扩建其在马来西亚柔佛州的现有数据中心设施。

数据中心的落成,是大模型在当地的算力供给,并赋能于豆包。数据中兴能提高数据处理的效率,在海量的数据中,豆包大模型能够快速地找到有价值的信息,为用户提供更加精准的推荐和预测服务。同时,数据中心还能够提供强大的存储能力,保障数据的安全和可靠。

另外一方面,大模型团队也可以吸纳精通当地语言的开发人员。从技术上来说,大语言模型有很强的地缘性。这个语言越接近于开发大模型所用的语言,那么大模型生成的效果就会越好。东南亚是一个语言多样性极其丰富的地区,拥有数百种语言。这些语言分属于不同的语系,主要包括南岛语系、汉藏语系、 Austroasiatic(澳斯特罗-亚细亚语系)、以及印度-雅利安语系等。因此,从开发角度来说,非常需要熟悉当地语言的开发者。

这里也解释了标题种的“杨枝甘露”。杨枝甘露这种饮料使用芒果、西米、椰奶制成,这些材料都源自于东南亚。但杨枝甘露的发明人来自于中国香港的一家餐厅,杨枝甘露这道饮品,正是这家餐厅为了向东南亚进军而开发的。

2023年年末,在Hugging Face上有一个非常火的模型,叫做sailor。这是由SEA.AI开发,专门服务于印尼语、泰语、越南语、马来语、老挝语、英语和中文,这七种东南亚特色语言的大模型。其目的显而易见,依然是为了抢占东南亚市场。

无独有偶,看上东南亚这块风水宝地的可不只有字节跳动。

自从2024年微软撤离中国后,这家公司就计划在东南亚地区,包括泰国、印度尼西亚和马来西亚,投资建设新的数据中心和人工智能基础设施。这些投资的总金额接近50亿美元,其中在印度尼西亚的投资达到17亿美元,在泰国的投资约为10亿美元,在马来西亚的投资约为22亿美元。

微软在泰国的数据中心是其在该地区建设的首个数据中心,位于泰国东部经济走廊(EEC),投资估计为10亿美元。这个数据中心将成为全球约300个微软数据中心之一,并计划为泰国超过10万人提供人工智能技能培训机会。

谷歌则是承诺在马来西亚投资20亿美元,用于在该地区建设谷歌首个东南亚数据中心,同时将谷歌云业务铺设到整个东南亚。

字节多少胜算?

虽然从战略投资层面来看,谷歌、微软、字节,他们三家干的事情一模一样,不过细分业务就不难发现,三者之间可以说是毫无关联。其实只要业务不会发生正面冲突,盖楼拿地之间也不会存在竞争。

由于TikTok的成功,字节可以将其策略复制到豆包上。最直接有效的方式就是翻译。在多语言环境中,豆包大模型可以提供高效的语言翻译服务,帮助TikTok等平台更好地服务于不同语言的用户群体。这项业务可以说是为东南亚环境量身定做的。

第二点则是广告优化。在TikTok等平台上,豆包大模型可以帮助广告商更精准地定位潜在客户,通过分析用户数据来优化广告投放策略,提高广告效果和投资回报率。

最后一点是用户行为预测。通过分析用户的行为模式,豆包大模型可以预测用户的潜在兴趣和需求,从而提前调整内容策略,以提高用户参与度和平台粘性。这样的做法有助于改善字节跳动接下来在东南亚的扩张方式。

张一鸣本人目前已经移居到了新加坡,一方面他是为了享受热带雨林气候,作为胡润富豪榜排行白手起家的富豪排行第二名,张一鸣有权利放纵一下自己。但是另一方面,居住在当地,能够更敏锐地察觉东南亚市场环境的变化。被字节跳动收购的PICO员工就曾表示:“从今年10月份开始,负责人经常来到新加坡向张一鸣汇报工作。”

世界上,字节跳动真正要担心的,是国内同行们的厮杀。豆包并非国内大模型种性能最优越的,因此一旦国内友商同样进军东南亚,就免不了一场声势浩大的围追堵截。

国内大模型厂商普遍喜欢卷价格、卷上下文窗口,相互之间的竞争非常激励,“你死我活”成为常态。然而东南亚整体环境则和国内完全相反,不仅不卷,节奏还非常缓慢。例如在马来西亚,标准工作时间通常是每周44小时,超过这个时间通常需要支付加班费。但实际上,马来西亚每周能做满44个工时的企业并不多见。当地男性雇员的平均月薪约为3085林吉特,女性雇员为2968林吉特,合人民币约为4700多块钱。

诚然,东南亚各国的平均教育水平确实不如中国,对于AI这种高新技术行业来说这点不太友好,然而马来西亚和新加坡也有一些排名靠前的学府。马来亚大学在2022年QS世界大学排名中位列第65位,亚洲地区大学排名第8位,而新加坡国立大学和南洋理工大学在2021年QS世界大学排名中分别位列全球第11名和第13名。

综合看下来就AI行业而言,对各大企业来收还是存在一些挑战的。东南亚对于母语是英语或者汉语的人来说都是宜居的,也就意味着字节跳动可以从国内派遣一些开发者以及管理者,部署在当地,以维持数据中心的运作。

除了大模型之外,字节跳动还在东南亚测试“创作者市场”,以促进内容创作者和品牌之间的协作,并吸引该地区的中小型企业在其平台上投放广告。而该企业也在向新加坡政府申请数字银行许可证,未来可能会开展金融科技相关产品。

字节在东南亚的布局是多元化的,不会把所有鸡蛋都放在同一个篮子里。豆包可以赋能并连接所有的业务,这正是其重要性的体现。

文:火焰翼人 / 数据猿
责编:凝视深空 / 数据猿

13480781d690d5922e958d0b1abfe7cb.jpeg

4f3b0c413c47eaa1aa0880529e1b5f3b.png

926110737bb2c44fb87ae2cc14abc411.png

0c2e51f8cf57690c12de79bbbf0b312e.jpeg

0e0f8462e70982ad10b85a39e2e8ac10.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1845078.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

推荐5个AI辅助生成论文、降低查重率的网站【2024最新】

一、引言 对于忙碌的学生来说,毕业论文通常是一项艰巨的任务。幸运的是,随着人工智能技术的发展,现在有一些工具可以帮助学生轻松完成论文。本文将介绍五个免费的AI工具,它们能够一键帮助你生成毕业论文,让你的学术生…

2024广东省职业技能大赛云计算赛项实战——Redis主从架构

Redis主从架构 前言 Redis是一个开源的内存数据结构存储系统,一般用于作为数据库、缓存和消息代理使用,而主从架构是许多分布式系统中常见的设计模式,用来提高系统的性能、可靠性和扩展性。 虚拟机使用的是自行创建的CentOS7,如…

记录SpringBoot启动报错解决

记录SpringBoot启动报错解决 报错现场 Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to determine a suitable driver class Action: Consider the following:If you want an embedde…

反转链表(java精简版)

反转一个单向链表。 public class ReversingLinkedList {static class Node {int val;Node next;public Node(int val) {this.val val;}public boolean hasNext() {return next ! null;}}public static void main(String[] args) {//构造Node head null;Node shift null;for…

MobileNet系列论文阅读笔记(MobileNetV1、MobileNetV2和MobileNetV3)

目录 引言MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications摘要Prior Work -- 先前工作MobileNet Architecture— MobileNet结构Depthwise Separable Convolution—深度可分离卷积Network Structure -- 网络结构 总结 MobileNetV2: Invert…

视频共享融合赋能平台LntonCVS视频监控业务平台建设安全煤矿矿井应用方案

随着我国经济的飞速增长,煤炭作为主要的能源之一,在我国的能源结构中扮演着至关重要的角色。然而,煤矿事故的频繁发生,不仅造成了巨大的人员伤亡和财产损失,也对社会产生了深远的负面影响。因此,实现煤矿的…

transformers Model

☆ 问题描述 在 transformers 框架中,Model 模块是核心组件之一,提供了多种预训练模型及其相关功能,广泛应用于自然语言处理(NLP)任务。 ★ 解决方案 # 导入相关文件 from transformers import AutoConfig, AutoM…

【odoo】常用的字符转义:“>“,“<“,““,“/“等

概要 字符转义是指在编写代码或处理文本数据时&#xff0c;将特殊字符转换为另一种形式&#xff0c;以便在特定的上下文中正确解析和处理这些字符。 内容 特殊字符描述XML转义表示法&和符号&amp;<小于符号<>大于符号>"双引号&quot;单引号&ap…

Day1:基础语法

今日目标&#xff1a;理解什么是变量、掌握常用的数据类型、学会数据类型转换 一、JavaScript 介绍 1. JavaScript 基础知识 主要讲解 &#xff1a;JavaScript 是什么、书写位置、注释、结束符、输入和输出语法、字面量。 1.1 JavaScript 是什么 是一种运行在客户端(浏览器…

B端业务需求分析的3大注意事项

通过深入分析业务需求&#xff0c;可以准确理解B端用户的具体需求&#xff0c;帮助项目团队设计出真正解决企业问题、提高工作效率的产品或服务。这减少了后期变更&#xff0c;节约了时间和资源。如果没有深入分析业务需求&#xff0c;产品或服务功能可能与实际业务需求脱节&am…

PHP转Go系列 | 数组切片的使用姿势

大家好&#xff0c;我是码农先森。 简介 在 PHP 语言中数组的使用很简单&#xff0c;易用程度简直变态&#xff0c;无论多么复杂的数据格式都可以用数组来表达&#xff0c;可以随心所欲的使用。 <?php $array [1, name, [sex > 男]]; print_r($array);$array []; $…

【LLM之NL2SQL】DAIL-SQL论文阅读笔记

研究背景 该研究旨在提供一个全面、系统的评估框架&#xff0c;用于评估基于大型语言模型&#xff08;LLM&#xff09;的Text-to-SQL技术。特别强调了不同的提示工程策略的有效性和效率&#xff0c;以及开源LLM的可行性。研究的重点是评估在零样本和少样本场景下的不同问题表示…

1.3自然语言的分布式表示-word2vec

文章目录 0基于计数的方法的问题1什么是基于推理的方法2神经网络中单词的表示2.1 MatMul 层的实现 3简单word2vec的实现3.1 CBOW模型的结构3.1.1神经元视角3.1.2层的视角3.1.3多层共享权重时存在的问题 3.2 CBOW模型的学习3.3单词的分布式表示 代码都位于&#xff1a;nlp&#…

《梦醒蝶飞:释放Excel函数与公式的力量》4.1if函数

第4章&#xff1a;逻辑与条件函数 第一节4.1 if函数 在Excel中&#xff0c;逻辑函数用于处理基于特定条件的真假判断&#xff0c;它们是构建复杂公式和进行高级数据分析的基础。本章将深入探讨逻辑函数的使用方法&#xff0c;特别是IF函数&#xff0c;这是Excel中最为常用的条…

Node.js 是一个开源的 跨平台的JavaScript运行环境

https://www.npmjs.com/ 中央仓库 Visual Studio Code - Code Editing. Redefined https://openjsf.org/ OpenJS 促进了关键 JavaScript 技术在全球范围内的广泛采用和持续发展。 Apache服务器 Nginx服务器 Tomcat服务器 Node.js服务器 Gunicorn服务器 uW…

6个步骤实现 Postman 接口压力测试

&#x1f345; 视频学习&#xff1a;文末有免费的配套视频可观看 &#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 这里讲是Postman做接口并发测试&#xff0c;基础用法不做赘述 1、第一步接口可以通的情况下点击…

番外篇 | FFCA-YOLO复现:面向遥感图像的小目标检测最新方法 | 解决小目标检测特征表示不足和背景混淆等问题

前言:Hello大家好,我是小哥谈。在论文中,作者的动机是设计一个高精度同时具备潜在的实时处理能力的小目标检测器。由此,作者首先分别提出了特征增强模块(FEM)与空间上下文感知模块(SCAM)来丰富局部和全局的上下文特征信息。其中,FEM通过多分支卷积拓宽了骨干网络的感受…

oracle发送https请求

参照 https://docs.oracle.com/cd/E11882_01/appdev.112/e40758/u_http.htm#i1025869 https://docs.oracle.com/cd/E11882_01/network.112/e40393/asowalet.htm#ASOAG160 https://docs.oracle.com/cd/E11882_01/appdev.112/e40758/d_networkacl_adm.htm#ARPLS148 https://d…

环境配置01:Torch、CUDA适配与显卡驱动更新

说明&#xff1a; torch版本依赖于CUDA版本与Python版本 Start Locally | PyTorch CUDA版本依赖于显卡驱动版本 1. CUDA 12.5 Release Notes — Release Notes 12.5 documentation 显卡驱动版本依赖于显卡型号与电脑系统 当前电脑3060显卡&#xff0c;安装了CUDA V11.6与tor…

查询mysql库表的几个语句

1、查询某个数据库的所有表 SELECTtable_name FROMinformation_schema.TABLES WHEREtable_schema database_namedatabase_name替换成你需要查询的数据库名称 2、查询某张表的所有字段名称 SELECTCOLUMN_NAME,column_comment FROMinformation_schema.COLUMNS WHEREtable…