转眼间,小米技术已经陪伴大家度过了一整个年头。在一年里,我们始终坚持为大家提供有趣好玩的技术科普、硬核前沿的技术干货,带给大家一切有关小米的新鲜技术创新内容。
2023年就要到了,欢迎你点击文末左下角的“阅读原文”填写一份有关小米技术内容的调研问卷,告诉我们你感兴趣的内容,以及对小米技术的建议,你的意见会让我们未来的内容做得更好。同时我们也会从中选择5位用户,为其送上我们精心准备的礼品。
让我们一起回顾一下2022年最受欢迎的文章 TOP20,细数每一个精彩瞬间。
01
本“徕”就美,Xiaomi 12S 系列原生双画质的修炼秘籍
为了让小米 12S 系列实现徕卡味儿,工程师们从光学镜头等硬件设计开始,一直到算法设计、画质调校,全流程都进行了深度的联合开发,以确保成像流程上的每一个环节都符合徕卡严苛的要求。通过机器学习算法进行智能化处理,创新性使用了动态提亮技术、自研了 deepAWB 技术、极致画质技术和高效计算技术,让手机也能打造立体感的影调,渲染临场感的色彩,捕捉柔和逼真的细节。一键记录原汁原味的徕卡,不再是设想。
02
手机也能拍出艺术品?大师镜头,“真”突破了不少
小米12S 系列(Pro/Ultra)搭载了“大师镜头包”,内含“35mm 经典人文黑白镜头”、“50mm 经典人像旋焦镜头”、“90mm 经典人像柔焦镜头”三款人像镜头。工程师为了进一步降低算法耗时,创新性地设计了图像的自适应并行处理框架。对柔焦模糊和二线性光斑的效果矛盾,研发出“自适应分层融合算法”,解决了因不同图层融合出现的生硬贴图感,实现兼具锐利光斑边缘和柔焦模糊的自然柔焦效果。从而让专业摄影更简单,让每刻记录更艺术。
03
独立空间音频打造360°沉浸声场,小米让科技更无界
小米 Buds 4 Pro 内置自研的独立空间音频技术,这一技术实现了空间音频技术在耳机内部芯片上的独立计算,无需依赖外部设备,即可营造出水平360° 的立体听感,既使头部转动,声源仍然保持固定,宛如置身现场。独立空间音频主要包含“360 声场”和“头部追踪”两部分,基于这一技术,小米 Buds 4 Pro 在延迟、适配性和全方位听感等方面都达到了行业领先水平。
04
干货丨小米表格识别技术揭秘
表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式,在办公、商务、教育等场景中有着广泛的实用价值。小米AI实验室工程师彭鑫和郭沛分享其研发的表格识别算法中的技术实现原理,该算法包含手机端的表格检测算法和服务端的表格识别算法,能够高效准确地提取图片中的表格,转化为可编辑的Excel 文件。
05
小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow
11月22日,IEEE 公布了2023年 Fellow 名单,小米集团语音首席科学家 Daniel Povey 凭借在语音识别和声学建模方面的杰出贡献成功入选。Daniel Povey 是语音识别开源工具 Kaldi 之父,加入小米带领团队研发新一代 Kaldi。目前,新一代 Kaldi 在缩短训练时间、提高识别率和加速解码等方面取得可喜成果。其在语音识别上的技术突破,在不断优化用户体验的同时,也推动着智能语音服务触手可及。
06
夺冠丨夜枭算法拿下CVPR夜景渲染双冠军
夜枭算法是针对夜晚场景的自研深度学习AI拍照算法。小米夜枭算法团队在誉为“影像算法奥林匹克”的CVPR NTIRE 2022 夜景渲染赛道中,以巨大的优势斩获大众评审和摄影师评审两项世界冠军。其技术创新在于,针对数据获取、噪声去除与细节保留的平衡、高动态范围的保留和准确的色彩还原三个方面的难点,夜枭算法自主研发了夜晚场景噪声标定系统、自引导的多尺度融合AI去噪算法和基于内容自适应的AI提亮模型和AI色彩还原模型。
07
重磅!小米正式发布《6G改变世界》白皮书
随着元宇宙、数字孪生等新场景、新业务的涌现,6G将掀起一场新的技术革命,为用户和各行各业带来“极致泛在,智慧随心”的服务体验。小米正式发布《6G改变世界》白皮书,从6G愿景出发,详细介绍了小米对6G应用场景的思考,同时针对6G的关键技术指标给出了相应的观点,在此基础上,本白皮书介绍了6G的潜在使能技术。愿与业界同仁共同推动6G的技术创新和产业发展。
08
又快又准又安全?实时字幕有“芯”秘密!
小爱翻译推出全新实时字幕功能,这一功能实现了离线条件下的中英文转写与翻译,能够几乎实时形成双语字幕,成为手机中高效又安全的同声传译助手。其实现的关键则在于小米自研语音识别和机器翻译技术的在高通AI引擎的成功落地。实时字幕不仅为低功耗、低延时的前沿AI应用的落地提供了范例,而且也对用户信息安全和隐私保护有着重要的意义。
09
全面蜕变打造轻薄精英,小米MIX Fold 2让折叠屏易手掌握
小米 MIX Fold 2 拥有展开仅5.4mm,重量仅262g 的轻薄体量。其搭载了小米自研的第三代转轴技术「微水滴形态转轴」。此外,主板、中框、散热、电池等组件也都使用了颠覆性的堆叠策略,挖掘尚未利用的内部空间,在超短 USB、超窄的弧形指纹模组和超薄定制扬声器等小元件上的设计也极具匠心,从而在业界将折叠屏的机身打造地如此轻薄,突破原有的厚度与宽度极限,“走完折叠屏步入实用时代的最后一公里”。
10
25000+专利!这份小米成绩单请米粉审阅
小米始终坚持技术创新,重视创新成果的知识产权保护,并充分尊重他人的知识产权。在2022年世界知识产权日,小米统计了一直以来技术创新与专利的成绩,截至2021年12月31日,小米全球专利授权数超过25000,在影像技术、充电技术、标准技术、MIUI、人工智能、AIoT 和仿生机器人方面成果颇丰。在高质量创新的道路上,小米将永不止步,以知识产权的实践推动创新的发展。
11
Tech talk丨情感对话技术:小爱同学治愈人心的底层逻辑
AI 实验室 NLP 场景对话团队工程师分享了小爱同学背后情感对话技术的奥秘。首先,小爱通过“情绪类别+情绪原因”结合的方法和约束优化目标的改进算法对用户表达(Query)进行情感分类。其次,团队以心理学为基础,通过共情回复策略,使小爱能够对不同事件引发的情绪采取不同的答复。最后,小爱基于自研的首个中文常识对话图谱和混合疏导策略模型,进行多轮情绪疏导,将复杂的情绪问题分阶段进行响应。综合来看,极大地提升了用户的使用体验,让小爱更有爱。
12
小米自研语音合成声音定制技术:让世界听见你的声音!
小米AI实验室将自研的声音适配算法和超级拟人语音合成技术应用于无障碍领域,为一位言语障碍用户“阿卷”开发了独一无二的定制声音,取代了以往的普通电子机械音,让阿卷可以用“自己的声音”与外界交流。这是小米AI实验室“声音配型捐赠”项目预研的一部分,体现了小米技术向善的承诺,用强大的技术能力推动“让世界上每个人都能享受科技带来的美好生活”的使命。
13
探索未来|一文看懂小米年度技术峰会·四大专场
2022小米年度技术峰会作为小米技术的聚合场和风向标,汇聚小米优秀工程师,分享最有料的技术干货,最新鲜的技术实践与最前沿的技术趋势,全方位展示小米核心技术成果。技术峰会包含硬件技术、软件技术、人工智能技术、信息技术、互联网技术,以及通讯技术与标准专场,为小米人创造技术分享和交流的机会,也提供深入了解公司技术进展与行业技术趋势平台。
14
小米铁蛋——CyberDog OTA升级说明
CyberDog 四足仿生机器人,是小米首次踏入机器人领域,探索未来新伙伴的全新一步,也是面向全球开发者实现开源的一个机器人平台。此次工程师们对铁蛋,进行了一次 OTA 升级,全新解锁了六大新板块功能,分别是:快速连接功能、遛狗步态、运动控制 SDK 接口、低功耗模式、图传延迟、拎狗保护。
15
干货 | Apache Doris在小米集团的运维实践
为了提高小米增长分析平台的查询性能以及降低平台的运维成本,小米引入了 Apache Doris 系统并广泛应用,内部也围绕 Doris 研发了一整套的自动化管理和运维系统,涉及集群部署和升级、监控和报警管理以及故障恢复多个方面。小米 OLAP 引擎研发工程师魏祚、小米存储计算引擎SRE工程师孟子楠从运维的角度介绍了 Apache Doris 在小米集团的应用实践。
16
干货丨小米自研主动降噪技术在Redmi Buds Pro4上的应用
小米AI实验室声学团队工程师段爽分享了基于 Redmi Buds 4 Pro 耳机的主动降噪技术的原理和实现方式。团队研发的声学主动降噪技术是一种多挡位自适应降噪技术,基于20000+条的场景音频数据分析,结合耳机上麦克风接收到的实时信号感知佩戴者所处的环境场景,以此选择不同的降噪模式,从而实现各种场景条件下良好的降噪体验。
17
Tech Talk丨如何调校一颗满级芯片
通用芯片的底层调校能力,已经成为当下中国手机市场打造差异化优势的关键。Redmi系统优化团队工程师邓永坚分享了 Redmi K50 Pro 所搭载的 4nm 天玑9000高端处理器背后的调教逻辑。工程师从 CPU 调度、内存管理、整机续航等诸多方向去优化,努力在性能、功耗、温控三方面,进行平衡取舍以达到平衡三角,坚持“不调教好,宁可不发”的“死磕”精神,为用户提供最好的基础体验。
18
黑客马拉松,48小时的技术耐力跑,这些工程师究竟有啥高招?
创想无界,生生不息。在小米集团第三届本届黑客马拉松中,“MiGu小米头箍-脑电波控制智能家居与疲劳监测”项目以十足的未来感和极高的完成度拔得头筹。MiGu小米头箍是一款能够识别脑电信息并执行对应指令的头箍设备,它能够依据读取到的脑电信号,通过机器学习训练的方式生成控制指令,更便捷地实现对智能家居的控制以及疲劳驾驶监测。另外,本届大赛作品已提交16项专利申请。
19
Tech Talk丨走进神奇的魔法世界之“魔法消除”技术
AI实验室工程师张亚森和产品经理何嘉分享魔法消除技术的原理。魔法消除功能包含智能去线、智能去人和一键去除全部人物的功能。这一功能实现背后的技术原理基于小米的两大自研算法:智能去线算法和AI智能去人算法。其优势在于:本地端计算,保障用户隐私;识别更智能,精准还原美丽;填充效果好,还原超清纹理。
20
权威解读丨百科全书式探析“小米影像大脑”
相机部工程师徐翔和张志辉介绍了小米自研全新的相机系统架构“小米影像大脑”。这套架构包含了加速引擎、计算单元、意图识别单元和生态引擎四个部分,安装上影像大脑的相机能将拍照速度提升53% ,连续拍照速度提升209% ,夜景拍照速度提升40% 的流畅效果。生态引擎则是一种服务于开发者的创新业务模式,将小米系统相机的硬件和算法能力以平台SDK的方式开放给第三方应用。
· · ·
感谢大家一直以来的陪伴和支持。新的一年,小米技术仍然会分享更多最前沿、最干货、最硬核的技术内容。
你希望小米技术2023年推出什么样的内容呢?再次欢迎你点击文末左下角的“阅读原文”填写一份调研问卷,告诉我们你的意见和建议,我们会从中选择5位用户,为其送上我们精心准备的礼品。
2023年,让我们一起携手前行!