年终回顾 | 小米技术最受欢迎的技术文章TOP20

news2024/11/16 19:34:57

转眼间,小米技术已经陪伴大家度过了一整个年头。在一年里,我们始终坚持为大家提供有趣好玩的技术科普、硬核前沿的技术干货,带给大家一切有关小米的新鲜技术创新内容。

2023年就要到了,欢迎你点击文末左下角的阅读原文”填写一份有关小米技术内容的调研问卷,告诉我们你感兴趣的内容,以及对小米技术的建议,你的意见会让我们未来的内容做得更好。同时我们也会从中选择5位用户,为其送上我们精心准备的礼品。

让我们一起回顾一下2022年最受欢迎的文章 TOP20,细数每一个精彩瞬间。

01 

本“徕”就美,Xiaomi 12S 系列原生双画质的修炼秘籍

15383cad2a38082addf9c89ddffeab18.png

为了让小米 12S 系列实现徕卡味儿,工程师们从光学镜头等硬件设计开始,一直到算法设计、画质调校,全流程都进行了深度的联合开发,以确保成像流程上的每一个环节都符合徕卡严苛的要求。通过机器学习算法进行智能化处理,创新性使用了动态提亮技术、自研了 deepAWB 技术极致画质技术高效计算技术,让手机也能打造立体感的影调,渲染临场感的色彩,捕捉柔和逼真的细节。一键记录原汁原味的徕卡,不再是设想。

02 

手机也能拍出艺术品?大师镜头,“真”突破了不少

7b24681d4164fe8eb3eab310c7e83469.png

小米12S 系列(Pro/Ultra)搭载了“大师镜头包”,内含“35mm 经典人文黑白镜头”、“50mm 经典人像旋焦镜头”、“90mm 经典人像柔焦镜头”三款人像镜头。工程师为了进一步降低算法耗时,创新性地设计了图像的自适应并行处理框架。对柔焦模糊和二线性光斑的效果矛盾,研发出“自适应分层融合算法”,解决了因不同图层融合出现的生硬贴图感,实现兼具锐利光斑边缘和柔焦模糊的自然柔焦效果。从而让专业摄影更简单,让每刻记录更艺术。

03 

独立空间音频打造360°沉浸声场,小米让科技更无界

f5825a804572b66a136f213a065dc967.png

小米 Buds 4 Pro 内置自研的独立空间音频技术这一技术实现了空间音频技术在耳机内部芯片上的独立计算,无需依赖外部设备,即可营造出水平360° 的立体听感,既使头部转动,声源仍然保持固定,宛如置身现场。独立空间音频主要包含“360 声场”“头部追踪”两部分,基于这一技术,小米 Buds 4 Pro 在延迟、适配性和全方位听感等方面都达到了行业领先水平。

04 

干货丨小米表格识别技术揭秘

2f299de88d49e3e961c68a92be6b8487.png

表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式在办公、商务、教育等场景中有着广泛的实用价值。小米AI实验室工程师彭鑫和郭沛分享其研发的表格识别算法中的技术实现原理,该算法包含手机端的表格检测算法和服务端的表格识别算法,能够高效准确地提取图片中的表格,转化为可编辑的Excel 文件。

05 

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow

80412dc7f1be33195d2cbee1a092ff7a.png

11月22日,IEEE 公布了2023年 Fellow 名单,小米集团语音首席科学家 Daniel Povey 凭借在语音识别和声学建模方面的杰出贡献成功入选。Daniel Povey 是语音识别开源工具 Kaldi 之父,加入小米带领团队研发新一代 Kaldi。目前,新一代 Kaldi 在缩短训练时间、提高识别率和加速解码等方面取得可喜成果。其在语音识别上的技术突破,在不断优化用户体验的同时,也推动着智能语音服务触手可及。

06 

夺冠丨夜枭算法拿下CVPR夜景渲染双冠军

548d01908c9bac72f59363d42e0a6b69.png

夜枭算法是针对夜晚场景的自研深度学习AI拍照算法。小米夜枭算法团队在誉为“影像算法奥林匹克”的CVPR NTIRE 2022 夜景渲染赛道中,以巨大的优势斩获大众评审和摄影师评审两项世界冠军。其技术创新在于,针对数据获取、噪声去除与细节保留的平衡、高动态范围的保留和准确的色彩还原三个方面的难点,夜枭算法自主研发了夜晚场景噪声标定系统、自引导的多尺度融合AI去噪算法和基于内容自适应的AI提亮模型和AI色彩还原模型。

07 

重磅!小米正式发布《6G改变世界》白皮书

1d6b6119315b1fd0631a12e18daa790e.png

随着元宇宙、数字孪生等新场景、新业务的涌现,6G将掀起一场新的技术革命,为用户和各行各业带来“极致泛在,智慧随心”的服务体验。小米正式发布《6G改变世界》白皮书,从6G愿景出发,详细介绍了小米对6G应用场景的思考,同时针对6G的关键技术指标给出了相应的观点,在此基础上,本白皮书介绍了6G的潜在使能技术。愿与业界同仁共同推动6G的技术创新和产业发展。

08 

又快又准又安全?实时字幕有“芯”秘密!

cb2bb58278b22a1b2f57ee0915e07bf4.png

小爱翻译推出全新实时字幕功能,这一功能实现了离线条件下的中英文转写与翻译,能够几乎实时形成双语字幕,成为手机中高效又安全的同声传译助手。其实现的关键则在于小米自研语音识别和机器翻译技术的在高通AI引擎的成功落地。实时字幕不仅为低功耗、低延时的前沿AI应用的落地提供了范例,而且也对用户信息安全和隐私保护有着重要的意义。

09 

全面蜕变打造轻薄精英,小米MIX Fold 2让折叠屏易手掌握


3aa86157aa097fff23b3f5a21ef1c20e.png

小米 MIX Fold 2 拥有展开仅5.4mm,重量仅262g 的轻薄体量。其搭载了小米自研的第三代转轴技术「微水滴形态转轴」。此外,主板、中框、散热、电池等组件也都使用了颠覆性的堆叠策略,挖掘尚未利用的内部空间,在超短 USB、超窄的弧形指纹模组和超薄定制扬声器等小元件上的设计也极具匠心,从而在业界将折叠屏的机身打造地如此轻薄,突破原有的厚度与宽度极限,“走完折叠屏步入实用时代的最后一公里”

10 

25000+专利!这份小米成绩单请米粉审阅

66e5ecd8906edc3b1635c866d9356ba6.png

小米始终坚持技术创新,重视创新成果的知识产权保护,并充分尊重他人的知识产权。在2022年世界知识产权日,小米统计了一直以来技术创新与专利的成绩,截至2021年12月31日,小米全球专利授权数超过25000,在影像技术、充电技术、标准技术、MIUI、人工智能、AIoT 和仿生机器人方面成果颇丰。在高质量创新的道路上,小米将永不止步,以知识产权的实践推动创新的发展。

11 

Tech talk丨情感对话技术:小爱同学治愈人心的底层逻辑

3e460ba3ac278ee0754dda938aed4ee0.png

AI 实验室 NLP 场景对话团队工程师分享了小爱同学背后情感对话技术的奥秘。首先,小爱通过“情绪类别+情绪原因”结合的方法和约束优化目标的改进算法对用户表达(Query)进行情感分类。其次,团队以心理学为基础,通过共情回复策略,使小爱能够对不同事件引发的情绪采取不同的答复。最后,小爱基于自研的首个中文常识对话图谱和混合疏导策略模型,进行多轮情绪疏导,将复杂的情绪问题分阶段进行响应。综合来看,极大地提升了用户的使用体验,让小爱更有爱。

12 

小米自研语音合成声音定制技术:让世界听见你的声音

bfa1d182ef3ad31f241283b5540f890c.png

小米AI实验室将自研的声音适配算法和超级拟人语音合成技术应用于无障碍领域,为一位言语障碍用户“阿卷”开发了独一无二的定制声音,取代了以往的普通电子机械音,让阿卷可以用“自己的声音”与外界交流。这是小米AI实验室“声音配型捐赠”项目预研的一部分,体现了小米技术向善的承诺,用强大的技术能力推动“让世界上每个人都能享受科技带来的美好生活”的使命。

13 

探索未来|一文看懂小米年度技术峰会·四大专场

5956453afcacbe93e618ee8bc93360d2.png

2022小米年度技术峰会作为小米技术的聚合场和风向标,汇聚小米优秀工程师,分享最有料的技术干货,最新鲜的技术实践与最前沿的技术趋势,全方位展示小米核心技术成果。技术峰会包含硬件技术、软件技术、人工智能技术、信息技术、互联网技术,以及通讯技术与标准专场,为小米人创造技术分享和交流的机会,也提供深入了解公司技术进展与行业技术趋势平台。

14 

小米铁蛋——CyberDog OTA升级说明

2bdf7339375fc92f9a33083d55e9f31d.png

CyberDog 四足仿生机器人,是小米首次踏入机器人领域,探索未来新伙伴的全新一步,也是面向全球开发者实现开源的一个机器人平台。此次工程师们对铁蛋,进行了一次 OTA 升级,全新解锁了六大新板块功能,分别是:快速连接功能、遛狗步态、运动控制 SDK 接口、低功耗模式、图传延迟、拎狗保护。

15 

干货 | Apache Doris在小米集团的运维实践

fa69a6288ffee2b767ef238d0f807010.png

为了提高小米增长分析平台的查询性能以及降低平台的运维成本,小米引入了 Apache Doris 系统并广泛应用,内部也围绕 Doris 研发了一整套的自动化管理和运维系统,涉及集群部署和升级、监控和报警管理以及故障恢复多个方面。小米 OLAP 引擎研发工程师魏祚、小米存储计算引擎SRE工程师孟子楠从运维的角度介绍了 Apache Doris 在小米集团的应用实践。

16 

干货丨小米自研主动降噪技术在Redmi Buds Pro4上的应用

5cd6d5cb87714cf29e3db9ad969a7e67.png

小米AI实验室声学团队工程师段爽分享了基于 Redmi Buds 4 Pro 耳机的主动降噪技术的原理和实现方式。团队研发的声学主动降噪技术是一种多挡位自适应降噪技术,基于20000+条的场景音频数据分析,结合耳机上麦克风接收到的实时信号感知佩戴者所处的环境场景,以此选择不同的降噪模式,从而实现各种场景条件下良好的降噪体验。

17 

Tech Talk丨如何调校一颗满级芯片

8ae20c256b7c4a67bcab8fe716a19c87.png

通用芯片的底层调校能力,已经成为当下中国手机市场打造差异化优势的关键。Redmi系统优化团队工程师邓永坚分享了 Redmi K50 Pro 所搭载的 4nm 天玑9000高端处理器背后的调教逻辑。工程师从 CPU 调度、内存管理、整机续航等诸多方向去优化,努力在性能、功耗、温控三方面,进行平衡取舍以达到平衡三角,坚持“不调教好,宁可不发”的“死磕”精神,为用户提供最好的基础体验。

18 

黑客马拉松,48小时的技术耐力跑,这些工程师究竟有啥高招?

fc6fce3b0d3bfa1c980502dbb23d04ab.png

创想无界,生生不息。在小米集团第三届本届黑客马拉松中,“MiGu小米头箍-脑电波控制智能家居与疲劳监测”项目以十足的未来感和极高的完成度拔得头筹。MiGu小米头箍是一款能够识别脑电信息并执行对应指令的头箍设备,它能够依据读取到的脑电信号,通过机器学习训练的方式生成控制指令,更便捷地实现对智能家居的控制以及疲劳驾驶监测。另外,本届大赛作品已提交16项专利申请。

19 

Tech Talk丨走进神奇的魔法世界之“魔法消除”技术

4a73a22933c08d3c794580dec1216a88.png

AI实验室工程师张亚森和产品经理何嘉分享魔法消除技术的原理。魔法消除功能包含智能去线、智能去人和一键去除全部人物的功能。这一功能实现背后的技术原理基于小米的两大自研算法:智能去线算法和AI智能去人算法。其优势在于:本地端计算,保障用户隐私;识别更智能,精准还原美丽;填充效果好,还原超清纹理。

20 

权威解读丨百科全书式探析“小米影像大脑”

4401fbbf31169911558fc10fb02572ca.png

相机部工程师徐翔和张志辉介绍了小米自研全新的相机系统架构“小米影像大脑”。这套架构包含了加速引擎、计算单元、意图识别单元生态引擎四个部分,安装上影像大脑的相机能将拍照速度提升53% ,连续拍照速度提升209% ,夜景拍照速度提升40% 的流畅效果。生态引擎则是一种服务于开发者的创新业务模式,将小米系统相机的硬件和算法能力以平台SDK的方式开放给第三方应用。

· · ·

感谢大家一直以来的陪伴和支持。新的一年,小米技术仍然会分享更多最前沿、最干货、最硬核的技术内容。

你希望小米技术2023年推出什么样的内容呢?再次欢迎你点击文末左下角的阅读原文”填写一份调研问卷,告诉我们你的意见和建议,我们会从中选择5位用户,为其送上我们精心准备的礼品。

2023年,让我们一起携手前行!

bbf0d16a78088fb196dba83a310cb2e6.gif

16da5b354963e8422ad66e29a568f7f9.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/130392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3:搜索框输入防抖实现整理笔记

目录 场景需求 前言 防抖 & 节流 防抖 节流 输入防抖存在的问题 指令实现 总结 在Vue开发中,遇到了搜索框输入防抖处理,算是防抖的使用场景之一吧,抽象其逻辑记录下来以备后用 场景需求 作为开发人员,一定要先搞清楚…

Android---Material Design

目录 一、什么是Material Design Z轴 Material Design 的一些 theme 一、什么是Material Design Material Design 中文名:材料设计语言,是由 Google 推出的全新的设计语言。Google 表示,这种设计语言旨在为手机、平板、台式机和“其它平台”…

标签平滑(Label Smoothing)详解

一、什么是label smoothing? 标签平滑(Label smoothing),像L1、L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地预测标签,改善…

spring6笔记2( ioc、bean的作用域、工厂模式、bean的四种实例化方式,生命周期)

第四章、Spring对ioc的实现 4.4 p命名空间注入 目的:简化配置。 使用p命名空间注入的前提条件包括两个: 第一:在XML头部信息中添加p命名空间的配置信息:xmlns:p"http://www.springframework.org/schema/p"第二&…

wanglinrong 程序 环境配置

1、总体要求 我的matlab版本是 r2020b、matconvnet-1.0-beta25、visual studio 2022。笔记本安装,没考虑GPU。建议vs的版本尽量比matlab版本低。 1.1 完美解决方案: 低版本Visual Studio与高版本Matlab,先装vs 后装matlab! 比如…

windows下PyTorch安装教程(1.10)

文章目录一.pytorch 1.10版本安装教程一.pytorch 1.10版本安装教程 PyTorch官网 pytorch与cuda版本关系 官网 从官网选择自己对应的conda,python,cuda版本,复制conda命令 在windows搜索框中搜索CMD,选择以管理员身份运行 使用conda新建虚拟环境pyt…

arthas离线包使用说明

arthas离线包使用说明 基于私有化全内网场景,打包了一套arthas离线包,方便后续对服务进行调试和问题的定位。 首先将arthas-bin.zip导入到服务器中 下载连接:https://download.csdn.net/download/Decembetion/87347459 将zip包解压 #解压 unz…

c4d导入大模型以及给建筑上贴图笔记

快捷键普及 h定位 o 鼠标中键 切换视图 鼠标左键移动视图 坐标轴反了,按w切换 alt左键 旋转 alt中键移动 alt右键 缩放 导入超大模型 导入后什么都看不到需要在工程属性里面修改为极大 image.pngshiftf2弹出材质编辑器 点四条杠可以移动选项卡 image.png点新建材质之…

基于GUI界面的yolov5人脸口罩检测项目

文章目录 前言 一、运行环境 二、环境配置 三、yolov5网络结构图介绍 四、 损失函数 五、数据集 六、实验内容 1.实验框架 2.实验环境 3.实验结果 前言 佩戴口罩可以有效降低在和感染者有接触时可能被感染者感染的风险。目前,在一些公共场所&#xff0c…

c++结构体数组sort排序出错?(关于sort排序comp比较器的严格弱排序性质)

文章目录sort的严格弱排序的性质无效的比较器(Invalid comparator)正确的比较器sort的严格弱排序的性质 我在给结构体数组排序的时候,自定义了sort函数的排序法则,我的结构体如下定义: struct score {int a, b, c;//…

English Learning - L1-8 时态(上) 2022.12.29 周四

English Learning - L1-8 时态(上) 2022.12.29 周四8 时态为什么时态难学?什么是时态?如何套用时态表8.1 一般时态核心思维(一) 一般现在时核心思维用法1. 普遍的事实和真理2. 重复活动(习惯&am…

166页7万字智慧工厂可视化解决方案

【版权声明】本资料来源网络,仅用于行业知识分享,供个人学习参考,请勿商用。【侵删致歉】如有侵权请联系小编,将在收到信息后第一时间进行删除!完整资料领取见文末,部分资料内容: 第 一 章 应用…

QT VS移植过程中出现的问题以及解决记录

目录 一、无法定位程序输入点于动态链接库 二、E1696 无法打开 源 文件 “QString“ 三、编译Qt项目提示 error MSB6006: “cmd.exe”已退出 四、禁止显示状态 错误 MSB8036 找不到 Windows SDK 五、E2512 功能测试宏的参数必须是简单标识符 六、Qt VS中双击ui文件无法打…

【计算机模型机设计】单周期MIPS CPU设计报告

2022年结束了,过去一年确实发生了很多事情,开心的、伤心的、激动的、平凡的…这些都已经成为过去了,只希望在新的一年里,能够多一些开心,少一些emo,做一些自己喜欢的事情。 其实说实话,感觉我的…

Linux驱动之平台总线

文章目录前言一、什么是平台总线?二、平台总线相关的结构体三、平台总线的注册和注销四、总线平台的框架总结前言 一个完整的驱动程序总是由三部分组成:设备、总线、驱动 设备就好比我们的硬件:比如oled ,那么总线就相当于iic总线…

Faster RCNN网络源码解读(Ⅲ) --- 如何搭建自己的数据集

目录 一、如何生成类似pascal voc一样结构的文件(split_data.py) 二、如何创建属于自己的数据集(my_dataset.py) 2.1 代码 2.2 代码解释 2.2.1 初始化函数__init__ 2.2.2 parse_xml_to_dict函数(解析xml文件&…

35岁程序员还能找到工作吗?60%选择转岗项目经理!

我因为工作关系接触过大把的程序员朋友,知道他们都有35岁年龄焦虑,曾经他们在群里调侃程序员的尽头是开出租车和开饭店。毕竟一个公司的CTO只有一个,随着年龄的增长他们的体力和学新的技术都会明显吃力,慢慢就承受不起失业&#x…

[极客大挑战 2019]Havefun1、EasySQL(BUUCTF)

前言: 这篇文章还是是为了帮助一些 像我这样的菜鸟 找到简单的题解 今天是2022年的最后一天, 这一年我居然写了72篇文章 获得5枚勋章 还多了14个粉丝 好了不说了,上水题的题解 EasySQL题目描述 解题工具: 不需什么工具,如题名easy …

元宇宙产业委员会发布《第一届第六次主任委员会议公报》

2022年12月29日中国移动通信联合会元宇宙产业工作委员会第一届第六次主任委员会议书面召开,共同主席3人、学术指导3人、产业指导3人,联席主任委员3人、执行主任委员4人、常务副主任委员9家/人、副主任委员25家/人均以通信方式出席会议并表决相关事项。 …

深入分析Linux虚拟化KVM-Qemu之ARMv8虚拟化

说明: KVM版本:5.9.1 QEMU版本:5.0.0 工具:Source Insight 3.5, Visio 1. 概述 KVM虚拟化离不开底层硬件的支持,本文将介绍ARMv8架构处理器对虚拟化的支持,包括内存虚拟化、中断虚拟化、I/O虚…